LOGIC.co.id – Google resmi meluncurkan Gemini 2.5 Flash, model kecerdasan buatan (AI) terbaru yang menonjolkan kecepatan tinggi dan efisiensi daya. Model ini dirancang untuk memenuhi kebutuhan aplikasi real-time dan beban kerja tinggi, sekaligus mengurangi biaya operasional.
Tersedia di Vertex AI untuk Fleksibilitas Pengembangan
Gemini 2.5 Flash akan segera tersedia di Vertex AI, platform pengembangan AI milik Google. Melalui platform ini, pengembang dapat menyesuaikan kecepatan, akurasi, dan biaya pemrosesan model AI sesuai kebutuhan masing-masing.
Menurut Google, model ini memiliki sistem komputasi “dinamis dan dapat dikendalikan” yang memungkinkan beban kerja disesuaikan dengan tingkat kompleksitas permintaan.
“Fleksibilitas ini merupakan kunci untuk mengoptimalkan performa Flash dalam aplikasi bervolume tinggi dan sensitif terhadap biaya,” tulis Google dalam blog resminya, dikutip dari TechCrunch, Kamis (10/4/2025).
Model AI Penalaran seperti o3-mini dan DeepSeek R1
Gemini 2.5 Flash merupakan model AI penalaran (reasoning), serupa dengan o3-mini milik OpenAI dan DeepSeek R1. Model reasoning dirancang untuk menganalisis dan memverifikasi informasi sebelum memberikan respons.
Pendekatan ini menjadikan Gemini 2.5 Flash lebih unggul dalam akurasi jawaban, meskipun mungkin mengorbankan sedikit kecepatan.
Ideal untuk Chatbot dan Pemrosesan Dokumen
Google menyatakan bahwa Gemini 2.5 Flash sangat cocok untuk aplikasi yang membutuhkan respons real-time dan volume permintaan tinggi. Contoh penggunaan idealnya meliputi:
- Chatbot layanan pelanggan
- Sistem penguraian dokumen (document parsing)
- Asisten virtual yang responsif
- Alat peringkasan otomatis berbasis teks
“Workhorse” untuk Efisiensi Skala Besar
Dalam blognya, Google menyebut Gemini 2.5 Flash sebagai “workhorse”, atau mesin kerja andalan yang andal dan konsisten dalam berbagai skenario penggunaan intensif.
“Ini adalah mesin ideal untuk asisten virtual responsif dan alat ringkasan real-time, di mana efisiensi dalam skala besar sangat krusial,” ujar Google.
Model ini diklaim memiliki latensi rendah dan biaya operasional yang lebih hemat dibanding model AI besar lainnya.
Tanpa Laporan Teknis, Google Beri Alasan Eksperimental
Meski telah resmi dirilis, Google tidak menerbitkan laporan teknis untuk Gemini 2.5 Flash. Hal ini menyulitkan publik untuk melakukan evaluasi menyeluruh terhadap performa dan keterbatasan model ini.
Google menjelaskan bahwa model ini masih dikategorikan sebagai eksperimental, sehingga informasi teknis belum dirilis secara terbuka.
Akan Tersedia Secara On-Premise Mulai Q3 2025
Google mengumumkan bahwa Gemini 2.5 Flash akan tersedia untuk lingkungan on-premise mulai kuartal ketiga (Q3) tahun 2025.
Model ini nantinya akan dijalankan di Google Distributed Cloud (GDC), solusi cloud lokal Google yang dirancang untuk perusahaan dengan standar keamanan dan tata kelola data tinggi.
Selain itu, Google juga menyatakan bahwa mereka tengah bekerja sama dengan Nvidia untuk menghadirkan model Gemini di sistem Nvidia Blackwell. Perangkat ini akan dapat dibeli langsung melalui Google atau mitra resminya.