Oleh | AI Huruf
Google benar-benar tergesa-gesa.
Baru saja ada kabar yang menyebutkan bahwa salah satu pendiri Google, Sergey Brin, memulai kembali "Mode Pendiri", secara pribadi mengawasi dan membentuk "tim elit" untuk meningkatkan kemampuan kunci Gemini dalam pemrograman AI dan agen otonom untuk mengejar pesaing seperti Anthropic.
Kemudian, Google mengumumkan pembaruan besar pada tengah malam, meluncurkan dua agen penelitian otonom generasi baru yang dibangun berdasarkan model Gemini 3.1 Pro: Deep Research dan Deep Research Max.
Tidak hanya memperkuat kemampuan penalaran di lapisan dasar model, tetapi juga mendorong agen penelitian otonom untuk berkembang ke arah platform tingkat perusahaan dan pengembang, melalui pembukaan API, dukungan data privat, tugas asinkron di latar belakang, dan cara lainnya, mencoba merebut peluang dalam skenario bernilai tinggi "Alat Penelitian/Analisis AI" ini, menghadapi persaingan dari pesaing seperti OpenAI (Hermes) dan Perplexity.
Kedua agen ini untuk pertama kalinya memungkinkan pengembang melalui satu panggilan API untuk menggabungkan data jaringan terbuka dengan informasi khusus perusahaan, dan menghasilkan bagan serta infografis asli dalam laporan penelitian, sekaligus dapat terhubung ke sumber data pihak ketiga mana pun melalui Model Context Protocol (MCP).
Kedua agen ini mulai tersedia dalam bentuk pratinjau publik melalui paket berbayar Gemini API, dan dapat diakses melalui Interactions API yang pertama kali diluncurkan Google pada Desember 2025.
Ya, agen baru ini saat ini hanya dapat digunakan melalui API, pengguna biasa tidak dapat menikmatinya di Aplikasi Gemini, bahkan jika mereka berlangganan pro. Melihat berita pembaruan tetapi tidak dapat menggunakannya, beberapa pengguna dengan sedih menyatakan: "Google entah bagaimana, terus menghukum kami para pengguna berlangganan Pro Aplikasi Gemini..."
CEO Google Sundar Pichai juga turun langsung ke X untuk mempromosikan: "Ketika Anda membutuhkan kecepatan dan efisiensi, gunakan Deep Research; ketika Anda mengejar kualitas konteks pengumpulan dan sintesis tertinggi, gunakan versi Max — versi ini melalui perhitungan waktu uji yang diperluas, mencapai skor 93,3% pada DeepSearchQA dan 54,6% pada HLE."
18 bulan yang lalu, tujuan Deep Research Google adalah membantu mahasiswa pascasarjana menghindari tenggelam dalam banyak tab browser. Kini, Google berharap dapat menggantikan penelitian dasar analis junior di bank investasi.
Jarak antara kedua tujuan ini — dan apakah teknologi ini benar-benar dapat menjembatani jarak ini — akan menentukan apakah agen penelitian otonom benar-benar akan menjadi produk transformatif di bidang perangkat lunak perusahaan, atau hanya menjadi demonstrasi AI lain yang terlihat bagus dalam pengujian patokan tetapi mengecewakan dalam rapat.
Dua Versi, Sesuai dengan Beban Kerja yang Berbeda
Deep Research standar memiliki latensi yang lebih rendah dan biaya yang lebih rendah, cocok untuk skenario yang mengutamakan kecepatan.
Deep Research Max mengutamakan kedalaman daripada kecepatan. Agen ini melalui perhitungan waktu uji yang diperluas (extended test-time compute), melakukan penalaran mendalam, pencarian, dan iterasi, dan akhirnya menghasilkan laporan.
Google mencatat bahwa alur kerja latar belakang asinkron adalah skenario penggunaan idealnya, misalnya melalui tugas terjadwal (cron job) yang berjalan di malam hari, dan keesokan paginya dapat memberikan laporan pemeriksaan lengkap (due diligence) kepada tim analis.
Dalam pengujian patokan Google sendiri, Deep Research Max menunjukkan kemajuan signifikan dalam tugas pengambilan dan penalaran. Agen ini dapat mengambil informasi dari lebih banyak sumber dibandingkan versi sebelumnya, dan menangkap nuansa halus yang mudah diabaikan oleh model lama.
Google juga memberikan perbandingan dengan pesaing.
Namun, membandingkan dengan GPT-5.4 OpenAI dan Opus 4.6 Anthropic tidak sepenuhnya adil. GPT-5.4 unggul dalam pencarian web otonom, tetapi tidak dioptimalkan khusus untuk penelitian mendalam. Untuk itu, OpenAI menyediakan agen DR mereka sendiri, yang setelah pembaruan Februari beralih ke GPT-5.2, bukan GPT-5.4. Model pencarian terkuat OpenAI sebenarnya adalah GPT-5.4 Pro, tetapi Google jelas tidak memasukkannya dalam perbandingan.
Menurut data OpenAI, GPT-5.4 Pro mencetak skor tertinggi hingga 89,3% pada patokan pencarian agen cerdas BrowseComp, sedangkan GPT-5.4 mencetak skor 82,7%.
Berdasarkan laporan Anthropic sendiri, Opus 4.6 mencetak skor lebih tinggi dari yang ditunjukkan Google pada BrowseComp, yaitu 84%. Skor ini diperoleh dengan mematikan fitur penalaran, dan kinerja model justru lebih baik daripada pengaturan penalaran intensif yang digunakan Google dalam pengujian patokan API.
Kesenjangan ini kemungkinan besar berasal dari perbedaan metode pengujian — apakah model dievaluasi melalui API mentah, atau dibungkus dalam rantai alat masing-masing laboratorium. Data Google belum tentu salah, tetapi perlu ditafsirkan dengan hati-hati. Bagaimanapun, cara penyajiannya kurang transparan.
Dukungan MCP
Fitur yang paling berpengaruh dalam peluncuran ini mungkin adalah penambahan dukungan untuk Model Context Protocol (MCP). Fitur ini mengubah Deep Research dari alat penelitian web yang kuat, menjadi lebih mendekati "analis data umum".
MCP adalah standar terbuka yang muncul untuk menghubungkan model AI ke sumber data eksternal. Ini memungkinkan Deep Research untuk menanyakan basis data privat, repositori dokumen internal, serta layanan data pihak ketiga yang profesional — sepanjang prosesnya, informasi sensitif tidak perlu meninggalkan lingkungan aslinya.
Dalam penerapan praktis, ini berarti sebuah perusahaan hedge fund dapat secara bersamaan mengarahkan Deep Research ke basis data aliran perdagangan internalnya dan terminal data keuangan, lalu meminta agen cerdas untuk menggabungkan keduanya dengan informasi publik dari web, dan secara komprehensif menghasilkan wawasan.
Google mengungkapkan bahwa saat ini sedang bekerja sama dengan perusahaan-perusahaan seperti FactSet, S&P, dan PitchBook, untuk merancang server MCP mereka, yang dengan jelas menunjukkan bahwa Google sedang mencari integrasi mendalam dengan penyedia data yang diandalkan sehari-hari oleh Wall Street dan industri jasa keuangan yang lebih luas.
Menurut artikel blog yang ditulis oleh manajer produk Google DeepMind Lukas Haas dan Srinivas Tadepalli, tujuannya adalah "memungkinkan pelanggan bersama untuk mengintegrasikan produk data keuangan ke dalam alur kerja yang didorong oleh Deep Research, dan dengan memanfaatkan alam semesta data massalnya, mengumpulkan konteks dengan kecepatan kilat, sehingga mencapai lompatan produktivitas."
Fitur ini langsung mengatasi salah satu titik nyeri paling bandel dalam adopsi AI perusahaan: kesenjangan besar antara informasi yang dapat ditemukan model di internet terbuka, dengan informasi yang sebenarnya dibutuhkan untuk pengambilan keputusan organisasi. Sebelumnya, menjembatani kesenjangan ini membutuhkan banyak pekerjaan rekayasa kustom.
Dukungan MCP yang dikombinasikan dengan kemampuan penjelajahan dan penalaran otonom Deep Research, menyederhanakan sebagian besar kompleksitas menjadi konfigurasi satu kali. Pengembang sekarang dapat membuat Deep Research menggunakan pencarian Google, server MCP jarak jauh, Konteks URL, eksekusi kode, dan pencarian file — atau sepenuhnya menutup akses web, dan hanya mencari pada data kustom.
Sistem juga mendukung input multimodal, termasuk PDF, CSV, gambar, audio, dan video, sebagai konteks grounding (grounding context).
Bagan Asli
Fitur penting kedua adalah pembuatan bagan dan infografis asli.
Versi Deep Research sebelumnya hanya dapat menghasilkan laporan teks biasa. Jika pengguna membutuhkan visualisasi, mereka harus mengekspor data dan membuat bagan sendiri. Kelemahan ini sangat melemahkan posisi "otomatisasi ujung ke ujung".
Sekarang, agen cerdas generasi baru dapat menyematkan bagan dan infografis berkualitas tinggi secara asli dalam laporan, merender kumpulan data kompleks secara dinamis dalam format HTML atau format Nano Banana Google, menjadikannya bagian langsung dari narasi analitis.
Bagi pengguna perusahaan — terutama di industri keuangan dan konsultasi yang perlu menghasilkan hasil yang dapat langsung disampaikan kepada pemangku kepentingan — fitur ini mengubah Deep Research dari alat "mempercepat fase penelitian", menjadi alat yang dapat menghasilkan produk analitis yang mendekati hasil akhir.
Selain itu, dikombinasikan dengan fitur perencanaan kolaboratif baru (yang memungkinkan pengguna meninjau, membimbing, dan mengoptimalkan rencana penelitian agen cerdas sebelum eksekusi), serta keluaran aliran waktu nyata dari langkah-langkah penalaran menengah, sistem baru ini memungkinkan pengembang untuk memiliki kontrol granular atas ruang lingkup investigasi, sambil mempertahankan tingkat transparansi tinggi yang dipersyaratkan oleh industri yang diatur.
Deep Research Sedang Menjadi Bagian dari "Infrastruktur" yang Disediakan Google untuk Perusahaan
Artikel blog resmi Google dengan jelas menyatakan bahwa ketika pengembang membangun menggunakan agen Deep Research, yang mereka panggil adalah "infrastruktur penelitian otonom yang sama yang memberikan kemampuan penelitian untuk beberapa produk populer Google (seperti Aplikasi Gemini, NotebookLM, Google Search, dan Google Finance)". Ini menunjukkan bahwa agen yang disediakan melalui API bukanlah versi sederhana dari versi internal Google, tetapi sistem yang sama, yang melayani eksternal dalam skala platform.
Proses evolusi ini berlangsung sangat cepat.
Google pertama kali meluncurkan Deep Research di Aplikasi Gemini pada Desember 2024, sebagai fitur C-ujung, saat itu didorong oleh Gemini 1.5 Pro. Google menggambarkannya sebagai asisten penelitian AI pribadi, yang dapat mensintesis informasi web dalam beberapa menit, membantu pengguna menghemat jam kerja.
Pada Maret 2025, Google meningkatkan Deep Research menggunakan Gemini 2.0 Flash Thinking Experimental, dan membuka uji coba untuk semua orang. Kemudian ditingkatkan ke Gemini 2.5 Pro Experimental, Google melaporkan bahwa evaluator lebih memilih laporannya 2 banding 1 dibandingkan pesaing.
Desember 2025 adalah titik balik penting, Google meluncurkan Interactions API, untuk pertama kalinya menyediakan Deep Research secara terprogram, didorong oleh Gemini 3 Pro, dan secara bersamaan merilis pengujian patokan DeepSearchQA sumber terbuka.
Model dasar yang mendorong peningkatan ini adalah Gemini 3.1 Pro, yang dirilis pada 19 Februari 2026. Model ini mencapai lompatan besar dalam kemampuan penalaran inti: dalam pengujian patokan ARC-AGI-2 yang mengevaluasi model dalam memecahkan pola logika baru, 3.1 Pro mencetak skor 77,1%, lebih dari dua kali lipat Gemini 3 Pro.












