Gemini App MAU Lebih dari 900 Juta, Penanganan Token Bulanan 3200 Triliun per Bulan, Nano Banana Hasilkan Lebih dari 50 Miliar Gambar......
Dalam konferensi Google I/O yang baru saja berakhir dini hari tadi, CEO Google Sundar Pichai langsung melemparkan angka-angka ini.
Setahun terakhir, AI menjadi nada dasar semua industri. Posisi Gemini di Google juga mulai berubah dari sekadar satu aplikasi tunggal, menjadi kemampuan AI dasar terpenting di semua produk Google.
Konferensi ini juga dimulai dari model, kemudian masuk ke produk Coding dan Agent.
Gemini Omni mendorong pembuatan video Google ke arah "Model Dunia", sementara Gemini 3.5 Flash bersama alat pemrograman AI didorong ke platform pengembangan Agent.
Kedua kemampuan ini kemudian masuk ke ekosistem lengkap Google: Pencarian, Gemini App, Flow, Spark, Chrome, kacamata XR, dan skenario e-commerce.
Gemini Omni Hadir, Momen "Nano Banana" di Dunia Video Tiba
Hal pertama yang dikupas tuntas dalam konferensi adalah Gemini Omni. Kami membuat video perbandingan dengan Seedance 2.0, lihat perbedaannya.
Google menggambarkan Gemini Omni sebagai model baru yang mampu "menciptakan konten apa pun dari input apa pun".
Ini menggabungkan kemampuan penalaran Gemini dengan model media generatif Google yang sudah ada, dengan tujuan meningkatkan pemahaman model terhadap dunia, kemampuan generasi multimodal, dan kemampuan pengeditan.
Google menekankan, model seperti Veo, Nano Banana, Genie sudah bisa menghasilkan video, gambar, dan simulasi interaktif, tetapi Gemini Omni melangkah lebih jauh, mulai menangani masalah seperti momentum, gravitasi yang lebih mendekati dunia fisik.
Contoh yang ditampilkan di lokasi konferensi termasuk video penjelasan lipatan protein. Pengguna hanya perlu memasukkan perintah seperti "buat animasi claymation tentang lipatan protein", Omni bisa mengubah konsep sains abstrak menjadi konten video.
Ia juga mendukung pengeditan video yang lebih alami. Pengguna dapat mengunggah video mereka sendiri, lalu memodifikasi gaya, menambahkan elemen, menyesuaikan detail dengan cara percakapan, bahkan mengubah lingkaran biasa menjadi lubang hitam, mengubah adegan jalan malam menjadi gambar yang lebih dramatis.
Google menyatakan, Gemini Omni dimulai dari video, nantinya akan berangsur menuju "input apa pun ke output apa pun". Ini juga alasan Google selalu mendesain Gemini sebagai model multimodal.
Model pertama keluarga Omni, Gemini Omni Flash, telah diluncurkan ke produk Google. Informasi lebih lanjut tentang Omni Pro akan diumumkan nanti. Fungsi Omni di Gemini App juga terbuka untuk pengguna berlangganan Google AI Plus, Pro, dan Ultra.
Ini berarti Gemini Omni bukan sekadar model pembuatan video. Google ingin memasukkannya ke dalam narasi "Model Dunia": model tidak hanya menghasilkan gambar, tetapi juga harus memahami hubungan fisik, hubungan gerak, dan logika adegan dalam gambar.
Setelah masuk ke aplikasi seperti Gemini App, Google Flow, dan YouTube Shorts, Omni juga akan mengembangkan alat kreatif generatif Google dari pengeditan gambar menjadi pengeditan video.
Gemini 3.5 Flash Diluncurkan, AI Tulis Kode Masuk Mode Kilat
Jika Gemini Omni sesuai dengan generasi dan pengeditan, Gemini 3.5 Flash sesuai dengan kecepatan, biaya, dan kemampuan eksekusi.
Google meluncurkan Gemini 3.5 Flash dalam konferensi ini, menyebutnya sebagai salah satu model pertama seri Gemini 3.5, berfokus pada agentic coding, tugas siklus panjang, dan alur kerja nyata.
Dibandingkan 3.1 Pro, 3.5 Flash menunjukkan peningkatan signifikan di hampir semua benchmark, terutama kemampuan kode, serta evaluasi seperti GDPVal yang lebih mendekati tugas ekonomi nyata.
Selain performa benchmark yang bagus, kecepatan output tokens 3.5 Flash 4 kali lebih cepat daripada model terdepan lainnya, dan setelah dioptimalkan khusus di Antigravity, kecepatannya bisa mencapai 12 kali.
Patut dicatat, Maret lalu, tugas pengembangan internal Google memproses sekitar 500 miliar token per hari, kemudian berlipat ganda setiap beberapa minggu, dan saat ini sudah melebihi 3 triliun token per hari. Google menyebutnya sebagai siklus umpan balik, menggunakan penggunaan nyata skala besar untuk terus meningkatkan 3.5 Flash.
Yang diluncurkan bersamaan dengan model adalah Antigravity 2.0.
Dari IDE bertenaga agent sebelumnya, ia ditingkatkan menjadi aplikasi desktop independen, dengan fokus beralih ke agent first. Pengguna tidak hanya membiarkan AI membantu menulis kode di editor, tetapi menyelesaikan tugas pengembangan melalui dialog Agent, produk Agent, dan kolaborasi multi-Agent.
Antigravity 2.0 menambahkan CLI lengkap, Antigravity SDK, dukungan suara asli model audio Gemini, dan mengintegrasikan layanan seperti Android, Firebase, Google AI Studio. Antigravity 2.0 sebagai aplikasi desktop independen, juga telah terbuka untuk pengguna global.
Google menggunakan demonstrasi intens tinggi di lokasi untuk menjelaskan arah Antigravity 2.0: membuat Agent membangun sistem operasi yang dapat dijalankan dari nol. Tugas ini dieksekusi secara paralel oleh 93 sub-Agent, berlangsung selama 12 jam, memulai lebih dari 15.000 permintaan model, memproses 2,6 miliar token, menghasilkan modul inti seperti penjadwal, manajemen memori, sistem file dari proyek kosong.
Google menyatakan, hal ini tidak dapat diselesaikan dengan Gemini 3.1 Pro, sedangkan menggunakan Gemini 3.5 Flash hanya menghabiskan kurang dari 1000 dollar kredit API.
Demonstrasi juga menunjukkan sistem ini menjalankan program kereta kecil SL dan Doom. Karena awalnya sistem kekurangan driver video dan keyboard, Antigravity melanjutkan menghasilkan kode terkait dan memperbaikinya, sehingga Doom dapat dijalankan. Google juga menyebut, cara serupa telah diuji pada proyek seperti suite pengeditan foto, aplikasi pesan real-time, platform kolaborasi multi-pengguna. Pekerjaan teknik yang awalnya membutuhkan berhari-hari dipersingkat menjadi beberapa jam atau bahkan lebih singkat.
Gemini 3.5 Flash telah terbuka untuk semua pengguna, mencakup produk dan API Google. Gemini 3.5 Pro masih digunakan dan ditingkatkan secara internal, diperkirakan akan dibuka bulan depan.
Dari Kotak Pencarian ke Agent Informasi, Google Membuat Ulang Pencarian AI
Setelah model dan alat pengembangan, Google mengalihkan fokus ke pencarian. Pencarian Google adalah pencarian AI.
Google menyatakan, AI Mode telah mencapai lebih dari 1 miliar MAU, volume kueri telah berlipat ganda setiap kuartal sejak diluncurkan.
Mulai hari ini, AI Mode ditingkatkan ke Gemini 3.5. Kotak pencarian cerdas baru juga mulai didorong hari itu. Ia mendukung input teks, gambar, file, dan video, serta memberikan saran AI saat pengguna memasukkan pertanyaan.
AI Overviews dan AI Mode juga digabung menjadi pengalaman pencarian AI yang lebih kontinu. Pengguna dapat melihat jawaban AI terlebih dahulu di halaman hasil pencarian utama, kemudian masuk ke AI Mode untuk terus menanyakan, konteks akan dipertahankan. Pengalaman pencarian baru ini telah diluncurkan untuk desktop dan seluler global pada hari konferensi.
Perubahan yang lebih besar adalah Agent Pencarian. Musim panas ini pengguna akan dapat membuat Agent Informasi di Search, membiarkannya terus melacak jenis informasi tertentu.
Misalnya, pengguna dapat membuatnya memantau saham bioteknologi besar dengan rasio harga terhadap pendapatan di bawah 15, arus kas positif, utang rendah; juga dapat membuatnya melacak informasi sewa jangka panjang, kolaborasi sepatu, dan produk baru. Saat kondisi berubah, Agent akan mengirim pembaruan terpadu kepada pengguna.
Google juga membawa kemampuan agentic coding dari Antigravity ke pencarian.
Nantinya, pencarian tidak hanya mengembalikan halaman web, ringkasan, atau kartu, tetapi juga dapat menghasilkan antarmuka interaktif untuk pertanyaan spesifik. Misalnya, pengguna bertanya "bagaimana lubang hitam mempengaruhi ruang-waktu", Search dapat menghasilkan komponen visual interaktif; terus menanyakan "bagaimana lubang hitam ganda menghasilkan gelombang gravitasi", Search akan menghasilkan ulang antarmuka dinamis dengan parameter yang dapat disesuaikan. Generative UI with Antigravity akan diluncurkan secara gratis untuk semua pengguna musim panas ini.
Pengalaman kustomisasi yang lebih kompleks juga sedang dalam perjalanan.
Google menampilkan perencana akhir pekan di lokasi, Search akan menggabungkan cuaca, peta, preferensi pengguna, Gmail, Calendar, dan informasi lainnya, menghasilkan alat kecil yang dapat terus dimodifikasi, dibagikan, dan disinkronkan dengan kalender. Pengalaman kustomisasi semacam ini akan dibuka terlebih dahulu untuk pengguna berlangganan dalam beberapa bulan mendatang.
Bisa Berjalan saat Dimatikan, Gemini Spark Membawa Kemampuan Agent ke Kehidupan Pribadi
Produk baru terpenting di sisi konsumen adalah Gemini Spark.
Gemini Spark adalah Agent AI pribadi, berjalan di mesin virtual khusus di Google Cloud, dapat menjalankan tugas 24/7. Ia didorong oleh Gemini 3.5 dan harness Antigravity, mendukung tugas latar belakang jangka panjang.
Setelah pengguna mematikan komputer, Spark masih dapat terus bekerja. Ia pertama terhubung ke alat Google sendiri, dalam beberapa minggu mendatang akan terhubung ke alat pihak ketiga melalui MCP.
Konferensi menampilkan beberapa skenario khas Spark.
Pengguna dapat memintanya merangkum rilis dan perkembangan Gemini Live minggu lalu, mengekstrak informasi dari Docs, Gmail, dan riwayat chat, lalu menghasilkan email tim dengan gaya penulisan pribadi.
Juga dapat memintanya mengelola pesta lingkungan, memelihara tabel RSVP Google Sheets, melacak siapa yang membawa apa, membuat draf email pengingat untuk tetangga yang belum mendaftar, dan secara otomatis menghasilkan halaman promosi Google Slides.
Spark juga mendukung input suara di ponsel.
Pengguna dapat menyebutkan beberapa tugas sekaligus, misalnya menandai semua rapat dengan Sundar menjadi merah muda terang, menulis surat undangan untuk tetangga baru, membuat dokumen daftar tugas sebelum akhir tahun ajaran anak. Spark akan membagi konten ini menjadi beberapa tugas independen, dan mengeksekusinya di latar belakang, hasilnya dapat disinkronkan antara ponsel dan komputer.
Gemini Spark dibuka untuk sebagian penguji minggu ini, minggu depan akan diluncurkan dalam bentuk beta untuk pengguna berlangganan Google AI Ultra di AS.
Google secara bersamaan meluncurkan paket Ultra baru seharga 100 dollar per bulan, dan menurunkan paket Ultra tertinggi dari 250 dollar per bulan menjadi 200 dollar per bulan.
Musim panas tahun ini nanti, Spark akan masuk ke Chrome, menjadi browser agen cerdas yang dapat menjalankan tugas di halaman web.
Gemini App Direvisi Besar-besaran, Ada juga "AI Morning Briefing" Versi Google
Gemini App sendiri juga mengalami perubahan besar yang menyeluruh.
Google memperkenalkan bahasa desain baru Neural Expressive, menambahkan animasi cair, warna cerah, font baru, dan umpan balik taktil.
Gemini App versi baru tidak lagi menampilkan jawaban sebagai teks panjang, tetapi akan menghasilkan tata letak yang lebih cocok untuk dibaca dan dioperasikan secara real-time berdasarkan konten, termasuk gambar interaktif, garis waktu, video tersemat, dll. Neural Expressive sekarang telah didorong ke Android, iOS, dan web secara global.
Gemini Live juga dibuat ulang, setelah dibuka dapat langsung masuk ke percakapan real-time. Pilihan aksen regional akan diluncurkan dalam beberapa minggu mendatang.
Gemini App juga menambahkan Daily Brief. Ini adalah Agent ringkasan yang dipersonalisasi untuk penggunaan pagi hari, akan menggabungkan informasi dari Gmail, Calendar, Tasks, mengatur hal-hal yang perlu diperhatikan pengguna hari itu, dan memberikan pintu masuk tindakan selanjutnya.
Daily Brief mulai hari ini diluncurkan untuk pengguna berlangganan Google AI Plus, Pro, dan Ultra di AS.
Di luar narasi Gemini yang lebih besar, Google juga memperbarui beberapa produk sehari-hari.
Google Maps baru-baru ini menyelesaikan peningkatan terbesar dalam sepuluh tahun, dan menambahkan Ask Maps. Ini memungkinkan pengguna mengajukan pertanyaan yang lebih panjang dan kompleks. Misalnya, konferensi memberi contoh skenario: anak jatuh ke kolam bebek, pernikahan dimulai 30 menit lagi, pengguna ingin tahu di mana bisa membeli gaun baru dengan berjalan kaki.
Docs juga mendapat kemampuan pembuatan suara baru. Pengguna tidak perlu memasukkan prompt yang tepat, dapat langsung mengutarakan ide dengan suara, membiarkan Gemini mengambil CV dari Drive, menemukan informasi acara dari Gmail, lalu menghasilkan draf Google Docs. Kemampuan ini akan diluncurkan untuk pengguna berlangganan Pro dan Ultra musim panas ini, kemampuan suara serupa juga akan masuk ke Gmail.
Setelah kemampuan generatif ditingkatkan, identifikasi sumber konten menjadi semakin penting.
Google menyatakan, sejak diluncurkan tiga tahun lalu, SynthID telah memberikan watermark tak terlihat untuk lebih dari 100 miliar gambar dan video, serta audio setara dengan 60.000 tahun. Selanjutnya, SynthID dan verifikasi kredensial konten akan diperluas ke Search dan Chrome.
Pengguna dapat mencari dengan lingkaran, atau klik kanan di Chrome untuk menanyakan apakah konten dihasilkan oleh AI, sistem akan menunjukkan apakah konten berasal dari AI, kamera, atau pernah diedit oleh alat AI generatif.
Google juga mengumumkan, OpenAI, Kakao, dan ElevenLabs akan mengadopsi SynthID 2. Sebelumnya, NVIDIA telah bergabung dengan sistem SynthID. Bagi Google, SynthID bukan hanya fungsi keamanan, tetapi juga bagian dari perjuangan untuk standar transparansi konten AI.
Paket Lengkap Kreasi Google, Mulai Mengepung Gambar, Desain, dan Video
Di bidang alat kreatif, Google meluncurkan banyak produk penting secara padat.
Google Pics adalah produk pembuatan dan pengeditan gambar baru di Google Workspace, ditujukan untuk skenario seperti poster pesta, infografis, gambar promosi. Pengguna dapat mulai dari satu gambar dasar, menghapus elemen, menyesuaikan ukuran objek, mengedit teks, dan menerjemahkan teks. Konten yang dihasilkan Pics akan memiliki watermark SynthID. Google Pics akan diluncurkan musim panas ini.
Produk desain Stitch juga mendapat pembaruan. Pengguna dapat menghasilkan antarmuka situs web atau aplikasi melalui satu prompt, lalu terus memodifikasi melalui teks atau suara, seperti memperbesar judul, menyesuaikan menu, menyorot lebih banyak pilihan pizza. Stitch mendukung ekspor desain sebagai kode, atau langsung memublikasikan situs web, pembaruan terkait telah dirilis.
Pembaruan Google Flow mendapat perhatian khusus. Setelah Gemini Omni masuk ke Flow, pengguna dapat mengubah lingkungan berdasarkan video asli, menambahkan efek visual, menambahkan karakter baru, sambil berusaha mempertahankan pertunjukan asli.
Flow juga menambahkan Agent baru, mendukung eksekusi beberapa tindakan sekaligus. Misalnya, menghasilkan 16 video dengan sudut kamera berbeda dari satu gambar, atau mengubah sekumpulan adegan pagi menjadi adegan malam hari secara massal.
Flow Tools memungkinkan pengguna membuat alat kreatif mereka sendiri di Flow, seperti efek video, animasi gambar tangan, dan alat lapisan teks, serta mendukung berbagi dan remix.
Google Flow Music dapat memperluas sebuah riff piano menjadi demo musik dengan arahan gaya. Fungsi baru Google Flow dan Google Flow Music ini telah diluncurkan.
Bertaruh pada Kacamata Cerdas, Google Mencoba Lagi Pintu Masuk Generasi Berikutnya
Di bagian perangkat keras, Google juga memperluas platform tingkat sistem operasi Android XR ini dari headset, perangkat XR, lebih lanjut ke bentuk kacamata cerdas.
Android XR adalah platform yang dikerjakan sama oleh Google dan Samsung, dan dioptimalkan untuk Qualcomm Snapdragon.
Google menyatakan, kacamata AI akan dibagi menjadi dua jenis: satu adalah kacamata tampilan dengan lensa kecil, yang lain adalah kacamata audio. Kacamata tampilan telah ditampilkan di I/O tahun lalu, tahun ini pengembang pertama telah mulai membuat pengalaman tampilan, program penguji tepercaya akan diperluas akhir tahun ini.
Yang akan dipasarkan lebih awal adalah kacamata audio.
Kacamata audio pertama akan diluncurkan musim gugur ini, dengan Samsung terlibat dalam pembuatan perangkat keras dan pengalaman, Warby Parker dan Gentle Monster bertanggung jawab atas desain kacamata. Kacamata ini terhubung ke ponsel, mendukung Android dan iOS. Jawaban Gemini diputar secara pribadi melalui earphone, bukan ditampilkan di lensa.
Dalam konferensi, demonstrator dapat menggunakan kacamata untuk meminta Gemini menavigasi ke tempat bertemu teman minggu lalu, menambahkan kafe di tengah jalan; juga dapat meminta Gemini membuka DoorDash untuk memesan kopi secara otomatis, menunggu konfirmasi pengguna;
juga dapat memintanya merangkum pesan diam, dan menulis makan malam keluarga ke kalender. Kacamata juga dapat bekerja sama dengan jam tangan, memungkinkan pengguna mengambil foto di tempat, dan menghasilkan gambar kartun dengan Nano Banana, lalu melihat pratinjau di jam tangan.
Akhir konferensi, skenario penggunaan Gemini juga diperluas ke skenario keamanan siber.
Google memperkenalkan CodeMender. Ini adalah Agent keamanan kode, dapat secara otomatis mencari dan memperbaiki kerentanan perangkat lunak kritis. Google akan mengundang sekelompok ahli untuk menguji API CodeMender, kemudian akan meluncurkannya lebih luas.
Sepanjang konferensi, informasi yang diberikan begitu banyak hingga membuat sesak napas. Hanya saja, ketika fungsi-fungsi AI ini benar-benar dibuka untuk puluhan juta, ratusan juta orang, satu masalah penghitungan yang paling realistis langsung muncul di depan mata: dengan biaya komputasi yang sangat besar ini, bagaimana Google akan mendapatkan kembali uangnya?
Selama lebih dari dua puluh tahun terakhir, Google mewakili model internet gratis yang khas. Pengguna menukar perhatian dan data dengan layanan, Google menghasilkan uang dari iklan dan distribusi. Model ini membuat Google menjadi perusahaan infrastruktur terkuat di era internet.
Tetapi biaya inferensi model besar sama sekali tidak sebanding dengan satu kali pencarian.
Memori konteks panjang, generasi multimodal, Agent lintas aplikasi, otomatisasi tingkat perusahaan, semua kemampuan ini di belakangnya adalah konsumsi daya komputasi yang berjalan terus-menerus. Semakin dalam AI masuk, semakin sulit bagi Google untuk terus mencerna biaya dengan cara "upgrade fitur gratis".
Itulah mengapa sepanjang konferensi, Google I/O tampaknya berbicara tentang peningkatan pengalaman, tetapi di baliknya mengarah pada langganan, kontrak perusahaan, tagihan komputasi, dan biaya layanan jangka panjang.
Pintu masuk gratis tentu tidak akan hilang, karena itu masih menjadi dasar Google mendapatkan pengguna, data, dan posisi ekosistem. Tetapi di atas pintu masuk ini, Google sedang menumpuk lapisan layanan cerdas baru: model yang lebih kuat, memori yang lebih panjang, izin sistem yang lebih dalam, eksekusi tugas yang lebih kompleks, dan layanan tingkat perusahaan yang lebih stabil.
Dengan kata lain, Google sedang berubah dari perusahaan layanan internet gratis, menjadi perusahaan infrastruktur langganan AI.
Hanya saja, masalah juga muncul: apakah pengguna mau membayar untuk pencarian? Biasanya, tidak.
Tetapi, jika ini adalah "asisten super serba bisa" yang dapat menangani email Anda 24/7, mengoordinasikan tugas, menganalisis laporan, mengelola rumah pintar, bahkan membantu Anda menulis kode mengembangkan aplikasi? Apakah Anda mau mengeluarkan puluhan hingga ratusan dollar setiap bulan untuknya?
Inilah proposisi bisnis inti yang ingin dibuktikan dengan mendesak oleh Google I/O tahun ini. Dan melihat pasar yang penuh semangat saat ini, jawabannya sepertinya sudah jelas.
Artikel ini berasal dari akun WeChat "APPSO", penulis: Menemukan Produk Masa Depan







































