Penulis: Xinzhiyuan
Google I/O 2026, penuh semangat dan gebrakan!
Baru saja, Sundar Pichai dan Demis Hassabis muncul di panggung bersama, meluncurkan semua gebrakan yang telah dipersiapkan selama setengah tahun terakhir sekaligus.
Tanpa sedikit pun kejutan, bintang terbesar malam ini, Gemini Omni resmi diperkenalkan!
Sebagai model besar yang benar-benar 'serba bisa', Omni dapat menerima input dalam bentuk apa pun dan menghasilkan konten apa pun. Dan untuk pertama kalinya mendukung output video, layaknya 'Nano Banana versi video'.
Klimaks lain malam ini, milik Gemini 3.5 Flash.
Di hampir semua tes benchmark, 3.5 Flash berhasil mengungguli model flagship pendahulunya sendiri, Gemini 3.1 Pro. Kecepatan output juga langsung berlipat ganda, bahkan lebih dari 4 kali lebih cepat dibandingkan GPT-5.5 dan Opus 4.7. 3.5 Pro yang lebih kuat, akan dirilis bulan depan.
Selain itu, sejumlah produk andalan baru juga diperkenalkan:
-
Antigravity 2.0: Aplikasi desktop independen baru, berevolusi dari IDE menjadi platform pengembangan Agen
-
Gemini Spark: Agen AI pribadi, berjalan di cloud 7x24 jam
-
Pembaruan Gemini App: Kode nama Neural Expressive, diubah ke penagihan berbasis daya komputasi
-
Paket Berlangganan AI Ultra: Tambahan versi $100, paket tertinggi turun dari $250 menjadi $200
-
Pembaruan Terbesar Google Search dalam 25 Tahun: Terintegrasi dengan 3.5 Flash, menambahkan kotak pencarian cerdas, pembuatan otomatis mini-aplikasi, dll
......
Bisa dibilang, kepadatan isi I/O ini, paling tinggi sepanjang tahun.
Peluncuran Perdana Gemini Omni: Lahirnya AI 'Serba Bisa'
Seperti yang diisyaratkan video teaser, Gemini Omni yang telah lama dinantikan akhirnya datang. Hassabis sendiri naik panggung mengumumkan, "Kami mengambil langkah penting berikutnya—Gemini Omni, sebuah model baru yang dapat membuat konten dari input apa pun".
Penampilannya menjelaskan segalanya. Kali ini Google ingin membangun mesin kreasi AI yang 'serba bisa'. Ini menggabungkan kecerdasan Gemini dengan AI generatif terkuat, memaksimalkan ketiga dimensi: pemahaman dunia, multimodalitas, dan penyuntingan. Intinya, dengan memberikan kombinasi gambar, audio, video, teks apa pun, ia dapat menghasilkan video berkualitas tinggi. Dan, video dapat diedit dengan cara mengobrol.
Yang lebih krusial, Omni tidak hanya 'terlihat seperti', ia benar-benar memahami dunia fisik. Kata-kata asli Hassabis adalah, sistem sebelumnya sering gagal saat mensimulasikan konsep seperti gravitasi, energi kinetik, tetapi Omni mencapai 'perubahan signifikan'. Ia menyuntikkan 'pengetahuan dunia' dan 'kemampuan penalaran' Gemini ke dalam pembuatan video.
-
Beri prompt "Jelaskan pelipatan protein dengan animasi tanah liat", video yang dihasilkan menunjukkan setiap langkah rantai asam amino melipat menjadi heliks alfa dan lipatan beta secara ilmiah akurat, secara visual adalah animasi stop-motion yang indah.
-
Atau misalnya, mengonfigurasi 26 huruf alfabet Inggris dengan objek terkait. C adalah Kapibara, D adalah bola disko, L adalah lampu lava. Omni tidak hanya menempelkan materi, ia benar-benar menghubungkan bahasa, gambar, dan semantik.
Harus diakui, langkah dari realistis ke bermakna, ini terlalu besar.
Di atas panggung, Hassabis mengeluarkan video selfie dan mulai mengeditnya langsung. Lingkaran yang digambar sembarangan di telapak tangan berubah menjadi lubang hitam, jalan tempat berjalan-jalan di sore hari berubah menjadi adegan cyberpunk. Satu kalimat menulis ulang gambar, satu kalimat mengubah dunia. Apa pun dapat menjadi kanvas untuk menciptakan realitas baru. Contoh lain, selfie bermain api di telapak tangan, selembar kertas digambar lingkaran langsung menjadi lubang hitam, berbagai permainan imajinatif dapat diwujudkan.
Dan, ini bukan sekali selesai. Anda dapat melanjutkan obrolan. Video yang dihasilkan Gemini Omni, karakternya konsisten, logika fisiknya valid, memori pemandangannya koheren.
-
Mulai dari cuplikan asli pertunjukan biola. Putaran kedua, "pindahkan pemain biola ke lingkungan gambar ini", lampirkan gambar referensi padang rumput bersalju, pemandangan langsung beralih, gerakan, pencahayaan semuanya menyesuaikan dengan lingkungan baru.
-
Putaran ketiga, "pindahkan kamera ke belakang bahu pemain biola", sudut pandang berputar, tetapi gerakan bermain dan musik benar-benar berkelanjutan.
Tidak peduli bagaimana pemandangan berubah, subjek dalam gambar tidak akan rusak.
Yang membuat orang semakin berpikir, adalah fleksibilitas input Omni. Gambar, teks, video, audio, referensi apa pun dapat dicampurkan sebagai input, menghasilkan output yang koheren. Anda bahkan dapat membuat Avatar sendiri, membuat versi AI dari Anda muncul di adegan apa pun, dengan suara Anda, melakukan hal-hal yang belum pernah Anda lakukan.
Saat ini, Omni Flash telah resmi diluncurkan, versi API akan dibuka dalam beberapa minggu ke depan. Sementara Omni Pro yang lebih kuat juga sedang dalam perjalanan. Berkat kemampuan integrasi kuat Google, Omni telah langsung terintegrasi dengan Gemini App, Google Flow, dan YouTube Shorts, pengguna YouTube Shorts bahkan dapat menggunakannya secara gratis.
Flash Mengungguli Pro: 3.5 Menulis Ulang Definisi 'Flagship'
Setelah Gemini Omni, sorotan utama lain di I/O ini, adalah peluncuran flagship baru Gemini 3.5 Flash. Definisi Google untuknya adalah, model pengkodean dan agen terkuat sejauh ini.
Di tempat, Sundar Pichai sendiri mengumumkan, "3.5 Flash mengungguli Gemini 3.1 Pro di hampir semua tes benchmark"! Ingat, 3.1 Pro adalah model flagship yang Google luncurkan baru tiga bulan lalu, sekarang, model level Flash saja sudah mengunggulinya.
Tak disangka, Google berhasil memberikan hasil yang menakjubkan dalam waktu singkat:
-
Terminal-Bench 2.1 (pengkodean): 76.2%
-
GDPval-AA (tugas Agen dunia nyata): 1656 Elo
-
MCP Atlas (penggunaan alat skala besar): 83.6%
-
CharXiv Reasoning (pemahaman multimodal): 84.2%
Keempat tes benchmark di atas, dibandingkan dengan Gemini 3.1 Pro, 3.5 Flash mengalami lompatan signifikan. Dalam hal kecepatan, 3.5 Flash menempati kuadran sendiri, 289 token/detik, lebih dari 4 kali lebih cepat dari model mutakhir lainnya. Selain itu, 3.5 Flash dalam beberapa tes benchmark, performanya setara, bahkan cukup untuk mengungguli GPT-5.5, Claude Opus 4.7. Harus diakui, 3.5 Flash cepat dan kuat, hampir tak ada lawan.
Parameter terlalu abstrak, lebih baik lihat demonstrasi nyata. Hanya dalam sekejap, 3.5 Flash dapat mencerna makalah akademis yang rumit, dan menulis situs web visualisasi dengan interaksi sempurna. Dalam tugas agen, melalui Antigravity, ia dapat menyelesaikan alur kerja multi-langkah, secara otomatis mengklasifikasikan dan menamai aset yang berserakan. Atau, menggunakan dua Agen, dalam waktu enam jam mereproduksi makalah AlphaZero, dan menulis game yang dapat berjalan lengkap.
93 Agen Membuat OS, Hanya 12 Jam
Dapat dilihat, semua kemampuan 3.5 Flash ini diwujudkan melalui Antigravity 2.0 yang baru. Hari ini, platform pengembangan Agen Google, Antigravity, telah ditingkatkan ke versi 2.0, dari IDE menjadi aplikasi desktop independen, sepenuhnya mengadopsi desain berbasis-Agen.
Varun naik panggung memberikan Demo yang membuat semua orang terpaku. Dia meminta Antigravity menggunakan 3.5 Flash, membangun sistem operasi dari nol. 93 sub-Agen bekerja secara paralel, mengirimkan lebih dari 15000 permintaan model, memproses 2.6 miliar token, 12 jam kemudian, sebuah proyek yang benar-benar kosong menjadi kernel OS yang fungsional lengkap. Scheduler, manajemen memori, sistem file, setiap baris kode ditulis, diuji, diaudit oleh Agen. Biaya API kurang dari $1000.
Kemudian, dia mencoba menjalankan DOOM di sistem operasi yang ditulis AI ini. Upaya pertama gagal, tidak ada driver video dan keyboard. Lalu dia langsung memasukkan perintah perbaikan di Antigravity 2.0, Agen mulai otomatis menulis kode driver. Setelah menunggu sebentar, tampilan DOOM muncul di layar, seluruh ruangan gemuruh.
Kesimpulannya, peningkatan inti yang dibawa Antigravity 2.0 meliputi:
-
Sub-Agen dapat dibuat secara dinamis, Agen utama membagi tugas menjadi sub-tugas dan membagikannya, berjalan paralel tanpa gangguan;
-
Manajemen tugas asinkron membuat operasi yang memakan waktu lama tidak lagi memblokir thread utama;
-
Scheduled Tasks dapat mengatur 'tugas terjadwal' untuk dieksekusi otomatis oleh Agen, misalnya memeriksa status PR sekali sehari, menjalankan skrip pemeriksaan kesehatan setiap jam.
-
Perintah garis miring baru:
/goalmembuat Agen menyelesaikan semuanya sekaligus,/grill-mesebaliknya membuat Agen memahami kebutuhan sebelum bertindak,/browsersecara eksplisit mengontrol penggunaan browser.
Namun, ini semua adalah kemampuan yang telah berjalan internal. Kecepatan pemrosesan token Google dengan Antigravity, pada Maret adalah 500 miliar per hari. Kini, melaju gila 3 triliun per hari. Dan, Flash versi 12 kali lebih cepat ini, mulai hari ini sudah dapat digunakan di Antigravity.
3.5 Flash sekaligus menjadi model default untuk Gemini App dan Mode AI Google Search, untuk semua pengguna global. Pengembang dapat menggunakannya melalui Antigravity 2.0, Gemini API, Google AI Studio. Pengguna korporat dapat mengakses melalui Gemini Enterprise Agent Platform. Yang lebih dahsyat, 3.5 Pro sedang dalam pengujian internal, akan dirilis bulan depan.
Asisten Pribadi 7x24 jam: Google Spark Akhirnya Datang
Rilis besar ketiga malam ini, tentu saja adalah Gemini Spark! Sundar Pichai memberikan posisi yang sangat jelas: Agen AI pribadi Anda. Bahkan ketika laptop ditutup, ia tidak berhenti. Ia berjalan di mesin virtual khusus di cloud, dapat beroperasi 7x24 jam online.
Gemini Spark didukung oleh Gemini 3.5 + kerangka kerja Antigravity, terintegrasi secara mendalam dengan 'paket lengkap perkantoran' Google. Wakil Presiden Produk Josh Woodward naik panggung mendemonstrasikan dua skenario, langsung membuat seluruh ruangan gembira.
-
Pertama adalah skenario kerja: Masukkan perintah, "bantu saya merancang email untuk tim, rangkum semua informasi tentang peluncuran Gemini Live dalam seminggu terakhir". Spark otomatis mengambil informasi dari Gmail, Docs, riwayat obrolan, bahkan memanggil keterampilan 'ghostwriter' yang ditulis Woodward sendiri, membuat email secara otomatis sesuai dengan nada bicara pribadinya. Seluruh proses diselesaikan di latar belakang, manusia hanya perlu meninjau dan mengirim. Benar, Spark mendukung keterampilan kustom (skills), membuatnya belajar cara bicara, preferensi, cara kerja Anda.
-
Kedua adalah skenario kehidupan: Merencanakan pesta lingkungan. Spark setelah menerima tugas, melangkah demi langkah. Ia membuat lembar pelacakan RSVP di Google Sheets, terhubung langsung ke Gmail, siapa yang membalas akan diperbarui otomatis. Untuk tetangga yang belum mendaftar, Spark otomatis menyusun email pengingat, membuat draf dan mengirimkannya setelah dikonfirmasi. Kemudian, ia juga membuat deck presentasi Google Slides, bahkan informasi tentang kastil udara yang akan ditempatkan di lingkungan dituliskan. Sepanjang proses tidak membuka satu pun aplikasi.
Tidak hanya itu, Spark juga memiliki kemampuan input suara yang kuat. Di tempat, Woodward mengeluarkan ponsel, langsung mengirim tiga tugas dengan suara: "Temukan semua rapat dengan Sundar, tandai dengan warna merah muda cerah", "Tulis surat undangan untuk tetangga baru John untuk bergabung dalam daftar pesta blok", "Buat dokumen yang mencantumkan hal-hal yang perlu dilakukan untuk anak sebelum akhir tahun ajaran, diurutkan berdasarkan tenggat waktu".
Suara langsung diubah menjadi instruksi teks, Spark otomatis membagi suara kontinu menjadi tiga thread tugas independen, dijalankan paralel di latar belakang.
Dalam hal harga, langganan AI Ultra $100 per bulan dapat menggunakan Spark Beta. Paket Ultra tertinggi turun dari $250 menjadi $200. Spark akan membuka Beta untuk pengguna AI Ultra AS mulai minggu depan.
Malam Ini, Google Membuka Pintu Masuk ASI
Melihat kembali I/O ini, yang benar-benar membuat bulu kuduk merinding, bukan satu produk tertentu. Melainkan semua kemampuan datang bersamaan.
Pemahaman multimodal penuh, generasi multimodal penuh, Agen online 24 jam—ketiga potongan teka-teki ini, Google satukan dalam satu malam. Omni mengubah satu kalimat menjadi dunia, tidak memerlukan manusia menyediakan materi apa pun; 93 Agen membuat sistem operasi dari nol, tidak memerlukan manusia menulis satu baris kode; Spark bekerja untuk Anda 7×24 jam, tidak memerlukan manusia membuka satu aplikasi.
Ketika AI tidak lagi memerlukan manusia 'memberi bahan', tetapi memahami, memutuskan, mengeksekusi, dan mengulangi sendiri—tujuan jalan ini, disebut ASI (Kecerdasan Super).
Tidak ada yang bisa memberikan jadwal pasti. Tetapi Google I/O malam ini, membuat semua orang menyadari satu hal: Di jalan menuju kecerdasan super, sudah tidak ada hambatan 'secara teknis tidak dapat dilakukan'. Sisanya, hanya kecepatan penyebaran rekayasa. Enam bulan lalu kita masih memperdebatkan apakah AGI adalah gelembung. Enam bulan kemudian, Google sudah menggunakan Agen untuk menulis sistem operasi. Akselerasi industri ini, telah melampaui jangkauan intuisi manusia.
Referensi:
-
https://youtu.be/wYSncx9zLIU
-
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/
-
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni/
-
https://antigravity.google/blog/introducing-google-antigravity-2-0
-
https://antigravity.google/blog/google-io-2026-feature-deep-dive
Editor: Peach Moses







































