Coding-nya masih amburadul, tapi Google emang jago soal "multimodal".
Gemini Omni Flash resmi buka API, Nano Banana versi video.
Mimpi 'Harry Potter' ala tukang kayu bukan lagi khayalan. Lihat sendiri empat trik digital yang dipamerin Gemini Omni ini:
Gila, konsistensi dan kejelasan teksnya! Buat apa lagi green screen dan efek spesial, langsung live aja jadi Doctor Strange.
Sekalian, si "banana" yang dinanti-nanti, juga dapet versi "kecepatan cahaya".
Nano Banana 2 Lite: Model gambar Gemini tercepat dan paling hemat biaya sejauh ini.
Nggak lebay — cuma butuh 4 detik buat bikin satu gambar, resolusi 1K cuma sekitar 2 rupiah lebih.

Dibandingin sama Nano Banana 2, kecepatannya bener-bener melesat.
Apalagi kalo disandingin sama GPT Image 2 yang butuh 3 menit buat bikin satu gambar...
Pantasan Gemini 3.5 Pro lama nggak keluar, ternyata waktunya habis buat ngurusi multimodal yang didamba-dambakan ya, Hassabis!!
Gemini Omni Flash
Gemini Omni Flash yang pertama kali muncul di Google I/O 2026, ngabisin kemampuan nalar multimodal Gemini sama generasi dan editing video, langsung menarik perhatian.
Sekarang, model ini udah resmi dibuka buat developer lewat Gemini API dan Google AI Studio. Bisa buat bikin dan edit video kualitas tinggi dengan mudah, berdasarkan teks, gambar, video, dan input lainnya.
Empat kemampuan kunci:
Editing video conversational: Ubah dan poles video pake bahasa natural, kayak ngedit dokumen di Feishu.
Referensi multimodal: Kombinasikan input gambar, teks, video, buat kontrol dan konsistensi adegan.
Pengetahuan dunia nyata: Manfaatin pengetahuan Gemini soal sejarah, biologi, logika narasi buat bikin video, nggak perlu nulis deskripsi gaya arsitektur tiga halaman.
Sinkronisasi teks dan aksi: Hubungkan teks dan grafis langsung ke aksi video dengan prompt sederhana.

Harganya juga kompetitif: Biaya output video per detik US$0.10, sejajar sama Veo 3.1 Fast.
Dari segi posisi, sama-sama model generasi video versi ringan, Omni Flash lebih nandain pengetahuan dunia Gemini, dan secara ekosistem juga nyenderin ke lapisan Gemini.
Tapi Google juga jujur, ngasih tau sendiri segudang batasan buat saat ini:
1. Saat ini cuma support generasi video 10 detik, bakal support lebih lama nanti;
2. Belum support upload referensi audio dan ekspansi adegan;
3. API support video sampai 3 detik sebagai materi referensi, tapi modelnya belum bisa proses input jenis ini dengan benar;
4. Konsistensi karakter saat ganti adegan dan pergerakan kamera masih terbatas.
Nano Banana 2 Lite
Nano Banana 2 Lite (alias gemini-3.1-flash-lite-image), dirancang khusus buat pemrosesan super cepat.
Setelah dioptimasi khusus, targetnya adalah aplikasi real-time yang super sensitif sama delay dan butuh proses banyak gambar dalam waktu singkat — kayak pembuatan materi e-commerce massal, iterasi kreatif iklan yang cepet, pipeline konten otomatis.
Dua poin jualan utama —
Kecepatan cahaya: Delay pembuatan gambar sekitar 4 detik, seperlima dari Nano Banana 2 (yang sekitar 20 detik).
Harga tempe: Satu gambar 1K cuma sekitar US$0.034, setengah harga Nano Banana 2, seperempat harga Nano Banana Pro.
Kecepatan dikebut, harga dipangkas, tapi kemampuan bikin gambar dan edit gambar nggak berkurang banyak. Nano Banana 2 Lite tetep jaga efek render teks yang bagus, di benchmark sejajar sama model kayak Grok.

Makanya saran Google: Kalo masih nekat pake Nano Banana generasi pertama, cepat ganti. Versi Lite udah ngalahin di semua metrik kunci.
Dua Pedang Bersatu
Tunggu dulu, jangan buru-buru pergi.
Kirain cuma rilis dua model paralel, ternyata Google bilang: Masih ada yang baru.
Keajaiban sebenarnya, adalah saat model-model ini dipakai berantai.
Seperti yang kita tau, pembuatan AIGC butuh iterasi berulang, manajemen materinya ribet banget.
Sekarang, dengan dua model ini, akhirnya nggak perlu upload file berulang-ulang, generasi gambar dan kreasi video nyambung seamless.
Secara spesifik, bisa pake Nano Banana 2 Lite buat bikin gambar super cepat, terus gambar yang udah jadi itu dipake sebagai materi referensi buat Gemini Omni Flash, langsung diubah jadi video.
Buat nunjukin Workflow ajaib 1+1>2 ini, Google bikin 3 Demo APP khusus:
1. Anywhere
Selfie atau upload foto, NB2 Lite langsung 'photoshop' kamu ke puluhan landmark dunia.
Terus klik gambarnya, Omni Flash ubah landmark statis jadi klip video dinamis.
Wisata siber, sekarang juga end-to-end.
2. Space Lift
Ini agak serem, kayaknya kalo dikombinin sama model dunia Genie, masa depan bakal ancam banyak perusahaan SaaS desain interior tradisional.
Upload foto ruangan, NB2 Lite keluarin berbagai opsi gaya desain. Pilih yang suka, klik tombol video, Omni langsung kasih kamu tur ruangan level film.
3. Omni product studio
Kabar gembira buat cross-border e-commerce.
Foto produk dengan latar putih, NB2 Lite keluarin berbagai gambar produk kontekstual, Omni Flash ubah gambar statis jadi video pendek e-commerce.
Dari "produk" ke "materi iklan", alurnya otomatis semua.
Jadi, multimodal itu buat apa sih?
Pertanyaan ini pasti sering banget ditanyain ke Google.
Apalagi di tahun 2026, Coding hampir identik sama tingkat kecerdasan model. Semua perusahaan mati-matian adu Coding.
Ngeyel banget soal multimodal, ngapain sih?
Narasi AGI nggak usah dibahas, dalam jangka pendek, model multimodal Google ini bener-bener bisa kasih tenaga ke banyak produknya.
Narasi AGI nggak usah dikembangkan. Dalam jangka pendek, model multimodal Google ini bener-bener bisa kasih tenaga ke banyak produknya — Stitch salah satunya, fitur edit foto di Pixel satu lagi, NotebookLM yang muncul tiba-tiba juga cukup wow.
Dua model baru yang dirilis kali ini, bikin orang liat lebih banyak potensi multimodal di skenario vertikal yang spesifik. E-commerce, desain interior, video pendek... permintaan bisnis ini nyata, duitnya juga nyata.
Ditambah dukungan ekosistem Android, nggak perlu terlalu khawatir soal komersialisasi.
Coding mungkin masih susah dikejar Google, tapi di meja permainan multimodal, Google mungkin satu-satunya pemain yang bisa kumpulin satu set kartu lengkap.
Tapi...
Gemni 3.5 Pro kapan datengnya sih!!!

Referensi:[1]https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/
Artikel ini berasal dari akun WeChat publik "量子位", penulis: Perhatian Teknologi Terdepan






