Versi Video Nano Banana Sudah Hadir: Dilengkapi Pengetahuan Dunia Gemini, Buat Gambar Cuma Perlu 4 Detik

marsbit发布于2026-07-01更新于2026-07-01

文章摘要

Versi video dari Nano Banana telah hadir: dilengkapi dengan pengetahuan dunia Gemini, versi asli "Banana" dapat menghasilkan gambar hanya dalam 4 detik. Google telah membuka API untuk Gemini Omni Flash, yang mengintegrasikan kemampuan penalaran multimodal dengan generasi dan penyuntingan video. Model ini dapat menghasilkan video berkualitas tinggi dari input teks, gambar, atau video, dengan fitur seperti penyuntingan percakapan, referensi multimodal, dan sinkronisasi teks dengan gerakan. Biayanya kompetitif: $0.10 per detik video. Sementara itu, Nano Banana 2 Lite (gemini-3.1-flash-lite-image) dirancang untuk kecepatan ekstrem, menghasilkan gambar 1K dalam sekitar 4 detik dengan biaya sekitar $0.034 per gambar. Kemampuan render teksnya tetap unggul. Keajaiban sebenarnya, menurut Google, adalah menggabungkan kedua model ini. Pengguna dapat membuat gambar cepat dengan Nano Banana 2 Lite, lalu menggunakannya sebagai referensi untuk Gemini Omni Flash guna membuat video secara mulus. Tiga aplikasi demo menunjukkan alur kerja ini: "Anywhere" untuk foto perjalanan dinamis, "Space Lift" untuk tur virtual desain interior, dan "Omni Product Studio" untuk membuat materi iklan e-commerce dari gambar produk. Pendekatan multimodal Google ini membuka potensi besar untuk aplikasi praktis di bidang e-commerce, desain, dan pembuatan konten pendek, memanfaatkan ekosistem Android untuk komersialisasi. Meskipun kemampuan coding masih menjadi tantangan, Google memperkuat posisinya di bidang mu...

Coding-nya masih amburadul, tapi Google emang jago soal "multimodal".

Gemini Omni Flash resmi buka API, Nano Banana versi video.

Mimpi 'Harry Potter' ala tukang kayu bukan lagi khayalan. Lihat sendiri empat trik digital yang dipamerin Gemini Omni ini:

Gila, konsistensi dan kejelasan teksnya! Buat apa lagi green screen dan efek spesial, langsung live aja jadi Doctor Strange.

Sekalian, si "banana" yang dinanti-nanti, juga dapet versi "kecepatan cahaya".

Nano Banana 2 Lite: Model gambar Gemini tercepat dan paling hemat biaya sejauh ini.

Nggak lebay — cuma butuh 4 detik buat bikin satu gambar, resolusi 1K cuma sekitar 2 rupiah lebih.

Dibandingin sama Nano Banana 2, kecepatannya bener-bener melesat.

Apalagi kalo disandingin sama GPT Image 2 yang butuh 3 menit buat bikin satu gambar...

Pantasan Gemini 3.5 Pro lama nggak keluar, ternyata waktunya habis buat ngurusi multimodal yang didamba-dambakan ya, Hassabis!!

Gemini Omni Flash

Gemini Omni Flash yang pertama kali muncul di Google I/O 2026, ngabisin kemampuan nalar multimodal Gemini sama generasi dan editing video, langsung menarik perhatian.

Sekarang, model ini udah resmi dibuka buat developer lewat Gemini API dan Google AI Studio. Bisa buat bikin dan edit video kualitas tinggi dengan mudah, berdasarkan teks, gambar, video, dan input lainnya.

Empat kemampuan kunci:

Editing video conversational: Ubah dan poles video pake bahasa natural, kayak ngedit dokumen di Feishu.

Referensi multimodal: Kombinasikan input gambar, teks, video, buat kontrol dan konsistensi adegan.

Pengetahuan dunia nyata: Manfaatin pengetahuan Gemini soal sejarah, biologi, logika narasi buat bikin video, nggak perlu nulis deskripsi gaya arsitektur tiga halaman.

Sinkronisasi teks dan aksi: Hubungkan teks dan grafis langsung ke aksi video dengan prompt sederhana.

Harganya juga kompetitif: Biaya output video per detik US$0.10, sejajar sama Veo 3.1 Fast.

Dari segi posisi, sama-sama model generasi video versi ringan, Omni Flash lebih nandain pengetahuan dunia Gemini, dan secara ekosistem juga nyenderin ke lapisan Gemini.

Tapi Google juga jujur, ngasih tau sendiri segudang batasan buat saat ini:

1. Saat ini cuma support generasi video 10 detik, bakal support lebih lama nanti;

2. Belum support upload referensi audio dan ekspansi adegan;

3. API support video sampai 3 detik sebagai materi referensi, tapi modelnya belum bisa proses input jenis ini dengan benar;

4. Konsistensi karakter saat ganti adegan dan pergerakan kamera masih terbatas.

Nano Banana 2 Lite

Nano Banana 2 Lite (alias gemini-3.1-flash-lite-image), dirancang khusus buat pemrosesan super cepat.

Setelah dioptimasi khusus, targetnya adalah aplikasi real-time yang super sensitif sama delay dan butuh proses banyak gambar dalam waktu singkat — kayak pembuatan materi e-commerce massal, iterasi kreatif iklan yang cepet, pipeline konten otomatis.

Dua poin jualan utama —

Kecepatan cahaya: Delay pembuatan gambar sekitar 4 detik, seperlima dari Nano Banana 2 (yang sekitar 20 detik).

Harga tempe: Satu gambar 1K cuma sekitar US$0.034, setengah harga Nano Banana 2, seperempat harga Nano Banana Pro.

Kecepatan dikebut, harga dipangkas, tapi kemampuan bikin gambar dan edit gambar nggak berkurang banyak. Nano Banana 2 Lite tetep jaga efek render teks yang bagus, di benchmark sejajar sama model kayak Grok.

Makanya saran Google: Kalo masih nekat pake Nano Banana generasi pertama, cepat ganti. Versi Lite udah ngalahin di semua metrik kunci.

Dua Pedang Bersatu

Tunggu dulu, jangan buru-buru pergi.

Kirain cuma rilis dua model paralel, ternyata Google bilang: Masih ada yang baru.

Keajaiban sebenarnya, adalah saat model-model ini dipakai berantai.

Seperti yang kita tau, pembuatan AIGC butuh iterasi berulang, manajemen materinya ribet banget.

Sekarang, dengan dua model ini, akhirnya nggak perlu upload file berulang-ulang, generasi gambar dan kreasi video nyambung seamless.

Secara spesifik, bisa pake Nano Banana 2 Lite buat bikin gambar super cepat, terus gambar yang udah jadi itu dipake sebagai materi referensi buat Gemini Omni Flash, langsung diubah jadi video.

Buat nunjukin Workflow ajaib 1+1>2 ini, Google bikin 3 Demo APP khusus:

1. Anywhere

Selfie atau upload foto, NB2 Lite langsung 'photoshop' kamu ke puluhan landmark dunia.

Terus klik gambarnya, Omni Flash ubah landmark statis jadi klip video dinamis.

Wisata siber, sekarang juga end-to-end.

2. Space Lift

Ini agak serem, kayaknya kalo dikombinin sama model dunia Genie, masa depan bakal ancam banyak perusahaan SaaS desain interior tradisional.

Upload foto ruangan, NB2 Lite keluarin berbagai opsi gaya desain. Pilih yang suka, klik tombol video, Omni langsung kasih kamu tur ruangan level film.

3. Omni product studio

Kabar gembira buat cross-border e-commerce.

Foto produk dengan latar putih, NB2 Lite keluarin berbagai gambar produk kontekstual, Omni Flash ubah gambar statis jadi video pendek e-commerce.

Dari "produk" ke "materi iklan", alurnya otomatis semua.

Jadi, multimodal itu buat apa sih?

Pertanyaan ini pasti sering banget ditanyain ke Google.

Apalagi di tahun 2026, Coding hampir identik sama tingkat kecerdasan model. Semua perusahaan mati-matian adu Coding.

Ngeyel banget soal multimodal, ngapain sih?

Narasi AGI nggak usah dibahas, dalam jangka pendek, model multimodal Google ini bener-bener bisa kasih tenaga ke banyak produknya.

Narasi AGI nggak usah dikembangkan. Dalam jangka pendek, model multimodal Google ini bener-bener bisa kasih tenaga ke banyak produknya — Stitch salah satunya, fitur edit foto di Pixel satu lagi, NotebookLM yang muncul tiba-tiba juga cukup wow.

Dua model baru yang dirilis kali ini, bikin orang liat lebih banyak potensi multimodal di skenario vertikal yang spesifik. E-commerce, desain interior, video pendek... permintaan bisnis ini nyata, duitnya juga nyata.

Ditambah dukungan ekosistem Android, nggak perlu terlalu khawatir soal komersialisasi.

Coding mungkin masih susah dikejar Google, tapi di meja permainan multimodal, Google mungkin satu-satunya pemain yang bisa kumpulin satu set kartu lengkap.

Tapi...

Gemni 3.5 Pro kapan datengnya sih!!!

Referensi:[1]https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/

Artikel ini berasal dari akun WeChat publik "量子位", penulis: Perhatian Teknologi Terdepan

热门币种推荐

相关问答

QApa itu Gemini Omni Flash dan apa saja empat kemampuan utamanya?

AGemini Omni Flash adalah model generasi video multimodal dari Google yang baru saja membuka API-nya. Empat kemampuannya adalah: 1. Penyuntingan video secara percakapan. 2. Referensi multimodal untuk kontrol adegan dan konsistensi. 3. Pengetahuan dunia nyata dari Gemini. 4. Sinkronisasi teks dan aksi dalam video.

QApa keunggulan utama dari Nano Banana 2 Lite (gemini-3.1-flash-lite-image)?

ANano Banana 2 Lite dirancang untuk kecepatan dan biaya rendah. Keunggulan utamanya adalah kecepatan menghasilkan gambar hanya dalam 4 detik dan biaya yang sangat ekonomis, yaitu sekitar 0,034 dolar untuk satu gambar resolusi 1K.

QBagaimana cara kerja gabungan antara Nano Banana 2 Lite dan Gemini Omni Flash menurut artikel?

AKedua model dapat digunakan secara beruntun untuk menciptakan alur kerja yang efisien. Pengguna dapat membuat gambar cepat dengan Nano Banana 2 Lite, lalu langsung menggunakan gambar tersebut sebagai referensi untuk membuat video dinamis dengan Gemini Omni Flash, sehingga proses pembuatan konten menjadi mulus.

QApa saja contoh aplikasi demo yang ditunjukkan Google yang menggunakan kombinasi kedua model tersebut?

AGoogle menunjukkan tiga aplikasi demo: 1. Anywhere (membuat foto perjalanan dan video dari foto diri). 2. Space Lift (mendesain ulang ruangan dan membuat tur video). 3. Omni Product Studio (membuat gambar dan video produk untuk e-commerce).

QApa keterbatasan yang disebutkan Google untuk Gemini Omni Flash saat ini?

AKeterbatasan Gemini Omni Flash saat ini adalah: 1. Hanya mendukung pembuatan video 10 detik. 2. Belum mendukung audio referensi atau ekstensi adegan. 3. API mendukung video referensi hingga 3 detik, tetapi model belum dapat memproses input tersebut dengan benar. 4. Konsistensi karakter saat transisi adegan masih terbatas.

你可能也喜欢

稳定币是加密世界的“保皇派”:Open USD 让旧货币体系亲自下场

Open USD的推出标志着稳定币竞争进入新阶段,由140多家传统金融、科技和加密机构组成的联盟共同参与,使其从创业公司的产品之争升级为基础设施之争。学者胡翌霖指出,稳定币并非加密革命的温和派,而是旧货币体系内部的“保皇派改革”——它利用区块链提升效率,却依然维护美元和美联储的中心地位。真正的加密革命需挑战更根本的前提:市场是否必须依赖央行作为货币秩序的核心。 Open USD由Visa、万事达、贝莱德、谷歌、Coinbase等巨头联合推出,允许企业零成本铸造赎回,并将储备收益分配给合作伙伴。这直接威胁到USDC等现有稳定币的商业模式。胡翌霖认为,其象征意义在于传统金融体系亲自下场主导稳定币网络,反衬出原生稳定币创业者的尴尬:若其目标仅是提升旧体系效率,那么当旧体系采纳该技术后,其革命性便宣告终结。 胡翌霖将稳定币比作天文学史上的第谷体系:虽吸收新技术,却拒绝“地球动起来”的核心革命。稳定币反对的是低效的支付网络与金融中介,而非美元本位本身。它更像是美元霸权的“区块链升级包”,可能强化而非削弱美元体系。如果链上金融全面以美元稳定币计价,繁荣的链上活动反而可能巩固链下传统金融资产的价值,使加密本币(如ETH)沦为单纯的“燃料”,难以获得货币性溢价。 因此,胡翌霖强调,追求文明级变革的加密项目(如比特币)不应将叙事降格为手续费经济,而必须坚持“去中心化”的核心,无论是通过币本位、抗审查还是开放治理。真正的“哥白尼时刻”在于让人们相信:市场交易与货币价值可以自发形成,无需一个固定的央行作为中心。稳定币可作为过渡工具,但若加密世界最终仍围绕美元旋转,则革命尚未成功。

链捕手1小时前

稳定币是加密世界的“保皇派”:Open USD 让旧货币体系亲自下场

链捕手1小时前

渣打接管 USDC 入口,Circle 让权换规模

渣打银行与Circle联合宣布,机构客户现可通过渣打账户体系直接进行USDC的铸造与赎回,无需在Circle单独开户。该服务率先在迪拜国际金融中心推出,未来将视监管情况拓展。 此举标志着全球系统重要性银行首次正面接管稳定币的“印钞”入口。对于养老金、主权基金等大型合规机构而言,他们此前因风控与合规门槛难以直接使用USDC,如今可通过其信任的银行渠道安全接入,相当于将USDC转化为“银行账户内的一个选项”,有望吸引巨量传统资金入场。 对Circle而言,这是一笔战略性交易:让渡部分前端客户关系,换取借助渣打成熟渠道触达以往难以突破的大型机构客户,从而提升USDC的整体发行规模与利息收入核心业务。对渣打而言,则无需自行发币,即可利用现有信用网络提供数字资产服务并收取费用。 双方形成了新的分工:Circle专注规模与信用背书,渣打则扮演合规入口与分销渠道。选择迪拜首发,意在利用其友好的监管环境进行模式试验,再向其他市场复制。 此事更深层的意义在于叙事转变:稳定币不再意图绕开传统金融体系,而是被整合进主流银行的资产负债表与产品货架,其机构层面的合法性问题已基本解决。未来的竞争焦点将转向在发行方、银行渠道与合规牌照的新组合中,谁更贴近客户并掌握定价权。

marsbit4小时前

渣打接管 USDC 入口,Circle 让权换规模

marsbit4小时前

‘芝加哥的最后一笔交易?’ – CFTC主席警告勿实施新0.2%加密货币税

伊利诺伊州于7月通过了一项对每笔加密货币交易征收0.2%的“一揽子”税,该政策作为州财政预算的一部分持续引发强烈反对。美国商品期货交易委员会主席罗斯汀·贝纳姆批评了州立法者,警告该法律可能使芝加哥丧失其金融市场地位。他在一篇评论文章中认为,这项惩罚性税法并无必要,并指出联邦政府已在推进更为审慎的《CLARITY法案》。芝加哥商业交易所作为全球最大衍生品交易所,总部设在伊利诺伊州并提供全天候加密货币交易。贝纳姆警告,此类措施将导致投资者逃离该州,这可能成为芝加哥的“最后一笔交易”。Coinbase首席法务官保罗·格鲁瓦尔也谴责该税法是愚蠢政策之一。该州税法将于2027年1月生效。尽管《CLARITY法案》旨在支持创新、引导加密业务在岸发展并保护相关就业,但其与税收关系不大。目前该法案在参议院受阻,且即使通过也无法提供加密货币税收减免。美国国会众议院已审议七项涉及加密货币税收的提案,旨在解决关键问题,但鉴于11月中期选举前的紧张日程,这些提案的立法进程可能仍需时日。总体而言,税收提案可能在选举后获得新的推动力,而加密货币税法的进展速度也将取决于中期选举后由谁控制国会。

ambcrypto4小时前

‘芝加哥的最后一笔交易?’ – CFTC主席警告勿实施新0.2%加密货币税

ambcrypto4小时前

交易

现货

热门文章

如何购买4

欢迎来到HTX.com!我们已经让购买4(4)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买4(4)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的4(4)购买完您的4(4)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易4(4)在HTX的现货市场轻松交易4(4)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

1.4k人学过发布于 2025.10.20更新于 2026.06.02

如何购买4

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对4(4)币价的意见。

活动图片