视频版Nano Banana来了:内置Gemini世界知识,原版香蕉出图仅需4秒

marsbitXuất bản vào 2026-07-01Cập nhật gần nhất vào 2026-07-01

Tóm tắt

谷歌发布两款新型多模态AI模型:视频生成模型Gemini Omni Flash与高速图像生成模型Nano Banana 2 Lite。 Gemini Omni Flash融合了Gemini的世界知识与视频生成能力,支持通过文本、图像或视频输入生成或编辑高质量视频,具备对话式编辑、多模态参考等核心功能,生成成本约为每秒0.10美元。不过目前仅支持生成10秒视频,且人物一致性等方面仍有局限。 Nano Banana 2 Lite则主打高速与经济性,生成一张1K分辨率图像仅需约4秒、成本约0.034美元,速度达前代产品的5倍,且文字渲染效果出色。 谷歌特别展示了将两款模型串联使用的应用潜力:可先用Nano Banana 2 Lite快速生成图像,再交由Omni Flash转化为动态视频,并演示了“赛博旅游”、“虚拟装修预览”和“电商短视频自动生成”三个具体场景,体现了多模态AI在垂直领域的落地价值。尽管在代码能力上不占优势,但谷歌正凭借其多模态技术布局,深入电商、内容创作等实用赛道,探索差异化的AGI发展路径。

虽然Coding还是一坨,但谷歌搞「多模态」确实有两把刷子。

Gemini Omni Flash正式开放API,视频版Nano Banana

麻瓜爆改「哈利波特」不再是梦想。且看官方用Gemini Omni表演的这四个数字魔术:

太离谱了,这一致性和文字清晰度,还要啥绿幕和特效,直接现场直播奇异博士。

与此同时,大家心心念念的「香蕉」,也迎来了「光速版」。

Nano Banana 2 Lite:迄今为止最快、最经济高效的Gemini图像模型。

毫不夸张——4秒出一张图,1K分辨率图像仅需约2毛多

和Nano Banana 2放在一起对比,这个速度,简直起飞了。

更别说一次生图能干3分钟的GPT Image 2......

怪不得半天没憋出来Gemini 3.5 Pro,敢情时间全花在心心念念的多模态上了是吧,哈萨比斯!!

Gemini Omni Flash

Google I/O 2026大会上首次亮相的Gemini Omni Flash,把Gemini的多模态推理能力与视频生成、编辑深度结合,当时就引发了不少关注。

如今,这个模型已通过Gemini API和Google AI Studio正式向开发者开放。能基于文本、图像和视频等多种输入,轻松生成高质量视频并进行编辑。

四项关键能力:

对话式视频编辑:用自然语言修改和精修视频,跟改飞书文档似的。

多模态参考:组合图像、文本、视频输入,保持场景控制和一致性。

现实世界知识:调用Gemini在历史、生物、叙事逻辑等方面的知识来构建视频,不用你再写三页Prompt描述建筑风格。

文字与动作同步:通过简单提示词,将文字和图形直接连接到视频动作。

价格也很有竞争力:每秒视频输出成本0.10美元,跟Veo 3.1 Fast持平。

定位方面,同为轻量版视频生成模型,Omni Flash更强调Gemini世界知识,生态方面也是全面朝Gemini层靠拢的。

不过谷歌也挺坦诚,主动列了一堆现阶段局限:

1、目前只支持10秒视频生成,后续会支持更长;

2、暂不支持音频参考上传和场景扩展;

3、API支持最长3秒的视频作为参考素材,但目前模型还无法正确处理这类输入;

4、场景切换和运镜时的人物一致性仍有局限。

Nano Banana 2 Lite

Nano Banana 2 Lite(又名gemini-3.1-flash-lite-image),专为高速处理而设计。

经过针对性优化,它瞄准的是那些对延迟极度敏感、需要短时间内批量处理大量图像的实时应用场景——比如电商素材批量生成、广告创意快速迭代、自动化内容流水线。

两大核心卖点——

光速:出图延迟约4秒,是Nano Banana 2的五分之一(后者约20秒)。

白菜价:一张1K图片仅需约0.034美元,是Nano Banana 2的一半,Nano Banana Pro的四分之一。

速度砍了,价格砍了,但生图和图像编辑能力并没有明显缩水。Nano Banana 2 Lite 依然保持了出色的文字渲染效果,在benchmark上和Grok等模型处于同一水平线。

因此谷歌的建议是:如果你还在贪便宜用初代Nano Banana,赶紧换。Lite版在各项关键指标上已经全方位碾压了。

双剑合璧

等等,先别走。

本以为这只是两款并行的模型发布,没想到谷歌表示:还有新花样。

真正的神奇之处,在于将这些模型串联起来使用。

众所周知,AIGC创作需要反复迭代,素材管理相当麻烦。

如今,借助这两个模型,终于不用再反复上传文件了,图像生成与视频创作无缝衔接。

具体来说,可以先用Nano Banana 2 Lite高速出图,再把生成的图像作为参考素材喂给 Gemini Omni Flash,一键转化为视频。

为了展示这套1+1>2的魔法Workflow,谷歌甚至专门做了3个Demo APP:

1、Anywhere

自拍一张或上传照片,NB2 Lite瞬间把你P到几十个地标景点里。

接着点一下图片,Omni Flash把静态景点变成动态短片。

赛博旅游,这下也端到端了。

2、Space Lift

这有点吓人,感觉再和Genie世界模型结合一下,未来怕是要威胁到不少传统装修方案SaaS公司。

上传一张房间照片,NB2 Lite先出各种装修风格方案。找到喜欢的,点视频按钮,Omni能直接给你一段电影级空间漫游。

3、Omni product studio

跨境电商的福音来了。

给产品拍张白底图,NB2 Lite出各种场景化商品图,Omni Flash再把静态图变成电商短视频。

从「产品」到「广告素材」,全链路自动跑完。

所以,多模态到底有什么用?

这个问题谷歌肯定被问了无数次。

尤其在2026年,Coding几乎等同于模型智商的代名词。每家都在Coding上往死里卷。

死磕多模态,图什么?

AGI叙事那一套就不说了,短期来看的话,谷歌这套多模态模型确实能赋能旗下不少产品。

AGI叙事那一套就不展开了。短期来看,谷歌这套多模态模型确实能赋能旗下不少产品——Stitch是一个,Pixel内置的P图是一个,NotebookLM的横空出世也蛮惊艳。

这次发的两个新模型,则让人看到了多模态在垂直场景落地的更多潜力。电商、装修、短视频......这些业务的需求是真的,钱也是真的。

加上有安卓生态加持,基本不用太担心商业化的问题。

Coding谷歌暂时追不上,但多模态这张牌桌,谷歌可能是唯一能组齐一套牌的玩家。

不过......

Gemni 3.5 Pro到底啥时候来啊!!!

参考链接:[1]https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/

本文来自微信公众号“量子位”,作者:关注前沿科技

Tiền kỹ thuật số thịnh hành

Câu hỏi Liên quan

Q文章介绍的两款新模型分别叫什么名字,它们的核心定位是什么?

A文章介绍了Gemini Omni Flash和Nano Banana 2 Lite两款新模型。Gemini Omni Flash是一个轻量级视频生成模型,核心定位是将Gemini的多模态推理能力与视频生成、编辑深度结合,强调利用Gemini的世界知识。Nano Banana 2 Lite(又称gemini-3.1-flash-lite-image)则是一个图像生成模型,专为高速、低成本处理大量图像而设计,瞄准对延迟极度敏感的实时应用场景。

QNano Banana 2 Lite的图像生成速度和成本是多少?

ANano Banana 2 Lite出图延迟约为4秒,一张1K分辨率图像的生成成本约为0.034美元(约合人民币两毛多)。其速度是前代Nano Banana 2的五分之一(后者约20秒),价格是后者的一半。

Q根据文章,Gemini Omni Flash具备哪四项关键能力?

AGemini Omni Flash具备四项关键能力:1. 对话式视频编辑:用自然语言修改和精修视频。2. 多模态参考:组合图像、文本、视频输入,保持场景控制一致性。3. 现实世界知识:调用Gemini在历史、生物等领域的知识来构建视频,无需复杂的描述。4. 文字与动作同步:通过简单提示词,将文字和图形直接连接到视频动作中。

Q文章提到谷歌展示了哪三个Demo APP来体现两个新模型的协同工作流程?

A谷歌展示了三个Demo APP来体现图像生成模型Nano Banana 2 Lite与视频生成模型Gemini Omni Flash的协同工作流程:1. Anywhere:用户上传自拍,NB2 Lite将用户P到地标景点照片中,Omni Flash再将静态景点图片转为动态短片。2. Space Lift:上传房间照片,NB2 Lite生成装修方案图,Omni Flash将选定方案生成电影级空间漫游视频。3. Omni product studio:上传产品白底图,NB2 Lite生成场景化商品图,Omni Flash将其转为电商短视频。

Q文章认为谷歌在多模态领域的优势是什么?

A文章认为,在当前众多厂商“死磕”代码能力(Coding)的情况下,谷歌在多模态领域持续投入并推出了Gemini Omni Flash和Nano Banana 2 Lite等模型,展示了多模态在电商、装修、短视频等垂直场景落地的潜力。凭借其自身产品生态(如Stitch、Pixel、NotebookLM)和安卓生态的加持,商业化前景明确。作者认为,在多模态这张牌桌上,谷歌可能是“唯一能组齐一套牌的玩家”。

Nội dung Liên quan

Lượng xem kênh YouTube về tiền điện tử giảm 70% vào năm 2026, cuộc khủng hoảng chú ý của nhà đầu tư nhỏ lẻ đang viết lại chu kỳ tiếp theo

Tác giả Liam 'Akiba' Wright phân tích sự sụt giảm đáng kể trong lượt xem hàng tháng của các kênh YouTube về tiền điện tử lớn vào năm 2026 so với tháng 1/2025, với mức giảm từ 27% đến gần 79%. Mặc dù số lượng người đăng ký vẫn cao, lượt xem hiện tại - đại diện cho sự chú ý tích cực - đã giảm mạnh, cho thấy sự chuyển hướng hoặc phân tán chú ý của các nhà đầu tư nhỏ lẻ. Dữ liệu từ các kênh như Coin Bureau, Crypto Banter, Altcoin Daily và Benjamin Cowen cho thấy lượng xem hàng ngày hiện thấp hơn nhiều so với đỉnh năm 2021. Điều này phản ánh một chu kỳ thị trường mới, nơi Bitcoin có thể được hỗ trợ bởi ETF và tổ chức, trong khi sự quan tâm của giới retail trở nên kém đồng đều và tập trung hơn vào một số ít kênh có nội dung phân tích chất lượng. Sự mệt mỏi trên mạng xã hội và việc người dùng chặn nội dung crypto cũng là tín hiệu cho thấy sự chú ý đang phân mảnh. Bài viết kết luận rằng tín hiệu cho một chu kỳ retail tiếp theo có thể sẽ xuất hiện đầu tiên thông qua sự phục hồi trong tốc độ xem hàng tháng/hàng ngày trên YouTube, trước khi số lượng người đăng ký thay đổi, đánh dấu sự trở lại của sự tò mò và chú ý từ các nhà đầu tư cá nhân.

marsbit47 phút trước

Lượng xem kênh YouTube về tiền điện tử giảm 70% vào năm 2026, cuộc khủng hoảng chú ý của nhà đầu tư nhỏ lẻ đang viết lại chu kỳ tiếp theo

marsbit47 phút trước

Đã được xác nhận: Claude Code lén kiểm tra người dùng, múi giờ và phòng thí nghiệm AI Trung Quốc đều là từ khóa

Hôm nay, Anthropic công bố Claude Sonnet 5 và thông báo Bộ Thương mại Mỹ dỡ bỏ lệnh hạn chế xuất khẩu đối với các mô hình Claude Fable 5 và Mythos 5. Tuy nhiên, cộng đồng nhà phát triển tập trung vào một vụ việc gây tranh cãi khác: Claude Code bị phát hiện thu thập thông tin người dùng một cách âm thầm. Theo báo cáo từ GitHub, Claude Code (các phiên bản 2.1.193 đến 2.1.196) chứa cơ chế ẩn tự động phát hiện múi giờ Trung Quốc (như Asia/Shanghai), cấu hình proxy mạng và kiểm tra xem người dùng có đang kết nối đến các tên miền liên quan đến phòng thí nghiệm AI Trung Quốc hay không (như của Baidu, Alibaba, ByteDance...). Thông tin này sau đó được mã hóa vào lời nhắc hệ thống gửi lên đám mây thông qua kỹ thuật steganography, cụ thể bằng cách thay đổi ký tự phân cách ngày tháng và sử dụng các ký tự Unicode gần giống nhau (như ', ʼ, ʹ) trong cụm từ "Today's date". Hành động này bị chỉ trích vì vi phạm sự tin cậy, khi người dùng không hề hay biết và không có tùy chọn từ chối. Một thành viên kỹ thuật của Anthropic (@trq212) đã phản hồi, thừa nhận đoạn mã này và cho biết nó sẽ bị xóa trong bản cập nhật tiếp theo. Sự việc làm dấy lên lo ngại về quyền riêng tư và tính minh bạch trong các công cụ trợ lý lập trình có quyền truy cập sâu vào hệ thống và mã nguồn.

marsbit1 giờ trước

Đã được xác nhận: Claude Code lén kiểm tra người dùng, múi giờ và phòng thí nghiệm AI Trung Quốc đều là từ khóa

marsbit1 giờ trước

Grayscale:Sau khi giảm một nửa, Bitcoin đã tiến gần đáy chu kỳ này

Bitcoin đã giảm hơn 50% từ mức đỉnh 125.000 USD vào tháng 10, xuống dưới 60.000 USD, đánh dấu mức thấp mới trong chu kỳ hiện tại. Zach Pandl, Giám đốc Nghiên cứu tại Grayscale, coi đây là một đợt điều chỉnh chu kỳ điển hình trong xu hướng tăng dài hạn của BTC chứ không phải sự đảo chiều. Các yếu tố chính gây áp lực bao gồm: kỳ vọng thắt chặt chính sách của Cục Dự trữ Liên bang Mỹ (Fed) dưới thời tân Chủ tịch Kevin Warsh, sự không chắc chắn xung quanh dự luật CLARITY tại Thượng viện Mỹ, áp lực lên bảng cân đối kế toán của các công ty như Strategy, và lo ngại về rủi ro bảo mật từ máy tính lượng tử. Bài viết đưa ra hai kịch bản chính để thoát khỏi thị trường gấu: * **Kịch bản lạc quan (cơ sở):** Dự luật CLARITY được thông qua, Fed không tăng lãi suất, và các biện pháp ổn định được thực hiện. Trong trường hợp này, Bitcoin có thể đã tiệm cận đáy. * **Kịch bản bi quan (xu hướng giảm):** Dự luật CLARITY thất bại, Fed buộc phải tăng lãi suất, và quá trình giảm đòn bẩy tiếp diễn. Điều này có thể khiến BTC giảm thêm, mặc dù mức giảm sâu 80% như lịch sử được cho là ít xảy ra do đợt tăng giá vừa qua ôn hòa hơn và nhu cầu thể chế vững chắc hơn. Dù các yếu tố chu kỳ gây ra biến động ngắn hạn, Grayscale vẫn lạc quan về triển vọng cấu trúc dài hạn, được hỗ trợ bởi việc áp dụng công nghệ blockchain bởi các tổ chức, sự phát triển của stablecoin, tài sản mã hóa, và các động lực cơ bản như nợ công cao, sự sụt giảm niềm tin vào các tổ chức trung gian và sự trỗi dậy của AI. Bài viết kết luận rằng mức định giá hiện tại tạo ra một điểm vào hấp dẫn cho các nhà đầu tư dài hạn, mặc dù đáy cuối cùng phụ thuộc vào các chất xúc tác chính sách sắp tới.

marsbit1 giờ trước

Grayscale:Sau khi giảm một nửa, Bitcoin đã tiến gần đáy chu kỳ này

marsbit1 giờ trước

Báo cáo tài chính 25 năm của Trump: Gia đình thu hơn 1 tỷ USD mỗi năm từ tiền điện tử, trong khi các nhà đầu tư nhỏ lẻ vẫn thua lỗ trên $TRUMP

Theo báo cáo tiết lộ tài chính năm 2025, các doanh nghiệp crypto liên quan đến gia đình cựu Tổng thống Trump đã thu về gần 12 tỷ USD, vượt xa nhiều danh mục bất động sản lâu năm. Nguồn thu chính đến từ hai nơi: World Liberty Financial kiếm được hơn 5 tỷ USD từ việc bán token quản trị và các sản phẩm mới, trong khi CIC Digital thu khoảng 6.35 tỷ USD tiền bản quyền từ meme coin $TRUMP. Tuy nhiên, trong khi Trump thu lợi lớn, nhiều nhà đầu tư nhỏ lẻ phải chịu thua lỗ. Giá token $TRUMP đã giảm từ mức đỉnh 74 USD xuống còn 1.68 USD, và token của World Liberty Financial cũng mất khoảng 80% giá trị kể từ khi giao dịch. Sự trỗi dậy của mảng kinh doanh crypto này diễn ra trong bối cảnh chính quyền Trump nới lỏng các quy định đối với ngành công nghiệp tiền số. Báo cáo cũng làm dấy lên các câu hỏi về xung đột lợi ích tiềm tàng, liên quan đến hàng loạt dự án bất động sản ở nước ngoài mang lại hàng triệu USD phí cho Trump khi ông tại nhiệm. Dù Nhà Trắng phủ nhận mọi xung đột, các giao dịch này vẫn tiếp tục được giám sát chặt chẽ.

marsbit2 giờ trước

Báo cáo tài chính 25 năm của Trump: Gia đình thu hơn 1 tỷ USD mỗi năm từ tiền điện tử, trong khi các nhà đầu tư nhỏ lẻ vẫn thua lỗ trên $TRUMP

marsbit2 giờ trước

Giao dịch

Giao ngay

Bài viết Nổi bật

Làm thế nào để Mua 4

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua 4 (4) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua 4 (4) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ 4 (4) của BạnSau khi mua 4 (4), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch 4 (4)Giao dịch 4 (4) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 570Xuất bản vào 2025.10.20Cập nhật vào 2026.06.02

Làm thế nào để Mua 4

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của 4 (4) được trình bày dưới đây.

活动图片