视频版Nano Banana来了：内置Gemini世界知识，原版香蕉出图仅需4秒

marsbitОпубликовано 2026-07-01Обновлено 2026-07-01

Введение

谷歌发布两款新型多模态AI模型：视频生成模型Gemini Omni Flash与高速图像生成模型Nano Banana 2 Lite。 Gemini Omni Flash融合了Gemini的世界知识与视频生成能力，支持通过文本、图像或视频输入生成或编辑高质量视频，具备对话式编辑、多模态参考等核心功能，生成成本约为每秒0.10美元。不过目前仅支持生成10秒视频，且人物一致性等方面仍有局限。 Nano Banana 2 Lite则主打高速与经济性，生成一张1K分辨率图像仅需约4秒、成本约0.034美元，速度达前代产品的5倍，且文字渲染效果出色。谷歌特别展示了将两款模型串联使用的应用潜力：可先用Nano Banana 2 Lite快速生成图像，再交由Omni Flash转化为动态视频，并演示了“赛博旅游”、“虚拟装修预览”和“电商短视频自动生成”三个具体场景，体现了多模态AI在垂直领域的落地价值。尽管在代码能力上不占优势，但谷歌正凭借其多模态技术布局，深入电商、内容创作等实用赛道，探索差异化的AGI发展路径。

虽然Coding还是一坨,但谷歌搞「多模态」确实有两把刷子。

Gemini Omni Flash正式开放API,视频版Nano Banana。

麻瓜爆改「哈利波特」不再是梦想。且看官方用Gemini Omni表演的这四个数字魔术:

&amp;amp;amp;amp;nbsp;

太离谱了,这一致性和文字清晰度,还要啥绿幕和特效,直接现场直播奇异博士。

与此同时,大家心心念念的「香蕉」,也迎来了「光速版」。

Nano Banana 2 Lite:迄今为止最快、最经济高效的Gemini图像模型。

毫不夸张——4秒出一张图,1K分辨率图像仅需约2毛多。

和Nano Banana 2放在一起对比,这个速度,简直起飞了。

更别说一次生图能干3分钟的GPT Image 2......

&amp;amp;amp;amp;nbsp;

怪不得半天没憋出来Gemini 3.5 Pro,敢情时间全花在心心念念的多模态上了是吧,哈萨比斯!!

Gemini Omni Flash

Google I/O 2026大会上首次亮相的Gemini Omni Flash,把Gemini的多模态推理能力与视频生成、编辑深度结合,当时就引发了不少关注。

如今,这个模型已通过Gemini API和Google AI Studio正式向开发者开放。能基于文本、图像和视频等多种输入,轻松生成高质量视频并进行编辑。

四项关键能力:

对话式视频编辑:用自然语言修改和精修视频,跟改飞书文档似的。

多模态参考:组合图像、文本、视频输入,保持场景控制和一致性。

现实世界知识:调用Gemini在历史、生物、叙事逻辑等方面的知识来构建视频,不用你再写三页Prompt描述建筑风格。

文字与动作同步:通过简单提示词,将文字和图形直接连接到视频动作。

价格也很有竞争力:每秒视频输出成本0.10美元,跟Veo 3.1 Fast持平。

定位方面,同为轻量版视频生成模型,Omni Flash更强调Gemini世界知识,生态方面也是全面朝Gemini层靠拢的。

不过谷歌也挺坦诚,主动列了一堆现阶段局限:

1、目前只支持10秒视频生成,后续会支持更长;

2、暂不支持音频参考上传和场景扩展;

3、API支持最长3秒的视频作为参考素材,但目前模型还无法正确处理这类输入;

4、场景切换和运镜时的人物一致性仍有局限。

Nano Banana 2 Lite

Nano Banana 2 Lite(又名gemini-3.1-flash-lite-image),专为高速处理而设计。

经过针对性优化,它瞄准的是那些对延迟极度敏感、需要短时间内批量处理大量图像的实时应用场景——比如电商素材批量生成、广告创意快速迭代、自动化内容流水线。

两大核心卖点——

光速:出图延迟约4秒,是Nano Banana 2的五分之一(后者约20秒)。

白菜价:一张1K图片仅需约0.034美元,是Nano Banana 2的一半,Nano Banana Pro的四分之一。

速度砍了,价格砍了,但生图和图像编辑能力并没有明显缩水。Nano Banana 2 Lite 依然保持了出色的文字渲染效果,在benchmark上和Grok等模型处于同一水平线。

因此谷歌的建议是:如果你还在贪便宜用初代Nano Banana,赶紧换。Lite版在各项关键指标上已经全方位碾压了。

双剑合璧

等等,先别走。

本以为这只是两款并行的模型发布,没想到谷歌表示:还有新花样。

真正的神奇之处,在于将这些模型串联起来使用。

众所周知,AIGC创作需要反复迭代,素材管理相当麻烦。

如今,借助这两个模型,终于不用再反复上传文件了,图像生成与视频创作无缝衔接。

具体来说,可以先用Nano Banana 2 Lite高速出图,再把生成的图像作为参考素材喂给 Gemini Omni Flash,一键转化为视频。

为了展示这套1+1>2的魔法Workflow,谷歌甚至专门做了3个Demo APP:

1、Anywhere

自拍一张或上传照片,NB2 Lite瞬间把你P到几十个地标景点里。

接着点一下图片,Omni Flash把静态景点变成动态短片。

赛博旅游,这下也端到端了。

&amp;amp;amp;amp;nbsp;

2、Space Lift

这有点吓人,感觉再和Genie世界模型结合一下,未来怕是要威胁到不少传统装修方案SaaS公司。

上传一张房间照片,NB2 Lite先出各种装修风格方案。找到喜欢的,点视频按钮,Omni能直接给你一段电影级空间漫游。

&amp;amp;amp;amp;nbsp;

3、Omni product studio

跨境电商的福音来了。

给产品拍张白底图,NB2 Lite出各种场景化商品图,Omni Flash再把静态图变成电商短视频。

从「产品」到「广告素材」,全链路自动跑完。

&amp;amp;amp;amp;nbsp;

所以,多模态到底有什么用?

这个问题谷歌肯定被问了无数次。

尤其在2026年,Coding几乎等同于模型智商的代名词。每家都在Coding上往死里卷。

死磕多模态,图什么?

AGI叙事那一套就不说了,短期来看的话,谷歌这套多模态模型确实能赋能旗下不少产品。

AGI叙事那一套就不展开了。短期来看,谷歌这套多模态模型确实能赋能旗下不少产品——Stitch是一个,Pixel内置的P图是一个,NotebookLM的横空出世也蛮惊艳。

这次发的两个新模型,则让人看到了多模态在垂直场景落地的更多潜力。电商、装修、短视频......这些业务的需求是真的,钱也是真的。

加上有安卓生态加持,基本不用太担心商业化的问题。

Coding谷歌暂时追不上,但多模态这张牌桌,谷歌可能是唯一能组齐一套牌的玩家。

不过......

Gemni 3.5 Pro到底啥时候来啊!!!

参考链接:[1]https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/

本文来自微信公众号“量子位”,作者:关注前沿科技

Трендовые криптовалюты

Haedal ProtocolHAEDAL

Связанные с этим вопросы

Q文章介绍的两款新模型分别叫什么名字，它们的核心定位是什么？

A文章介绍了Gemini Omni Flash和Nano Banana 2 Lite两款新模型。Gemini Omni Flash是一个轻量级视频生成模型，核心定位是将Gemini的多模态推理能力与视频生成、编辑深度结合，强调利用Gemini的世界知识。Nano Banana 2 Lite（又称gemini-3.1-flash-lite-image）则是一个图像生成模型，专为高速、低成本处理大量图像而设计，瞄准对延迟极度敏感的实时应用场景。

QNano Banana 2 Lite的图像生成速度和成本是多少？

ANano Banana 2 Lite出图延迟约为4秒，一张1K分辨率图像的生成成本约为0.034美元（约合人民币两毛多）。其速度是前代Nano Banana 2的五分之一（后者约20秒），价格是后者的一半。

Q根据文章，Gemini Omni Flash具备哪四项关键能力？

AGemini Omni Flash具备四项关键能力：1. 对话式视频编辑：用自然语言修改和精修视频。2. 多模态参考：组合图像、文本、视频输入，保持场景控制一致性。3. 现实世界知识：调用Gemini在历史、生物等领域的知识来构建视频，无需复杂的描述。4. 文字与动作同步：通过简单提示词，将文字和图形直接连接到视频动作中。

Q文章提到谷歌展示了哪三个Demo APP来体现两个新模型的协同工作流程？

A谷歌展示了三个Demo APP来体现图像生成模型Nano Banana 2 Lite与视频生成模型Gemini Omni Flash的协同工作流程：1. Anywhere：用户上传自拍，NB2 Lite将用户P到地标景点照片中，Omni Flash再将静态景点图片转为动态短片。2. Space Lift：上传房间照片，NB2 Lite生成装修方案图，Omni Flash将选定方案生成电影级空间漫游视频。3. Omni product studio：上传产品白底图，NB2 Lite生成场景化商品图，Omni Flash将其转为电商短视频。

Q文章认为谷歌在多模态领域的优势是什么？

A文章认为，在当前众多厂商“死磕”代码能力(Coding)的情况下，谷歌在多模态领域持续投入并推出了Gemini Omni Flash和Nano Banana 2 Lite等模型，展示了多模态在电商、装修、短视频等垂直场景落地的潜力。凭借其自身产品生态（如Stitch、Pixel、NotebookLM）和安卓生态的加持，商业化前景明确。作者认为，在多模态这张牌桌上，谷歌可能是“唯一能组齐一套牌的玩家”。

Похожее

Просмотры крипто-каналов на YouTube в 2026 году упали на 70%, кризис внимания розничных инвесторов меняет сценарий следующего цикла

Анализ показывает, что в 2026 году просмотры крупнейших криптовалютных YouTube-каналов, таких как Coin Bureau, Crypto Banter, Altcoin Daily и Benjamin Cowen, упали на 26,9–78,7% по сравнению с январём 2025 года. Несмотря на сохранение миллионов подписчиков, текущая активная аудитория значительно сократилась. Это указывает на отток внимания розничных инвесторов от длинных видеоформатов, хотя интерес не исчез полностью, а стал более избирательным. Рынок становится более сегментированным: биткоин может поддерживаться институциональными ETF, в то время как интерес к альткойнам и контенту для розничных инвесторов слабеет. Следующий цикл может начаться не с роста подписок, а с увеличения ежедневных и месячных просмотров, что станет опережающим индикатором возвращения розничного интереса.

marsbit47 мин. назад

Просмотры крипто-каналов на YouTube в 2026 году упали на 70%, кризис внимания розничных инвесторов меняет сценарий следующего цикла

marsbit47 мин. назад

Подтверждено: Claude Code тайно проверяет пользователей, временные зоны и китайские AI-лаборатории — ключевые слова

Сегодня компания Anthropic оказалась в центре скандала. В тот же день, когда она анонсировала модель Claude Sonnet 5 и сообщила об отмене экспортных ограничений США на Claude Fable 5 и Mythos 5, в сообществе разработчиков была раскрыта тревожная информация. Разработчики обнаружили, что инструмент Claude Code тайно собирает данные пользователей. В частности, он проверяет системный часовой пояс пользователя (например, Asia/Shanghai) и анализирует переменную среды `ANTHROPIC_BASE_URL` для определения использования пользовательских прокси или API-серверов. Эти адреса затем сравниваются со скрытым списком из 147 доменов, связанных с китайскими технологическими компаниями и ИИ-лабораториями (такими как Baidu, Alibaba, Moonshot AI), а также с зеркалами и реселлерами Claude. Собранная информация не передаётся открыто. Вместо этого она кодируется в системные промпты, отправляемые в облако, с помощью стеганографии. Например, меняется формат даты (с 2026-06-30 на 2026/06/30) или используются различные почти неразличимые символы Unicode (например, ' , ʼ , ʹ) в фразе "Today's date". Эти изменения служат скрытыми метками, указывающими на использование китайского часового пояса, прокси или доступ с доменов из списка. Основная проблема заключается не в самом сборе телеметрии, а в скрытном и нераскрытом способе её реализации, который нарушает доверие пользователей. Учитывая, что Claude Code имеет доступ к исходному коду и может выполнять команды, такое поведение вызывает серьёзные вопросы о конфиденциальности и прозрачности. После разоблачения представитель Anthropic заявил, что спорный код будет удалён в следующем обновлении.

marsbit1 ч. назад

Подтверждено: Claude Code тайно проверяет пользователей, временные зоны и китайские AI-лаборатории — ключевые слова

marsbit1 ч. назад

Grayscale: После обвала на 50%, BTC близок к дну текущего цикла

Биткоин упал ниже 60 тыс. долларов, достигнув нового минимума текущего цикла. По мнению Грейскал, это корректировка в рамках долгосрочного восходящего тренда. Ключевым фактором давления стали изменившиеся ожидания относительно политики ФРС (ожидание повышения ставок при новом председателе), что ослабило "сделку на обесценивание фиата". Другие негативные факторы включают неопределенность с принятием закона CLARITY, давление на балансы компаний вроде Strategy и опасения по поводу квантовых вычислений. Однако структурные драйверы роста (институциональное внедрение, долговая нагрузка правительств, развитие ИИ) остаются в силе. Выход из текущей фазы видится по двум сценариям. Оптимистичный (близость к дну): если ФРС не станет повышать ставки, закон CLARITY будет принят, а компании укрепят балансы. Пессимистичный (возможность дальнейшего снижения): если эти риски реализуются. При этом глубина падения, вероятно, будет меньше исторических максимумов (~80%) из-за более сдержанного роста в этом цикле и устойчивого институционального спроса. Исследователи Grayscale сохраняют долгосрочный оптимизм, считая текущие уровни привлекательными для инвесторов с долгосрочным горизонтом.

marsbit1 ч. назад

Grayscale: После обвала на 50%, BTC близок к дну текущего цикла

marsbit1 ч. назад

Руководство по выживанию в медвежьем рынке Web3: десять книг, которые помогут пройти через цикл

**Руководство по выживанию в медвежьем рынке Web3: 10 книг, которые помогут пережить цикл** Криптоиндустрия, пережившая четыре бычьих и четыре медвежьих рынка, использует периоды спада для переосмысления. В это время важно не просто ждать восстановления, а накапливать знания. Предлагаемая подборка книг затрагивает фундаментальные темы — технологии, экономику, культуру и психологию — помогая сохранить ясность мышления. 1. **«2049: будущие 10000 дней» Кевина Келли.** Дает долгосрочную перспективу, где криптовалюты могут стать второй мировой валютой, а их сочетание с ИИ — основой новых операционных систем. 2. **«Человеческая деятельность» Людвига фон Мизеса.** Объясняет природу человеческого действия и роль денег как инструмента расчета, укрепляя уверенность в действиях в условиях неопределенности. 3. **«Природа технологий» Брайана Артура.** Показывает, что технологии развиваются через комбинацию существующих решений, что объясняет эволюцию блокчейна и появление DeFi, NFT и других направлений. 4. **«Далекий спаситель» До Тунсюэ.** Раскрывает важность «культурных атрибутов»: сильная культура полагается на себя и законы, а слабая ищет спасителя. Урок для тех, кто хочет пережить медвежий рынок. 5. **«Суверенная личность» Дж. Д. Дэвидсона и У. Рис-Могга.** Предсказала еще в 1997 году появление технологий, которые передают власть от государств к отдельным людям, как это делает криптовалюта. 6. **«Уроки Японии: руководство по выживанию в эпоху рецессии».** Анализ 30-летнего периода стагнации в Японии показывает, что даже в условиях общего спада есть растущие сегменты (как, например, стейблкоины в криптоиндустрии). 7. **«Частные деньги» Фридриха Хайека.** Идеологическая основа для биткоина: конкуренция между валютами, а не государственная монополия, — лучший способ обеспечить стабильность. 8. **«Вопросы и ответы об инвестициях Дуань Юнпина».** Подчеркивает важность следования простым принципам: делать правильные вещи и избегать неправильных, что особенно важно в медвежий рынок. 9. **«Пророчество Баладжи: технологии, правда и руководство по созданию будущего» Баладжи С. Шринивасана.** Взгляд предпринимателя и инвестора, утверждающего, что блокчейн — важнейшее изобретение со времен письменности, и описывающего конкретные идеи для будущего. 10. **«Избранные произведения Мао Цзэдуна».** Предлагает стратегическое мышление для слабой стороны в противостоянии с сильной системой: анализ противоречий, определение союзников и тактика «окружения городов деревнями» (внедрение через развивающиеся рынки). Эти книги помогают укрепить не только знания, но и психологическую устойчивость, необходимую для преодоления рыночных циклов.

Foresight News2 ч. назад

Руководство по выживанию в медвежьем рынке Web3: десять книг, которые помогут пройти через цикл

Foresight News2 ч. назад

Кто самый успешный зарабатывающий мужчина в криптоиндустрии? Трамп заработал более $1,4 миллиарда в 2025 году.

Согласно отчету Управления по вопросам государственной этики США, бывший президент Дональд Трамп в 2025 году получил доход, превышающий 1.42 миллиарда долларов, от криптовалютных активов, что резко контрастирует с общим спадом на рынке в этот период. Основными источниками дохода стали операции через связанные с ним компании, такие как CIC Digital LLC и DT Marks Defi LLC, которые зарабатывали преимущественно на лицензионных отчислениях от мем-коинов, продаже токенов и стейкинге. При этом стоимость его собственного мем-коина значительно упала, что привело к убыткам для сотен тысяч инвесторов. Раскрытие этой информации происходит на фоне дебатов вокруг законопроекта CLARITY Act, который может запретить высокопоставленным чиновникам владеть криптоактивами из-за конфликта интересов, что особенно актуально в случае с Трампом, совмещающим роль бенефициара и регулятора.

Foresight News2 ч. назад

Кто самый успешный зарабатывающий мужчина в криптоиндустрии? Трамп заработал более $1,4 миллиарда в 2025 году.

Foresight News2 ч. назад

Торговля

Спот

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на 4 (4) представлены ниже.

视频版Nano Banana来了：内置Gemini世界知识，原版香蕉出图仅需4秒

Введение

Gemini Omni Flash

Nano Banana 2 Lite

双剑合璧

所以,多模态到底有什么用?

Трендовые криптовалюты

Связанные с этим вопросы

Похожее

Просмотры крипто-каналов на YouTube в 2026 году упали на 70%, кризис внимания розничных инвесторов меняет сценарий следующего цикла

Подтверждено: Claude Code тайно проверяет пользователей, временные зоны и китайские AI-лаборатории — ключевые слова

Grayscale: После обвала на 50%, BTC близок к дну текущего цикла

Руководство по выживанию в медвежьем рынке Web3: десять книг, которые помогут пройти через цикл

Кто самый успешный зарабатывающий мужчина в криптоиндустрии? Трамп заработал более $1,4 миллиарда в 2025 году.

Торговля

Популярные статьи

Как купить 4

Неделя обучения по популярным токенам 4: В 2025 году экосистема TRON переживает взрывной рост, TRON укрепляет позиции лидера по переводу стейблкоинов

Обсуждения

Топ вопросы

Популярные категории

Популярные теги