Video Edition Nano Banana Arrives: Built-in Gemini World Knowledge, Original Banana Generates Images in Just 4 Seconds

marsbitОпубликовано 2026-07-01Обновлено 2026-07-01

Введение

Google has unveiled two new multimodal AI models: Gemini Omni Flash and Nano Banana 2 Lite. Gemini Omni Flash is a video generation and editing model that leverages Gemini's world knowledge. It allows for conversational video editing using natural language prompts, maintains scene consistency, and integrates text/graphics with video actions. Priced at $0.10 per second of output, its current limitations include a 10-second video cap. Nano Banana 2 Lite (gemini-3.1-flash-lite-image) is an optimized image generation model focused on speed and cost. It produces a 1K resolution image in about 4 seconds at a cost of roughly $0.034, making it significantly faster and cheaper than its predecessor. It retains strong text rendering capabilities. A key highlight is the combined workflow: users can rapidly generate images with Nano Banana 2 Lite and then seamlessly feed them into Gemini Omni Flash to create videos. Google demonstrated this with three application demos: "Anywhere" for creating travel videos from photos, "Space Lift" for generating interior design walkthroughs, and "Omni Product Studio" for automating e-commerce ad creation from product photos. The release underscores Google's strategic focus on advancing multimodal AI for practical, commercial applications in areas like marketing, design, and content creation, despite competitive pressures in other AI domains.

Although coding is still a mess, Google really has a knack for "multimodality".

The Gemini Omni Flash API is officially open, introducing the video edition Nano Banana.

Magical remakes of "Harry Potter" are no longer a dream. Just watch these four digital magic tricks performed by Gemini Omni:

It's insane. This level of consistency and text clarity makes green screens and special effects almost obsolete—just go live as Doctor Strange.

Meanwhile, the beloved "Banana" has welcomed a "lightspeed edition".

Nano Banana 2 Lite: The fastest, most cost-effective Gemini image model to date.

No exaggeration—it takes just 4 seconds to generate one image. A 1K resolution image costs about 20+ cents.

Compared side-by-side with Nano Banana 2, this speed is practically taking off.

Not to mention GPT Image 2, which takes 3 minutes for a single image generation...

No wonder Gemini 3.5 Pro hasn't been released yet—they probably spent all their time on their beloved multimodality, right, Hassabis!!

Gemini Omni Flash

First unveiled at Google I/O 2026, Gemini Omni Flash deeply integrates Gemini's multimodal reasoning capabilities with video generation and editing, garnering significant attention then.

Now, this model is officially available to developers via the Gemini API and Google AI Studio. It can easily generate and edit high-quality videos based on various inputs like text, images, and video.

Four key capabilities:

Conversational Video Editing: Modify and refine videos using natural language, just like editing a Lark document.

Multimodal Reference: Combine image, text, and video inputs to maintain scene control and consistency.

Real-World Knowledge: Leverage Gemini's knowledge in history, biology, narrative logic, etc., to construct videos, saving you from writing three pages of prompts to describe architectural styles.

Text and Action Synchronization: Connect text and graphics directly to video actions through simple prompts.

The pricing is also very competitive: $0.10 per second of video output, on par with Veo 3.1 Fast.

In terms of positioning, Omni Flash, also a lightweight video generation model, emphasizes Gemini's world knowledge and fully aligns with the Gemini ecosystem.

But Google is also quite candid, proactively listing a bunch of current limitations:

1. Currently only supports 10-second video generation; longer support will come later.

2. Does not yet support audio reference uploads or scene expansion.

3. The API supports video reference uploads up to 3 seconds, but the model currently cannot correctly process such inputs.

4. There are still limitations in character consistency during scene changes and camera movements.

Nano Banana 2 Lite

Nano Banana 2 Lite (also known as gemini-3.1-flash-lite-image) is designed specifically for high-speed processing.

Through targeted optimization, it aims at real-time application scenarios that are extremely sensitive to latency and require processing large volumes of images in a short time—such as bulk generation of e-commerce materials, rapid iteration of ad creatives, and automated content pipelines.

Two core selling points—

Lightspeed: Image generation latency is about 4 seconds, one-fifth of Nano Banana 2's (which is about 20 seconds).

Dirt Cheap: A 1K image costs about $0.034, half the price of Nano Banana 2 and one-quarter of Nano Banana Pro.

Speed and price are cut, but image generation and editing capabilities haven't noticeably shrunk. Nano Banana 2 Lite still maintains excellent text rendering effects, benchmarking on par with models like Grok.

Therefore, Google's suggestion is: If you're still cheaping out with the first-gen Nano Banana, swap it now. The Lite version already comprehensively outperforms it in all key metrics.

Twin Blades United

Wait, hold on.

You might think this is just the parallel release of two models, but Google indicates there's more.

The real magic lies in chaining these models together.

As we all know, AIGC creation requires repeated iteration, and asset management can be quite troublesome.

Now, with these two models, you no longer need to repeatedly upload files—image generation and video creation are seamlessly connected.

Specifically, you can first use Nano Banana 2 Lite to generate images at high speed, then feed the generated images as reference material to Gemini Omni Flash to transform them into videos with one click.

To showcase this magical 1+1>2 workflow, Google even created 3 Demo APPs:

1、Anywhere

Take a selfie or upload a photo, and NB2 Lite instantly Photoshopped you into dozens of landmark scenes.

Then click on the image, and Omni Flash turns the static scene into a dynamic short video.

Cyber tourism, now also end-to-end.

2、Space Lift

This is a bit scary. Combined with the Genie world model in the future, it might threaten many traditional interior design SaaS companies.

Upload a photo of a room. NB2 Lite first generates various interior design styles. Find one you like, click the video button, and Omni can directly create a cinematic space walkthrough for you.

3、Omni product studio

A boon for cross-border e-commerce.

Take a white-background photo of a product. NB2 Lite generates various contextual product images. Omni Flash then turns the static images into e-commerce short videos.

From "product" to "advertising material", the entire chain runs automatically.

So, what's the use of multimodality anyway?

Google has surely been asked this countless times.

Especially in 2026, where Coding ability has become almost synonymous with model intelligence. Everyone is fiercely competing in Coding.

Obsessing over multimodality, for what?

Forget the whole AGI narrative for a moment. In the short term, Google's suite of multimodal models can indeed empower many of its products—Stitch is one, the built-in photo editing in Pixel is another, and the emergence of NotebookLM was quite impressive.

The two new models released this time reveal even more potential for multimodality to land in vertical scenarios. E-commerce, interior design, short videos... the demand in these businesses is real, and so is the money.

Plus, with the Android ecosystem supporting it, there's little worry about commercialization.

Google might not catch up in Coding for now, but at the multimodality poker table, Google might be the only player with a full deck.

But...

When is Gemni 3.5 Pro coming out already!!!

Reference:[1]https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/

This article comes from the WeChat public account "QbitAI", author: Following Cutting-Edge Tech

Трендовые криптовалюты

Связанные с этим вопросы

QWhat are the two new Gemini models announced, and what are their primary functions?

ATwo new models are announced: Gemini Omni Flash and Nano Banana 2 Lite. Gemini Omni Flash is a multimodal video generation and editing model that can create videos from text, image, and video inputs. Nano Banana 2 Lite is an ultra-fast and cost-effective image generation model.

QWhat are the key features and performance claims for the Nano Banana 2 Lite image model?

ANano Banana 2 Lite is claimed to be the fastest and most cost-effective Gemini image model. It generates a 1K resolution image in about 4 seconds at a cost of approximately $0.034 per image. It maintains strong text rendering capabilities while being significantly faster and cheaper than its predecessor.

QHow does Gemini Omni Flash leverage its 'world knowledge' capability, and what is one of its stated limitations?

AGemini Omni Flash can call upon Gemini's knowledge in areas like history, biology, and narrative logic to inform video generation, reducing the need for detailed user prompts. One stated limitation is that it currently only supports generating videos up to 10 seconds in length, with longer support planned for the future.

QAccording to the article, how can the two models be used together in a workflow? Provide one example.

AThe models can be used in a seamless 'image-to-video' workflow. For example, you can first use Nano Banana 2 Lite to quickly generate an image (like a product scene). Then, you can feed that generated image as a reference directly into Gemini Omni Flash to create a video based on it, eliminating the need to manually upload files between steps.

QWhat is the article's perspective on Google's focus on multimodal AI compared to coding capabilities?

AThe article suggests that while Google may be lagging in the 'Coding' race (often used as a proxy for model intelligence), it is a strong contender in multimodal AI. It argues that multimodal models have clear, immediate commercial applications in fields like e-commerce and content creation, and Google, with its ecosystem, is well-positioned to capitalize on this.

Похожее

Стандарт Чартерд берет на себя вход для USDC, Circle уступает контроль ради масштаба

2 июля Standard Chartered и Circle объявили о партнёрстве: институциональные клиенты теперь могут выпускать (чеканить) и выкупать стейблкоин USDC напрямую через банковские счета Standard Chartered, без необходимости открывать отдельный аккаунт в Circle. Услуга будет запущена в первую очередь в Дубайском международном финансовом центре (DIFC). Это знаковое событие, поскольку Standard Chartered становится первым банком из числа глобальных системно значимых (G-SIB), который будет предоставлять институциональным клиентам такой «единый вход» для операций с USDC. Это открывает доступ к стейблкоину для крупных традиционных финансовых игроков, таких как пенсионные фонды и суверенные фонды, которые ранее могли сдерживаться нормативными требованиями и необходимостью взаимодействовать напрямую с криптовалютной компанией. Для Circle это стратегический шаг по обмену прямых отношений с клиентами на масштабирование через мощную дистрибьюторскую сеть банка. Основная бизнес-модель Circle строится на доходах от резервов (в основном казначейских облигаций США), поддерживающих USDC, поэтому увеличение общего объема в обращении является ключевым приоритетом. Standard Chartered, в свою очередь, усиливает своё предложение для клиентов, интегрируя проверенный цифровой актив в свои банковские услуги. Партнёрство символизирует более широкий сдвиг в индустрии: вместо того чтобы обходить традиционную финансовую систему, стейблкоины всё чаще становятся её частью, интегрируясь в банковскую инфраструктуру и нормативно-правовую базу. Вопросы о будущем индустрии теперь вращаются вокруг перераспределения влияния и определения того, кто будет ближе к клиенту и, следовательно, будет контролировать ценообразование.

marsbitТолько что

Стандарт Чартерд берет на себя вход для USDC, Circle уступает контроль ради масштаба

marsbitТолько что

«Последняя сделка Чикаго?» – Глава CFTC предупреждает о новом 0,2% налоге на криптовалюты

Председатель Комиссии по торговле товарными фьючерсами (CFTC) Майк Селиг раскритиковал новый закон штата Иллинойс, который вводит универсальный налог в размере 0,2% на каждую криптовалютную транзакцию. Он предупредил, что этот налог, который вступит в силу в январе 2027 года, может подорвать финансовое положение Чикаго, поскольку инвесторы и компании, включая крупнейшую в мире фьючерсную биржу CME, могут покинуть штат. Селиг назвал этот шаг "последней сделкой" Чикаго, отметив, что он противоречит более взвешенному федеральному закону CLARITY, направленному на регулирование и поддержку инноваций. Главный юрист Coinbase Пол Грюол также осудил налог как губительную для инноваций политику. В то время как федеральные законодатели рассматривают несколько предложений по налогообложению криптовалют, включая устранение двойного налогообложения, прогресс может замедлиться из-за предстоящих промежуточных выборов в ноябре. Окончательное принятие федеральных правил, которые могли бы предложить ясность, скорее всего, отложится до 2025 года.

ambcrypto1 мин. назад

«Последняя сделка Чикаго?» – Глава CFTC предупреждает о новом 0,2% налоге на криптовалюты

ambcrypto1 мин. назад

Граница в $75: Hyperliquid приближается к ключевой точке принятия решения

С октября 2025 года большинство криптоактивов, включая Bitcoin (BTC), находились в нисходящем тренде. Однако Hyperliquid (HYPE) выделялся среди крупных альткойнов, демонстрируя устойчивый долгосрочный бычий тренд на протяжении более года. На недельном графике отмечался восходящий структурированный рост, а цена составляла $70,11, показав рост на 7,51% за неделю и на 74% за год. Несмотря на это, индикатор RSI формировал более низкие максимумы, что указывало на возможность медвежьей дивергенции при преодолении уровня $72,1. В июле HYPE торговался в диапазоне от $53,35 до $74,78. Цена преодолела краткосрочное сопротивление в $67,2, и сохранялись предпосылки для дальнейшего роста к ключевой зоне предложения в $75. Это подтверждалось ростом индикатора On-Balance Volume (OBV) и RSI выше уровня 50, что сигнализировало о сохранении покупательского давления. Однако для свинг-трейдеров оптимальные условия для входа еще не сложились. Рекомендуется дождаться теста уровня $75: либо пробой, либо отскок от этой зоны предложат четкие сигналы для открытия позиций с целями на поддержках в середине или внизу диапазона.

ambcrypto1 ч. назад

Граница в $75: Hyperliquid приближается к ключевой точке принятия решения

ambcrypto1 ч. назад

‘Угроза не уменьшилась’: Почему Резервный банк Индии усиливает предупреждения о криптовалюте?

Резервный банк Индии (RBI) вновь заявил парламентскому комитету по финансам о своей неизменной оппозиции легализации криптовалют, таких как Bitcoin. RBI предупреждает, что виртуальные цифровые активы (VDA), функционируя вне традиционной банковской системы, представляют серьёзные риски для финансовой стабильности, сложно регулируются и могут использоваться для отмывания денег и финансирования терроризма. Банк ссылается на опыт ЕС (жёсткое регулирование) и таких стран, как Китай и Катар (полный запрет). В отличие от RBI, Институт дипломированных бухгалтеров Индии (ICAI) выступает не за запрет, а за создание всеобъемлющей правовой базы для VDA, предлагая разработать стандарты учёта и отчётности для повышения прозрачности. Такие жёсткие предупреждения RBI поступают на фоне данных TRM Labs: в первой половине 2026 года зафиксирован рекордный рост числа хакерских атак в криптосфере (207 инцидентов), хотя общий объём убытков сократился. Эксперты отмечают, что угрозы становятся более изощрёнными. Одновременно розничная торговля криптовалютами в Индии замедляется. В стране уже действует налоговая система для криптоопераций, а новый бюджет предусматривает штрафы за неуведомление о сделках, что ужесточает регулирование. Таким образом, в Индии сохраняется напряжённость между позицией регулятора (RBI), видящего в криптовалютах угрозу, и профессионального сообщества (ICAI), предлагающего путь регулирования, а не запрета.

ambcrypto3 ч. назад

‘Угроза не уменьшилась’: Почему Резервный банк Индии усиливает предупреждения о криптовалюте?

ambcrypto3 ч. назад

Мнение: Падение биткойна на 10% произошло не из-за продажи Сэйлором 32 BTC

В начале июня 2024 года биткоин упал примерно на 10% до уровня около 65 500 долларов. Популярное предположение о том, что причиной стало продажа всего 32 BTC (на 2,5 млн долларов) компанией Майкла Сэйлора MicroStrategy, не соответствует масштабу рынка. Реальными причинами коррекции стали три фактора. Во-первых, последовательный отток средств из американских спотовых биткоин-ETF (около 4,4 млрд долларов за две недели) и переводы активов с биржи Mt.Gox (перевод 10,4 тыс. BTC) создали давление на спрос и ожидания будущих продаж. Во-вторых, капитал перетекал в акции технологических и ИИ-компаний, такие как крупные размещения Alphabet и SpaceX, создавая конкуренцию за рискованные активы. В-третьих, эти фундаментальные факторы спровоцировали массовую ликвидацию длинных позиций с высоким кредитным плечом (на 16,6 млрд долларов), что усилило и ускорило падение. Таким образом, падение было вызвано не символической продажей, а комбинацией оттока институциональных средств, опасений по поводу предложения, оттока капитала в другие секторы и последующего каскада ликвидаций на фоне высокого рычага. Хотя технические индикаторы могут указывать на приближение к зоне возможной поддержки, для устойчивого восстановления рынку криптоактивов необходимо время, чтобы переварить давление продаж в условиях перераспределения глобального рискового капитала.

marsbit4 ч. назад

Мнение: Падение биткойна на 10% произошло не из-за продажи Сэйлором 32 BTC

marsbit4 ч. назад

Торговля

Спот

Популярные статьи

Как купить 4

Добро пожаловать на HTX.com! Мы сделали приобретение 4 (4) простым и удобным. Следуйте нашему пошаговому руководству и отправляйтесь в свое крипто-путешествие.Шаг 1: Создайте аккаунт на HTXИспользуйте свой адрес электронной почты или номер телефона, чтобы зарегистрироваться и бесплатно создать аккаунт на HTX. Пройдите удобную регистрацию и откройте для себя весь функционал.Создать аккаунтШаг 2: Перейдите в Купить криптовалюту и выберите свой способ оплатыКредитная/Дебетовая Карта: Используйте свою карту Visa или Mastercard для мгновенной покупки 4 (4).Баланс: Используйте средства с баланса вашего аккаунта HTX для простой торговли.Третьи Лица: Мы добавили популярные способы оплаты, такие как Google Pay и Apple Pay, для повышения удобства.P2P: Торгуйте напрямую с другими пользователями на HTX.Внебиржевая Торговля (OTC): Мы предлагаем индивидуальные услуги и конкурентоспособные обменные курсы для трейдеров.Шаг 3: Хранение 4 (4)После приобретения вами 4 (4) храните их в своем аккаунте на HTX. В качестве альтернативы вы можете отправить их куда-либо с помощью перевода в блокчейне или использовать для торговли с другими криптовалютами.Шаг 4: Торговля 4 (4)С легкостью торгуйте 4 (4) на спотовом рынке HTX. Просто зайдите в свой аккаунт, выберите торговую пару, совершайте сделки и следите за ними в режиме реального времени. Мы предлагаем удобный интерфейс как для начинающих, так и для опытных трейдеров.

704 просмотров всегоОпубликовано 2025.10.20Обновлено 2026.06.02

Как купить 4

Неделя обучения по популярным токенам 4: В 2025 году экосистема TRON переживает взрывной рост, TRON укрепляет позиции лидера по переводу стейблкоинов

В 2025 году экосистема TRON быстро развивается, уделяя особое внимание взаимодействию, безопасности и практическому внедрению.

2.2k просмотров всегоОпубликовано 2025.12.30Обновлено 2025.12.30

Неделя обучения по популярным токенам 4: В 2025 году экосистема TRON переживает взрывной рост, TRON укрепляет позиции лидера по переводу стейблкоинов

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на 4 (4) представлены ниже.

活动图片