Выходит видео-версия Nano Banana: встроена мировая база знаний Gemini, оригинальная банановая генерация изображений занимает всего 4 секунды

marsbitОпубликовано 2026-07-01Обновлено 2026-07-01

Введение

Выпущены две новые мультимодальные модели от Google: Gemini Omni Flash и Nano Banana 2 Lite. Gemini Omni Flash, доступная через API, сочетает возможности Gemini по работе с текстом, изображениями и видео, позволяя генерировать и редактировать видео с использованием знаний о мире. Модель поддерживает диалоговое редактирование видео, работу с несколькими типами входных данных и синхронизацию текста с действием. Стоимость генерации — около 0,10 доллара за секунду видео. Nano Banana 2 Lite — это оптимизированная для скорости модель генерации изображений. Она создаёт изображение с разрешением 1K примерно за 4 секунды и стоит около 0,034 доллара за изображение, что делает её вдвое дешевле и в пять раз быстрее Nano Banana 2, сохраняя при этом качество рендеринга текста. Ключевая инновация — возможность совместного использования моделей в едином рабочем процессе. Пользователи могут быстро генерировать изображения с помощью Nano Banana 2 Lite, а затем немедленно использовать их в качестве основы для создания видео в Gemini Omni Flash. Google представил три демо-приложения, иллюстрирующих этот подход: «Anywhere» для создания туристических видео из фото, «Space Lift» для визуализации дизайна интерьера и «Omni product studio» для автоматической генерации рекламного контента для электронной коммерции. Эти разработки демонстрируют стратегию Google по внедрению мультимодального ИИ в практические, коммерчески жизнеспособные приложения, охватывающие такие области, как маркетинг, дизайн и р...

Хотя «кодинг» пока ещё так себе, но у Google явно есть пара козырей в рукаве, когда дело доходит до «мультимодальности».

Gemini Omni Flash официально открывает API — представляем видеоверсию Nano Banana.

Теперь мечта «магов-переделкистов» о «Гарри Поттере» может стать реальностью. Оцените эти четыре цифровых фокуса от Google с использованием Gemini Omni:

Просто невероятно! Эта согласованность и чёткость текста... Зачем тогда зелёный экран и спецэффекты? Можно сразу в прямом эфире показывать Доктора Стрэнджа.

И в то же время долгожданный «банан» обзаводится «светоскоростной» версией.

Nano Banana 2 Lite: самая быстрая и экономически эффективная модель генерации изображений Gemini на сегодняшний день.

Без преувеличений — 4 секунды на одно изображение, картинка с разрешением 1K обойдётся примерно в 2 с лишним цента.

Если сравнить с Nano Banana 2, эта скорость просто взрывная.

Не говоря уже о GPT Image 2, которому для одного изображения нужно 3 минуты...

Теперь понятно, почему так долго нет Gemini 3.5 Pro — оказывается, всё время ушло на страстно любимую «мультимодальность», да, Хассабис?!

Gemini Omni Flash

Gemini Omni Flash, впервые представленный на Google I/O 2026, глубоко интегрирует возможности мультимодального анализа Gemini с генерацией и редактированием видео, что сразу привлекло внимание.

Теперь эта модель официально доступна разработчикам через Gemini API и Google AI Studio. Она легко генерирует и редактирует высококачественное видео на основе текстовых, графических и видео-входных данных.

Четыре ключевые возможности:

Диалоговое редактирование видео: изменение и доработка видео естественным языком, прямо как редактирование документа в Feishu.

Мультимодальные ссылки: комбинирование изображений, текста, видео с сохранением контроля над сценой и согласованности.

Знания о реальном мире: использование знаний Gemini в истории, биологии, логике повествования для построения видео — не нужно писать трёхстраничные промпты, описывая архитектурный стиль.

Синхронизация текста и действий: подключение текста и графики непосредственно к действиям в видео с помощью простых промптов.

Цены тоже конкурентоспособные: стоимость вывода видео за секунду составляет 0.10 доллара, что на уровне Veo 3.1 Fast.

В плане позиционирования, будучи такой же облегчённой моделью генерации видео, Omni Flash больше делает упор на мировые знания Gemini, а в экосистемном плане также полностью ориентирован на уровень Gemini.

Впрочем, Google довольно откровенен и сам перечисляет ряд текущих ограничений:

1. Пока поддерживается генерация видео длиной только до 10 секунд, позже будут поддержаны более длинные ролики;

2. Временно не поддерживается загрузка аудио-референсов и расширение сцен;

3. API поддерживает видео длиной до 3 секунд в качестве справочного материала, но модель пока не может корректно обрабатывать такие входные данные;

4. Согласованность персонажей при смене сцен и движениях камеры всё ещё ограничена.

Nano Banana 2 Lite

Nano Banana 2 Lite (также известная как gemini-3.1-flash-lite-image) создана для скоростной обработки.

Благодаря целевой оптимизации она нацелена на сценарии реального времени, крайне чувствительные к задержкам и требующие обработки больших объёмов изображений за короткое время — например, пакетная генерация материалов для электронной коммерции, быстрая итерация рекламных креативов, автоматизированные конвейеры контента.

Два основных преимущества —

Скорость света: задержка генерации изображения около 4 секунд, что в пять раз быстрее Nano Banana 2 (около 20 секунд).

Цена копеечная: одно изображение 1K стоит около 0.034 доллара, что вдвое дешевле Nano Banana 2 и в четыре раза дешевле Nano Banana Pro.

Скорость увеличена, цена снижена, но возможности генерации и редактирования изображений заметно не пострадали. Nano Banana 2 Lite по-прежнему сохраняет отличный эффект рендеринга текста, находясь на одном уровне с такими моделями, как Grok, по тестам.

Поэтому рекомендация Google такая: если вы всё ещё пользуетесь первым Nano Banana ради дешевизны, срочно меняйте. Lite-версия уже по всем ключевым показателям полностью его превосходит.

Объединение двух клинков

Стоп, не уходите.

Казалось бы, это всего лишь выпуск двух параллельных моделей, но Google заявляет: есть ещё кое-что новенькое.

Настоящее волшебство заключается в использовании этих моделей последовательно.

Всем известно, что создание AIGC-контента требует многократных итераций, и управление материалами довольно хлопотно.

Теперь же, благодаря этим двум моделям, больше не нужно постоянно загружать файлы — генерация изображений и создание видео плавно соединяются.

Конкретно: можно сначала быстро сгенерировать изображение с помощью Nano Banana 2 Lite, а затем использовать созданное изображение в качестве референс-материала для Gemini Omni Flash, одним кликом превратив его в видео.

Чтобы продемонстрировать этот магический воркфлоу «1+1>2», Google даже специально разработал 3 демо-приложения:

1. Anywhere (Где угодно)

Сделайте селфи или загрузите фото, и NB2 Lite моментально перенесёт вас на десятки знаковых достопримечательностей.

Затем нажмите на картинку, и Omni Flash превратит статичную достопримечательность в динамичный короткий ролик.

Кибертуризм теперь тоже стал сквозным процессом.

2. Space Lift (Космический лифт / Преображение пространства)

Это даже немного пугает. Кажется, если это ещё объединить с мировой моделью Genie, в будущем могут пострадать многие традиционные SaaS-компании, предлагающие решения по ремонту.

Загрузите фото комнаты, NB2 Lite предложит различные варианты стилей ремонта. Найдёте понравившийся — нажмите кнопку «видео», и Omni даст вам киношный тур по пространству.

3. Omni product studio (Универсальная студия товаров)

Благая весть для трансграничной электронной коммерции.

Сделайте фото товара на белом фоне, NB2 Lite создаст различные контекстные изображения товара, а Omni Flash превратит статичные картинки в короткие рекламные видео для электронной коммерции.

Весь путь от «продукта» до «рекламного материала» автоматически пройден.

Итак, для чего же нужна мультимодальность?

Google, наверняка, этот вопрос задавали бесчисленное количество раз.

Особенно в 2026 году, когда «кодинг» почти стал синонимом интеллекта модели. Все изо всех сил стараются преуспеть в «кодинге».

Зачем так упорно бороться за мультимодальность?

Опустим громкие нарративы про ИИО. В краткосрочной перспективе эта мультимодальная модель Google действительно может дать импульс многим её продуктам.

О нарративах про ИИО говорить не будем. В краткосрочной перспективе эта мультимодальная модель Google действительно может дать импульс многим её продуктам — Stitch один из них, встроенное редактирование фото в Pixel — другой, появление NotebookLM тоже впечатляет.

Выпуск двух новых моделей позволяет увидеть больший потенциал применения мультимодальности в вертикальных сценариях. Электронная коммерция, ремонт, короткие видео... Спрос в этих сферах реален, и деньги там тоже реальные.

Плюс, имея поддержку экосистемы Android, в плане коммерциализации особо беспокоиться не приходится.

В «кодинге» Google временно не догнать, но за столом мультимодальности Google, возможно, единственный игрок, способный собрать полную колоду карт.

Однако...

Так когда же выйдет Gemni 3.5 Pro?!!!

Ссылки:[1]https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/

Статья из официального аккаунта WeChat «Квантовый бит», автор: В центре внимания — передовые технологии

Трендовые криптовалюты

Связанные с этим вопросы

QЧто такое Gemini Omni Flash и каковы его ключевые возможности?

AGemini Omni Flash — это мультимодальная модель от Google, способная создавать и редактировать видео на основе текстовых, графических и видео-вводов. Её ключевые возможности: диалоговое редактирование видео, работа с мультимодальными референсами, использование реальных знаний (история, биология и т.д.) и синхронизация текста с действием в видео.

QЧем отличается Nano Banana 2 Lite от предыдущих версий модели "банан"?

ANano Banana 2 Lite (gemini-3.1-flash-lite-image) — это самая быстрая и экономичная версия модели для генерации изображений. Она генерирует изображение с разрешением 1K примерно за 4 секунды по цене около $0.034 за картинку, что в пять раз быстрее и в два раза дешевле, чем Nano Banana 2.

QКакую новую рабочую схему (workflow) предложила Google, комбинируя новые модели?

AGoogle предложила схему, где сначала модель Nano Banana 2 Lite быстро генерирует изображение, а затем модель Gemini Omni Flash использует это изображение как референс для создания динамического видео. Это позволяет бесшовно переходить от генерации изображений к созданию видео.

QКакие примеры приложений-демо создала Google для демонстрации новых возможностей моделей?

AGoogle представила три демо-приложения: 1) "Anywhere" — переносит человека на фоны известных достопримечательностей и анимирует их; 2) "Space Lift" — генерирует варианты дизайна интерьера по фото комнаты и создаёт видео-тур; 3) "Omni product studio" — создаёт контекстные изображения товаров и рекламные видеоролики для электронной коммерции.

QКаковы текущие ограничения модели Gemini Omni Flash?

AТекущие ограничения Gemini Omni Flash: генерация видео длительностью до 10 секунд, отсутствие поддержки аудио-референсов и расширения сцен, ограниченная обработка видео-референсов (хотя API их принимает), а также проблемы с сохранением консистентности персонажей при смене сцен и движениях камеры.

Похожее

Кто самый успешный зарабатывающий мужчина в криптоиндустрии? Трамп заработал более $1,4 миллиарда в 2025 году.

Согласно отчету Управления по вопросам государственной этики США, бывший президент Дональд Трамп в 2025 году получил доход, превышающий 1.42 миллиарда долларов, от криптовалютных активов, что резко контрастирует с общим спадом на рынке в этот период. Основными источниками дохода стали операции через связанные с ним компании, такие как CIC Digital LLC и DT Marks Defi LLC, которые зарабатывали преимущественно на лицензионных отчислениях от мем-коинов, продаже токенов и стейкинге. При этом стоимость его собственного мем-коина значительно упала, что привело к убыткам для сотен тысяч инвесторов. Раскрытие этой информации происходит на фоне дебатов вокруг законопроекта CLARITY Act, который может запретить высокопоставленным чиновникам владеть криптоактивами из-за конфликта интересов, что особенно актуально в случае с Трампом, совмещающим роль бенефициара и регулятора.

Foresight News7 мин. назад

Кто самый успешный зарабатывающий мужчина в криптоиндустрии? Трамп заработал более $1,4 миллиарда в 2025 году.

Foresight News7 мин. назад

Финансовый отчет Трампа за 25 лет: Семья заработала на криптовалюте более 10 миллиардов долларов в год, а розничные инвесторы теряют деньги на $TRUMP

Отчет о финансовом раскрытии Трампа за 2025 год показывает, что его криптовалютный бизнес принес доход около 12 миллиардов долларов, превзойдя большую часть его многолетних активов в сфере недвижимости. Основные источники: компания World Liberty Financial, занимающаяся продажей "управляющих токенов" (свыше 5 млрд долларов), и CIC Digital LLC, получающая роялти от мем-токена TRUMP (около 6.35 млрд долларов). Тем временем, цена токена TRUMP упала с пика в 74 доллара до 1.68 доллара, а токен World Liberty Financial потерял 80% стоимости с начала торгов. Многие розничные инвесторы оказались в убытке, в то время как аффилированные с Трампом лица сохраняют контроль над большей частью токенов TRUMP. Рост криптодоходов совпал с изменением регуляторной политики администрации Трампа в пользу индустрии. Белый дом отрицает конфликт интересов, заявляя, что бизнес передан в доверительное управление сыновьям, а президент действует исключительно в общественных интересах.

marsbit8 мин. назад

Финансовый отчет Трампа за 25 лет: Семья заработала на криптовалюте более 10 миллиардов долларов в год, а розничные инвесторы теряют деньги на $TRUMP

marsbit8 мин. назад

От «кластеризации адресов» к «стандартам доказательств»: почему Chainalysis стремится переопределить трассировку в блокчейне?

В конце июня 2026 года Chainalysis представила структуру данных под названием «Blockchain Tracing Ontology» (Онтология блокчейн-трассировки), направленную на создание более унифицированной системы описания данных для анализа блокчейна. Это скорее отраслевая инициатива по стандартизации, чем новый продукт. Ключевая проблема, которую она решает, — отсутствие единых стандартов интерпретации открытых данных блокчейна. Разные компании, используя различные алгоритмы кластеризации адресов, часто приходят к противоречивым выводам о принадлежности адресов, что создает проблемы в судебных расследованиях и соблюдении нормативных требований. Предлагаемая онтология — это не новый алгоритм, а общий «язык» для описания результатов анализа. Она вводит более детальную модель данных, заменяя упрощенное понятие «кластера» на иерархическую структуру: Сущность → Кошелек → Сегмент кошелька → Адреса. Это лучше отражает сложную структуру кошельков крупных организаций, например, бирж. Главное нововведение — смещение фокуса с результата на процесс анализа. Для каждого вывода необходимо указывать используемые доказательства (Evidence), правила анализа и уровень достоверности (Confidence). Это делает анализ объяснимым, проверяемым и воспроизводимым, что критически важно для его использования в качестве судебного доказательства, как было в деле Bitcoin Fog. Chainalysis подчеркивает, что анализ блокчейна сам по себе не устанавливает реальную личность, а лишь раскрывает связи между адресами. Идентификация требует дополнительной информации извне цепи. В долгосрочной перспективе инициатива направлена на переход отрасли от подхода, основанного на опыте, к стандартизированному. Это может повысить согласованность данных между разными организациями, снизить затраты на взаимодействие и укрепить доверие со стороны регуляторов и судов. Конкурентное преимущество в будущем будет определяться не только точностью алгоритмов, но и прозрачностью, качеством данных и надежностью доказательств.

marsbit36 мин. назад

От «кластеризации адресов» к «стандартам доказательств»: почему Chainalysis стремится переопределить трассировку в блокчейне?

marsbit36 мин. назад

Начинается «гонка по конференциям» во второй половине года! Полный обзор глобального графика Web3-саммитов на 2026 год

Обзор ключевых конференций Web3 на вторую половину 2026 года Вторая половина 2026 года предлагает насыщенную программу глобальных конференций по Web3, NFT, блокчейну и криптовалютам. **Третий квартал** стартует в июле с мероприятий в Азии: IVS в Киото и WebX в Токио (Япония), а также Canada Crypto Week в Торонто. Август пройдет под знаком мероприятий в Юго-Восточной Азии: Conviction в Хошимине (Вьетнам) и Bitcoin Hong Kong. Сентябрь станет самым насыщенным месяцем, охватывая события на пяти континентах: от NFT NYC в Нью-Йорке и ETHRome в Риме до Money20/20 в Саудовской Аравии, European Blockchain Convention в Барселоне и Корейской блокчейн-недели (KBW) в Сеуле. **Четвертый квартал** откроется в октябре важным событием — TOKEN2049 Singapore, которое станет единственной подобной конференцией в году после отмены дубайской версии. В ноябре внимание сместится на Devcon 8 и Bitcoin Amsterdam, а также на Solana Breakpoint в Лондоне. Завершит год декабрьская пара мероприятий на Ближнем Востоке: Blockchain Life в Дубае и Bitcoin MENA в Абу-Даби. Статья также содержит ссылки на уже прошедшие в первой половине 2026 года мероприятия, такие как Paris Blockchain Week, Consensus Hong Kong, ETHDenver и Bitcoin 2026 Las Vegas, предоставляя полную картину событийного календаря года.

Foresight News46 мин. назад

Начинается «гонка по конференциям» во второй половине года! Полный обзор глобального графика Web3-саммитов на 2026 год

Foresight News46 мин. назад

Только что: Fable 5 снят с глобальных ограничений

【Эксклюзив от New Zhiyuan】Американское Министерство торговли официально сняло экспортные ограничения с передовых моделей ИИ Fable 5 и Mythos 5 компании Anthropic. Ограничения были отменены после личного подписания распоряжения министром торговли Ховардом Латником. Доступ к моделям будет восстановлен для всех пользователей по всему миру уже завтра. Это решение положило конец 18-дневному периоду ограничений, который вызвал серьёзные затруднения в глобальном сообществе разработчиков, особенно среди тех, кто зависит от этих «сильнейших в мире» моделей для программирования в рамках так называемой «Vibe Coding» экономики. Anthropic согласилась на активный мониторинг и устранение рисков безопасности, связанных с моделью, а также на сотрудничество по протоколам будущих выпусков и отчётность о любой обнаруженной «злонамеренной активности». Сообщество разработчиков встретило новость с большим энтузиазмом. Генеральный директор Anthropic Дарио Амодеи изначально столкнулся с трудностями в переговорах с властями, но прогресс был достигнут после того, как соучредитель Том Браун взял на себя ведущую роль в коммуникации. Завтрашнее восстановление глобального доступа знаменует собой новый этап в развитии инструментов ИИ-кодирования. Anthropic пообещала в ближайшее время поделиться дополнительными обновлениями.

marsbit1 ч. назад

Только что: Fable 5 снят с глобальных ограничений

marsbit1 ч. назад

Торговля

Спот

Популярные статьи

Как купить 4

Добро пожаловать на HTX.com! Мы сделали приобретение 4 (4) простым и удобным. Следуйте нашему пошаговому руководству и отправляйтесь в свое крипто-путешествие.Шаг 1: Создайте аккаунт на HTXИспользуйте свой адрес электронной почты или номер телефона, чтобы зарегистрироваться и бесплатно создать аккаунт на HTX. Пройдите удобную регистрацию и откройте для себя весь функционал.Создать аккаунтШаг 2: Перейдите в Купить криптовалюту и выберите свой способ оплатыКредитная/Дебетовая Карта: Используйте свою карту Visa или Mastercard для мгновенной покупки 4 (4).Баланс: Используйте средства с баланса вашего аккаунта HTX для простой торговли.Третьи Лица: Мы добавили популярные способы оплаты, такие как Google Pay и Apple Pay, для повышения удобства.P2P: Торгуйте напрямую с другими пользователями на HTX.Внебиржевая Торговля (OTC): Мы предлагаем индивидуальные услуги и конкурентоспособные обменные курсы для трейдеров.Шаг 3: Хранение 4 (4)После приобретения вами 4 (4) храните их в своем аккаунте на HTX. В качестве альтернативы вы можете отправить их куда-либо с помощью перевода в блокчейне или использовать для торговли с другими криптовалютами.Шаг 4: Торговля 4 (4)С легкостью торгуйте 4 (4) на спотовом рынке HTX. Просто зайдите в свой аккаунт, выберите торговую пару, совершайте сделки и следите за ними в режиме реального времени. Мы предлагаем удобный интерфейс как для начинающих, так и для опытных трейдеров.

695 просмотров всегоОпубликовано 2025.10.20Обновлено 2026.06.02

Как купить 4

Неделя обучения по популярным токенам 4: В 2025 году экосистема TRON переживает взрывной рост, TRON укрепляет позиции лидера по переводу стейблкоинов

В 2025 году экосистема TRON быстро развивается, уделяя особое внимание взаимодействию, безопасности и практическому внедрению.

2.2k просмотров всегоОпубликовано 2025.12.30Обновлено 2025.12.30

Неделя обучения по популярным токенам 4: В 2025 году экосистема TRON переживает взрывной рост, TRON укрепляет позиции лидера по переводу стейблкоинов

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на 4 (4) представлены ниже.

活动图片