Выходит видео-версия Nano Banana: встроена мировая база знаний Gemini, оригинальная банановая генерация изображений занимает всего 4 секунды

marsbitОпубликовано 2026-07-01Обновлено 2026-07-01

Введение

Выпущены две новые мультимодальные модели от Google: Gemini Omni Flash и Nano Banana 2 Lite. Gemini Omni Flash, доступная через API, сочетает возможности Gemini по работе с текстом, изображениями и видео, позволяя генерировать и редактировать видео с использованием знаний о мире. Модель поддерживает диалоговое редактирование видео, работу с несколькими типами входных данных и синхронизацию текста с действием. Стоимость генерации — около 0,10 доллара за секунду видео. Nano Banana 2 Lite — это оптимизированная для скорости модель генерации изображений. Она создаёт изображение с разрешением 1K примерно за 4 секунды и стоит около 0,034 доллара за изображение, что делает её вдвое дешевле и в пять раз быстрее Nano Banana 2, сохраняя при этом качество рендеринга текста. Ключевая инновация — возможность совместного использования моделей в едином рабочем процессе. Пользователи могут быстро генерировать изображения с помощью Nano Banana 2 Lite, а затем немедленно использовать их в качестве основы для создания видео в Gemini Omni Flash. Google представил три демо-приложения, иллюстрирующих этот подход: «Anywhere» для создания туристических видео из фото, «Space Lift» для визуализации дизайна интерьера и «Omni product studio» для автоматической генерации рекламного контента для электронной коммерции. Эти разработки демонстрируют стратегию Google по внедрению мультимодального ИИ в практические, коммерчески жизнеспособные приложения, охватывающие такие области, как маркетинг, дизайн и р...

Хотя «кодинг» пока ещё так себе, но у Google явно есть пара козырей в рукаве, когда дело доходит до «мультимодальности».

Gemini Omni Flash официально открывает API — представляем видеоверсию Nano Banana.

Теперь мечта «магов-переделкистов» о «Гарри Поттере» может стать реальностью. Оцените эти четыре цифровых фокуса от Google с использованием Gemini Omni:

&amp;amp;amp;amp;nbsp;

Просто невероятно! Эта согласованность и чёткость текста... Зачем тогда зелёный экран и спецэффекты? Можно сразу в прямом эфире показывать Доктора Стрэнджа.

И в то же время долгожданный «банан» обзаводится «светоскоростной» версией.

Nano Banana 2 Lite: самая быстрая и экономически эффективная модель генерации изображений Gemini на сегодняшний день.

Без преувеличений — 4 секунды на одно изображение, картинка с разрешением 1K обойдётся примерно в 2 с лишним цента.

Если сравнить с Nano Banana 2, эта скорость просто взрывная.

Не говоря уже о GPT Image 2, которому для одного изображения нужно 3 минуты...

&amp;amp;amp;amp;nbsp;

Теперь понятно, почему так долго нет Gemini 3.5 Pro — оказывается, всё время ушло на страстно любимую «мультимодальность», да, Хассабис?!

Gemini Omni Flash

Gemini Omni Flash, впервые представленный на Google I/O 2026, глубоко интегрирует возможности мультимодального анализа Gemini с генерацией и редактированием видео, что сразу привлекло внимание.

Теперь эта модель официально доступна разработчикам через Gemini API и Google AI Studio. Она легко генерирует и редактирует высококачественное видео на основе текстовых, графических и видео-входных данных.

Четыре ключевые возможности:

Диалоговое редактирование видео: изменение и доработка видео естественным языком, прямо как редактирование документа в Feishu.

Мультимодальные ссылки: комбинирование изображений, текста, видео с сохранением контроля над сценой и согласованности.

Знания о реальном мире: использование знаний Gemini в истории, биологии, логике повествования для построения видео — не нужно писать трёхстраничные промпты, описывая архитектурный стиль.

Синхронизация текста и действий: подключение текста и графики непосредственно к действиям в видео с помощью простых промптов.

Цены тоже конкурентоспособные: стоимость вывода видео за секунду составляет 0.10 доллара, что на уровне Veo 3.1 Fast.

В плане позиционирования, будучи такой же облегчённой моделью генерации видео, Omni Flash больше делает упор на мировые знания Gemini, а в экосистемном плане также полностью ориентирован на уровень Gemini.

Впрочем, Google довольно откровенен и сам перечисляет ряд текущих ограничений:

1. Пока поддерживается генерация видео длиной только до 10 секунд, позже будут поддержаны более длинные ролики;

2. Временно не поддерживается загрузка аудио-референсов и расширение сцен;

3. API поддерживает видео длиной до 3 секунд в качестве справочного материала, но модель пока не может корректно обрабатывать такие входные данные;

4. Согласованность персонажей при смене сцен и движениях камеры всё ещё ограничена.

Nano Banana 2 Lite

Nano Banana 2 Lite (также известная как gemini-3.1-flash-lite-image) создана для скоростной обработки.

Благодаря целевой оптимизации она нацелена на сценарии реального времени, крайне чувствительные к задержкам и требующие обработки больших объёмов изображений за короткое время — например, пакетная генерация материалов для электронной коммерции, быстрая итерация рекламных креативов, автоматизированные конвейеры контента.

Два основных преимущества —

Скорость света: задержка генерации изображения около 4 секунд, что в пять раз быстрее Nano Banana 2 (около 20 секунд).

Цена копеечная: одно изображение 1K стоит около 0.034 доллара, что вдвое дешевле Nano Banana 2 и в четыре раза дешевле Nano Banana Pro.

Скорость увеличена, цена снижена, но возможности генерации и редактирования изображений заметно не пострадали. Nano Banana 2 Lite по-прежнему сохраняет отличный эффект рендеринга текста, находясь на одном уровне с такими моделями, как Grok, по тестам.

Поэтому рекомендация Google такая: если вы всё ещё пользуетесь первым Nano Banana ради дешевизны, срочно меняйте. Lite-версия уже по всем ключевым показателям полностью его превосходит.

Объединение двух клинков

Стоп, не уходите.

Казалось бы, это всего лишь выпуск двух параллельных моделей, но Google заявляет: есть ещё кое-что новенькое.

Настоящее волшебство заключается в использовании этих моделей последовательно.

Всем известно, что создание AIGC-контента требует многократных итераций, и управление материалами довольно хлопотно.

Теперь же, благодаря этим двум моделям, больше не нужно постоянно загружать файлы — генерация изображений и создание видео плавно соединяются.

Конкретно: можно сначала быстро сгенерировать изображение с помощью Nano Banana 2 Lite, а затем использовать созданное изображение в качестве референс-материала для Gemini Omni Flash, одним кликом превратив его в видео.

Чтобы продемонстрировать этот магический воркфлоу «1+1>2», Google даже специально разработал 3 демо-приложения:

1. Anywhere (Где угодно)

Сделайте селфи или загрузите фото, и NB2 Lite моментально перенесёт вас на десятки знаковых достопримечательностей.

Затем нажмите на картинку, и Omni Flash превратит статичную достопримечательность в динамичный короткий ролик.

Кибертуризм теперь тоже стал сквозным процессом.

&amp;amp;amp;amp;nbsp;

2. Space Lift (Космический лифт / Преображение пространства)

Это даже немного пугает. Кажется, если это ещё объединить с мировой моделью Genie, в будущем могут пострадать многие традиционные SaaS-компании, предлагающие решения по ремонту.

Загрузите фото комнаты, NB2 Lite предложит различные варианты стилей ремонта. Найдёте понравившийся — нажмите кнопку «видео», и Omni даст вам киношный тур по пространству.

&amp;amp;amp;amp;nbsp;

3. Omni product studio (Универсальная студия товаров)

Благая весть для трансграничной электронной коммерции.

Сделайте фото товара на белом фоне, NB2 Lite создаст различные контекстные изображения товара, а Omni Flash превратит статичные картинки в короткие рекламные видео для электронной коммерции.

Весь путь от «продукта» до «рекламного материала» автоматически пройден.

&amp;amp;amp;amp;nbsp;

Итак, для чего же нужна мультимодальность?

Google, наверняка, этот вопрос задавали бесчисленное количество раз.

Особенно в 2026 году, когда «кодинг» почти стал синонимом интеллекта модели. Все изо всех сил стараются преуспеть в «кодинге».

Зачем так упорно бороться за мультимодальность?

Опустим громкие нарративы про ИИО. В краткосрочной перспективе эта мультимодальная модель Google действительно может дать импульс многим её продуктам.

О нарративах про ИИО говорить не будем. В краткосрочной перспективе эта мультимодальная модель Google действительно может дать импульс многим её продуктам — Stitch один из них, встроенное редактирование фото в Pixel — другой, появление NotebookLM тоже впечатляет.

Выпуск двух новых моделей позволяет увидеть больший потенциал применения мультимодальности в вертикальных сценариях. Электронная коммерция, ремонт, короткие видео... Спрос в этих сферах реален, и деньги там тоже реальные.

Плюс, имея поддержку экосистемы Android, в плане коммерциализации особо беспокоиться не приходится.

В «кодинге» Google временно не догнать, но за столом мультимодальности Google, возможно, единственный игрок, способный собрать полную колоду карт.

Однако...

Так когда же выйдет Gemni 3.5 Pro?!!!

Ссылки:[1]https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/

Статья из официального аккаунта WeChat «Квантовый бит», автор: В центре внимания — передовые технологии

Трендовые криптовалюты

Haedal ProtocolHAEDAL

Связанные с этим вопросы

QЧто такое Gemini Omni Flash и каковы его ключевые возможности?

AGemini Omni Flash — это мультимодальная модель от Google, способная создавать и редактировать видео на основе текстовых, графических и видео-вводов. Её ключевые возможности: диалоговое редактирование видео, работа с мультимодальными референсами, использование реальных знаний (история, биология и т.д.) и синхронизация текста с действием в видео.

QЧем отличается Nano Banana 2 Lite от предыдущих версий модели "банан"?

ANano Banana 2 Lite (gemini-3.1-flash-lite-image) — это самая быстрая и экономичная версия модели для генерации изображений. Она генерирует изображение с разрешением 1K примерно за 4 секунды по цене около $0.034 за картинку, что в пять раз быстрее и в два раза дешевле, чем Nano Banana 2.

QКакую новую рабочую схему (workflow) предложила Google, комбинируя новые модели?

AGoogle предложила схему, где сначала модель Nano Banana 2 Lite быстро генерирует изображение, а затем модель Gemini Omni Flash использует это изображение как референс для создания динамического видео. Это позволяет бесшовно переходить от генерации изображений к созданию видео.

QКакие примеры приложений-демо создала Google для демонстрации новых возможностей моделей?

AGoogle представила три демо-приложения: 1) "Anywhere" — переносит человека на фоны известных достопримечательностей и анимирует их; 2) "Space Lift" — генерирует варианты дизайна интерьера по фото комнаты и создаёт видео-тур; 3) "Omni product studio" — создаёт контекстные изображения товаров и рекламные видеоролики для электронной коммерции.

QКаковы текущие ограничения модели Gemini Omni Flash?

AТекущие ограничения Gemini Omni Flash: генерация видео длительностью до 10 секунд, отсутствие поддержки аудио-референсов и расширения сцен, ограниченная обработка видео-референсов (хотя API их принимает), а также проблемы с сохранением консистентности персонажей при смене сцен и движениях камеры.

Похожее

Grayscale: После обвала на 50%, BTC близок к дну текущего цикла

Биткоин упал ниже 60 тыс. долларов, достигнув нового минимума текущего цикла. По мнению Грейскал, это корректировка в рамках долгосрочного восходящего тренда. Ключевым фактором давления стали изменившиеся ожидания относительно политики ФРС (ожидание повышения ставок при новом председателе), что ослабило "сделку на обесценивание фиата". Другие негативные факторы включают неопределенность с принятием закона CLARITY, давление на балансы компаний вроде Strategy и опасения по поводу квантовых вычислений. Однако структурные драйверы роста (институциональное внедрение, долговая нагрузка правительств, развитие ИИ) остаются в силе. Выход из текущей фазы видится по двум сценариям. Оптимистичный (близость к дну): если ФРС не станет повышать ставки, закон CLARITY будет принят, а компании укрепят балансы. Пессимистичный (возможность дальнейшего снижения): если эти риски реализуются. При этом глубина падения, вероятно, будет меньше исторических максимумов (~80%) из-за более сдержанного роста в этом цикле и устойчивого институционального спроса. Исследователи Grayscale сохраняют долгосрочный оптимизм, считая текущие уровни привлекательными для инвесторов с долгосрочным горизонтом.

marsbit19 мин. назад

Grayscale: После обвала на 50%, BTC близок к дну текущего цикла

marsbit19 мин. назад

Руководство по выживанию в медвежьем рынке Web3: десять книг, которые помогут пройти через цикл

**Руководство по выживанию в медвежьем рынке Web3: 10 книг, которые помогут пережить цикл** Криптоиндустрия, пережившая четыре бычьих и четыре медвежьих рынка, использует периоды спада для переосмысления. В это время важно не просто ждать восстановления, а накапливать знания. Предлагаемая подборка книг затрагивает фундаментальные темы — технологии, экономику, культуру и психологию — помогая сохранить ясность мышления. 1. **«2049: будущие 10000 дней» Кевина Келли.** Дает долгосрочную перспективу, где криптовалюты могут стать второй мировой валютой, а их сочетание с ИИ — основой новых операционных систем. 2. **«Человеческая деятельность» Людвига фон Мизеса.** Объясняет природу человеческого действия и роль денег как инструмента расчета, укрепляя уверенность в действиях в условиях неопределенности. 3. **«Природа технологий» Брайана Артура.** Показывает, что технологии развиваются через комбинацию существующих решений, что объясняет эволюцию блокчейна и появление DeFi, NFT и других направлений. 4. **«Далекий спаситель» До Тунсюэ.** Раскрывает важность «культурных атрибутов»: сильная культура полагается на себя и законы, а слабая ищет спасителя. Урок для тех, кто хочет пережить медвежий рынок. 5. **«Суверенная личность» Дж. Д. Дэвидсона и У. Рис-Могга.** Предсказала еще в 1997 году появление технологий, которые передают власть от государств к отдельным людям, как это делает криптовалюта. 6. **«Уроки Японии: руководство по выживанию в эпоху рецессии».** Анализ 30-летнего периода стагнации в Японии показывает, что даже в условиях общего спада есть растущие сегменты (как, например, стейблкоины в криптоиндустрии). 7. **«Частные деньги» Фридриха Хайека.** Идеологическая основа для биткоина: конкуренция между валютами, а не государственная монополия, — лучший способ обеспечить стабильность. 8. **«Вопросы и ответы об инвестициях Дуань Юнпина».** Подчеркивает важность следования простым принципам: делать правильные вещи и избегать неправильных, что особенно важно в медвежий рынок. 9. **«Пророчество Баладжи: технологии, правда и руководство по созданию будущего» Баладжи С. Шринивасана.** Взгляд предпринимателя и инвестора, утверждающего, что блокчейн — важнейшее изобретение со времен письменности, и описывающего конкретные идеи для будущего. 10. **«Избранные произведения Мао Цзэдуна».** Предлагает стратегическое мышление для слабой стороны в противостоянии с сильной системой: анализ противоречий, определение союзников и тактика «окружения городов деревнями» (внедрение через развивающиеся рынки). Эти книги помогают укрепить не только знания, но и психологическую устойчивость, необходимую для преодоления рыночных циклов.

Foresight News38 мин. назад

Руководство по выживанию в медвежьем рынке Web3: десять книг, которые помогут пройти через цикл

Foresight News38 мин. назад

Кто самый успешный зарабатывающий мужчина в криптоиндустрии? Трамп заработал более $1,4 миллиарда в 2025 году.

Согласно отчету Управления по вопросам государственной этики США, бывший президент Дональд Трамп в 2025 году получил доход, превышающий 1.42 миллиарда долларов, от криптовалютных активов, что резко контрастирует с общим спадом на рынке в этот период. Основными источниками дохода стали операции через связанные с ним компании, такие как CIC Digital LLC и DT Marks Defi LLC, которые зарабатывали преимущественно на лицензионных отчислениях от мем-коинов, продаже токенов и стейкинге. При этом стоимость его собственного мем-коина значительно упала, что привело к убыткам для сотен тысяч инвесторов. Раскрытие этой информации происходит на фоне дебатов вокруг законопроекта CLARITY Act, который может запретить высокопоставленным чиновникам владеть криптоактивами из-за конфликта интересов, что особенно актуально в случае с Трампом, совмещающим роль бенефициара и регулятора.

Foresight News1 ч. назад

Кто самый успешный зарабатывающий мужчина в криптоиндустрии? Трамп заработал более $1,4 миллиарда в 2025 году.

Foresight News1 ч. назад

Финансовый отчет Трампа за 25 лет: Семья заработала на криптовалюте более 10 миллиардов долларов в год, а розничные инвесторы теряют деньги на $TRUMP

Отчет о финансовом раскрытии Трампа за 2025 год показывает, что его криптовалютный бизнес принес доход около 12 миллиардов долларов, превзойдя большую часть его многолетних активов в сфере недвижимости. Основные источники: компания World Liberty Financial, занимающаяся продажей "управляющих токенов" (свыше 5 млрд долларов), и CIC Digital LLC, получающая роялти от мем-токена TRUMP (около 6.35 млрд долларов). Тем временем, цена токена TRUMP упала с пика в 74 доллара до 1.68 доллара, а токен World Liberty Financial потерял 80% стоимости с начала торгов. Многие розничные инвесторы оказались в убытке, в то время как аффилированные с Трампом лица сохраняют контроль над большей частью токенов TRUMP. Рост криптодоходов совпал с изменением регуляторной политики администрации Трампа в пользу индустрии. Белый дом отрицает конфликт интересов, заявляя, что бизнес передан в доверительное управление сыновьям, а президент действует исключительно в общественных интересах.

marsbit1 ч. назад

Финансовый отчет Трампа за 25 лет: Семья заработала на криптовалюте более 10 миллиардов долларов в год, а розничные инвесторы теряют деньги на $TRUMP

marsbit1 ч. назад

От «кластеризации адресов» к «стандартам доказательств»: почему Chainalysis стремится переопределить трассировку в блокчейне?

В конце июня 2026 года Chainalysis представила структуру данных под названием «Blockchain Tracing Ontology» (Онтология блокчейн-трассировки), направленную на создание более унифицированной системы описания данных для анализа блокчейна. Это скорее отраслевая инициатива по стандартизации, чем новый продукт. Ключевая проблема, которую она решает, — отсутствие единых стандартов интерпретации открытых данных блокчейна. Разные компании, используя различные алгоритмы кластеризации адресов, часто приходят к противоречивым выводам о принадлежности адресов, что создает проблемы в судебных расследованиях и соблюдении нормативных требований. Предлагаемая онтология — это не новый алгоритм, а общий «язык» для описания результатов анализа. Она вводит более детальную модель данных, заменяя упрощенное понятие «кластера» на иерархическую структуру: Сущность → Кошелек → Сегмент кошелька → Адреса. Это лучше отражает сложную структуру кошельков крупных организаций, например, бирж. Главное нововведение — смещение фокуса с результата на процесс анализа. Для каждого вывода необходимо указывать используемые доказательства (Evidence), правила анализа и уровень достоверности (Confidence). Это делает анализ объяснимым, проверяемым и воспроизводимым, что критически важно для его использования в качестве судебного доказательства, как было в деле Bitcoin Fog. Chainalysis подчеркивает, что анализ блокчейна сам по себе не устанавливает реальную личность, а лишь раскрывает связи между адресами. Идентификация требует дополнительной информации извне цепи. В долгосрочной перспективе инициатива направлена на переход отрасли от подхода, основанного на опыте, к стандартизированному. Это может повысить согласованность данных между разными организациями, снизить затраты на взаимодействие и укрепить доверие со стороны регуляторов и судов. Конкурентное преимущество в будущем будет определяться не только точностью алгоритмов, но и прозрачностью, качеством данных и надежностью доказательств.

marsbit1 ч. назад

От «кластеризации адресов» к «стандартам доказательств»: почему Chainalysis стремится переопределить трассировку в блокчейне?

marsbit1 ч. назад

Торговля

Спот

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на 4 (4) представлены ниже.

Выходит видео-версия Nano Banana: встроена мировая база знаний Gemini, оригинальная банановая генерация изображений занимает всего 4 секунды

Введение

Gemini Omni Flash

Nano Banana 2 Lite

Объединение двух клинков

Итак, для чего же нужна мультимодальность?

Трендовые криптовалюты

Связанные с этим вопросы

Похожее

Grayscale: После обвала на 50%, BTC близок к дну текущего цикла

Руководство по выживанию в медвежьем рынке Web3: десять книг, которые помогут пройти через цикл

Кто самый успешный зарабатывающий мужчина в криптоиндустрии? Трамп заработал более $1,4 миллиарда в 2025 году.

Финансовый отчет Трампа за 25 лет: Семья заработала на криптовалюте более 10 миллиардов долларов в год, а розничные инвесторы теряют деньги на $TRUMP

От «кластеризации адресов» к «стандартам доказательств»: почему Chainalysis стремится переопределить трассировку в блокчейне?

Торговля

Популярные статьи

Как купить 4

Неделя обучения по популярным токенам 4: В 2025 году экосистема TRON переживает взрывной рост, TRON укрепляет позиции лидера по переводу стейблкоинов

Обсуждения

Топ вопросы

Популярные категории

Популярные теги