Выходит видео-версия Nano Banana: встроена мировая база знаний Gemini, оригинальная банановая генерация изображений занимает всего 4 секунды

marsbitОпубликовано 2026-07-01Обновлено 2026-07-01

Введение

Выпущены две новые мультимодальные модели от Google: Gemini Omni Flash и Nano Banana 2 Lite. Gemini Omni Flash, доступная через API, сочетает возможности Gemini по работе с текстом, изображениями и видео, позволяя генерировать и редактировать видео с использованием знаний о мире. Модель поддерживает диалоговое редактирование видео, работу с несколькими типами входных данных и синхронизацию текста с действием. Стоимость генерации — около 0,10 доллара за секунду видео. Nano Banana 2 Lite — это оптимизированная для скорости модель генерации изображений. Она создаёт изображение с разрешением 1K примерно за 4 секунды и стоит около 0,034 доллара за изображение, что делает её вдвое дешевле и в пять раз быстрее Nano Banana 2, сохраняя при этом качество рендеринга текста. Ключевая инновация — возможность совместного использования моделей в едином рабочем процессе. Пользователи могут быстро генерировать изображения с помощью Nano Banana 2 Lite, а затем немедленно использовать их в качестве основы для создания видео в Gemini Omni Flash. Google представил три демо-приложения, иллюстрирующих этот подход: «Anywhere» для создания туристических видео из фото, «Space Lift» для визуализации дизайна интерьера и «Omni product studio» для автоматической генерации рекламного контента для электронной коммерции. Эти разработки демонстрируют стратегию Google по внедрению мультимодального ИИ в практические, коммерчески жизнеспособные приложения, охватывающие такие области, как маркетинг, дизайн и р...

Хотя «кодинг» пока ещё так себе, но у Google явно есть пара козырей в рукаве, когда дело доходит до «мультимодальности».

Gemini Omni Flash официально открывает API — представляем видеоверсию Nano Banana.

Теперь мечта «магов-переделкистов» о «Гарри Поттере» может стать реальностью. Оцените эти четыре цифровых фокуса от Google с использованием Gemini Omni:

Просто невероятно! Эта согласованность и чёткость текста... Зачем тогда зелёный экран и спецэффекты? Можно сразу в прямом эфире показывать Доктора Стрэнджа.

И в то же время долгожданный «банан» обзаводится «светоскоростной» версией.

Nano Banana 2 Lite: самая быстрая и экономически эффективная модель генерации изображений Gemini на сегодняшний день.

Без преувеличений — 4 секунды на одно изображение, картинка с разрешением 1K обойдётся примерно в 2 с лишним цента.

Если сравнить с Nano Banana 2, эта скорость просто взрывная.

Не говоря уже о GPT Image 2, которому для одного изображения нужно 3 минуты...

Теперь понятно, почему так долго нет Gemini 3.5 Pro — оказывается, всё время ушло на страстно любимую «мультимодальность», да, Хассабис?!

Gemini Omni Flash

Gemini Omni Flash, впервые представленный на Google I/O 2026, глубоко интегрирует возможности мультимодального анализа Gemini с генерацией и редактированием видео, что сразу привлекло внимание.

Теперь эта модель официально доступна разработчикам через Gemini API и Google AI Studio. Она легко генерирует и редактирует высококачественное видео на основе текстовых, графических и видео-входных данных.

Четыре ключевые возможности:

Диалоговое редактирование видео: изменение и доработка видео естественным языком, прямо как редактирование документа в Feishu.

Мультимодальные ссылки: комбинирование изображений, текста, видео с сохранением контроля над сценой и согласованности.

Знания о реальном мире: использование знаний Gemini в истории, биологии, логике повествования для построения видео — не нужно писать трёхстраничные промпты, описывая архитектурный стиль.

Синхронизация текста и действий: подключение текста и графики непосредственно к действиям в видео с помощью простых промптов.

Цены тоже конкурентоспособные: стоимость вывода видео за секунду составляет 0.10 доллара, что на уровне Veo 3.1 Fast.

В плане позиционирования, будучи такой же облегчённой моделью генерации видео, Omni Flash больше делает упор на мировые знания Gemini, а в экосистемном плане также полностью ориентирован на уровень Gemini.

Впрочем, Google довольно откровенен и сам перечисляет ряд текущих ограничений:

1. Пока поддерживается генерация видео длиной только до 10 секунд, позже будут поддержаны более длинные ролики;

2. Временно не поддерживается загрузка аудио-референсов и расширение сцен;

3. API поддерживает видео длиной до 3 секунд в качестве справочного материала, но модель пока не может корректно обрабатывать такие входные данные;

4. Согласованность персонажей при смене сцен и движениях камеры всё ещё ограничена.

Nano Banana 2 Lite

Nano Banana 2 Lite (также известная как gemini-3.1-flash-lite-image) создана для скоростной обработки.

Благодаря целевой оптимизации она нацелена на сценарии реального времени, крайне чувствительные к задержкам и требующие обработки больших объёмов изображений за короткое время — например, пакетная генерация материалов для электронной коммерции, быстрая итерация рекламных креативов, автоматизированные конвейеры контента.

Два основных преимущества —

Скорость света: задержка генерации изображения около 4 секунд, что в пять раз быстрее Nano Banana 2 (около 20 секунд).

Цена копеечная: одно изображение 1K стоит около 0.034 доллара, что вдвое дешевле Nano Banana 2 и в четыре раза дешевле Nano Banana Pro.

Скорость увеличена, цена снижена, но возможности генерации и редактирования изображений заметно не пострадали. Nano Banana 2 Lite по-прежнему сохраняет отличный эффект рендеринга текста, находясь на одном уровне с такими моделями, как Grok, по тестам.

Поэтому рекомендация Google такая: если вы всё ещё пользуетесь первым Nano Banana ради дешевизны, срочно меняйте. Lite-версия уже по всем ключевым показателям полностью его превосходит.

Объединение двух клинков

Стоп, не уходите.

Казалось бы, это всего лишь выпуск двух параллельных моделей, но Google заявляет: есть ещё кое-что новенькое.

Настоящее волшебство заключается в использовании этих моделей последовательно.

Всем известно, что создание AIGC-контента требует многократных итераций, и управление материалами довольно хлопотно.

Теперь же, благодаря этим двум моделям, больше не нужно постоянно загружать файлы — генерация изображений и создание видео плавно соединяются.

Конкретно: можно сначала быстро сгенерировать изображение с помощью Nano Banana 2 Lite, а затем использовать созданное изображение в качестве референс-материала для Gemini Omni Flash, одним кликом превратив его в видео.

Чтобы продемонстрировать этот магический воркфлоу «1+1>2», Google даже специально разработал 3 демо-приложения:

1. Anywhere (Где угодно)

Сделайте селфи или загрузите фото, и NB2 Lite моментально перенесёт вас на десятки знаковых достопримечательностей.

Затем нажмите на картинку, и Omni Flash превратит статичную достопримечательность в динамичный короткий ролик.

Кибертуризм теперь тоже стал сквозным процессом.

2. Space Lift (Космический лифт / Преображение пространства)

Это даже немного пугает. Кажется, если это ещё объединить с мировой моделью Genie, в будущем могут пострадать многие традиционные SaaS-компании, предлагающие решения по ремонту.

Загрузите фото комнаты, NB2 Lite предложит различные варианты стилей ремонта. Найдёте понравившийся — нажмите кнопку «видео», и Omni даст вам киношный тур по пространству.

3. Omni product studio (Универсальная студия товаров)

Благая весть для трансграничной электронной коммерции.

Сделайте фото товара на белом фоне, NB2 Lite создаст различные контекстные изображения товара, а Omni Flash превратит статичные картинки в короткие рекламные видео для электронной коммерции.

Весь путь от «продукта» до «рекламного материала» автоматически пройден.

Итак, для чего же нужна мультимодальность?

Google, наверняка, этот вопрос задавали бесчисленное количество раз.

Особенно в 2026 году, когда «кодинг» почти стал синонимом интеллекта модели. Все изо всех сил стараются преуспеть в «кодинге».

Зачем так упорно бороться за мультимодальность?

Опустим громкие нарративы про ИИО. В краткосрочной перспективе эта мультимодальная модель Google действительно может дать импульс многим её продуктам.

О нарративах про ИИО говорить не будем. В краткосрочной перспективе эта мультимодальная модель Google действительно может дать импульс многим её продуктам — Stitch один из них, встроенное редактирование фото в Pixel — другой, появление NotebookLM тоже впечатляет.

Выпуск двух новых моделей позволяет увидеть больший потенциал применения мультимодальности в вертикальных сценариях. Электронная коммерция, ремонт, короткие видео... Спрос в этих сферах реален, и деньги там тоже реальные.

Плюс, имея поддержку экосистемы Android, в плане коммерциализации особо беспокоиться не приходится.

В «кодинге» Google временно не догнать, но за столом мультимодальности Google, возможно, единственный игрок, способный собрать полную колоду карт.

Однако...

Так когда же выйдет Gemni 3.5 Pro?!!!

Ссылки:[1]https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/

Статья из официального аккаунта WeChat «Квантовый бит», автор: В центре внимания — передовые технологии

Трендовые криптовалюты

Связанные с этим вопросы

QЧто такое Gemini Omni Flash и каковы его ключевые возможности?

AGemini Omni Flash — это мультимодальная модель от Google, способная создавать и редактировать видео на основе текстовых, графических и видео-вводов. Её ключевые возможности: диалоговое редактирование видео, работа с мультимодальными референсами, использование реальных знаний (история, биология и т.д.) и синхронизация текста с действием в видео.

QЧем отличается Nano Banana 2 Lite от предыдущих версий модели "банан"?

ANano Banana 2 Lite (gemini-3.1-flash-lite-image) — это самая быстрая и экономичная версия модели для генерации изображений. Она генерирует изображение с разрешением 1K примерно за 4 секунды по цене около $0.034 за картинку, что в пять раз быстрее и в два раза дешевле, чем Nano Banana 2.

QКакую новую рабочую схему (workflow) предложила Google, комбинируя новые модели?

AGoogle предложила схему, где сначала модель Nano Banana 2 Lite быстро генерирует изображение, а затем модель Gemini Omni Flash использует это изображение как референс для создания динамического видео. Это позволяет бесшовно переходить от генерации изображений к созданию видео.

QКакие примеры приложений-демо создала Google для демонстрации новых возможностей моделей?

AGoogle представила три демо-приложения: 1) "Anywhere" — переносит человека на фоны известных достопримечательностей и анимирует их; 2) "Space Lift" — генерирует варианты дизайна интерьера по фото комнаты и создаёт видео-тур; 3) "Omni product studio" — создаёт контекстные изображения товаров и рекламные видеоролики для электронной коммерции.

QКаковы текущие ограничения модели Gemini Omni Flash?

AТекущие ограничения Gemini Omni Flash: генерация видео длительностью до 10 секунд, отсутствие поддержки аудио-референсов и расширения сцен, ограниченная обработка видео-референсов (хотя API их принимает), а также проблемы с сохранением консистентности персонажей при смене сцен и движениях камеры.

Похожее

Grayscale: После обвала на 50%, BTC близок к дну текущего цикла

Биткоин упал ниже 60 тыс. долларов, достигнув нового минимума текущего цикла. По мнению Грейскал, это корректировка в рамках долгосрочного восходящего тренда. Ключевым фактором давления стали изменившиеся ожидания относительно политики ФРС (ожидание повышения ставок при новом председателе), что ослабило "сделку на обесценивание фиата". Другие негативные факторы включают неопределенность с принятием закона CLARITY, давление на балансы компаний вроде Strategy и опасения по поводу квантовых вычислений. Однако структурные драйверы роста (институциональное внедрение, долговая нагрузка правительств, развитие ИИ) остаются в силе. Выход из текущей фазы видится по двум сценариям. Оптимистичный (близость к дну): если ФРС не станет повышать ставки, закон CLARITY будет принят, а компании укрепят балансы. Пессимистичный (возможность дальнейшего снижения): если эти риски реализуются. При этом глубина падения, вероятно, будет меньше исторических максимумов (~80%) из-за более сдержанного роста в этом цикле и устойчивого институционального спроса. Исследователи Grayscale сохраняют долгосрочный оптимизм, считая текущие уровни привлекательными для инвесторов с долгосрочным горизонтом.

marsbit19 мин. назад

Grayscale: После обвала на 50%, BTC близок к дну текущего цикла

marsbit19 мин. назад

Руководство по выживанию в медвежьем рынке Web3: десять книг, которые помогут пройти через цикл

**Руководство по выживанию в медвежьем рынке Web3: 10 книг, которые помогут пережить цикл** Криптоиндустрия, пережившая четыре бычьих и четыре медвежьих рынка, использует периоды спада для переосмысления. В это время важно не просто ждать восстановления, а накапливать знания. Предлагаемая подборка книг затрагивает фундаментальные темы — технологии, экономику, культуру и психологию — помогая сохранить ясность мышления. 1. **«2049: будущие 10000 дней» Кевина Келли.** Дает долгосрочную перспективу, где криптовалюты могут стать второй мировой валютой, а их сочетание с ИИ — основой новых операционных систем. 2. **«Человеческая деятельность» Людвига фон Мизеса.** Объясняет природу человеческого действия и роль денег как инструмента расчета, укрепляя уверенность в действиях в условиях неопределенности. 3. **«Природа технологий» Брайана Артура.** Показывает, что технологии развиваются через комбинацию существующих решений, что объясняет эволюцию блокчейна и появление DeFi, NFT и других направлений. 4. **«Далекий спаситель» До Тунсюэ.** Раскрывает важность «культурных атрибутов»: сильная культура полагается на себя и законы, а слабая ищет спасителя. Урок для тех, кто хочет пережить медвежий рынок. 5. **«Суверенная личность» Дж. Д. Дэвидсона и У. Рис-Могга.** Предсказала еще в 1997 году появление технологий, которые передают власть от государств к отдельным людям, как это делает криптовалюта. 6. **«Уроки Японии: руководство по выживанию в эпоху рецессии».** Анализ 30-летнего периода стагнации в Японии показывает, что даже в условиях общего спада есть растущие сегменты (как, например, стейблкоины в криптоиндустрии). 7. **«Частные деньги» Фридриха Хайека.** Идеологическая основа для биткоина: конкуренция между валютами, а не государственная монополия, — лучший способ обеспечить стабильность. 8. **«Вопросы и ответы об инвестициях Дуань Юнпина».** Подчеркивает важность следования простым принципам: делать правильные вещи и избегать неправильных, что особенно важно в медвежий рынок. 9. **«Пророчество Баладжи: технологии, правда и руководство по созданию будущего» Баладжи С. Шринивасана.** Взгляд предпринимателя и инвестора, утверждающего, что блокчейн — важнейшее изобретение со времен письменности, и описывающего конкретные идеи для будущего. 10. **«Избранные произведения Мао Цзэдуна».** Предлагает стратегическое мышление для слабой стороны в противостоянии с сильной системой: анализ противоречий, определение союзников и тактика «окружения городов деревнями» (внедрение через развивающиеся рынки). Эти книги помогают укрепить не только знания, но и психологическую устойчивость, необходимую для преодоления рыночных циклов.

Foresight News38 мин. назад

Руководство по выживанию в медвежьем рынке Web3: десять книг, которые помогут пройти через цикл

Foresight News38 мин. назад

Кто самый успешный зарабатывающий мужчина в криптоиндустрии? Трамп заработал более $1,4 миллиарда в 2025 году.

Согласно отчету Управления по вопросам государственной этики США, бывший президент Дональд Трамп в 2025 году получил доход, превышающий 1.42 миллиарда долларов, от криптовалютных активов, что резко контрастирует с общим спадом на рынке в этот период. Основными источниками дохода стали операции через связанные с ним компании, такие как CIC Digital LLC и DT Marks Defi LLC, которые зарабатывали преимущественно на лицензионных отчислениях от мем-коинов, продаже токенов и стейкинге. При этом стоимость его собственного мем-коина значительно упала, что привело к убыткам для сотен тысяч инвесторов. Раскрытие этой информации происходит на фоне дебатов вокруг законопроекта CLARITY Act, который может запретить высокопоставленным чиновникам владеть криптоактивами из-за конфликта интересов, что особенно актуально в случае с Трампом, совмещающим роль бенефициара и регулятора.

Foresight News1 ч. назад

Кто самый успешный зарабатывающий мужчина в криптоиндустрии? Трамп заработал более $1,4 миллиарда в 2025 году.

Foresight News1 ч. назад

Финансовый отчет Трампа за 25 лет: Семья заработала на криптовалюте более 10 миллиардов долларов в год, а розничные инвесторы теряют деньги на $TRUMP

Отчет о финансовом раскрытии Трампа за 2025 год показывает, что его криптовалютный бизнес принес доход около 12 миллиардов долларов, превзойдя большую часть его многолетних активов в сфере недвижимости. Основные источники: компания World Liberty Financial, занимающаяся продажей "управляющих токенов" (свыше 5 млрд долларов), и CIC Digital LLC, получающая роялти от мем-токена TRUMP (около 6.35 млрд долларов). Тем временем, цена токена TRUMP упала с пика в 74 доллара до 1.68 доллара, а токен World Liberty Financial потерял 80% стоимости с начала торгов. Многие розничные инвесторы оказались в убытке, в то время как аффилированные с Трампом лица сохраняют контроль над большей частью токенов TRUMP. Рост криптодоходов совпал с изменением регуляторной политики администрации Трампа в пользу индустрии. Белый дом отрицает конфликт интересов, заявляя, что бизнес передан в доверительное управление сыновьям, а президент действует исключительно в общественных интересах.

marsbit1 ч. назад

Финансовый отчет Трампа за 25 лет: Семья заработала на криптовалюте более 10 миллиардов долларов в год, а розничные инвесторы теряют деньги на $TRUMP

marsbit1 ч. назад

От «кластеризации адресов» к «стандартам доказательств»: почему Chainalysis стремится переопределить трассировку в блокчейне?

В конце июня 2026 года Chainalysis представила структуру данных под названием «Blockchain Tracing Ontology» (Онтология блокчейн-трассировки), направленную на создание более унифицированной системы описания данных для анализа блокчейна. Это скорее отраслевая инициатива по стандартизации, чем новый продукт. Ключевая проблема, которую она решает, — отсутствие единых стандартов интерпретации открытых данных блокчейна. Разные компании, используя различные алгоритмы кластеризации адресов, часто приходят к противоречивым выводам о принадлежности адресов, что создает проблемы в судебных расследованиях и соблюдении нормативных требований. Предлагаемая онтология — это не новый алгоритм, а общий «язык» для описания результатов анализа. Она вводит более детальную модель данных, заменяя упрощенное понятие «кластера» на иерархическую структуру: Сущность → Кошелек → Сегмент кошелька → Адреса. Это лучше отражает сложную структуру кошельков крупных организаций, например, бирж. Главное нововведение — смещение фокуса с результата на процесс анализа. Для каждого вывода необходимо указывать используемые доказательства (Evidence), правила анализа и уровень достоверности (Confidence). Это делает анализ объяснимым, проверяемым и воспроизводимым, что критически важно для его использования в качестве судебного доказательства, как было в деле Bitcoin Fog. Chainalysis подчеркивает, что анализ блокчейна сам по себе не устанавливает реальную личность, а лишь раскрывает связи между адресами. Идентификация требует дополнительной информации извне цепи. В долгосрочной перспективе инициатива направлена на переход отрасли от подхода, основанного на опыте, к стандартизированному. Это может повысить согласованность данных между разными организациями, снизить затраты на взаимодействие и укрепить доверие со стороны регуляторов и судов. Конкурентное преимущество в будущем будет определяться не только точностью алгоритмов, но и прозрачностью, качеством данных и надежностью доказательств.

marsbit1 ч. назад

От «кластеризации адресов» к «стандартам доказательств»: почему Chainalysis стремится переопределить трассировку в блокчейне?

marsbit1 ч. назад

Торговля

Спот

Популярные статьи

Как купить 4

Добро пожаловать на HTX.com! Мы сделали приобретение 4 (4) простым и удобным. Следуйте нашему пошаговому руководству и отправляйтесь в свое крипто-путешествие.Шаг 1: Создайте аккаунт на HTXИспользуйте свой адрес электронной почты или номер телефона, чтобы зарегистрироваться и бесплатно создать аккаунт на HTX. Пройдите удобную регистрацию и откройте для себя весь функционал.Создать аккаунтШаг 2: Перейдите в Купить криптовалюту и выберите свой способ оплатыКредитная/Дебетовая Карта: Используйте свою карту Visa или Mastercard для мгновенной покупки 4 (4).Баланс: Используйте средства с баланса вашего аккаунта HTX для простой торговли.Третьи Лица: Мы добавили популярные способы оплаты, такие как Google Pay и Apple Pay, для повышения удобства.P2P: Торгуйте напрямую с другими пользователями на HTX.Внебиржевая Торговля (OTC): Мы предлагаем индивидуальные услуги и конкурентоспособные обменные курсы для трейдеров.Шаг 3: Хранение 4 (4)После приобретения вами 4 (4) храните их в своем аккаунте на HTX. В качестве альтернативы вы можете отправить их куда-либо с помощью перевода в блокчейне или использовать для торговли с другими криптовалютами.Шаг 4: Торговля 4 (4)С легкостью торгуйте 4 (4) на спотовом рынке HTX. Просто зайдите в свой аккаунт, выберите торговую пару, совершайте сделки и следите за ними в режиме реального времени. Мы предлагаем удобный интерфейс как для начинающих, так и для опытных трейдеров.

695 просмотров всегоОпубликовано 2025.10.20Обновлено 2026.06.02

Как купить 4

Неделя обучения по популярным токенам 4: В 2025 году экосистема TRON переживает взрывной рост, TRON укрепляет позиции лидера по переводу стейблкоинов

В 2025 году экосистема TRON быстро развивается, уделяя особое внимание взаимодействию, безопасности и практическому внедрению.

2.2k просмотров всегоОпубликовано 2025.12.30Обновлено 2025.12.30

Неделя обучения по популярным токенам 4: В 2025 году экосистема TRON переживает взрывной рост, TRON укрепляет позиции лидера по переводу стейблкоинов

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на 4 (4) представлены ниже.

活动图片