Утечка модели генерации изображений, которая популярнее Nano Banana. Скриншоты больше не являются доказательством | Включая промпты

marsbitОпубликовано 2026-04-19Обновлено 2026-04-19

Введение

Модель GPT Image 2 от OpenAI, ещё не анонсированная официально, была протестирована пользователями. Она демонстрирует значительное улучшение в рендеринге текста, включая точное отображение китайских, японских и корейских символов, что делает скриншоты ненадёжными в качестве доказательств. Модель превосходит Midjourney и Nano Banana Pro в реалистичности, следовании инструкциям и знании мира. Она способна генерировать фотореалистичные изображения интерфейсов, продуктовых этикеток и сцен с точными деталями. Это открывает новые возможности для дизайнеров и создателей контента. Ожидается, что официальный выпуск состоится в мае 2026 года. Для тестирования доступна платформа LM Arena.

Ваше представление о генерации изображений по тексту всё ещё застряло на Nano Banana?

Но, дитя, времена снова изменились.

@johnAGI168 https://x.com/johnAGI168/status/2044781168151724067

@0115hippo https://x.com/0115hippo/status/2044722124611539160

В начале апреля на платформе оценки LM Arena появились три анонимные модели генерации изображений с кодовыми названиями maskingtape-alpha, packingtape-alpha и gaffertape-alpha. Через несколько часов они исчезли.

Официально OpenAI ещё не анонсировала эту модель, но, судя по метаданным, возвращаемым API, и записям тестов пользователей, у неё уже есть широко принятое название: GPT Image 2.

Скриншоты больше не могут быть доказательством

В последние годы одним из самых очевидных недостатков моделей генерации изображений ИИ был текст на картинках. Во времена DALL-E 3, если вы просили его написать «Hello» на изображении, вы могли получить «Hellp» или даже «Hl10», буквы выглядели так, словно они пьяны и шатаются. GPT Image 1 стал намного лучше, он мог обрабатывать простые английские надписи. К GPT Image 1.5 точность рендеринга английского текста достигла почти 95%, но всё ещё были заметные недостатки в нелатинских системах письма, таких как китайский, японский, корейский и другие.

А утекшие образцы изображений GPT Image 2 изменили это впечатление.

@MrLarus https://x.com/MrLarus/status/2044824800909054181

@akokoi1 https://x.com/akokoi1/status/2044789531615056175

Текст на картинках — какой должен быть, такой и есть. Китайские иероглифы чёткие, форма символов точная, черты полные. Кто-то тестировал генерацию изображения, похожего на удостоверение личности: имя, адрес, номер документа — всё было отрендерено правильно, вёрстка аккуратная, на первый взгляд похоже на фото реального документа.

Это хорошая новость. Прогресс в рендеринге текста означает, что генерация инфографики, плакатов, упаковки продуктов, сложно вёрстанных диаграмм стала более надёжной.

Но у медали есть и обратная сторона. Модель, способная генерировать достоверно выглядящие изображения в стиле удостоверений, точно рендерить скриншоты интерфейсов, естественно, делает утверждение «скриншот может быть доказательством» всё более сомнительным.

Для сравнения, это также является ключевым различием между серией GPT Image и другими моделями. Midjourney до сих пор не достиг никаких успехов в рендеринге текста, у серии Stable Diffusion тоже старые проблемы. Согласно утёкшим результатам тестов Arena, GPT Image 2 превзошёл Midjourney по четырём параметрам: рендеринг текста, следование инструкциям, фотореалистичность и знания о мире; преимущество последнего в основном сохраняется в художественных стилях и эстетическом контроле.

Знает ли он на самом деле, как выглядит этот мир?

Один тестировщик попросил модель сгенерировать страницу с гипотетическими ценами на продукт GPT-8. В результате получилось изображение, вёрстка которого действительно была в стиле сайта OpenAI, расположение кнопок и выбор шрифтов были похожи на скриншот реального интерфейса, иерархическая логика таблицы цен также была правильной.

GPT Image 2 может генерировать изображения, чрезвычайно похожие на реальные программные интерфейсы, включая окна браузера, интерфейсы мобильных приложений, диаграммы для визуализации данных, — уровень достоверности несравним с продуктами предыдущего поколения.

@johnAGI168 https://x.com/johnAGI168/status/2044781168151724067

@levelsio https://x.com/levelsio/status/2040333489476681758

Это приведёт к некоторым很有意思的实际用途. Дизайнеры при создании прототипов продуктов не должны сначала открывать Figma и рисовать кучу框架, они могут直接用文字描述想要的界面, и на выходе得到参考图 для обсуждения с командой. При создании инвесторской презентации (Deck) можно показать «скриншот продукта», не дожидаясь, пока инженер напишет код. При написании документации примеры интерфейсов для иллюстрации можно генерировать напрямую, не думая, откуда брать скриншоты для пустой страницы.

@marmaduke091 https://x.com/marmaduke091/status/2040338311873515597

Генерация изображений — это уже не просто «генерация изображений»

OpenAI уже объявила, что DALL-E 2 и DALL-E 3 официально прекратят работу 12 мая 2026 года. DALL-E 3 в Azure OpenAI был снят с эксплуатации досрочно в феврале.

DALL-E для многих стало первым местом знакомства с генерацией изображений ИИ, от тех размытых ранних работ до сегодняшнего дня прошло всего несколько лет.

В то же время Google, которая только в начале 2026 года утвердила своё лидерство в отрасли с помощью Nano Banana Pro, возможно, почувствует давление. Согласно ранним отчётам о тестировании, GPT Image 2 одновременно превзошёл Nano Banana Pro по трём параметрам: реалистичность, рендеринг текста и знания о мире — такая тройная победа встречается нечасто.

Для создателей ощущения сложные. Иллюстраторы, графические дизайнеры, фотографы — это уже не в первый раз сталкиваются с этой темой. С момента выпуска GPT Image 1 количество вакансий внештатных графических дизайнеров сократилось примерно на 18%. ИИ в некоторых сценариях действительно заменяет решение «я найму человека для этого дела», но он также создаёт новые способы работы, позволяя одному человеку делать больше.

Скорость эволюции моделей генерации изображений уже не оставляет много времени на адаптацию. От запуска GPT Image 1 до версии 1.5 прошло всего несколько месяцев. От 1.5 до 2 — примерно полгода. Каждое поколение решает ключевые недостатки предыдущего, одновременно открывая новые возможности.

GPT Image 2 сейчас находится на этапе A/B-тестирования, некоторые пользователи ChatGPT уже случайным образом получили доступ. Окно официального выпуска, по общим прогнозам, придётся на период около мая, когда DALL-E будет снят с эксплуатации. Если хотите испытать его заранее, в настоящее время можно попытать удачу на платформе оценки LM Arena.

Адрес для тестирования: https://arena.ai

Согласно отзывам сообщества и известным преимуществам этой модели, следующие шаблоны промптов могут максимально повысить ваши шансы на успех:

Промпт для UI/скриншотов: Фотографически реалистичный скриншот мобильного банковского приложения, чётко отображающий историю транзакций, где дата, сумма и название merchantа чётко различимы. Экран iPhone 16, естественное держание телефона в руке, фон кофейни.

Промпт для этикетки продукта: Фотографическое изображение бутылки крафтового пива, детали этикетки чёткие, отображается название пивоварни «Oakridge Brewing Co.», крепость алкоголя 6.8%, логотип с горами и список ингредиентов. Студийное освещение, белый фон.

Промпт для вывесок/неона: Фотография ночной улочки в Токио, видны多处 вывески с неоновой подсветкой на японском и английском языках, включая вывеску рамэн-ресторана с надписью «Ichiban Ramen — Est. 1987», вывеску караоке-бара и различные светящиеся рекламные щиты. На мокром после дождя тротуаре отражаются огни.

Промпт для интерфейса/знаний о мире: Фотографически реалистичный скриншот видео на YouTube, демонстрирующий видео под названием «Как собрать компьютер в 2026 году», у которого 2.3 миллиона просмотров, с реалистичными комментариями, рекомендациями видео в боковой панели и информацией о канале. Вид в desktop браузере.

Промпт-триггер для широкоэкранного формата: Это кинематографичное широкоэкранное фото, снятое в сумерках с внешним видом магазина IKEA, показывает светящуюся вывеску IKEA, parking lot с реалистичными автомобилями и покупателей, входящих и выходящих. Освещение в золотой час, формат 16:9.

Источник изображений и ссылка без указания авторства: https://miraflow.ai/blog/how-to-use-duct-tape-ai-model-arena-gpt-image-2-guide

Эта статья из WeChat Official Account "APPSO", автор: 发现明日产品的 (Discover Tomorrow's Products)

Трендовые криптовалюты

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

BrevisBREV

PancakeSwapCAKE

JUSTJST

Связанные с этим вопросы

QЧто такое GPT Image 2 и почему он стал известен?

AGPT Image 2 — это новая модель генерации изображений от OpenAI, которая была неофициально обнаружена на платформе LM Arena в апреле 2026 года. Она стала известна благодаря значительному улучшению рендеринга текста (включая китайские иероглифы), точности визуализации интерфейсов и способности создавать фотореалистичные изображения, что превосходит предыдущие модели, такие как DALL-E 3 и даже Nano Banana Pro от Google.

QКакие основные улучшения GPT Image 2 по сравнению с предыдущими моделями?

AGPT Image 2 демонстрирует революционные улучшения в трёх ключевых областях: 1) Точный рендеринг текста на различных языках, включая китайский, без ошибок в символах или компоновке. 2) Высокая точность в воспроизведении мировых знаний, например, генерации реалистичных интерфейсов приложений или веб-страниц. 3) Фотореалистичность изображений, что делает скриншоты или документы, созданные моделью, практически неотличимыми от настоящих.

QПочему скриншоты больше не могут считаться надёжным доказательством?

AБлагодаря способности GPT Image 2 генерировать фотореалистичные изображения с точным текстом и деталями (например, документы, интерфейсы приложений или скриншоты веб-страниц), становится практически невозможно отличить сгенерированное изображение от реального. Это подрывает доверие к скриншотам как к доказательству, поскольку их можно легко подделать с помощью ИИ.

QКаковы практические применения GPT Image 2 для дизайнеров и разработчиков?

AМодель открывает новые возможности для профессионалов: дизайнеры могут быстро создавать прототипы интерфейсов, описывая их текстом; разработчики — генерировать визуализации для документации без необходимости реального скриншота; маркетологи — создавать реалистичные изображения продукта с точными этикетками. Это ускоряет рабочий процесс и снижает зависимость от ручного труда.

QКак можно получить доступ к GPT Image 2 и какие подсказки эффективны для генерации?

AВ настоящее время GPT Image 2 находится на этапе A/B-тестирования, и доступ случаен для некоторых пользователей ChatGPT. Для тестирования можно попробовать платформу LM Arena (arena.ai). Эффективные подсказки включают описание деталей: для интерфейсов — указание точных текстов и элементов, для продуктов — чёткие надписи на этикетках, для сцен — упоминание формата (например, киноширокоэкранный 16:9) и контекста (например, 'после дождя').

Похожее

На неделе с 3 по 9 августа стоит обратить внимание: Закон CLARITY, возможно, будет поставлен на голосование в Сенате; SpaceX и Circle опубликуют финансовые отчеты

**Важные события на следующей неделе (3–9 августа 2026 г.)** **Ключевые даты:** * **3 августа:** Публикация отчетов American Bitcoin за Q2. Полное закрытие сервисов DeFi-трекера Zapper и кошелька Ctrl Wallet. LayerZero прекратит поддержку ретрансляторов v1. Upbit прекратит торговлю токенами AQT и AERGO. * **4 августа:** Публикация финансовых отчетов SpaceX и Hut 8 за второй квартал 2026 года. * **5 августа:** Circle опубликует отчет за Q2. Начинается предварительное ценовое консультирование для IPO компании Unitree Tech (Ушу Цзишу) в Китае. * **6 августа:** Первая крупная разблокировка акций SpaceX — до 12% от общего капитала. * **7 августа:** Выход важных данных по рынку труда США (отчет о занятости за июль). Предельный срок для Сената США — получить 60 голосов в поддержку **Закона CLARITY** (билль о регулировании криптовалют и этике). Ожидается выпуск Grok 4.6 от xAI. * **8 августа:** Начало принудительной подачи сигналов в сети Bitcoin согласно предложению BIP-110. * **На неделе (дата уточняется):** Ожидается голосование полного состава Сената США по **Закону CLARITY**. Выход нового релиза XRP Ledger (v3.3.0) с новыми функциями, такими как конфиденциальные данные и пакетные транзакции. **Основные темы недели:** корпоративная отчетность (SpaceX, Circle), регулирование (CLARITY Act), рыночные события (разблокировка акций SpaceX, отчет по занятости в США) и обновления в технологиях блокчейна.

marsbit14 мин. назад

На неделе с 3 по 9 августа стоит обратить внимание: Закон CLARITY, возможно, будет поставлен на голосование в Сенате; SpaceX и Circle опубликуют финансовые отчеты

marsbit14 мин. назад

Акции упали сильнее, чем криптовалюты. Куда делись деньги?

Автор: Кэти,白话区块链 28-29 июля, Сеул. Индекс Kospi впервые в истории Южной Кореи два дня подряд срабатывал на приостановку торгов. Первый день: падение на 10.84%, второй день: -5.98%. SK Hynix, крупнейшая по весу акция, потеряла за два дня около 23%. Падение Nasdaq, глобальный обвал акций полупроводниковых компаний, массовые потери на кредитных ETF. За два дня откат Kospi от пика июня достиг 40%. Июль угрожает стать худшим месяцем в истории индекса. Все ранее перегретые сделки были перевернуты, как стол. Это не локальный негатив по одной акции, а глобальное принудительное снижение кредитного плеча. Самое парадоксальное: на этот раз больше всего на «криптовалютное» падение похожи именно акции. Спот: прибыль SK Hynix за второй квартал достигла рекордных 60.54 трлн вон, но из-за несоответствия прогнозу в 64.22 трлн акция подверглась жесткой распродаже. Хорошие новости не растут — это уже плохая новость. Производные инструменты пострадали еще сильнее. Кредитный ETF с плечом 2x на SK Hynix упал на 83% с пика, потеряв в стоимости более 1 трлн гонконгских долларов. Эмитент был вынужден изменить правила продукта. Неожиданно: Биткоин, известный высокой волатильностью, с 1 июля вырос почти на 15%, в то время как акции демонстрировали «криптовалютную» динамику. Это не паника всего рынка, а точечный сброс перегретых позиций. Триггеры: отчет SK Hynix и фактор Китая — крупнейшее IPO ChangXin Memory, направленное на расширение производства DRAM, создало конкуренцию для нарратива о дефиците памяти для ИИ. Дополнительное давление — нормализация политики Банка Японии и потенциальное сокращение кэрри-трейда в иенах. Эксперт Дэн Найлз считает, что это не крах логики ИИ, а «краткосрочное дно», вызванное принудительными ликвидациями мелких инвесторов и хедж-фондов. Промышленная логика не мертва — умерло кредитное плечо. Перетекли ли деньги из акций в Биткоин? Нет. «Устойчивость» Биткоина объясняется тем, что он уже прошел фазу распродаж раньше. В мае-июне американские спотовые BTC-ETF зафиксировали рекордный отток средств. К июлю продавать было уже нечего. Небольшой приток в июле — лишь частичное восстановление. Настоящие «защитные» деньги пошли в золото. Коэффициент корреляции между Биткоином и золотом упал до -0.88. Нарратив о «цифровом золоте» разбит: золото — для сохранения капитала, Биткоин — для роста. Деньги придут в криптоактивы при выполнении трех условий: смягчение глобального давления на ликвидность; снижение ставок ФРС без рецессии; принятие закона CLARITY, устраняющего регуляторные неопределенности. Пока Биткоин — не убежище, а актив, который раньше других прошел очистку. Но когда шторм утихнет и глобальный капитал снова начнет распределяться, Биткоин займет место в первых рядах очереди. Место уже зарезервировано.

marsbit15 мин. назад

Акции упали сильнее, чем криптовалюты. Куда делись деньги?

marsbit15 мин. назад

Диалог с Далио: Сейчас мы находимся в пузыре ИИ, 1% моего инвестиционного портфеля — это биткоин

Источник: интервью Рэя Далио, основателя Bridgewater Associates, для подкаста "The Diary Of A CEO". Далио, предсказавший кризис 2008 года, обсуждает "большой цикл" — концепцию, охватывающую долговые проблемы, растущее неравенство и геополитические сдвиги. Он указывает, что текущий ажиотаж вокруг ИИ демонстрирует классические признаки пузыря, который может лопнуть из-за высокой долговой нагрузки, роста процентных ставок и чрезмерной эмиссии акций, что способно привести к рецессии. Для защиты личного капитала в неопределенные времена Далио советует диверсификацию: вместо хранения наличных инвестировать в акции, золото, облигации. Сам он держит около 1% портфеля в биткоине, считая его "твердыми деньгами", но предпочитает физическое золото из-за его статуса резервного актива и независимости от технологических рисков. Говоря о влиянии ИИ, Далио отмечает, что технология заменяет не только физический труд, но и элементы мышления, что увеличит разрыв между капиталом и трудом. Ключевыми останутся человеческие качества — эмоции и интуиция, а успеха добьются те, кто научится работать в партнерстве с ИИ. На геополитической арене, по его мнению, мир движется к регионализации с центрами в виде США и Китая. Вовлечение США в конфликты, подобные иранскому, обнажает снижение их абсолютного влияния. Внутренние вызовы, такие как дебаты о налогах на богатство, риск капитального бегства и низкая производительность, также ставят под вопрос стабильность традиционных держав в текущей фазе цикла.

marsbit4 ч. назад

Диалог с Далио: Сейчас мы находимся в пузыре ИИ, 1% моего инвестиционного портфеля — это биткоин

marsbit4 ч. назад

7.2 трлн вон за один день: иностранные инвесторы установили рекорд чистых покупок в пятницу! Уолл-Стрит: встречный ветер в плане ликвидности на южнокорейском рынке уже утих

Капиталы возвращаются на южнокорейский рынок акций. 31 июля иностранные инвесторы осуществили чистые покупки акций KOSPI на рекордные 7,2 трлн вон за один день, что стало самым высоким показателем в истории. По данным Citigroup, эта цифра знаменует собой кардинальный разворот после месяцев масштабного оттока средств нерезидентов. В июле чистые продажи иностранными инвесторами значительно сократились до 9,8 трлн вон по сравнению с 48,4 трлн и 44,5 трлн вон в июне и мае соответственно. Одновременно внутренние пенсионные и инвестиционные фонды в июле вернулись к чистым покупкам на 1,0 трлн вон. Дополнительным фактором снижения волатильности стали новые правила Комиссии по финансовым услугам (FSC), ужесточившие с 31 июля доступ розничных инвесторов к ETF с плечом на отдельные акции. После введения норм торговый оборот таких инструментов упал примерно вдвое. Citigroup сохраняет целевую точку для KOSPI на уровне 10000 пунктов, отмечая ослабление давления со стороны движения капиталов. Аналитики видят поддержку рынку в устойчивости фундаментальных показателей сектора чипов памяти, низких оценках KOSPI, сильной экономике и благоприятной политике властей, включая возможные меры по поддержке ликвидности.

marsbit4 ч. назад

7.2 трлн вон за один день: иностранные инвесторы установили рекорд чистых покупок в пятницу! Уолл-Стрит: встречный ветер в плане ликвидности на южнокорейском рынке уже утих

marsbit4 ч. назад

Экстренная новость! Следующее поколение ИИ от OpenAI прорывает 10 задач уровня Филдсовской премии

У OpenAI произошел прорыв: их новая модель Astra решила 10 сложнейших математических проблем уровня Филдсовской премии. Среди достижений — построение первого примера несофической группы, опровергающее гипотезу Громова (1999 г.), прорыв в задаче упаковки сфер в высоких размерностях, где не было прогресса 46 лет, и опровержение гипотезы жесткости Конна. Результаты, изложенные в 249-страничной работе, проверены с помощью Lean 4. По оценкам, стоимость создания доказательств составила около 2000 долларов. Это событие знаменует поворотный момент, демонстрирующий способность ИИ совершать глубокие открытия в фундаментальной математике.

marsbit5 ч. назад

Экстренная новость! Следующее поколение ИИ от OpenAI прорывает 10 задач уровня Филдсовской премии

marsbit5 ч. назад

Торговля

Спот

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на BANANA (BANANA) представлены ниже.

Утечка модели генерации изображений, которая популярнее Nano Banana. Скриншоты больше не являются доказательством | Включая промпты

Введение

Скриншоты больше не могут быть доказательством

Знает ли он на самом деле, как выглядит этот мир?

Генерация изображений — это уже не просто «генерация изображений»

Трендовые криптовалюты

Связанные с этим вопросы

Похожее

На неделе с 3 по 9 августа стоит обратить внимание: Закон CLARITY, возможно, будет поставлен на голосование в Сенате; SpaceX и Circle опубликуют финансовые отчеты

Акции упали сильнее, чем криптовалюты. Куда делись деньги?

Диалог с Далио: Сейчас мы находимся в пузыре ИИ, 1% моего инвестиционного портфеля — это биткоин

Экстренная новость! Следующее поколение ИИ от OpenAI прорывает 10 задач уровня Филдсовской премии

Торговля

Популярные статьи

Как купить BANANA

Обсуждения

Топ вопросы

Популярные категории

Популярные теги