奥特曼「红色警戒」5个月后,GPT Image 2屠榜,断层领先反杀谷歌

marsbitОпубликовано 2026-04-27Обновлено 2026-04-27

【导读】被Google按了半年头,OpenAI终于祭出一记反杀。GPT Image 2上线12小时,就登顶Arena文生图榜,领先Nano Banana 2达241分。Arena官方称,这是Image Arena文生图排行榜迄今最大的分差。

发布当天,三榜通杀。

GPT Image 2上线12小时,Text-to-Image(文生图)、Single-Image Edit(单图编辑)、Multi-Image Edit(多图编辑)三个分榜全部登顶。

Arena官方原话:「a clean sweep」(全胜)。

文生图主榜,GPT Image 2 1512分,Nano Banana 2 1271分。241分差距,Arena史上最大。

「没有任何模型曾以这种差距统治过Image Arena」,Arena官方表示。

在Image Arena所有盲测对决中,GPT Image 2的胜率是93%:100张图配对盲选,93张人们选了OpenAI那张。

「如果把DALL-E看作洞穴壁画,把Images 1.0视为古代艺术,那么Images 2.0就是文艺复兴」。

OpenAI在发布会开场中这样介绍Images 2.0,奥特曼更是将它称作跨代升级:

这好像一下子从GPT-3跃升到了GPT-5。

https://www.youtube.com/watch?v=sWkGomJ3TLI

OpenAI官方API文档对Images 2.0给出了一个最高级的评价。

https://developers.openai.com/api/docs/models/gpt-image-2

但真正的故事,并不在数据里。

被Google压了半年,OpenAI总算扳回一局

时间倒回2025年8月。

Google放出了Nano Banana。这个在Gemini里嵌入的图像生成模型,在C端瞬间引爆。

三个月后的Q3财报会上,Google CEO Sundar Pichai亲口披露了一组数字:Gemini月活,从7月的4.5亿涨到10月的6.5亿。

Google Labs负责人Josh Woodward称,这一增长很大程度上来自Nano Banana带动的图像生成热潮。

11月,Google再发Nano Banana Pro。文本渲染能力惊艳,AI图像第一次能把字写对,OpenAI在C端被反超。

11月18日,Google再补一刀。Gemini 3发布即登顶LM Arena,1501分,首个突破1500的前沿模型。

这一月底,奥特曼对全公司发了一份「红色警戒」(code red)的内部备忘录。

据The Information报道,奥特曼私下告诉员工,Gemini 3可能给OpenAI带来经济逆风。Yahoo Finance后续披露:code red之下,OpenAI暂停了AI Agent等其他产品的研发,资源全部倾斜到ChatGPT。

12月,OpenAI仓促拿出GPT Image 1.5。Arena第一,但C端没能引爆。

2026年2月,Google再补一刀,Nano Banana 2登场,Arena再度领先。

OpenAI又输了一次。

一直到4月21日,GPT Image 2上线,OpenAI这才实现反超,重新扳回一局。

画图AI将被重新定义

GPT Image 2凭什么能领先241分?

核心答案藏在架构层面。

GPT Image 2不是Stable Diffusion那一代的扩散模型。

OpenAI研究负责人Boyuan Chen称这是「revamped from scratch」(从零重构)的「generalist model」(通用模型),OpenAI的内部叫法是「图像版的GPT」。

但Chen在press briefing时拒绝公开承认它具体是扩散还是自回归架构。

外界普遍把它理解为「带推理规划的图像生成系统」:画之前先规划,再下笔。这正是GPT Image 2和上一代图像模型最大的不同。

OpenAI在官方说明里给了它一个新标签:首个具备原生思考能力的图像模型(image model with native thinking capabilities)。

画之前先想、画完自己检查、需要时联网搜索资料、一次能产出8张前后连贯的图。

这不是画笔,是会思考的视觉助理。

Arena榜单分项数据显示:

文字渲染(Text Rendering)单项,GPT Image 2比前代涨了316分;卡通动漫和人像各涨296分;3个产品/3D/写实分类,整体在+247到+277分区间。

文字渲染是2025年11月Nano Banana Pro首次解决的问题,但当时准确率94%。GPT Image 2把它推到了99%。

OpenAI发布会现场演示:让GPT Image 2画一碗米饭,其中只有一粒米上写有模型名字。

具体到能力展示,OpenAI总裁Greg Brockman在自己的X账号上做了示范。

第一个案例,老照片修复。

褪色发黄的家庭老照片,一个提示词,立刻变身高清彩色版。

OpenAI官方API文档里那句「high-fidelity image inputs」(高保真图像输入),说的就是模型对原图细节的保留能力:输入端能精确读取褪色的、破损的、模糊的老照片细节,输出端才能重新渲染出清晰版。

第二个案例中,Brockman转发了用户@doodlestein的一组测试图:用同一个复杂提示词让GPT Image 2画一张数学解释图。

他评价说,即便是复杂提示词,GPT Image 2也能生成风格各异的图。

@doodlestein 测试GPT Image 2用同一个提示词画一张线性代数解释图。模型一口气画出4个完全不同的版本:同样是Mona Lisa+特征向量教学,每个版本的构图、配色、信息密度完全不同。

这个案例真正价值不在「能画数学图」,而是解决了过去两年中AI生图的一个重要的痛点:输出单一、变体可控性差。

GPT Image 2第一次让「一个prompt给我4个完全不同的方向」变成了产品级能力。

业内一位LM Arena资深测试者点评道:

GPT Image 2和Nano Banana Pro之间的差距,跟Nano Banana Pro和DALL-E之间的差距一样大。

跨了整整一代。

GPT Image 2 Thinking模式生成的manga风格漫画页:从一个简单提示词出发,模型保持角色一致性、铺出多格剧情。

DALL-E退役,Adobe Canva被逼到墙角

发布当天,下游工具集成的速度比技术圈预期的还快。

Figma、Canva、Adobe Firefly、fal、Hermes Agent,全部在4月21日当天完成集成。

API定价更是暗藏杀机:

高质量出图$0.21一张;ChatGPT Plus $20一个月,图像生成已经包含在套餐里。

这个差价背后,可能带来2026年图像生成行业最大的产业重构。

GPT Image 2生成的photorealistic candid(写实抓拍)。海岸、阴天、复古车、胶片质感——这种过去要专业摄影师外拍+后期才能达到的视觉效果,现在API $0.21一张。OpenAI研究员Gabriel Goh说,photorealism是他对这个模型最兴奋的能力。

5月12日,DALL-E 2和DALL-E 3正式退役。

它们是2022年开启了整个AIGC视觉革命的开山祖师。三年后,被OpenAI自家的继承者,亲手送入历史。

OpenAI在官方发布说明里提到:

图像不是装饰,是语言。一张好图做的事和一个好句子一样:选择、排列、揭示。

这代表了一种产品哲学的转向。

当然,也不是没有反方声音。ZDNet在实测中发现,GPT Image 2无法准确复刻品牌logo,连ZDNet自己的logo都被画歪了。

Nano Banana 2在portrait realism和multi-reference一致性上仍有优势。

GPT Image 2虽然还不够完美,但赛道格局已经出现了变化。

渲染时代结束了,推理时代刚开始

Google把推理塞进图像模型里。OpenAI把图像工具塞进推理模型里。242分Elo差距测的就是二者架构上的差异。

implicator.ai的这句评价,划分了图像生成的两个时代。

2022到2025年,是渲染时代。

DALL-E、Midjourney、Stable Diffusion,目标都是「画得像」。模型是画笔,用户是画师,prompt是画稿。

GPT Image 2代表的是一个推理时代。

模型先思考再下笔,能搜索、能自检、能完成任务。它不是画笔,是会画画的助手。

GPT Image 2发布真正值得重视的,是图像生成走向「会思考」这件事本身。

短期看,Black Forest Labs(Flux 2)麻烦可能最大。

Kingy AI直言:作为diffusion-first(扩散为先)的厂商,Flux 2的整条技术流水线在架构上和「token-by-token」的推理路线是冲突的。

要么融合,要么重写,没有第三条路。

中期看,Google可能会在下个季度反击。Nano Banana 3,或者Imagen-Reason,时间不会太久。

长期看,这件事的影响远不止图像生成。

当AI开始用「思考」来产出图像、视频、音频、代码,整个生成式AI的范式都会跟着发生变化。

去年12月,奥特曼在备忘录里敲下「code red」的时候,应该没想到五个月后会以这种方式回到Arena榜首。

但这次反杀的真正意义,可能不是OpenAI赢了Google,而是OpenAI改写了图像生成赛道的规则。

Arena.AI单图编辑榜(Image Edit Arena):GPT Image 2 (medium) 仍以1510+分继续登顶,第二、三、四、五名全部被OpenAI自家模型和Google Gemini系列占据。https://arena.ai/leaderboard/image-edit

Google下一拳什么时候出?这个问题决定了2026下半年AI格局的走向。

而在那一拳挥出来之前,GPT Image 2会在Arena榜首坐多久,没人知道。

参考资料:

https://x.com/gdb/status/2048449695622586576

https://arena.ai/leaderboard/image-edit

本文来自微信公众号“新智元”,编辑:元宇

Трендовые криптовалюты

Похожее

Обратный отсчет до GPT-5.6: Прощай с иллюзией единого API, итерации вычислительной мощности не сравнятся с одним согласованием

В середине июня 2026 года ряд событий, включая ограничения для модели Fable 5, открытый исходный код GLM-5.2 и утечку информации о GPT-5.6, указывают на переломный момент в индустрии ИИ. Логика развития отрасли претерпевает существенные изменения: во-первых, «пригодность к использованию» становится важнее «передовых технологий», формируется «двухколейная» система сосуществования контролируемых закрытых и локальных открытых моделей; во-вторых, конкуренция смещается от «языкового интеллекта» к «пространственному интеллекту (моделям мира)», требующему огромных вычислительных мощностей; в-третьих, «независимость от модели» становится критически важной для разработчиков приложений для обеспечения непрерывности бизнеса в условиях транснациональных регуляторных рисков. Инцидент с Fable 5 (Anthropic), доступ к которой для неамериканских пользователей был ограничен через 72 часа после запуска, демонстрирует, что технологическое лидерство может быть ограничено нормативными требованиями. В ответ открытое сообщество, как показывает выпуск GLM-5.2 с лицензией MIT, предлагает стабильные, экономичные и локально развертываемые альтернативы, сокращающие затраты и снижающие зависимость. В свою очередь, OpenAI, судя по утечкам, фокусирует GPT-5.6 на развитии «пространственного интеллекта» и «моделей мира», пытаясь создать новое технологическое преимущество в областях, требующих высокой вычислительной мощности, таких как 3D-моделирование и робототехника. Ключевой вывод: в новой эре оценивать инфраструктуру ИИ необходимо не только по техническим показателям, но и по устойчивости к нормативным требованиям. Для разработчиков жизненно важно создавать архитектуры, не зависящие от конкретной модели, чтобы обеспечить быстрый переход между поставщиками и поддержание непрерывности бизнеса.

marsbit1 ч. назад

Обратный отсчет до GPT-5.6: Прощай с иллюзией единого API, итерации вычислительной мощности не сравнятся с одним согласованием

marsbit1 ч. назад

Закончится ли скоро «битва субсидий на токены» между ИИ-гигантами?

Токены ИИ, используемые в подписках, на самом деле сильно субсидируются: в дорогих тарифах стоимость потреблённых токенов может в 70 раз превышать абонентскую плату. Основные игроки, такие как OpenAI и Anthropic, активно привлекают инвестиции и готовятся к IPO, но их бизнес-модель сталкивается с фундаментальной проблемой — отсутствием «эффекта привязки» (lock-in) пользователей. В отличие от интернет-сервисов, таких как такси или доставка еды, токены легко заменяемы, и пользователи могут быстро переключиться на более дешёвый аналог. Билл Марис, основатель Google Ventures, отмечает, что Google, обладая огромной прибылью от рекламы, может снизить цену токенов на 80%, оказывая давление на конкурентов, которые зависят от внешнего финансирования. Это делает ценовую войну не средством достижения монополии, а скорее бесконечной «игрой на выживание», где цель — остаться за игровым столом. Вероятный сценарий — превращение токенов в стандартизированную инфраструктуру, подобную электричеству или интернет-трафику, где цены стремятся к себестоимости, а прибыль становится минимальной. Это означает, что эпоха крупных субсидий может продлиться, и пользователи продолжат получать мощные ИИ-сервисы по относительно низкой цене, но сами компании-разработчики вряд ли достигнут сверхвысокой прибыльности в долгосрочной перспективе.

marsbit1 ч. назад

Закончится ли скоро «битва субсидий на токены» между ИИ-гигантами?

marsbit1 ч. назад

За пределами поля: Игра на прибыль вокруг чемпионата мира

**За пределами поля: Игры на прибыль вокруг Чемпионата мира по футболу 2026** Чемпионат мира — это не только фестиваль для фанатов, но и глобальное окно для спекуляций. Турнир концентрирует внимание, эмоции и капитал, создавая целую экосистему для азартных игр. Основные сферы: 1. **Прогнозные рынки (Polymarket, Kalshi):** Набирают популярность, опережая традиционные букмекеров. Торговля контрактами на исходы событий привлекла миллиарды долларов, порождая истории о крупных выигрышах и потерях. 2. **Традиционные спортивные ставки:** Остаются основой с ожидаемым оборотом свыше $500 млрд. В США ставки на футбол временно становятся ключевым видом спорта для букмекерских платформ. 3. **Акции ("концептуальные акции"):** Котировки компаний, связанных с потреблением (например, корейские сети фастфуда, японские бренды), резко колеблются в зависимости от успехов национальных сборных, отражая настроения фанатов. 4. **Перепродажа билетов:** Рынок билетов превратился в арену для спекуляций. Цены на вторичном рынке сильно зависят от команд, матчей и локаций. Появились даже схемы продажи "права на покупку" билетов (FIFA RTB) и "короткие" продажи без наличия билета. 5. **Коллекционные предметы и мерч:** Ограниченные серии товаров (например, тематические футболки Нью-Йорка) и классические коллекционные предметы (наклейки Panini) становятся объектами перепродажи с высокой наценкой. Распространена и продажа поддельной атрибутики. 6. **Криптовалюты:** Волна мем-токенов на тему ЧМ на блокчейне Solana привлекла спекулянтов, но большинство проектов не имеют реальной ценности и являются схемами "накачки и сброса", ведущими к большим потерям. 7. **Информационные услуги:** Зарабатывают на потребности в данных для спекуляций. Примеры: сайты для отслеживания динамики цен на билеты (SeatSidekick) и платные Telegram-каналы с прогнозами на ставки. Итог: Пока на поле разыгрываются матчи, за его пределами разворачивается масштабная финансовая игра, где истинными победителями часто становятся не те, кто угадал счет, а те, кто вовремя понял, куда направляются внимание и деньги миллионов.

marsbit2 ч. назад

За пределами поля: Игра на прибыль вокруг чемпионата мира

marsbit2 ч. назад

Заявление о фонде Hyperliquid ETF привлекает внимание, поскольку нарратив HYPE набирает обороты на X

Сводка (на русском): Сообщение в X от AlphaOnChain от 20 июня 2026 года привлекло внимание к теме ETF на Hyperliquid (HYPE). В посте утверждается, что три ETF на HYPE, запущенные в мае 2026 года, уже аккумулировали совместные активы на сумму 158 миллионов долларов США. Согласно данным, крупнейшими продуктами являются ETF Bitwise HYPE (88 млн долларов) и 21Shares HYPE ETF (66 млн долларов). Этот слух подчеркивает растущий интерес рынка к альткойн-нарративу HYPE. Hyperliquid известен своей экосистемой, ориентированной на децентрализованную торговлю perpetual-контрактами и инфраструктуру бирж. Возможный приток средств в ETF-продукты может указывать на то, что институциональный и розничный спрос начинает смещаться за пределы биткойна и Ethereum в сторону более рискованных активов. Ключевая оговорка статьи заключается в необходимости проверки данных. Поскольку информация исходит из социальных сетей, а не из официальных заявлений эмитентов или данных фондов, к цифрам следует относиться с осторожностью. Публикация скорее отражает растущее внимание к нарративу Hyperliquid, а не является подтвержденным фактом. Для трейдеров важно это различие: краткосрочные движения могут быть вызваны ажиотажем в соцсетях, но устойчивый рост, как правило, требует подтвержденного спроса, ликвидности и развития экосистемы.

bitcoinist3 ч. назад

Заявление о фонде Hyperliquid ETF привлекает внимание, поскольку нарратив HYPE набирает обороты на X

bitcoinist3 ч. назад

Как Codex использует компьютер? Три подхода и границы доступа

Статья объясняет три способа, которыми Codex взаимодействует с компьютером: Computer Use, расширение для Chrome и встроенный браузер. Каждый предназначен для разных задач и уровней доступа. **Computer Use** — самый широкий по охвату. Он позволяет Codex видеть и управлять графическим интерфейсом macOS/Windows, работать с нативными приложениями, системными настройками и даже iOS-симулятором. Это решение для задач без API, но оно медленнее и требует самого высокого уровня доверия. **Расширение для Chrome** дает доступ к уже авторизованным сессиям, кукам и вкладкам браузера. Идеально для работы с Gmail, LinkedIn, Salesforce, внутренними панелями или исследований, требующих входа в аккаунт. Оно работает в контексте вашего браузера. **Встроенный браузер** изолирован, не использует ваши логины и cookies. Он идеален для разработки и отладки: работы с локальным сервером, проверки верстки, визуальных багов и оставления дизайн-комментариев прямо на странице. **Appshots** — не четвертый способ управления, а инструмент для указания контекста (например, скриншот окна), чтобы Codex понял, о чем речь, без предоставления прав на управление. **Ключевой принцип:** выбирать самый узкий и безопасный способ для задачи. Использовать плагины или MCP, если возможно. Для веб-разработки — встроенный браузер. Для задач, требующих авторизации — Chrome. Computer Use — это "последняя миля" для задач, где недоступны структурированные инструменты.

marsbit3 ч. назад

Как Codex использует компьютер? Три подхода и границы доступа

marsbit3 ч. назад

Торговля

Спот
Фьючерсы

Популярные статьи

Как купить BANANA

Добро пожаловать на HTX.com! Мы сделали приобретение Banana Gun (BANANA) простым и удобным. Следуйте нашему пошаговому руководству и отправляйтесь в свое крипто-путешествие.Шаг 1: Создайте аккаунт на HTXИспользуйте свой адрес электронной почты или номер телефона, чтобы зарегистрироваться и бесплатно создать аккаунт на HTX. Пройдите удобную регистрацию и откройте для себя весь функционал.Создать аккаунтШаг 2: Перейдите в Купить криптовалюту и выберите свой способ оплатыКредитная/Дебетовая Карта: Используйте свою карту Visa или Mastercard для мгновенной покупки Banana Gun (BANANA).Баланс: Используйте средства с баланса вашего аккаунта HTX для простой торговли.Третьи Лица: Мы добавили популярные способы оплаты, такие как Google Pay и Apple Pay, для повышения удобства.P2P: Торгуйте напрямую с другими пользователями на HTX.Внебиржевая Торговля (OTC): Мы предлагаем индивидуальные услуги и конкурентоспособные обменные курсы для трейдеров.Шаг 3: Хранение Banana Gun (BANANA)После приобретения вами Banana Gun (BANANA) храните их в своем аккаунте на HTX. В качестве альтернативы вы можете отправить их куда-либо с помощью перевода в блокчейне или использовать для торговли с другими криптовалютами.Шаг 4: Торговля Banana Gun (BANANA)С легкостью торгуйте Banana Gun (BANANA) на спотовом рынке HTX. Просто зайдите в свой аккаунт, выберите торговую пару, совершайте сделки и следите за ними в режиме реального времени. Мы предлагаем удобный интерфейс как для начинающих, так и для опытных трейдеров.

451 просмотров всегоОпубликовано 2024.03.29Обновлено 2026.06.02

Как купить BANANA

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на BANANA (BANANA) представлены ниже.

活动图片