Un modèle de génération d'images plus populaire que Nano Banana a fuité, les captures d'écran ne sont plus des preuves | Inclut les prompts

marsbitPublished on 2026-04-19Last updated on 2026-04-19

Abstract

Un nouveau modèle de génération d'image, potentiellement GPT Image 2 d'OpenAI, a fuité et surpasse les modèles précédents comme Nano Banana de Google. Sa principale avancée réside dans le rendu parfait du texte, y compris les caractères chinois, permettant de créer des images réalistes de documents, d'interfaces utilisateur et d'écrans avec un texte précis. Cette capacité remet en cause la fiabilité des captures d'écran comme preuve. Le modèle excelle également dans le réalisme photographique, le suivi des instructions et la connaissance du monde, générant des interfaces qui semblent authentiques. Il ouvre de nouvelles possibilités pour les designers et les créateurs de contenu. Actuellement en test A/B, son lancement officiel est prévu autour de mai 2026. Des invites spécifiques sont partagées pour maximiser son potentiel.

Votre impression de la génération d'images à partir de texte est-elle encore à l'ère de Nano Banana ?

Mais mon enfant, les temps ont encore changé.

@johnAGI168 https://x.com/johnAGI168/status/2044781168151724067

@0115hippo https://x.com/0115hippo/status/2044722124611539160

Début avril, trois modèles d'image anonymes, portant les noms de code maskingtape-alpha, packingtape-alpha et gaffertape-alpha, sont apparus sur la plateforme d'évaluation LM Arena. Ils ont disparu quelques heures plus tard.

OpenAI n'a pas officiellement annoncé ce modèle, mais selon les métadonnées renvoyées par l'API et les enregistrements de tests des utilisateurs, il a déjà un nom largement accepté : GPT Image 2.

Les captures d'écran ne peuvent plus servir de preuve

Ces dernières années, l'un des points faibles les plus évidents des modèles de génération d'images par IA était le texte dans les images. À l'époque de DALL-E 3, si vous lui demandiez d'écrire « Hello » dans une image, vous pouviez obtenir « Hellp » ou même « Hl10 », les lettres penchant comme si elles étaient ivres. GPT Image 1 s'est beaucoup amélioré, capable de traiter des étiquettes anglaises simples. Avec GPT Image 1.5, la précision du rendu des textes anglais approchait déjà les 95 %, mais des défauts importants subsistaient pour les systèmes d'écriture non latins comme le chinois, le japonais, le coréen, etc.

Les échantillons divulgués de GPT Image 2 ont changé cette impression.

@MrLarus https://x.com/MrLarus/status/2044824800909054181

@akokoi1 https://x.com/akokoi1/status/2044789531615056175

Le texte dans l'image est ce qu'il doit être. Le chinois est clair, la forme des caractères est précise, les traits sont complets. Quelqu'un a testé la génération d'une image de type carte d'identité : le nom, l'adresse, le numéro de pièce d'identité étaient tous rendus correctement, la mise en page était régulière, ressemblant à première vue à une photo d'un document réel.

C'est une bonne nouvelle. Les progrès dans le rendu du texte signifient que la génération d'infographies, d'affiches, d'emballages de produits, de graphiques à la mise en page complexe devient plus fiable.

Mais il y a toujours un revers à la médaille. Un modèle capable de générer des images de type document d'identité trompeusement réalistes, de rendre précisément des captures d'écran d'interface utilisateur, rend naturellement de plus en plus suspecte l'idée que « les captures d'écran peuvent servir de preuve ».

En comparaison, c'est aussi la différence centrale entre la série GPT Image et les autres modèles. Midjourney n'a jusqu'à présent fait de progrès dans le rendu du texte, la série Stable Diffusion a aussi ce vieux problème. Selon les résultats de test divulgués d'Arena, GPT Image 2 dépasse Midjourney sur quatre dimensions : rendu du texte, suivi des instructions, réalisme photographique et connaissance du monde, l'avantage de ce dernier restant principalement dans le style artistique et le contrôle esthétique.

Savez-vous vraiment à quoi ressemble ce monde ?

Un testeur a demandé au modèle de générer une page de tarification hypothétique pour un produit GPT-8. L'image résultante avait une mise en page dans le style du site web d'OpenAI, la position des boutons et le choix des polices semblaient être tirés d'une interface réelle, la logique hiérarchique du tableau des prix était correcte.

GPT Image 2 peut générer des images extrêmement similaires à des interfaces logicielles réelles, y compris des fenêtres de navigateur, des interfaces d'applications mobiles, des graphiques de visualisation de données, avec une fidélité que la génération précédente ne pouvait égaler.

@johnAGI168 https://x.com/johnAGI168/status/2044781168151724067

@levelsio https://x.com/levelsio/status/2040333489476681758

Cela apportera des utilisations pratiques très intéressantes. Les designers, lors de la création de maquettes de produits, n'auront pas besoin d'ouvrir d'abord Figma pour dessiner un tas de cadres ; ils pourront directement décrire l'interface souhaitée avec du texte, et le résultat sera une image de référence utilisable pour discuter avec l'équipe. Lors de la création d'un Deck pour investisseurs, il sera possible de montrer une « capture d'écran du produit » sans attendre que l'ingénieur écrive le code. Lors de la rédaction de documentation, les exemples d'interface pour illustrer le propos pourront être générés directement, sans avoir à réfléchir à l'endroit où trouver une capture d'écran face à une page blanche.

@marmaduke091 https://x.com/marmaduke091/status/2040338311873515597

La génération d'images n'est déjà plus seulement de la « génération d'images »

OpenAI a déjà annoncé que DALL-E 2 et DALL-E 3 cesseront officiellement leur service le 12 mai 2026. Le DALL-E 3 d'Azure OpenAI a déjà pris sa retraite anticipée en février.

DALL-E a été le premier contact de beaucoup avec la génération d'images par IA, il ne s'est écoulé que quelques années depuis ces premières œuvres floues jusqu'à aujourd'hui.

Parallèlement, Google, qui venait juste d'établir sa position dans l'industrie début 2026 avec Nano Banana Pro, pourrait ressentir la pression. Les premiers rapports de test indiquent que GPT Image 2 surpasse Nano Banana Pro sur trois dimensions simultanément : le réalisme, le rendu du texte et la connaissance du monde, un triple succès peu commun.

Pour les créateurs, les sentiments sont mitigés. Illustrateurs, designers graphiques, photographes, ce n'est pas la première fois qu'ils sont confrontés à ce sujet. Depuis la sortie de GPT Image 1, le nombre de postes de designers graphiques indépendants a diminué d'environ 18 %. L'IA a effectivement remplacé, dans certains scénarios, la décision « je veux embaucher quelqu'un pour faire cela », mais elle crée aussi de nouvelles façons de travailler, permettant à une personne de faire plus de choses.

La vitesse d'évolution des modèles de génération d'images ne laisse déjà plus beaucoup de temps d'adaptation. GPT Image 1 est passé de la mise en ligne à la version 1.5 en quelques mois seulement. De la version 1.5 à la 2, à peine six mois. Chaque génération résout les principaux défauts de la précédente tout en ouvrant de nouvelles possibilités.

GPT Image 2 est actuellement en phase de test A/B, certains utilisateurs de ChatGPT ont déjà obtenu un accès aléatoire. La fenêtre de publication officielle est généralement prévue autour de mai, autour de la retraite de DALL-E. Pour une expérience anticipée, vous pouvez actuellement tenter votre chance sur la plateforme d'évaluation LM Arena.

Adresse de test : https://arena.ai

Selon les retours de la communauté et les avantages connus de ce modèle, les modèles de prompts suivants peuvent maximiser vos chances de succès :

Prompt d'interface utilisateur/capture d'écran : Une capture d'écran photoréaliste d'une application bancaire mobile, affichant clairement un historique de transactions, avec la date, le montant et le nom du commerçant clairement discernables. Écran d'iPhone 16, téléphone tenu naturellement en main, arrière-plan de café.

Prompt d'étiquette de produit : Une photo de produit photoréaliste d'une bouteille de bière artisanale, les détails de l'étiquette sont clairs, affichant le nom de la brasserie « Oakridge Brewing Co. », le degré d'alcool 6.8 %, un logo montagne et la liste des ingrédients. Éclairage en studio, fond blanc.

Prompt de signalisation : Une photo de rue d'une ruelle de Tokyo de nuit, visiblement de multiples enseignes au néon bilingues japonais-anglais, incluant une enseigne de restaurant de ramen portant « Ichiban Ramen — Est. 1987 », une enseigne de bar karaoké et diverses publicités lumineuses. Le trottoir est lisse et humide après la pluie, reflétant les lumières.

Prompt de connaissance de l'interface/du monde : Une capture d'écran photoréaliste d'une vidéo YouTube, montrant une vidéo intitulée « Comment assembler un ordinateur en 2026 », cette vidéo a 2,3 millions de vues, avec des commentaires réalistes, des vidéos recommandées dans la barre latérale et des informations sur la chaîne. Vue navigateur de bureau.

Prompt déclencheur grand écran : C'est une photo cinématographique au format large, capturant l'apparence d'un magasin Ikea au crépuscule, montrant l'enseigne Ikea lumineuse, des voitures réalistes sur le parking et des clients entrant et sortant. Lumière de l'heure dorée, format 16:9.

Source des images non attribuées et référence : https://miraflow.ai/blog/how-to-use-duct-tape-ai-model-arena-gpt-image-2-guide

Cet article provient du compte WeChat officiel « APPSO », auteur : Découvrir les produits de demain

Trending Cryptos

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

Billionaire Ray Dalio Explains Why He Prefers Gold to Bitcoin

Ray Dalio, billionaire investor and founder of Bridgewater Associates, advises investors to consider "hard money" assets like gold and Bitcoin to hedge against potential financial collapse, citing high debt, inequality, and geopolitical tensions as systemic risks. While he allocates about 1% of his personal portfolio to Bitcoin and suggests a 5-15% allocation to such non-printable assets, he prefers gold. Dalio expresses caution about Bitcoin due to potential government regulation, infrastructure vulnerabilities from technologies like quantum computing, and privacy concerns. He emphasizes the importance of a balanced, diversified portfolio across stocks, bonds, real estate, gold, and Bitcoin to navigate economic uncertainty.

cryptonews.ru25m ago

Billionaire Ray Dalio Explains Why He Prefers Gold to Bitcoin

cryptonews.ru25m ago

LATEST NEWS: Michael Saylor Makes Statement Regarding Today's Bitcoin Sale! 'I Said I Would Never Sell My Personal Bitcoins'

In a recent development, Michael Saylor's company, MicroStrategy, sold 1,638 Bitcoin for approximately $105 million, reducing its total holdings to 842,138 BTC. The sale, executed at an average price of $63,957 per Bitcoin, was conducted to fund the distribution of preferred stock and the repurchase of STRC shares. Following this transaction, Sclar clarified his famous stance of "Never sell your Bitcoin." He emphasized that his personal policy of never selling any of his own Bitcoin, not a single satoshi, is advice directed at individual investors. Sclar stated that MicroStrategy, as a public company, operates under a separate capital management policy, which has always included the potential to buy or sell Bitcoin for corporate needs, a stance publicly disclosed since 2020. He insisted that the company's fundamental belief in Bitcoin remains unchanged.

cryptonews.ru1h ago

LATEST NEWS: Michael Saylor Makes Statement Regarding Today's Bitcoin Sale! 'I Said I Would Never Sell My Personal Bitcoins'

cryptonews.ru1h ago

Analytics Company Reveals Critical Threshold for Bitcoin (BTC): 'This Could End the Bear Market!'. Here Are the Details

Analytical firm 10x Research highlights a critical threshold for Bitcoin's market direction. Founder Markus Thielen states that a monthly close above $63,000 is key to confirming a bear market bottom. Currently, Bitcoin remains below this level and its 7- and 30-day moving averages, with a 3.2% weekly decline, indicating a persisting short-term bearish trend. Thielen warns of macroeconomic risks, suggesting that if U.S. 10-year Treasury yields continue rising, the Federal Reserve may resume interest rate hikes in September, posing a significant risk to risk assets like Bitcoin. Additionally, potential selling pressure could arise from Bitcoin mining companies shifting focus to AI (holding roughly 100,000 BTC) and from institutional Bitcoin holders liquidating assets. For Bitcoin to resume an upward trend, it must hold key technical levels while navigating a favorable macroeconomic environment. *This is not investment advice.

cryptonews.ru1h ago

Analytics Company Reveals Critical Threshold for Bitcoin (BTC): 'This Could End the Bear Market!'. Here Are the Details

cryptonews.ru1h ago

XDC Tech integrates Bridge’s stablecoin platform to bring on-chain stablecoin settlement to agentic AI commerce

XDC Tech, the institutional arm of the XDC Network, has integrated with Bridge's stablecoin infrastructure platform. This integration provides developers on XDC with direct access to Bridge's tools for converting between cash and stablecoins, virtual accounts, and multi-currency custody, eliminating the need to build compliance layers. The primary use case is enabling fast, on-chain stablecoin settlements for payments. Businesses can accept fiat currencies via Bridge's virtual accounts and receive near real-time settlement in stablecoins on XDC, bypassing traditional banking delays. This applies to trade finance, tokenized assets, and crucially, the emerging agentic AI economy. For AI agents, the partnership provides several key capabilities: machine-speed settlement (XDC finalizes transactions in ~2 seconds), regulated global fiat access via Bridge's licenses, dedicated virtual accounts as agent wallets, multi-currency custody for cross-border commerce, and compliance-by-design features like KYC/KYB. This infrastructure allows autonomous AI agents to transact seamlessly with real-world financial systems. The integration is a foundational step in XDC's roadmap to become a settlement layer for the agentic economy, where AI agents can conduct commerce at machine speed while meeting regulatory standards.

cointelegraph1h ago

XDC Tech integrates Bridge’s stablecoin platform to bring on-chain stablecoin settlement to agentic AI commerce

cointelegraph1h ago

BlackRock launches tokenized money market funds for stablecoin reserves

BlackRock, the world's largest asset manager, has launched two tokenized money market funds for use as stablecoin reserves. The first, BlackRock Select Treasury Based Liquidity Fund OnChain Shares (BSTBL), tokenizes an existing fund on Ethereum. The second, BlackRock Daily Reinvestment Stablecoin Reserve Vehicle (BRSRV), is a new multi-chain fund for institutions. Both funds are structured to qualify as eligible reserve assets under the US GENIUS Act of 2025. This move expands BlackRock's presence in the tokenized Treasury market, where its BUIDL fund already holds over $2.6 billion in assets.

cointelegraph2h ago

BlackRock launches tokenized money market funds for stablecoin reserves

cointelegraph2h ago

Trading

Spot

Hot Articles

How to Buy BANANA

Welcome to HTX.com! We've made purchasing Banana Gun (BANANA) simple and convenient. Follow our step-by-step guide to embark on your crypto journey.Step 1: Create Your HTX AccountUse your email or phone number to sign up for a free account on HTX. Experience a hassle-free registration journey and unlock all features.Get My AccountStep 2: Go to Buy Crypto and Choose Your Payment MethodCredit/Debit Card: Use your Visa or Mastercard to buy Banana Gun (BANANA) instantly.Balance: Use funds from your HTX account balance to trade seamlessly.Third Parties: We've added popular payment methods such as Google Pay and Apple Pay to enhance convenience.P2P: Trade directly with other users on HTX.Over-the-Counter (OTC): We offer tailor-made services and competitive exchange rates for traders.Step 3: Store Your Banana Gun (BANANA)After purchasing your Banana Gun (BANANA), store it in your HTX account. Alternatively, you can send it elsewhere via blockchain transfer or use it to trade other cryptocurrencies.Step 4: Trade Banana Gun (BANANA)Easily trade Banana Gun (BANANA) on HTX's spot market. Simply access your account, select your trading pair, execute your trades, and monitor in real-time. We offer a user-friendly experience for both beginners and seasoned traders.

3.6k Total ViewsPublished 2024.03.29Updated 2026.06.02

Discussions

Welcome to the HTX Community. Here, you can stay informed about the latest platform developments and gain access to professional market insights. Users' opinions on the price of BANANA (BANANA) are presented below.

Un modèle de génération d'images plus populaire que Nano Banana a fuité, les captures d'écran ne sont plus des preuves | Inclut les prompts

Abstract

Les captures d'écran ne peuvent plus servir de preuve

Savez-vous vraiment à quoi ressemble ce monde ?

La génération d'images n'est déjà plus seulement de la « génération d'images »

Trending Cryptos

Related Questions

Related Reads

Billionaire Ray Dalio Explains Why He Prefers Gold to Bitcoin

LATEST NEWS: Michael Saylor Makes Statement Regarding Today's Bitcoin Sale! 'I Said I Would Never Sell My Personal Bitcoins'

Analytics Company Reveals Critical Threshold for Bitcoin (BTC): 'This Could End the Bear Market!'. Here Are the Details

XDC Tech integrates Bridge’s stablecoin platform to bring on-chain stablecoin settlement to agentic AI commerce

BlackRock launches tokenized money market funds for stablecoin reserves

Trading

Hot Articles

How to Buy BANANA

Discussions

Top Questions