Un modèle de génération d'images plus populaire que Nano Banana a fuité, les captures d'écran ne sont plus des preuves | Inclut les prompts

marsbitPublicado a 2026-04-19Actualizado a 2026-04-19

Resumen

Un nouveau modèle de génération d'image, potentiellement GPT Image 2 d'OpenAI, a fuité et surpasse les modèles précédents comme Nano Banana de Google. Sa principale avancée réside dans le rendu parfait du texte, y compris les caractères chinois, permettant de créer des images réalistes de documents, d'interfaces utilisateur et d'écrans avec un texte précis. Cette capacité remet en cause la fiabilité des captures d'écran comme preuve. Le modèle excelle également dans le réalisme photographique, le suivi des instructions et la connaissance du monde, générant des interfaces qui semblent authentiques. Il ouvre de nouvelles possibilités pour les designers et les créateurs de contenu. Actuellement en test A/B, son lancement officiel est prévu autour de mai 2026. Des invites spécifiques sont partagées pour maximiser son potentiel.

Votre impression de la génération d'images à partir de texte est-elle encore à l'ère de Nano Banana ?

Mais mon enfant, les temps ont encore changé.

@johnAGI168 https://x.com/johnAGI168/status/2044781168151724067

@0115hippo https://x.com/0115hippo/status/2044722124611539160

Début avril, trois modèles d'image anonymes, portant les noms de code maskingtape-alpha, packingtape-alpha et gaffertape-alpha, sont apparus sur la plateforme d'évaluation LM Arena. Ils ont disparu quelques heures plus tard.

OpenAI n'a pas officiellement annoncé ce modèle, mais selon les métadonnées renvoyées par l'API et les enregistrements de tests des utilisateurs, il a déjà un nom largement accepté : GPT Image 2.

Les captures d'écran ne peuvent plus servir de preuve

Ces dernières années, l'un des points faibles les plus évidents des modèles de génération d'images par IA était le texte dans les images. À l'époque de DALL-E 3, si vous lui demandiez d'écrire « Hello » dans une image, vous pouviez obtenir « Hellp » ou même « Hl10 », les lettres penchant comme si elles étaient ivres. GPT Image 1 s'est beaucoup amélioré, capable de traiter des étiquettes anglaises simples. Avec GPT Image 1.5, la précision du rendu des textes anglais approchait déjà les 95 %, mais des défauts importants subsistaient pour les systèmes d'écriture non latins comme le chinois, le japonais, le coréen, etc.

Les échantillons divulgués de GPT Image 2 ont changé cette impression.

@MrLarus https://x.com/MrLarus/status/2044824800909054181

@akokoi1 https://x.com/akokoi1/status/2044789531615056175

Le texte dans l'image est ce qu'il doit être. Le chinois est clair, la forme des caractères est précise, les traits sont complets. Quelqu'un a testé la génération d'une image de type carte d'identité : le nom, l'adresse, le numéro de pièce d'identité étaient tous rendus correctement, la mise en page était régulière, ressemblant à première vue à une photo d'un document réel.

C'est une bonne nouvelle. Les progrès dans le rendu du texte signifient que la génération d'infographies, d'affiches, d'emballages de produits, de graphiques à la mise en page complexe devient plus fiable.

Mais il y a toujours un revers à la médaille. Un modèle capable de générer des images de type document d'identité trompeusement réalistes, de rendre précisément des captures d'écran d'interface utilisateur, rend naturellement de plus en plus suspecte l'idée que « les captures d'écran peuvent servir de preuve ».

En comparaison, c'est aussi la différence centrale entre la série GPT Image et les autres modèles. Midjourney n'a jusqu'à présent fait de progrès dans le rendu du texte, la série Stable Diffusion a aussi ce vieux problème. Selon les résultats de test divulgués d'Arena, GPT Image 2 dépasse Midjourney sur quatre dimensions : rendu du texte, suivi des instructions, réalisme photographique et connaissance du monde, l'avantage de ce dernier restant principalement dans le style artistique et le contrôle esthétique.

Savez-vous vraiment à quoi ressemble ce monde ?

Un testeur a demandé au modèle de générer une page de tarification hypothétique pour un produit GPT-8. L'image résultante avait une mise en page dans le style du site web d'OpenAI, la position des boutons et le choix des polices semblaient être tirés d'une interface réelle, la logique hiérarchique du tableau des prix était correcte.

GPT Image 2 peut générer des images extrêmement similaires à des interfaces logicielles réelles, y compris des fenêtres de navigateur, des interfaces d'applications mobiles, des graphiques de visualisation de données, avec une fidélité que la génération précédente ne pouvait égaler.

@johnAGI168 https://x.com/johnAGI168/status/2044781168151724067

@levelsio https://x.com/levelsio/status/2040333489476681758

Cela apportera des utilisations pratiques très intéressantes. Les designers, lors de la création de maquettes de produits, n'auront pas besoin d'ouvrir d'abord Figma pour dessiner un tas de cadres ; ils pourront directement décrire l'interface souhaitée avec du texte, et le résultat sera une image de référence utilisable pour discuter avec l'équipe. Lors de la création d'un Deck pour investisseurs, il sera possible de montrer une « capture d'écran du produit » sans attendre que l'ingénieur écrive le code. Lors de la rédaction de documentation, les exemples d'interface pour illustrer le propos pourront être générés directement, sans avoir à réfléchir à l'endroit où trouver une capture d'écran face à une page blanche.

@marmaduke091 https://x.com/marmaduke091/status/2040338311873515597

La génération d'images n'est déjà plus seulement de la « génération d'images »

OpenAI a déjà annoncé que DALL-E 2 et DALL-E 3 cesseront officiellement leur service le 12 mai 2026. Le DALL-E 3 d'Azure OpenAI a déjà pris sa retraite anticipée en février.

DALL-E a été le premier contact de beaucoup avec la génération d'images par IA, il ne s'est écoulé que quelques années depuis ces premières œuvres floues jusqu'à aujourd'hui.

Parallèlement, Google, qui venait juste d'établir sa position dans l'industrie début 2026 avec Nano Banana Pro, pourrait ressentir la pression. Les premiers rapports de test indiquent que GPT Image 2 surpasse Nano Banana Pro sur trois dimensions simultanément : le réalisme, le rendu du texte et la connaissance du monde, un triple succès peu commun.

Pour les créateurs, les sentiments sont mitigés. Illustrateurs, designers graphiques, photographes, ce n'est pas la première fois qu'ils sont confrontés à ce sujet. Depuis la sortie de GPT Image 1, le nombre de postes de designers graphiques indépendants a diminué d'environ 18 %. L'IA a effectivement remplacé, dans certains scénarios, la décision « je veux embaucher quelqu'un pour faire cela », mais elle crée aussi de nouvelles façons de travailler, permettant à une personne de faire plus de choses.

La vitesse d'évolution des modèles de génération d'images ne laisse déjà plus beaucoup de temps d'adaptation. GPT Image 1 est passé de la mise en ligne à la version 1.5 en quelques mois seulement. De la version 1.5 à la 2, à peine six mois. Chaque génération résout les principaux défauts de la précédente tout en ouvrant de nouvelles possibilités.

GPT Image 2 est actuellement en phase de test A/B, certains utilisateurs de ChatGPT ont déjà obtenu un accès aléatoire. La fenêtre de publication officielle est généralement prévue autour de mai, autour de la retraite de DALL-E. Pour une expérience anticipée, vous pouvez actuellement tenter votre chance sur la plateforme d'évaluation LM Arena.

Adresse de test : https://arena.ai

Selon les retours de la communauté et les avantages connus de ce modèle, les modèles de prompts suivants peuvent maximiser vos chances de succès :

Prompt d'interface utilisateur/capture d'écran : Une capture d'écran photoréaliste d'une application bancaire mobile, affichant clairement un historique de transactions, avec la date, le montant et le nom du commerçant clairement discernables. Écran d'iPhone 16, téléphone tenu naturellement en main, arrière-plan de café.

Prompt d'étiquette de produit : Une photo de produit photoréaliste d'une bouteille de bière artisanale, les détails de l'étiquette sont clairs, affichant le nom de la brasserie « Oakridge Brewing Co. », le degré d'alcool 6.8 %, un logo montagne et la liste des ingrédients. Éclairage en studio, fond blanc.

Prompt de signalisation : Une photo de rue d'une ruelle de Tokyo de nuit, visiblement de multiples enseignes au néon bilingues japonais-anglais, incluant une enseigne de restaurant de ramen portant « Ichiban Ramen — Est. 1987 », une enseigne de bar karaoké et diverses publicités lumineuses. Le trottoir est lisse et humide après la pluie, reflétant les lumières.

Prompt de connaissance de l'interface/du monde : Une capture d'écran photoréaliste d'une vidéo YouTube, montrant une vidéo intitulée « Comment assembler un ordinateur en 2026 », cette vidéo a 2,3 millions de vues, avec des commentaires réalistes, des vidéos recommandées dans la barre latérale et des informations sur la chaîne. Vue navigateur de bureau.

Prompt déclencheur grand écran : C'est une photo cinématographique au format large, capturant l'apparence d'un magasin Ikea au crépuscule, montrant l'enseigne Ikea lumineuse, des voitures réalistes sur le parking et des clients entrant et sortant. Lumière de l'heure dorée, format 16:9.

Source des images non attribuées et référence : https://miraflow.ai/blog/how-to-use-duct-tape-ai-model-arena-gpt-image-2-guide

Cet article provient du compte WeChat officiel « APPSO », auteur : Découvrir les produits de demain

Criptos en tendencia

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

Preguntas relacionadas

QQu'est-ce que le GPT Image 2 et pourquoi est-il significatif ?

ALe GPT Image 2 est un modèle de génération d'images par IA, présumé être le successeur des modèles DALL-E d'OpenAI. Il est significatif car il surpasse considérablement ses prédécesseurs et les concurrents comme Midjourney et Nano Banana Pro dans des domaines clés comme le rendu du texte, le suivi des instructions, le réalisme photographique et la connaissance du monde. Sa fuite a suscité beaucoup d'attention en raison de ses capacités avancées.

QEn quoi le GPT Image 2 change-t-il la perception des captures d'écran comme preuve ?

ALe GPT Image 2 peut générer des images de faux documents (comme des cartes d'identité) et des interfaces utilisateur (comme des pages de tarification ou des captures d'écran d'applications) d'un réalisme si convaincant qu'il devient extrêmement difficile de distinguer le vrai du faux. Cette capacité remet en cause la fiabilité des captures d'écran en tant que preuve, car elles peuvent désormais être facilement falsifiées.

QQuels sont les avantages pratiques du GPT Image 2 pour les créateurs et les concepteurs ?

APour les créateurs et les concepteurs, le GPT Image 2 offre des avantages significatifs : il permet de générer rapidement des maquettes d'interface utilisateur réalistes pour des prototypes, de créer des visuels pour des présentations ou de la documentation sans avoir besoin de captures d'écran réelles, et de produire des images de produits avec un texte et des étiquettes parfaitement rendus, ce qui accélère considérablement le flux de travail.

QComment le GPT Image 2 se compare-t-il à d'autres modèles comme Midjourney et Nano Banana Pro ?

ASelon les tests et les fuites, le GPT Image 2 surpasse à la fois Midjourney et le Nano Banana Pro de Google dans plusieurs domaines critiques. Il est supérieur dans le rendu du texte (y compris les caractères non latins comme le chinois), le réalisme photographique, le suivi des instructions et la connaissance du monde (comme la recréation précise d'interfaces logicielles familières). Midjourney conserve un avantage dans le contrôle du style artistique et de l'esthétique.

QOù et comment les utilisateurs peuvent-ils essayer le GPT Image 2 ?

AActuellement, le GPT Image 2 n'est pas officiellement publié. Il est en phase de test A/B, et certains utilisateurs de ChatGPT y ont un accès aléatoire. Les utilisateurs peuvent également tenter leur chance sur la plateforme d'évaluation LM Arena (https://arena.ai) où le modèle est parfois disponible. Son lancement officiel est prévu autour du 12 mai 2026, date à laquelle les services DALL-E 2 et DALL-E 3 seront interrompus.

Lecturas Relacionadas

El multimillonario Ray Dalio explica por qué prefiere el oro al bitcoin

El multimillonario inversor Ray Dalio, fundador de Bridgewater Associates, ha compartido sus perspectivas sobre el sistema financiero global y la asignación de activos. Advierte sobre la formación de una burbuja en los mercados relacionada con la inteligencia artificial, y señala riesgos económicos debido a altos niveles de deuda, desigualdad y tensiones geopolíticas. Dalio recomienda que los inversores consideren "dinero duro" como el bitcoin y el oro, activos que no pueden imprimirse, ante un posible colapso financiero. Aunque asigna aproximadamente el 1% de su cartera personal al bitcoin y sugiere una asignación del 5% al 15% a este tipo de activos, expresa mayor preferencia por el oro. Sus principales reservas sobre el bitcoin incluyen la capacidad de los gobiernos para regularlo o gravarlo, la posible vulnerabilidad de su infraestructura ante tecnologías como la computación cuántica y preocupaciones sobre su privacidad. En cambio, destaca el oro por su historia milenaria y su condición de activo tangible. En conclusión, Dalio enfatiza la necesidad de una cartera diversificada y equilibrada que incluya acciones, bonos, propiedades, oro y bitcoin, en lugar de depender de un solo activo para protegerse contra la volatilidad financiera.

cryptonews.ruHace 21 min(s)

El multimillonario Ray Dalio explica por qué prefiere el oro al bitcoin

cryptonews.ruHace 21 min(s)

Empresa de análisis revela umbral crítico para Bitcoin (BTC): "¡Esto podría poner fin al mercado bajista!". Aquí están los detalles.

Aunque Bitcoin se mantiene por encima de los 60.000 dólares, el analista Markus Thielen de 10x Research señala que aún no hay confirmación de que el mercado bajista haya tocado fondo. El nivel crítico a observar es un cierre mensual por encima de los 63.000 dólares, umbral que no se alcanzó en julio. Actualmente, el precio está por debajo de las medias móviles clave y ha caído un 3,2% en la última semana, manteniendo una tendencia bajista a corto plazo. Thielen advierte de riesgos macroeconómicos, como una posible subida de tipos por la Fed en septiembre si continúa al alza el rendimiento de los bonos estadounidenses a 10 años, lo que presionaría a activos de riesgo como Bitcoin. Además, señala posibles presiones vendedoras por parte de mineros que poseen unas 100.000 BTC y de empresas institucionales que gestionan Bitcoin. En conclusión, para que Bitcoin retome una tendencia alcista necesita superar los niveles técnicos clave y contar con condiciones macroeconómicas favorables.

cryptonews.ruHace 1 hora(s)

Empresa de análisis revela umbral crítico para Bitcoin (BTC): "¡Esto podría poner fin al mercado bajista!". Aquí están los detalles.

cryptonews.ruHace 1 hora(s)

ÚLTIMAS NOTICIAS: Michael Saylor declara sobre la venta de bitcoin de hoy: «Dije que nunca vendería mis bitcoins personales»

La empresa Strategy, dirigida por Michael Saylor, vendió hoy 1.638 bitcoins por aproximadamente 105 millones de dólares, reduciendo su tenencia total a 842.138 BTC. Saylor aclaró tras la venta que sus inversiones personales en bitcoin y la política de gestión de capital de Strategy como empresa pública deben separarse. Según datos oficiales, la empresa vendió los bitcoins a un precio promedio de 63.957 dólares. Los fondos se utilizaron para financiar distribuciones de acciones preferentes y recomprar acciones STRC. Anteriormente, Strategy había indicado que podría vender bitcoins si es necesario para cubrir necesidades de capital, pagar dividendos o intereses de deuda, y recomprar valores. Saylor enfatizó que su conocida frase "Nunca vendas tus bitcoins" está dirigida a inversionistas privados. Declaró: "Cuando digo que nunca vendan sus bitcoins, hablo de un inversionista a otro. Yo nunca he vendido mis bitcoins, ni un solo satoshi. Strategy es una empresa pública, no es mi billetera personal". Saylor afirmó que Strategy ha declarado públicamente desde 2020 que podría comprar o vender bitcoins para gestionar su capital, y sostuvo que la creencia fundamental de la empresa en bitcoin no ha cambiado.

cryptonews.ruHace 1 hora(s)

ÚLTIMAS NOTICIAS: Michael Saylor declara sobre la venta de bitcoin de hoy: «Dije que nunca vendería mis bitcoins personales»

cryptonews.ruHace 1 hora(s)

XDC Tech integra la plataforma de stablecoins de Bridge para llevar la liquidación de stablecoins on-chain al comercio con IA agencial

XDC Tech, la rama institucional en EE. UU. de XDC Network, ha integrado la plataforma de infraestructura de stablecoins Bridge, una empresa de Stripe. Esta integración proporciona a los desarrolladores de XDC acceso directo a herramientas para convertir entre efectivo y stablecoins, cuentas virtuales y custodia multi-moneda, sin necesidad de construir una capa de cumplimiento normativo propio. El caso de uso principal son los pagos. Las empresas pueden aceptar dólares, euros y otras divisas fiduciarias a través de las cuentas virtuales de Bridge y recibir liquidación en stablecoins en XDC casi en tiempo real, eliminando bancos corresponsales y largas compensaciones. Esto ya funciona en finanzas comerciales y se extiende a activos tokenizados. La asociación es fundamental para el objetivo de XDC de ser la capa de liquidación para la economía agéntica, donde los agentes de IA autónomos realizan transacciones a velocidad de máquina. Bridge aporta: 1. Liquidación a velocidad de máquina para agentes autónomos. 2. Acceso regulado a canales fiduciarios en EE. UU., UE y Latinoamérica. 3. Cuentas virtuales que actúan como carteras nativas para agentes. 4. Custodia multi-moneda para comercio agéntico transfronterizo. 5. Soporte para finanzas comerciales y activos tokenizados dirigidos por agentes. 6. Cumplimiento normativo integrado (KYC/KYB) para pagos autónomos. La integración, disponible a través de los portales de desarrolladores de XDC y Bridge, combina la velocidad, bajo costo y cumplimiento ISO 20022 de XDC con la infraestructura regulada global de Bridge para permitir pagos agenticos rápidos, regulados y programables.

cointelegraphHace 1 hora(s)

XDC Tech integra la plataforma de stablecoins de Bridge para llevar la liquidación de stablecoins on-chain al comercio con IA agencial

cointelegraphHace 1 hora(s)

BlackRock lanza fondos del mercado monetario tokenizados para reservas de stablecoins

BlackRock, el mayor gestor de activos del mundo, ha lanzado dos productos tokenizados del mercado monetario diseñados para servir como activos de reserva para las stablecoins. El primero, BlackRock Select Treasury Based Liquidity Fund OnChain Shares (BSTBL), es una clase de acciones tokenizada de un fondo existente en Ethereum. El segundo, BlackRock Daily Reinvestment Stablecoin Reserve Vehicle (BRSRV), es un nuevo fondo tokenizado disponible para inversores institucionales que admite múltiples blockchains y reinvierte dividendos automáticamente. Ambos fondos están estructurados para calificar como activos de reserva elegibles para emisores de stablecoins bajo la ley GENIUS Act de 2025. Este lanzamiento amplía la presencia de BlackRock en el mercado de bonos del Tesoro tokenizados.

cointelegraphHace 2 hora(s)

BlackRock lanza fondos del mercado monetario tokenizados para reservas de stablecoins

cointelegraphHace 2 hora(s)

Trading

Spot

Artículos destacados

Cómo comprar BANANA

¡Bienvenido a HTX.com! Hemos hecho que comprar Banana Gun (BANANA) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar Banana Gun (BANANA) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu Banana Gun (BANANA)Después de comprar tu Banana Gun (BANANA), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear Banana Gun (BANANA)Tradear fácilmente con Banana Gun (BANANA) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

243 Vistas totalesPublicado en 2024.12.11Actualizado en 2026.06.02

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de BANANA (BANANA).

Un modèle de génération d'images plus populaire que Nano Banana a fuité, les captures d'écran ne sont plus des preuves | Inclut les prompts

Resumen

Les captures d'écran ne peuvent plus servir de preuve

Savez-vous vraiment à quoi ressemble ce monde ?

La génération d'images n'est déjà plus seulement de la « génération d'images »

Criptos en tendencia

Preguntas relacionadas

Lecturas Relacionadas

El multimillonario Ray Dalio explica por qué prefiere el oro al bitcoin

Empresa de análisis revela umbral crítico para Bitcoin (BTC): "¡Esto podría poner fin al mercado bajista!". Aquí están los detalles.

ÚLTIMAS NOTICIAS: Michael Saylor declara sobre la venta de bitcoin de hoy: «Dije que nunca vendería mis bitcoins personales»

XDC Tech integra la plataforma de stablecoins de Bridge para llevar la liquidación de stablecoins on-chain al comercio con IA agencial

BlackRock lanza fondos del mercado monetario tokenizados para reservas de stablecoins

Trading

Artículos destacados

Cómo comprar BANANA

Discusiones

Categorías populares

Etiquetas Populares