Model Pembuat Gambar yang Lebih Hebat dari Nano Banana Bocor, Screenshot Bukan Lagi Bukti | Dilengkapi Prompt

marsbitPublié le 2026-04-19Dernière mise à jour le 2026-04-19

Résumé

Model gambar AI terbaru OpenAI, yang diduga bernama GPT Image 2, telah bocor dan menunjukkan peningkatan signifikan dalam hal rendering teks, termasuk aksara non-Latin seperti bahasa Tionghoa. Model ini dapat menghasilkan gambar yang sangat realistis, seperti screenshot antarmuka pengguna, label produk, dan bahkan dokumen identitas yang tampak asli. Kemampuan ini tidak hanya berguna untuk desainer dan pembuat konten, tetapi juga memunculkan kekhawatiran bahwa screenshot tidak lagi dapat dijadikan bukti yang andal. Model ini dilaporkan mengungguli model lain seperti Midjourney dalam hal rendering teks, pemahaman instruksi, dan pengetahuan dunia. Meskipun belum secara resmi diumumkan, model ini sedang dalam tahap A/B testing dan diperkirakan akan diluncurkan resmi sekitar Mei 2026. Pengguna dapat mencobanya di platform LM Arena dengan prompt tertentu untuk hasil terbaik.

Apakah kesanmu tentang pembuatan gambar dari teks masih tertinggal di Nano Banana?

Tapi nak, zaman sudah berubah lagi.

@johnAGI168 https://x.com/johnAGI168/status/2044781168151724067

@0115hippo https://x.com/0115hippo/status/2044722124611539160

Awal April, tiga model gambar anonim muncul di platform evaluasi LM Arena, dengan kode maskingtape-alpha, packingtape-alpha, gaffertape-alpha. Beberapa jam kemudian mereka menghilang.

OpenAI secara resmi belum mengumumkan model ini, tetapi berdasarkan metadata yang dikembalikan API dan catatan pengujian dari sisi pengguna, model ini sudah memiliki nama yang diterima luas: GPT Image 2.

Screenshot Tidak Bisa Lagi Dianggap Bukti

Beberapa tahun terakhir, salah satu kelemahan paling mencolok dari model pembuat gambar AI adalah teks dalam gambar. Di era DALL-E 3, jika kamu memintanya menulis "Hello" di gambar, yang keluar mungkin "Hellp" atau bahkan "Hl10", huruf-hurufnya miring seperti mabuk. GPT Image 1 jauh lebih baik, bisa menangani label bahasa Inggris sederhana. Sampai GPT Image 1.5, akurasi rendering teks Inggrisnya sudah mendekati 95%, tetapi masih memiliki kelemahan jelas pada sistem non-alfabet Latin seperti bahasa Cina, Jepang, Korea.

Namun, gambar sampel bocoran GPT Image 2 mengubah kesan ini.

@MrLarus https://x.com/MrLarus/status/2044824800909054181

@akokoi1 https://x.com/akokoi1/status/2044789531615056175

Teks dalam gambar, apa adanya. Bahasa Cina jelas, bentuk huruf akurat, guratan lengkap. Ada yang menguji menghasilkan gambar seperti KTP, nama, alamat, nomor dokumen semuanya dirender dengan benar, tata letak rapi, sekilas terlihat seperti foto dokumen asli.

Ini kabar baik. Kemajuan rendering teks berarti menghasilkan infografik, poster, kemasan produk, bagan dengan tata letak kompleks, menjadi lebih andal.

Tapi setiap koin memiliki dua sisi. Model yang bisa menghasilkan gambar mirip dokumen asli, merender screenshot UI dengan tepat, secara alami juga membuat hal "screenshot bisa dijadikan bukti" semakin dipertanyakan.

Dibandingkan, ini juga perbedaan inti antara seri GPT Image dan model lainnya. Midjourney hingga kini belum berbuat banyak dalam rendering teks, seri Stable Diffusion juga masalah lama. Berdasarkan hasil tes Arena yang bocor, GPT Image 2 melampaui Midjourney dalam empat dimensi: rendering teks, mengikuti instruksi, realisme foto, dan pengetahuan dunia, keunggulan Midjourney terutama tetap ada pada kontrol gaya seni dan estetika.

Apakah Ia Benar-Benar Tahu Seperti Apa Dunia Ini?

Seorang penguji meminta model menghasilkan halaman harga produk GPT-8 hipotetis, hasilnya, tata letaknya memang bergaya situs web OpenAI, posisi tombol dan pemilihan font seperti diambil dari antarmuka nyata, logika hierarki tabel harga juga benar.

GPT Image 2 dapat menghasilkan gambar yang sangat mirip dengan antarmuka perangkat lunak nyata, termasuk jendela browser, antarmuka aplikasi seluler, bagan visualisasi data, fidelity-nya tidak dapat dibandingkan dengan produk generasi sebelumnya.

@johnAGI168 https://x.com/johnAGI168/status/2044781168151724067

@levelsio https://x.com/levelsio/status/2040333489476681758

Ini akan membawa beberapa kegunaan praktis yang sangat menarik. Saat mendesain prototipe produk, desainer tidak perlu membuka Figma dulu untuk menggambar banyak kerangka, langsung menggunakan deskripsi teks untuk antarmuka yang diinginkan, yang keluar adalah gambar referensi yang bisa digunakan untuk diskusi dengan tim. Saat membuat Deck untuk investor, tidak perlu menunggu insinyur menulis kode untuk menampilkan "screenshot produk". Saat menulis dokumentasi, contoh antarmuka untuk gambar pendamping dapat langsung dihasilkan, tidak perlu memikirkan dari mana mengambil screenshot di depan halaman kosong.

@marmaduke091 https://x.com/marmaduke091/status/2040338311873515597

Pembuatan Gambar, Bukan Hanya "Membuat Gambar" Lagi

OpenAI telah mengumumkan bahwa DALL-E 2 dan DALL-E 3 akan secara resmi berhenti beroperasi pada 12 Mei 2026. DALL-E 3 dari Azure OpenAI sudah pensiun lebih awal pada bulan Februari.

DALL-E adalah tempat banyak orang pertama kali mengenal pembuatan gambar AI, dari karya-karya buram awal hingga hari ini, hanya dalam beberapa tahun.

Sementara itu, Google, yang baru saja memantapkan posisinya di industri dengan Nano Banana Pro awal 2026, mungkin akan merasakan tekanan. Laporan pengujian awal menunjukkan bahwa GPT Image 2 secara bersamaan melampaui Nano Banana Pro dalam tiga dimensi: realisme, rendering teks, dan pengetahuan dunia, tiga kemenangan beruntun seperti ini tidak umum.

Bagi para pencipta, perasaannya kompleks. Ilustrator, desainer grafis, fotografer, bukan pertama kalinya menghadapi topik ini. Sejak peluncuran GPT Image 1, jumlah posisi desain grafis freelance telah turun sekitar 18%. AI memang dalam beberapa skenario telah menggantikan keputusan "Saya ingin mempekerjakan seseorang untuk melakukan ini", tetapi juga menciptakan cara kerja baru, membuat apa yang bisa dilakukan satu orang menjadi lebih banyak.

Kecepatan evolusi model pembuat gambar, sudah tidak memberikan banyak waktu adaptasi lagi. GPT Image 1 dari上线 ke 1.5, hanya beberapa bulan. 1.5 ke 2, mungkin hanya setengah tahun. Setiap generasi menyelesaikan kelemahan inti generasi sebelumnya, sekaligus membuka kemungkinan baru.

GPT Image 2 sekarang masih dalam tahap pengujian A/B, beberapa pengguna ChatGPT sudah secara acak mendapatkan akses. Jendela waktu rilis resmi, diprediksi secara umum sekitar Mei, bertepatan dengan pensiunnya DALL-E. Jika ingin mencoba lebih awal, saat ini bisa mencoba peruntungan di platform evaluasi LM Arena.

Alamat Tes: https://arena.ai

Berdasarkan umpan balik komunitas dan keunggulan model yang diketahui, template prompt berikut dapat memaksimalkan peluang keberhasilanmu:

Prompt UI/Screenshot: Screenshot aplikasi bank seluler yang fotorealistik, dengan jelas menampilkan riwayat transaksi, di mana tanggal, jumlah, dan nama merchant terbaca jelas. Layar iPhone 16, memegang ponsel secara alami, latar belakang kedai kopi.

Prompt Label Produk: Foto produk botol bir kerajinan fotorealistik, detail label jelas, menampilkan nama pabrik bir "Oakridge Brewing Co.", alkohol 6.8%, logo pegunungan dan daftar bahan. Pencahayaan studio, latar belakang putih.

Prompt Tanda/Logo: Foto pemandangan jalanan lorong Tokyo di malam hari, terlihat beberapa papan neon bilingual Jepang-Inggris, termasuk papan ramen bertuliskan "Ichiban Ramen — Est. 1987", papan bar karaoke, dan berbagai papan iklan bercahaya. Trotoar basah setelah hujan memantulkan cahaya.

Prompt Antarmuka/Pengetahuan Dunia: Screenshot video YouTube yang fotorealistik, menampilkan video berjudul "Cara Merakit Komputer di Tahun 2026", video tersebut memiliki 2,3 juta penayangan, dilengkapi bagian komentar yang realistis, video rekomendasi bilah samping, dan informasi saluran. Tampilan desktop browser.

Prompt Pemicu Layar Lebar: Ini adalah foto layar lebar yang sinematik, memotret eksterior toko IKEA saat senja, menampilkan papan IKEA bercahaya, parkiran dengan mobil yang realistis, serta pembeli yang masuk dan keluar. Pencahayaan golden hour, format 16:9.

Sumber gambar tidak bertanda dan referensi: https://miraflow.ai/blog/how-to-use-duct-tape-ai-model-arena-gpt-image-2-guide

Artikel ini dari akun WeChat "APPSO", penulis: Menemukan Produk Masa Depan

Cryptos en tendance

Questions liées

QApa yang membuat GPT Image 2 berbeda dari model pembuatan gambar AI sebelumnya seperti DALL-E 3 atau Nano Banana?

AGPT Image 2 unggul dalam rendering teks yang akurat (termasuk aksara non-Latin seperti bahasa Tionghoa), pemahaman pengetahuan dunia nyata, dan kemampuan menghasilkan gambar antarmuka pengguna yang realistis. Ini mengatasi kelemahan utama model sebelumnya seperti kesalahan penulisan teks dan ketidakkonsistenan visual.

QMengapa screenshot tidak lagi dapat diandalkan sebagai bukti dengan hadirnya GPT Image 2?

AKarena GPT Image 2 dapat menghasilkan gambar yang sangat realistis seperti screenshot aplikasi, dokumen identitas, atau antarmuka website dengan teks dan tata letak yang sempurna, sehingga memudahkan pembuatan konten palsu yang sulit dibedakan dari aslinya.

QApa saja keunggulan GPT Image 2 dibandingkan Midjourney berdasarkan pengujian LM Arena?

ABerdasarkan LM Arena, GPT Image 2 mengungguli Midjourney dalam empat aspek: rendering teks, kepatuhan pada instruksi, realisme foto, dan pemahaman pengetahuan dunia. Midjourney hanya unggul dalam kontrol gaya artistik dan estetika.

QBagaimana cara mengakses GPT Image 2 untuk dicoba sebelum rilis resminya?

APengguna dapat mencoba mengaksesnya melalui platform evaluasi LM Arena (https://arena.ai) karena model ini sedang dalam fase A/B testing. Beberapa pengguna ChatGPT juga mungkin mendapatkan akses acak.

QApa contoh prompt yang efektif untuk menghasilkan gambar UI realistis menggunakan GPT Image 2?

AContoh prompt: 'Foto screenshot aplikasi perbankan seluler yang terlihat realistis, menampilkan riwayat transaksi dengan tanggal, jumlah, dan nama merchant yang jelas. Layar iPhone 16, latar belakang kedai kopi, dipegang secara alami.'

Lectures associées

La Corée du Sud se prépare à réguler les transferts cryptographiques transfrontaliers dans le cadre d'un nouveau système

La Corée du Sud prévoit d'inclure les entreprises de fintech dans son nouveau cadre d'autorisation pour les transferts d'actifs virtuels, qui doit entrer en vigueur en décembre. Cette décision suit l'introduction d'une période de grâce de six mois dans l'amendement de la loi sur les transactions de change. À partir de décembre, les entreprises effectuant des transferts transfrontaliers via des actifs virtuels devront s'enregistrer auprès du ministère de l'Économie et des Finances et déclarer leurs transactions via le système de déclaration des changes coréen. Ce cadre réglementaire vise à placer ces transferts sous surveillance officielle, les autorités ayant constaté que de nombreux transferts d'actifs numériques échappaient au contrôle des changes, présentant des risques de blanchiment d'argent et d'activités criminelles. Initialement, les règles s'appliquaient principalement aux plateformes d'échange de cryptomonnaies. Cependant, les régulateurs sud-coréens envisagent désormais d'élargir le champ des entités éligibles pour inclure des acteurs non traditionnels, comme les fintechs, si elles peuvent effectuer ces transferts de manière efficace. Le ministère et la Banque de Corée collaborent avec les acteurs du secteur pour finaliser les règles d'application avant le lancement en décembre. Cette initiative s'inscrit dans un contexte plus large de renforcement de la supervision des actifs numériques par la Corée du Sud, qui travaille également sur une réglementation pour les produits financiers tokenisés.

TheNewsCryptoIl y a 1 h

La Corée du Sud se prépare à réguler les transferts cryptographiques transfrontaliers dans le cadre d'un nouveau système

TheNewsCryptoIl y a 1 h

Microsoft identifie un nouveau logiciel malveillant ciblant les adresses de portefeuille et les clés privées

En février 2026, Microsoft Threat Intelligence a découvert une nouvelle campagne de malware ciblant les cryptomonnaies, identifiée sous le nom de Trojan/CryptoBandits.A. Ce logiciel malveillant, propagé via des fichiers .lnk malveillants sur des clés USB, opère sans installer ni serveur de commande classique. Il utilise l'hôte de script Windows et une technologie ActiveX pour déployer un proxy Tor, permettant une connexion discrète aux serveurs des attaquants via un service caché Tor. Une fois installé, le malware déploie deux modules : l'un pour sa propagation et l'autre agissant comme un "clipper" et voleur d'informations. Il surveille en permanence le presse-papier pour y déceler des phrases de récupération (de 12 ou 24 mots), des clés privées Bitcoin/Ethereum et des adresses de portefeuille. Lorsqu'un utilisateur copie une adresse pour effectuer une transaction, le malware la remplace silencieusement par une adresse contrôlée par les attaquants. De plus, le malware capture des captures d'écran qu'il envoie via Tor, permettant aux cybercriminels d'évaluer les soldes et activités des victimes. Il dispose également de capacités d'exécution de code à distance et assure sa persistance via des tâches planifiées. Microsoft recommande aux organisations de désactiver l'exécution automatique, de restreindre les interpréteurs de script et les raccourcis exécutables depuis les périphériques USB, et de surveiller toute activité suspecte liée à l'exécution de JavaScript, aux proxys locaux (port 9050), ou à la surveillance du presse-papier. Cette campagne illustre l'adaptation continue des menaces à l'essor des cryptomonnaies.

TheNewsCryptoIl y a 1 h

Microsoft identifie un nouveau logiciel malveillant ciblant les adresses de portefeuille et les clés privées

TheNewsCryptoIl y a 1 h

Sans équipe commerciale, un chiffre d'affaires de 20 millions de dollars : comment Viktor, l'employé IA, a-t-il séduit 30 000 entreprises ?

Sans équipe commerciale, le produit Viktor, un « employé IA », génère 20 millions de dollars de revenus annuels auprès de plus de 30 000 entreprises. Fondé par une équipe issue de DeepMind, Viktor se présente comme un « collègue IA de niveau 3 » capable d'exécuter des tâches de bout en bout, et non un simple assistant. Son utilisation est simplifiée : via une mention @ dans Slack ou Microsoft Teams, les employés peuvent lui demander en langage naturel d'effectuer des tâches complexes, comme générer un rapport ou réaliser un rapprochement comptable, sans avoir besoin de maîtriser l'ingénierie des prompts. Le succès repose sur un modèle de croissance tiré par le produit (PLG) et une tarification basée sur la consommation de crédits pour les tâches, réduisant les coûts d'essai. Viktor permet également une automatisation proactive, exécutant des processus comme la génération de présentations en croisant plusieurs outils. Son intégration à Teams, avec 320 millions d'utilisateurs, marque une étape vers une adoption à grande échelle, mais soulève aussi des défis majeurs : la conformité dans les grandes entreprises, les risques d'erreur dus à la boîte noire des décisions de l'IA, et la nécessité de gagner la confiance via une gouvernance robuste (journaux d'audit, permissions). L'équilibre entre efficacité automatisée et contrôle restera crucial pour son adoption dans les flux métiers essentiels.

marsbitIl y a 2 h

Sans équipe commerciale, un chiffre d'affaires de 20 millions de dollars : comment Viktor, l'employé IA, a-t-il séduit 30 000 entreprises ?

marsbitIl y a 2 h

Entretien avec les cofondateurs de CoreWeave, « action liée à Nvidia » : La demande d'IA semble s'intensifier chaque jour

Interview des dirigeants de CoreWeave : La demande d'IA semble « s'intensifier » quotidiennement CoreWeave, leader des services cloud de nouvelle génération (neocloud), a récemment partagé ses perspectives sur le marché de l'infrastructure IA. Ses dirigeants, Brannin McBee et Nick Robbins, soulignent que la demande ne faiblit pas ; au contraire, elle s'accentue chaque jour, portée par l'essor des agents IA, du raisonnement et des applications d'inférence en entreprise. Ils observent un changement structurel : le goulot d'étranglement ne se limite plus aux GPU. L'attention se porte désormais sur des défis d'infrastructure plus larges : la disponibilité des centres de données (powered shells), l'approvisionnement en CPU, en mémoire HBM, en stockage, ainsi que les capacités d'exécution de la chaîne logistique. CoreWeave, qui sert des clients majeurs comme OpenAI, Anthropic et Meta, constate une demande croissante pour les CPU (notamment les futurs Vera CPU de NVIDIA) et le stockage, nécessitant une refonte des conceptions de data centers. La différenciation de CoreWeave réside dans son excellence opérationnelle, sa rapidité de déploiement et ses performances validées par des tiers. Son modèle commercial, basé sur des contrats à long terme, lui permet de protéger ses marges en répercutant les coûts des composants comme la mémoire HBM. Le déploiement à grande échelle des nouvelles plates-formes comme Vera Rubin (VR) devrait suivre un calendrier similaire à celui des systèmes GB200, avec une accélération majeure attendue en 2027. En résumé, la course à l'infrastructure IA évolue d'une simple acquisition de puces vers une capacité globale à livrer des systèmes complexes de manière fiable et à grande échelle.

marsbitIl y a 2 h

Entretien avec les cofondateurs de CoreWeave, « action liée à Nvidia » : La demande d'IA semble s'intensifier chaque jour

marsbitIl y a 2 h

Trading

Spot
Futures

Articles tendance

Comment acheter BANANA

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Banana Gun (BANANA) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Banana Gun (BANANA).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Banana Gun (BANANA)Après avoir acheté vos Banana Gun (BANANA), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Banana Gun (BANANA)Tradez facilement Banana Gun (BANANA) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

166 vues totalesPublié le 2024.12.11Mis à jour le 2026.06.02

Comment acheter BANANA

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de BANANA (BANANA) sont présentées ci-dessous.

活动图片