Model Pembuat Gambar yang Lebih Hebat dari Nano Banana Bocor, Screenshot Bukan Lagi Bukti | Dilengkapi Prompt

marsbitPubblicato 2026-04-19Pubblicato ultima volta 2026-04-19

Introduzione

Model gambar AI terbaru OpenAI, yang diduga bernama GPT Image 2, telah bocor dan menunjukkan peningkatan signifikan dalam hal rendering teks, termasuk aksara non-Latin seperti bahasa Tionghoa. Model ini dapat menghasilkan gambar yang sangat realistis, seperti screenshot antarmuka pengguna, label produk, dan bahkan dokumen identitas yang tampak asli. Kemampuan ini tidak hanya berguna untuk desainer dan pembuat konten, tetapi juga memunculkan kekhawatiran bahwa screenshot tidak lagi dapat dijadikan bukti yang andal. Model ini dilaporkan mengungguli model lain seperti Midjourney dalam hal rendering teks, pemahaman instruksi, dan pengetahuan dunia. Meskipun belum secara resmi diumumkan, model ini sedang dalam tahap A/B testing dan diperkirakan akan diluncurkan resmi sekitar Mei 2026. Pengguna dapat mencobanya di platform LM Arena dengan prompt tertentu untuk hasil terbaik.

Apakah kesanmu tentang pembuatan gambar dari teks masih tertinggal di Nano Banana?

Tapi nak, zaman sudah berubah lagi.

@johnAGI168 https://x.com/johnAGI168/status/2044781168151724067

@0115hippo https://x.com/0115hippo/status/2044722124611539160

Awal April, tiga model gambar anonim muncul di platform evaluasi LM Arena, dengan kode maskingtape-alpha, packingtape-alpha, gaffertape-alpha. Beberapa jam kemudian mereka menghilang.

OpenAI secara resmi belum mengumumkan model ini, tetapi berdasarkan metadata yang dikembalikan API dan catatan pengujian dari sisi pengguna, model ini sudah memiliki nama yang diterima luas: GPT Image 2.

Screenshot Tidak Bisa Lagi Dianggap Bukti

Beberapa tahun terakhir, salah satu kelemahan paling mencolok dari model pembuat gambar AI adalah teks dalam gambar. Di era DALL-E 3, jika kamu memintanya menulis "Hello" di gambar, yang keluar mungkin "Hellp" atau bahkan "Hl10", huruf-hurufnya miring seperti mabuk. GPT Image 1 jauh lebih baik, bisa menangani label bahasa Inggris sederhana. Sampai GPT Image 1.5, akurasi rendering teks Inggrisnya sudah mendekati 95%, tetapi masih memiliki kelemahan jelas pada sistem non-alfabet Latin seperti bahasa Cina, Jepang, Korea.

Namun, gambar sampel bocoran GPT Image 2 mengubah kesan ini.

@MrLarus https://x.com/MrLarus/status/2044824800909054181

@akokoi1 https://x.com/akokoi1/status/2044789531615056175

Teks dalam gambar, apa adanya. Bahasa Cina jelas, bentuk huruf akurat, guratan lengkap. Ada yang menguji menghasilkan gambar seperti KTP, nama, alamat, nomor dokumen semuanya dirender dengan benar, tata letak rapi, sekilas terlihat seperti foto dokumen asli.

Ini kabar baik. Kemajuan rendering teks berarti menghasilkan infografik, poster, kemasan produk, bagan dengan tata letak kompleks, menjadi lebih andal.

Tapi setiap koin memiliki dua sisi. Model yang bisa menghasilkan gambar mirip dokumen asli, merender screenshot UI dengan tepat, secara alami juga membuat hal "screenshot bisa dijadikan bukti" semakin dipertanyakan.

Dibandingkan, ini juga perbedaan inti antara seri GPT Image dan model lainnya. Midjourney hingga kini belum berbuat banyak dalam rendering teks, seri Stable Diffusion juga masalah lama. Berdasarkan hasil tes Arena yang bocor, GPT Image 2 melampaui Midjourney dalam empat dimensi: rendering teks, mengikuti instruksi, realisme foto, dan pengetahuan dunia, keunggulan Midjourney terutama tetap ada pada kontrol gaya seni dan estetika.

Apakah Ia Benar-Benar Tahu Seperti Apa Dunia Ini?

Seorang penguji meminta model menghasilkan halaman harga produk GPT-8 hipotetis, hasilnya, tata letaknya memang bergaya situs web OpenAI, posisi tombol dan pemilihan font seperti diambil dari antarmuka nyata, logika hierarki tabel harga juga benar.

GPT Image 2 dapat menghasilkan gambar yang sangat mirip dengan antarmuka perangkat lunak nyata, termasuk jendela browser, antarmuka aplikasi seluler, bagan visualisasi data, fidelity-nya tidak dapat dibandingkan dengan produk generasi sebelumnya.

@johnAGI168 https://x.com/johnAGI168/status/2044781168151724067

@levelsio https://x.com/levelsio/status/2040333489476681758

Ini akan membawa beberapa kegunaan praktis yang sangat menarik. Saat mendesain prototipe produk, desainer tidak perlu membuka Figma dulu untuk menggambar banyak kerangka, langsung menggunakan deskripsi teks untuk antarmuka yang diinginkan, yang keluar adalah gambar referensi yang bisa digunakan untuk diskusi dengan tim. Saat membuat Deck untuk investor, tidak perlu menunggu insinyur menulis kode untuk menampilkan "screenshot produk". Saat menulis dokumentasi, contoh antarmuka untuk gambar pendamping dapat langsung dihasilkan, tidak perlu memikirkan dari mana mengambil screenshot di depan halaman kosong.

@marmaduke091 https://x.com/marmaduke091/status/2040338311873515597

Pembuatan Gambar, Bukan Hanya "Membuat Gambar" Lagi

OpenAI telah mengumumkan bahwa DALL-E 2 dan DALL-E 3 akan secara resmi berhenti beroperasi pada 12 Mei 2026. DALL-E 3 dari Azure OpenAI sudah pensiun lebih awal pada bulan Februari.

DALL-E adalah tempat banyak orang pertama kali mengenal pembuatan gambar AI, dari karya-karya buram awal hingga hari ini, hanya dalam beberapa tahun.

Sementara itu, Google, yang baru saja memantapkan posisinya di industri dengan Nano Banana Pro awal 2026, mungkin akan merasakan tekanan. Laporan pengujian awal menunjukkan bahwa GPT Image 2 secara bersamaan melampaui Nano Banana Pro dalam tiga dimensi: realisme, rendering teks, dan pengetahuan dunia, tiga kemenangan beruntun seperti ini tidak umum.

Bagi para pencipta, perasaannya kompleks. Ilustrator, desainer grafis, fotografer, bukan pertama kalinya menghadapi topik ini. Sejak peluncuran GPT Image 1, jumlah posisi desain grafis freelance telah turun sekitar 18%. AI memang dalam beberapa skenario telah menggantikan keputusan "Saya ingin mempekerjakan seseorang untuk melakukan ini", tetapi juga menciptakan cara kerja baru, membuat apa yang bisa dilakukan satu orang menjadi lebih banyak.

Kecepatan evolusi model pembuat gambar, sudah tidak memberikan banyak waktu adaptasi lagi. GPT Image 1 dari上线 ke 1.5, hanya beberapa bulan. 1.5 ke 2, mungkin hanya setengah tahun. Setiap generasi menyelesaikan kelemahan inti generasi sebelumnya, sekaligus membuka kemungkinan baru.

GPT Image 2 sekarang masih dalam tahap pengujian A/B, beberapa pengguna ChatGPT sudah secara acak mendapatkan akses. Jendela waktu rilis resmi, diprediksi secara umum sekitar Mei, bertepatan dengan pensiunnya DALL-E. Jika ingin mencoba lebih awal, saat ini bisa mencoba peruntungan di platform evaluasi LM Arena.

Alamat Tes: https://arena.ai

Berdasarkan umpan balik komunitas dan keunggulan model yang diketahui, template prompt berikut dapat memaksimalkan peluang keberhasilanmu:

Prompt UI/Screenshot: Screenshot aplikasi bank seluler yang fotorealistik, dengan jelas menampilkan riwayat transaksi, di mana tanggal, jumlah, dan nama merchant terbaca jelas. Layar iPhone 16, memegang ponsel secara alami, latar belakang kedai kopi.

Prompt Label Produk: Foto produk botol bir kerajinan fotorealistik, detail label jelas, menampilkan nama pabrik bir "Oakridge Brewing Co.", alkohol 6.8%, logo pegunungan dan daftar bahan. Pencahayaan studio, latar belakang putih.

Prompt Tanda/Logo: Foto pemandangan jalanan lorong Tokyo di malam hari, terlihat beberapa papan neon bilingual Jepang-Inggris, termasuk papan ramen bertuliskan "Ichiban Ramen — Est. 1987", papan bar karaoke, dan berbagai papan iklan bercahaya. Trotoar basah setelah hujan memantulkan cahaya.

Prompt Antarmuka/Pengetahuan Dunia: Screenshot video YouTube yang fotorealistik, menampilkan video berjudul "Cara Merakit Komputer di Tahun 2026", video tersebut memiliki 2,3 juta penayangan, dilengkapi bagian komentar yang realistis, video rekomendasi bilah samping, dan informasi saluran. Tampilan desktop browser.

Prompt Pemicu Layar Lebar: Ini adalah foto layar lebar yang sinematik, memotret eksterior toko IKEA saat senja, menampilkan papan IKEA bercahaya, parkiran dengan mobil yang realistis, serta pembeli yang masuk dan keluar. Pencahayaan golden hour, format 16:9.

Sumber gambar tidak bertanda dan referensi: https://miraflow.ai/blog/how-to-use-duct-tape-ai-model-arena-gpt-image-2-guide

Artikel ini dari akun WeChat "APPSO", penulis: Menemukan Produk Masa Depan

Crypto di tendenza

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

Domande pertinenti

QApa yang membuat GPT Image 2 berbeda dari model pembuatan gambar AI sebelumnya seperti DALL-E 3 atau Nano Banana?

AGPT Image 2 unggul dalam rendering teks yang akurat (termasuk aksara non-Latin seperti bahasa Tionghoa), pemahaman pengetahuan dunia nyata, dan kemampuan menghasilkan gambar antarmuka pengguna yang realistis. Ini mengatasi kelemahan utama model sebelumnya seperti kesalahan penulisan teks dan ketidakkonsistenan visual.

QMengapa screenshot tidak lagi dapat diandalkan sebagai bukti dengan hadirnya GPT Image 2?

AKarena GPT Image 2 dapat menghasilkan gambar yang sangat realistis seperti screenshot aplikasi, dokumen identitas, atau antarmuka website dengan teks dan tata letak yang sempurna, sehingga memudahkan pembuatan konten palsu yang sulit dibedakan dari aslinya.

QApa saja keunggulan GPT Image 2 dibandingkan Midjourney berdasarkan pengujian LM Arena?

ABerdasarkan LM Arena, GPT Image 2 mengungguli Midjourney dalam empat aspek: rendering teks, kepatuhan pada instruksi, realisme foto, dan pemahaman pengetahuan dunia. Midjourney hanya unggul dalam kontrol gaya artistik dan estetika.

QBagaimana cara mengakses GPT Image 2 untuk dicoba sebelum rilis resminya?

APengguna dapat mencoba mengaksesnya melalui platform evaluasi LM Arena (https://arena.ai) karena model ini sedang dalam fase A/B testing. Beberapa pengguna ChatGPT juga mungkin mendapatkan akses acak.

QApa contoh prompt yang efektif untuk menghasilkan gambar UI realistis menggunakan GPT Image 2?

AContoh prompt: 'Foto screenshot aplikasi perbankan seluler yang terlihat realistis, menampilkan riwayat transaksi dengan tanggal, jumlah, dan nama merchant yang jelas. Layar iPhone 16, latar belakang kedai kopi, dipegang secara alami.'

Letture associate

LATEST NEWS: Michael Saylor Makes Statement Regarding Today's Bitcoin Sale! 'I Said I Would Never Sell My Personal Bitcoins'

In a recent development, Michael Saylor's company, MicroStrategy, sold 1,638 Bitcoin for approximately $105 million, reducing its total holdings to 842,138 BTC. The sale, executed at an average price of $63,957 per Bitcoin, was conducted to fund the distribution of preferred stock and the repurchase of STRC shares. Following this transaction, Sclar clarified his famous stance of "Never sell your Bitcoin." He emphasized that his personal policy of never selling any of his own Bitcoin, not a single satoshi, is advice directed at individual investors. Sclar stated that MicroStrategy, as a public company, operates under a separate capital management policy, which has always included the potential to buy or sell Bitcoin for corporate needs, a stance publicly disclosed since 2020. He insisted that the company's fundamental belief in Bitcoin remains unchanged.

cryptonews.ru10 min fa

LATEST NEWS: Michael Saylor Makes Statement Regarding Today's Bitcoin Sale! 'I Said I Would Never Sell My Personal Bitcoins'

cryptonews.ru10 min fa

Analytics Company Reveals Critical Threshold for Bitcoin (BTC): 'This Could End the Bear Market!'. Here Are the Details

Analytical firm 10x Research highlights a critical threshold for Bitcoin's market direction. Founder Markus Thielen states that a monthly close above $63,000 is key to confirming a bear market bottom. Currently, Bitcoin remains below this level and its 7- and 30-day moving averages, with a 3.2% weekly decline, indicating a persisting short-term bearish trend. Thielen warns of macroeconomic risks, suggesting that if U.S. 10-year Treasury yields continue rising, the Federal Reserve may resume interest rate hikes in September, posing a significant risk to risk assets like Bitcoin. Additionally, potential selling pressure could arise from Bitcoin mining companies shifting focus to AI (holding roughly 100,000 BTC) and from institutional Bitcoin holders liquidating assets. For Bitcoin to resume an upward trend, it must hold key technical levels while navigating a favorable macroeconomic environment. *This is not investment advice.

cryptonews.ru10 min fa

Analytics Company Reveals Critical Threshold for Bitcoin (BTC): 'This Could End the Bear Market!'. Here Are the Details

cryptonews.ru10 min fa

XDC Tech integrates Bridge’s stablecoin platform to bring on-chain stablecoin settlement to agentic AI commerce

XDC Tech, the institutional arm of the XDC Network, has integrated with Bridge's stablecoin infrastructure platform. This integration provides developers on XDC with direct access to Bridge's tools for converting between cash and stablecoins, virtual accounts, and multi-currency custody, eliminating the need to build compliance layers. The primary use case is enabling fast, on-chain stablecoin settlements for payments. Businesses can accept fiat currencies via Bridge's virtual accounts and receive near real-time settlement in stablecoins on XDC, bypassing traditional banking delays. This applies to trade finance, tokenized assets, and crucially, the emerging agentic AI economy. For AI agents, the partnership provides several key capabilities: machine-speed settlement (XDC finalizes transactions in ~2 seconds), regulated global fiat access via Bridge's licenses, dedicated virtual accounts as agent wallets, multi-currency custody for cross-border commerce, and compliance-by-design features like KYC/KYB. This infrastructure allows autonomous AI agents to transact seamlessly with real-world financial systems. The integration is a foundational step in XDC's roadmap to become a settlement layer for the agentic economy, where AI agents can conduct commerce at machine speed while meeting regulatory standards.

cointelegraph24 min fa

XDC Tech integrates Bridge’s stablecoin platform to bring on-chain stablecoin settlement to agentic AI commerce

cointelegraph24 min fa

BlackRock launches tokenized money market funds for stablecoin reserves

BlackRock, the world's largest asset manager, has launched two tokenized money market funds for use as stablecoin reserves. The first, BlackRock Select Treasury Based Liquidity Fund OnChain Shares (BSTBL), tokenizes an existing fund on Ethereum. The second, BlackRock Daily Reinvestment Stablecoin Reserve Vehicle (BRSRV), is a new multi-chain fund for institutions. Both funds are structured to qualify as eligible reserve assets under the US GENIUS Act of 2025. This move expands BlackRock's presence in the tokenized Treasury market, where its BUIDL fund already holds over $2.6 billion in assets.

cointelegraph50 min fa

BlackRock launches tokenized money market funds for stablecoin reserves

cointelegraph50 min fa

Is a New Era Beginning for Bitcoin? MicroStrategy Starts August with Further Sales: Announces Another Major BTC Sell-Off!

The world's largest public holder of Bitcoin, the company "Strategy," has announced another sale of its Bitcoin holdings. According to founder Michael Saylor, the company sold 1,638 BTC for approximately $105 million between July 27th and August 2nd, at an average price of $63,957 per Bitcoin. The stated purpose of the sale was to fund preferred stock dividends and buy back its stock, ticker STRC. As a result, Strategy's total Bitcoin holdings have decreased to 842,138. The company has not purchased any Bitcoin for roughly six weeks, with its last purchase occurring in July. During the same period, Strategy also raised $290.6 million through a sale of its MSTR stock. A portion of these funds, $81.2 million, was used for the STRC buyback. The company reported that its US dollar reserves have grown to approximately $4 billion. This increase in cash extends the projected period for which it can fund dividends using these reserves by 57 days, to a total of 2.3 years. Strategy emphasized its current asset position, stating it holds 842,138 BTC in its Bitcoin treasury and $4.0 billion in its US dollar treasury as of August 2, 2026.

cryptonews.ru1 h fa

Is a New Era Beginning for Bitcoin? MicroStrategy Starts August with Further Sales: Announces Another Major BTC Sell-Off!

cryptonews.ru1 h fa

Trading

Spot

Articoli Popolari

Come comprare BANANA

Benvenuto in HTX.com! Abbiamo reso l'acquisto di Banana Gun (BANANA) semplice e conveniente. Segui la nostra guida passo passo per intraprendere il tuo viaggio nel mondo delle criptovalute.Step 1: Crea il tuo Account HTXUsa la tua email o numero di telefono per registrarti il tuo account gratuito su HTX. Vivi un'esperienza facile e sblocca tutte le funzionalità,Crea il mio accountStep 2: Vai in Acquista crypto e seleziona il tuo metodo di pagamentoCarta di credito/debito: utilizza la tua Visa o Mastercard per acquistare immediatamente Banana GunBANANA.Bilancio: Usa i fondi dal bilancio del tuo account HTX per fare trading senza problemi.Terze parti: abbiamo aggiunto metodi di pagamento molto utilizzati come Google Pay e Apple Pay per maggiore comodità.P2P: Fai trading direttamente con altri utenti HTX.Over-the-Counter (OTC): Offriamo servizi su misura e tassi di cambio competitivi per i trader.Step 3: Conserva Banana Gun (BANANA)Dopo aver acquistato Banana Gun (BANANA), conserva nel tuo account HTX. In alternativa, puoi inviare tramite trasferimento blockchain o scambiare per altre criptovalute.Step 4: Scambia Banana Gun (BANANA)Scambia facilmente Banana Gun (BANANA) nel mercato spot di HTX. Accedi al tuo account, seleziona la tua coppia di trading, esegui le tue operazioni e monitora in tempo reale. Offriamo un'esperienza user-friendly sia per chi ha appena iniziato che per i trader più esperti.

210 Totale visualizzazioniPubblicato il 2024.12.11Aggiornato il 2026.06.02

Discussioni

Benvenuto nella Community HTX. Qui puoi rimanere informato sugli ultimi sviluppi della piattaforma e accedere ad approfondimenti esperti sul mercato. Le opinioni degli utenti sul prezzo di BANANA BANANA sono presentate come di seguito.