Model Pembuat Gambar yang Lebih Hebat dari Nano Banana Bocor, Screenshot Bukan Lagi Bukti | Dilengkapi Prompt

marsbitDipublikasikan tanggal 2026-04-19Terakhir diperbarui pada 2026-04-19

Abstrak

Model gambar AI terbaru OpenAI, yang diduga bernama GPT Image 2, telah bocor dan menunjukkan peningkatan signifikan dalam hal rendering teks, termasuk aksara non-Latin seperti bahasa Tionghoa. Model ini dapat menghasilkan gambar yang sangat realistis, seperti screenshot antarmuka pengguna, label produk, dan bahkan dokumen identitas yang tampak asli. Kemampuan ini tidak hanya berguna untuk desainer dan pembuat konten, tetapi juga memunculkan kekhawatiran bahwa screenshot tidak lagi dapat dijadikan bukti yang andal. Model ini dilaporkan mengungguli model lain seperti Midjourney dalam hal rendering teks, pemahaman instruksi, dan pengetahuan dunia. Meskipun belum secara resmi diumumkan, model ini sedang dalam tahap A/B testing dan diperkirakan akan diluncurkan resmi sekitar Mei 2026. Pengguna dapat mencobanya di platform LM Arena dengan prompt tertentu untuk hasil terbaik.

Apakah kesanmu tentang pembuatan gambar dari teks masih tertinggal di Nano Banana?

Tapi nak, zaman sudah berubah lagi.

@johnAGI168 https://x.com/johnAGI168/status/2044781168151724067

@0115hippo https://x.com/0115hippo/status/2044722124611539160

Awal April, tiga model gambar anonim muncul di platform evaluasi LM Arena, dengan kode maskingtape-alpha, packingtape-alpha, gaffertape-alpha. Beberapa jam kemudian mereka menghilang.

OpenAI secara resmi belum mengumumkan model ini, tetapi berdasarkan metadata yang dikembalikan API dan catatan pengujian dari sisi pengguna, model ini sudah memiliki nama yang diterima luas: GPT Image 2.

Screenshot Tidak Bisa Lagi Dianggap Bukti

Beberapa tahun terakhir, salah satu kelemahan paling mencolok dari model pembuat gambar AI adalah teks dalam gambar. Di era DALL-E 3, jika kamu memintanya menulis "Hello" di gambar, yang keluar mungkin "Hellp" atau bahkan "Hl10", huruf-hurufnya miring seperti mabuk. GPT Image 1 jauh lebih baik, bisa menangani label bahasa Inggris sederhana. Sampai GPT Image 1.5, akurasi rendering teks Inggrisnya sudah mendekati 95%, tetapi masih memiliki kelemahan jelas pada sistem non-alfabet Latin seperti bahasa Cina, Jepang, Korea.

Namun, gambar sampel bocoran GPT Image 2 mengubah kesan ini.

@MrLarus https://x.com/MrLarus/status/2044824800909054181

@akokoi1 https://x.com/akokoi1/status/2044789531615056175

Teks dalam gambar, apa adanya. Bahasa Cina jelas, bentuk huruf akurat, guratan lengkap. Ada yang menguji menghasilkan gambar seperti KTP, nama, alamat, nomor dokumen semuanya dirender dengan benar, tata letak rapi, sekilas terlihat seperti foto dokumen asli.

Ini kabar baik. Kemajuan rendering teks berarti menghasilkan infografik, poster, kemasan produk, bagan dengan tata letak kompleks, menjadi lebih andal.

Tapi setiap koin memiliki dua sisi. Model yang bisa menghasilkan gambar mirip dokumen asli, merender screenshot UI dengan tepat, secara alami juga membuat hal "screenshot bisa dijadikan bukti" semakin dipertanyakan.

Dibandingkan, ini juga perbedaan inti antara seri GPT Image dan model lainnya. Midjourney hingga kini belum berbuat banyak dalam rendering teks, seri Stable Diffusion juga masalah lama. Berdasarkan hasil tes Arena yang bocor, GPT Image 2 melampaui Midjourney dalam empat dimensi: rendering teks, mengikuti instruksi, realisme foto, dan pengetahuan dunia, keunggulan Midjourney terutama tetap ada pada kontrol gaya seni dan estetika.

Apakah Ia Benar-Benar Tahu Seperti Apa Dunia Ini?

Seorang penguji meminta model menghasilkan halaman harga produk GPT-8 hipotetis, hasilnya, tata letaknya memang bergaya situs web OpenAI, posisi tombol dan pemilihan font seperti diambil dari antarmuka nyata, logika hierarki tabel harga juga benar.

GPT Image 2 dapat menghasilkan gambar yang sangat mirip dengan antarmuka perangkat lunak nyata, termasuk jendela browser, antarmuka aplikasi seluler, bagan visualisasi data, fidelity-nya tidak dapat dibandingkan dengan produk generasi sebelumnya.

@johnAGI168 https://x.com/johnAGI168/status/2044781168151724067

@levelsio https://x.com/levelsio/status/2040333489476681758

Ini akan membawa beberapa kegunaan praktis yang sangat menarik. Saat mendesain prototipe produk, desainer tidak perlu membuka Figma dulu untuk menggambar banyak kerangka, langsung menggunakan deskripsi teks untuk antarmuka yang diinginkan, yang keluar adalah gambar referensi yang bisa digunakan untuk diskusi dengan tim. Saat membuat Deck untuk investor, tidak perlu menunggu insinyur menulis kode untuk menampilkan "screenshot produk". Saat menulis dokumentasi, contoh antarmuka untuk gambar pendamping dapat langsung dihasilkan, tidak perlu memikirkan dari mana mengambil screenshot di depan halaman kosong.

@marmaduke091 https://x.com/marmaduke091/status/2040338311873515597

Pembuatan Gambar, Bukan Hanya "Membuat Gambar" Lagi

OpenAI telah mengumumkan bahwa DALL-E 2 dan DALL-E 3 akan secara resmi berhenti beroperasi pada 12 Mei 2026. DALL-E 3 dari Azure OpenAI sudah pensiun lebih awal pada bulan Februari.

DALL-E adalah tempat banyak orang pertama kali mengenal pembuatan gambar AI, dari karya-karya buram awal hingga hari ini, hanya dalam beberapa tahun.

Sementara itu, Google, yang baru saja memantapkan posisinya di industri dengan Nano Banana Pro awal 2026, mungkin akan merasakan tekanan. Laporan pengujian awal menunjukkan bahwa GPT Image 2 secara bersamaan melampaui Nano Banana Pro dalam tiga dimensi: realisme, rendering teks, dan pengetahuan dunia, tiga kemenangan beruntun seperti ini tidak umum.

Bagi para pencipta, perasaannya kompleks. Ilustrator, desainer grafis, fotografer, bukan pertama kalinya menghadapi topik ini. Sejak peluncuran GPT Image 1, jumlah posisi desain grafis freelance telah turun sekitar 18%. AI memang dalam beberapa skenario telah menggantikan keputusan "Saya ingin mempekerjakan seseorang untuk melakukan ini", tetapi juga menciptakan cara kerja baru, membuat apa yang bisa dilakukan satu orang menjadi lebih banyak.

Kecepatan evolusi model pembuat gambar, sudah tidak memberikan banyak waktu adaptasi lagi. GPT Image 1 dari上线 ke 1.5, hanya beberapa bulan. 1.5 ke 2, mungkin hanya setengah tahun. Setiap generasi menyelesaikan kelemahan inti generasi sebelumnya, sekaligus membuka kemungkinan baru.

GPT Image 2 sekarang masih dalam tahap pengujian A/B, beberapa pengguna ChatGPT sudah secara acak mendapatkan akses. Jendela waktu rilis resmi, diprediksi secara umum sekitar Mei, bertepatan dengan pensiunnya DALL-E. Jika ingin mencoba lebih awal, saat ini bisa mencoba peruntungan di platform evaluasi LM Arena.

Alamat Tes: https://arena.ai

Berdasarkan umpan balik komunitas dan keunggulan model yang diketahui, template prompt berikut dapat memaksimalkan peluang keberhasilanmu:

Prompt UI/Screenshot: Screenshot aplikasi bank seluler yang fotorealistik, dengan jelas menampilkan riwayat transaksi, di mana tanggal, jumlah, dan nama merchant terbaca jelas. Layar iPhone 16, memegang ponsel secara alami, latar belakang kedai kopi.

Prompt Label Produk: Foto produk botol bir kerajinan fotorealistik, detail label jelas, menampilkan nama pabrik bir "Oakridge Brewing Co.", alkohol 6.8%, logo pegunungan dan daftar bahan. Pencahayaan studio, latar belakang putih.

Prompt Tanda/Logo: Foto pemandangan jalanan lorong Tokyo di malam hari, terlihat beberapa papan neon bilingual Jepang-Inggris, termasuk papan ramen bertuliskan "Ichiban Ramen — Est. 1987", papan bar karaoke, dan berbagai papan iklan bercahaya. Trotoar basah setelah hujan memantulkan cahaya.

Prompt Antarmuka/Pengetahuan Dunia: Screenshot video YouTube yang fotorealistik, menampilkan video berjudul "Cara Merakit Komputer di Tahun 2026", video tersebut memiliki 2,3 juta penayangan, dilengkapi bagian komentar yang realistis, video rekomendasi bilah samping, dan informasi saluran. Tampilan desktop browser.

Prompt Pemicu Layar Lebar: Ini adalah foto layar lebar yang sinematik, memotret eksterior toko IKEA saat senja, menampilkan papan IKEA bercahaya, parkiran dengan mobil yang realistis, serta pembeli yang masuk dan keluar. Pencahayaan golden hour, format 16:9.

Sumber gambar tidak bertanda dan referensi: https://miraflow.ai/blog/how-to-use-duct-tape-ai-model-arena-gpt-image-2-guide

Artikel ini dari akun WeChat "APPSO", penulis: Menemukan Produk Masa Depan

Pertanyaan Terkait

QApa yang membuat GPT Image 2 berbeda dari model pembuatan gambar AI sebelumnya seperti DALL-E 3 atau Nano Banana?

AGPT Image 2 unggul dalam rendering teks yang akurat (termasuk aksara non-Latin seperti bahasa Tionghoa), pemahaman pengetahuan dunia nyata, dan kemampuan menghasilkan gambar antarmuka pengguna yang realistis. Ini mengatasi kelemahan utama model sebelumnya seperti kesalahan penulisan teks dan ketidakkonsistenan visual.

QMengapa screenshot tidak lagi dapat diandalkan sebagai bukti dengan hadirnya GPT Image 2?

AKarena GPT Image 2 dapat menghasilkan gambar yang sangat realistis seperti screenshot aplikasi, dokumen identitas, atau antarmuka website dengan teks dan tata letak yang sempurna, sehingga memudahkan pembuatan konten palsu yang sulit dibedakan dari aslinya.

QApa saja keunggulan GPT Image 2 dibandingkan Midjourney berdasarkan pengujian LM Arena?

ABerdasarkan LM Arena, GPT Image 2 mengungguli Midjourney dalam empat aspek: rendering teks, kepatuhan pada instruksi, realisme foto, dan pemahaman pengetahuan dunia. Midjourney hanya unggul dalam kontrol gaya artistik dan estetika.

QBagaimana cara mengakses GPT Image 2 untuk dicoba sebelum rilis resminya?

APengguna dapat mencoba mengaksesnya melalui platform evaluasi LM Arena (https://arena.ai) karena model ini sedang dalam fase A/B testing. Beberapa pengguna ChatGPT juga mungkin mendapatkan akses acak.

QApa contoh prompt yang efektif untuk menghasilkan gambar UI realistis menggunakan GPT Image 2?

AContoh prompt: 'Foto screenshot aplikasi perbankan seluler yang terlihat realistis, menampilkan riwayat transaksi dengan tanggal, jumlah, dan nama merchant yang jelas. Layar iPhone 16, latar belakang kedai kopi, dipegang secara alami.'

Bacaan Terkait

Wang Chuan: Bagaimana Tidak Cemas Ketika Tetangga Si Lao Wang Mendapatkan Untung Tiga Puluh Kali Lipat dari Investasi Saham Penyimpanan (6) - Perangkap Barang Homogen

**Ringkasan: Perangkap Barang Komoditas Homogen di Industri Penyimpanan** Artikel ini membahas sifat siklus yang berbahaya dan risiko tinggi dalam berinvestasi di saham perusahaan penyimpanan data, menggunakan contoh sejarah seperti Iomega. Inti masalahnya terletak pada **sifat komoditas yang homogen**: produk seperti DRAM dan flash memory sangat mirip, tanpa keunggulan merek, sehingga harganya sangat fluktuatif berdasarkan penawaran dan permintaan global. Polanya selalu sama: permintaan yang elastis (dapat menurun jika harga terlalu tinggi) berhadapan dengan pasokan yang kaku dan membutuhkan investasi besar serta waktu lama untuk dikembangkan. Saat permintaan tiba-tiba melonjak (misalnya, karena ledakan AI), pasokan yang terbatas mendorong harga naik drastis, menghasilkan margin keuntungan yang sangat tinggi bagi produsen seperti Micron dan Sandisk. Namun, **margin tinggi inilah yang akhirnya menghancurkan dirinya sendiri**. Perusahaan akan berinvestasi besar-besaran untuk menambah kapasitas, dan ketika pasokan baru membanjiri pasar (biasanya 18+ bulan kemudian), harga akan anjlok tajam. Saham bisa kehilangan 95% nilainya atau bahkan bangkrut, seperti yang terjadi pada Mostek, Qimonda, dan lainnya. Penulis memperingatkan beberapa jebakan kritis: 1. **Jebakan P/E Rendah**: Pada puncak siklus, laba tinggi membuat rasio P/E saham tampak rendah dan menarik bagi investor nilai. Namun, ini justru saat yang paling berbahaya karena keuntungan itu bisa cepat menguap. 2. **Ilusi Perjanjian Jangka Panjang (LTA)**: Perjanjian untuk mengunci harga dengan pembeli besar sering kali rapuh. Ketika harga spot turun di bawah harga LTA, pembeli akan mencari celah atau menekan pemasok, membuat perlindungan itu sia-sia. 3. **Risiko Asimetris**: Banyak faktor yang dapat dengan cepat mengubah keseimbangan: resesi, pengurangan pengeluaran AI, kecepatan ekspansi kapasitas (terutama dari produsen China), atau terobosan teknologi yang mengurangi kebutuhan memori. Risiko penurunan harga jauh lebih besar daripada potensi kenaikan lebih lanjut. Kesimpulannya, industri penyimpanan adalah "pembakar kekayaan" bagi investor yang tidak waspada. Kesuksesan spektakuler seperti kenaikan 160x saham Iomega bersifat sementara dan sering diikuti oleh kehancuran. Kunci untuk tidak cemas adalah memahami sifat siklus yang kejam ini dan menghindari godaan untuk membeli pada saat margin keuntungan dan optimisme mencapai puncaknya.

链捕手14m yang lalu

Wang Chuan: Bagaimana Tidak Cemas Ketika Tetangga Si Lao Wang Mendapatkan Untung Tiga Puluh Kali Lipat dari Investasi Saham Penyimpanan (6) - Perangkap Barang Homogen

链捕手14m yang lalu

AI PC Tiba, Bentrok Lokal dengan Model Besar 120B! NVIDIA Redefinisikan Dasar "PC AI Pribadi" dengan RTX Spark

Dalam acara GTC 2026, NVIDIA memperkenalkan SoC RTX Spark, yang membawa standar baru untuk "PC AI pribadi" dengan komputasi AI 1 petaflop (1000 TOPS), jauh melampaui NPU 45-50 TOPS pada AI PC generasi sebelumnya. Chip ini mengintegrasikan GPU arsitektur Blackwell dengan 6144 inti CUDA dan CPU Arm 20-inti dari MediaTek, menggunakan memori terpadu hingga 128GB. Desain ini memungkinkan CPU dan GPU berbagi kumpulan memori yang sama, menghilangkan hambatan transfer data dan mendukung model besar hingga 120B parameter berjalan secara lokal. Microsoft berkolaborasi dengan NVIDIA untuk meningkatkan mekanisme keamanan asli Windows dan memperkenalkan runtime sandbox open-source OpenShell, memberikan lapisan isolasi penting untuk agen AI lokal. Adobe juga mengumumkan pengembangan ulang mendasar untuk Photoshop dan Premiere guna mengoptimalkan arsitektur memori terpadu RTX Spark, yang diklaim dapat meningkatkan kinerja hingga dua kali lipat. Enam OEM utama termasuk ASUS, Dell, HP, Lenovo, Microsoft Surface, dan MSI akan merilis laptop tipis dan desktop kompak dengan RTX Spark pada musim gugur tahun ini. Meskipun demikian, detail seperti harga, efisiensi daya, dan performa nyata dalam skenario non-AI masih perlu dikonfirmasi setelah produk diluncurkan. Kehadiran RTX Spark menandai pergeseran potensial dalam industri PC menuju platform SoC yang berpusat pada GPU.

marsbit27m yang lalu

AI PC Tiba, Bentrok Lokal dengan Model Besar 120B! NVIDIA Redefinisikan Dasar "PC AI Pribadi" dengan RTX Spark

marsbit27m yang lalu

Huang Renxun: Vera Rubin Mulai Diproduksi Massal, AI Agent Adalah Fokus Utama, Menantang Intel Menuju Gerbang AI PC Generasi Berikutnya

CEO Nvidia Jensen Huang mengumumkan serangkaian produk dan strategi baru dalam pidato utamanya di GTC Taipei 2026. Arsitektur Vera Rubin telah memasuki produksi massal penuh, dengan OpenAI, Anthropic, dan SpaceX sebagai pelanggan pertama. Nvidia menekankan fokus pada pengembangan AI Agent dan meluncurkan CPU Vera khusus untuk itu. Nvidia juga mengincar pasar AI PC generasi berikutnya dengan mengumumkan prosesor baru untuk sistem Windows, menantang Intel. Chip bernama RTX SPARK dikembangkan bersama MediaTek dan akan diproduksi oleh TSMC, ditargetkan rilis musim gugur tahun ini untuk laptop dan desktop. Di bidang kendaraan otonom, platform DRIVE Hyperion mengukuhkan posisinya, dengan perusahaan seperti BYD, Geely, Zeekr, Xiaomi, dan Pony.ai mengadopsi atau mengembangkan sistem berbasis platform tersebut. Model inferensi super Alpamayo 2 juga diperkenalkan untuk robotaxi. Untuk robotika humanoid, Nvidia meluncurkan platform referensi NVIDIA Isaac GR00T untuk penelitian akademis dan toolkit agen cerdas sumber terbuka. Perusahaan bermitra dengan Unitree (H2 Plus sebagai model referensi) dan produsen robot global lainnya. Produk penting lainnya termasuk model AI baru Nemotron 3 Ultra dan platform DSX yang bertindak sebagai "panduan" lengkap untuk membangun infrastruktur pabrik AI. Harga saham Nvidia naik 2.7% dalam perdagangan malam.

marsbit56m yang lalu

Huang Renxun: Vera Rubin Mulai Diproduksi Massal, AI Agent Adalah Fokus Utama, Menantang Intel Menuju Gerbang AI PC Generasi Berikutnya

marsbit56m yang lalu

Wawancara Master Makro Raoul Pal: Titik Singularitas Ekonomi Mendekat, Jangan Mudah Turun dalam Empat Tahun ke Depan

Dalam wawancara dengan Raoul Pal, pendiri Real Vision, ia membahas fenomena "economic singularity" di mana perkembangan AI yang eksponensial akan mengubah ekonomi global. AI, sebagai kompetisi terbesar dalam sejarah, memicu aliran modal besar-besaran dan tidak akan berhenti karena menjadi perlombaan strategis antara AS dan Tiongkok. Pal menjelaskan bahwa singularitas ekonomi terjadi ketika sistem tidak lagi dapat mengikuti kecepatan inovasi teknologi, terutama dengan kemunculan agen AI yang dapat beroperasi jauh lebih cepat daripada manusia. Meskipun AI menarik banyak minat, Pal tetap yakin bahwa cryptocurrency menawarkan imbal hasil terbaik dalam jangka panjang. Ia melihat potensi besar pada aset kripto, terutama layer-1 seperti Ethereum, Solana, dan Sui, yang akan menjadi infrastruktur utama bagi ekonomi digital masa depan, termasuk untuk agen AI. Pal menekankan bahwa penurunan harga Bitcoin baru-baru ini hanyalah koreksi dalam tren bull market, dan ia menggunakan kesempatan ini untuk menambah posisi di aset seperti Sui dan Zcash. Pal menyarankan strategi "beli dan tahan" daripada trading aktif, karena sejarah menunjukkan bahwa investor pasif seringkali mendapatkan keuntungan lebih besar. Ia optimis tentang prospek 2026-2027, didukung oleh adopsi bank, regulasi yang lebih jelas, likuiditas global yang meningkat, dan pertumbuhan stablecoin. Menurutnya, probabilitas skenario positif mencapai 70%, menjadikan kripto sebagai peluang penting dalam menghadapi transformasi ekonomi mendatang.

链捕手57m yang lalu

Wawancara Master Makro Raoul Pal: Titik Singularitas Ekonomi Mendekat, Jangan Mudah Turun dalam Empat Tahun ke Depan

链捕手57m yang lalu

Trading

Spot
Futures

Artikel Populer

Cara Membeli BANANA

Selamat datang di HTX.com! Kami telah membuat pembelian Banana Gun (BANANA) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli Banana Gun (BANANA) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan Banana Gun (BANANA) AndaSetelah melakukan pembelian, simpan Banana Gun (BANANA) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading Banana Gun (BANANA)Lakukan trading Banana Gun (BANANA) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

154 Total TayanganDipublikasikan pada 2024.12.11Diperbarui pada 2025.03.21

Cara Membeli BANANA

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga BANANA (BANANA) disajikan di bawah ini.

活动图片