Model Pembuat Gambar yang Lebih Hebat dari Nano Banana Bocor, Screenshot Bukan Lagi Bukti | Dilengkapi Prompt

marsbitXuất bản vào 2026-04-19Cập nhật gần nhất vào 2026-04-19

Tóm tắt

Model gambar AI terbaru OpenAI, yang diduga bernama GPT Image 2, telah bocor dan menunjukkan peningkatan signifikan dalam hal rendering teks, termasuk aksara non-Latin seperti bahasa Tionghoa. Model ini dapat menghasilkan gambar yang sangat realistis, seperti screenshot antarmuka pengguna, label produk, dan bahkan dokumen identitas yang tampak asli. Kemampuan ini tidak hanya berguna untuk desainer dan pembuat konten, tetapi juga memunculkan kekhawatiran bahwa screenshot tidak lagi dapat dijadikan bukti yang andal. Model ini dilaporkan mengungguli model lain seperti Midjourney dalam hal rendering teks, pemahaman instruksi, dan pengetahuan dunia. Meskipun belum secara resmi diumumkan, model ini sedang dalam tahap A/B testing dan diperkirakan akan diluncurkan resmi sekitar Mei 2026. Pengguna dapat mencobanya di platform LM Arena dengan prompt tertentu untuk hasil terbaik.

Apakah kesanmu tentang pembuatan gambar dari teks masih tertinggal di Nano Banana?

Tapi nak, zaman sudah berubah lagi.

@johnAGI168 https://x.com/johnAGI168/status/2044781168151724067

@0115hippo https://x.com/0115hippo/status/2044722124611539160

Awal April, tiga model gambar anonim muncul di platform evaluasi LM Arena, dengan kode maskingtape-alpha, packingtape-alpha, gaffertape-alpha. Beberapa jam kemudian mereka menghilang.

OpenAI secara resmi belum mengumumkan model ini, tetapi berdasarkan metadata yang dikembalikan API dan catatan pengujian dari sisi pengguna, model ini sudah memiliki nama yang diterima luas: GPT Image 2.

Screenshot Tidak Bisa Lagi Dianggap Bukti

Beberapa tahun terakhir, salah satu kelemahan paling mencolok dari model pembuat gambar AI adalah teks dalam gambar. Di era DALL-E 3, jika kamu memintanya menulis "Hello" di gambar, yang keluar mungkin "Hellp" atau bahkan "Hl10", huruf-hurufnya miring seperti mabuk. GPT Image 1 jauh lebih baik, bisa menangani label bahasa Inggris sederhana. Sampai GPT Image 1.5, akurasi rendering teks Inggrisnya sudah mendekati 95%, tetapi masih memiliki kelemahan jelas pada sistem non-alfabet Latin seperti bahasa Cina, Jepang, Korea.

Namun, gambar sampel bocoran GPT Image 2 mengubah kesan ini.

@MrLarus https://x.com/MrLarus/status/2044824800909054181

@akokoi1 https://x.com/akokoi1/status/2044789531615056175

Teks dalam gambar, apa adanya. Bahasa Cina jelas, bentuk huruf akurat, guratan lengkap. Ada yang menguji menghasilkan gambar seperti KTP, nama, alamat, nomor dokumen semuanya dirender dengan benar, tata letak rapi, sekilas terlihat seperti foto dokumen asli.

Ini kabar baik. Kemajuan rendering teks berarti menghasilkan infografik, poster, kemasan produk, bagan dengan tata letak kompleks, menjadi lebih andal.

Tapi setiap koin memiliki dua sisi. Model yang bisa menghasilkan gambar mirip dokumen asli, merender screenshot UI dengan tepat, secara alami juga membuat hal "screenshot bisa dijadikan bukti" semakin dipertanyakan.

Dibandingkan, ini juga perbedaan inti antara seri GPT Image dan model lainnya. Midjourney hingga kini belum berbuat banyak dalam rendering teks, seri Stable Diffusion juga masalah lama. Berdasarkan hasil tes Arena yang bocor, GPT Image 2 melampaui Midjourney dalam empat dimensi: rendering teks, mengikuti instruksi, realisme foto, dan pengetahuan dunia, keunggulan Midjourney terutama tetap ada pada kontrol gaya seni dan estetika.

Apakah Ia Benar-Benar Tahu Seperti Apa Dunia Ini?

Seorang penguji meminta model menghasilkan halaman harga produk GPT-8 hipotetis, hasilnya, tata letaknya memang bergaya situs web OpenAI, posisi tombol dan pemilihan font seperti diambil dari antarmuka nyata, logika hierarki tabel harga juga benar.

GPT Image 2 dapat menghasilkan gambar yang sangat mirip dengan antarmuka perangkat lunak nyata, termasuk jendela browser, antarmuka aplikasi seluler, bagan visualisasi data, fidelity-nya tidak dapat dibandingkan dengan produk generasi sebelumnya.

@johnAGI168 https://x.com/johnAGI168/status/2044781168151724067

@levelsio https://x.com/levelsio/status/2040333489476681758

Ini akan membawa beberapa kegunaan praktis yang sangat menarik. Saat mendesain prototipe produk, desainer tidak perlu membuka Figma dulu untuk menggambar banyak kerangka, langsung menggunakan deskripsi teks untuk antarmuka yang diinginkan, yang keluar adalah gambar referensi yang bisa digunakan untuk diskusi dengan tim. Saat membuat Deck untuk investor, tidak perlu menunggu insinyur menulis kode untuk menampilkan "screenshot produk". Saat menulis dokumentasi, contoh antarmuka untuk gambar pendamping dapat langsung dihasilkan, tidak perlu memikirkan dari mana mengambil screenshot di depan halaman kosong.

@marmaduke091 https://x.com/marmaduke091/status/2040338311873515597

Pembuatan Gambar, Bukan Hanya "Membuat Gambar" Lagi

OpenAI telah mengumumkan bahwa DALL-E 2 dan DALL-E 3 akan secara resmi berhenti beroperasi pada 12 Mei 2026. DALL-E 3 dari Azure OpenAI sudah pensiun lebih awal pada bulan Februari.

DALL-E adalah tempat banyak orang pertama kali mengenal pembuatan gambar AI, dari karya-karya buram awal hingga hari ini, hanya dalam beberapa tahun.

Sementara itu, Google, yang baru saja memantapkan posisinya di industri dengan Nano Banana Pro awal 2026, mungkin akan merasakan tekanan. Laporan pengujian awal menunjukkan bahwa GPT Image 2 secara bersamaan melampaui Nano Banana Pro dalam tiga dimensi: realisme, rendering teks, dan pengetahuan dunia, tiga kemenangan beruntun seperti ini tidak umum.

Bagi para pencipta, perasaannya kompleks. Ilustrator, desainer grafis, fotografer, bukan pertama kalinya menghadapi topik ini. Sejak peluncuran GPT Image 1, jumlah posisi desain grafis freelance telah turun sekitar 18%. AI memang dalam beberapa skenario telah menggantikan keputusan "Saya ingin mempekerjakan seseorang untuk melakukan ini", tetapi juga menciptakan cara kerja baru, membuat apa yang bisa dilakukan satu orang menjadi lebih banyak.

Kecepatan evolusi model pembuat gambar, sudah tidak memberikan banyak waktu adaptasi lagi. GPT Image 1 dari上线 ke 1.5, hanya beberapa bulan. 1.5 ke 2, mungkin hanya setengah tahun. Setiap generasi menyelesaikan kelemahan inti generasi sebelumnya, sekaligus membuka kemungkinan baru.

GPT Image 2 sekarang masih dalam tahap pengujian A/B, beberapa pengguna ChatGPT sudah secara acak mendapatkan akses. Jendela waktu rilis resmi, diprediksi secara umum sekitar Mei, bertepatan dengan pensiunnya DALL-E. Jika ingin mencoba lebih awal, saat ini bisa mencoba peruntungan di platform evaluasi LM Arena.

Alamat Tes: https://arena.ai

Berdasarkan umpan balik komunitas dan keunggulan model yang diketahui, template prompt berikut dapat memaksimalkan peluang keberhasilanmu:

Prompt UI/Screenshot: Screenshot aplikasi bank seluler yang fotorealistik, dengan jelas menampilkan riwayat transaksi, di mana tanggal, jumlah, dan nama merchant terbaca jelas. Layar iPhone 16, memegang ponsel secara alami, latar belakang kedai kopi.

Prompt Label Produk: Foto produk botol bir kerajinan fotorealistik, detail label jelas, menampilkan nama pabrik bir "Oakridge Brewing Co.", alkohol 6.8%, logo pegunungan dan daftar bahan. Pencahayaan studio, latar belakang putih.

Prompt Tanda/Logo: Foto pemandangan jalanan lorong Tokyo di malam hari, terlihat beberapa papan neon bilingual Jepang-Inggris, termasuk papan ramen bertuliskan "Ichiban Ramen — Est. 1987", papan bar karaoke, dan berbagai papan iklan bercahaya. Trotoar basah setelah hujan memantulkan cahaya.

Prompt Antarmuka/Pengetahuan Dunia: Screenshot video YouTube yang fotorealistik, menampilkan video berjudul "Cara Merakit Komputer di Tahun 2026", video tersebut memiliki 2,3 juta penayangan, dilengkapi bagian komentar yang realistis, video rekomendasi bilah samping, dan informasi saluran. Tampilan desktop browser.

Prompt Pemicu Layar Lebar: Ini adalah foto layar lebar yang sinematik, memotret eksterior toko IKEA saat senja, menampilkan papan IKEA bercahaya, parkiran dengan mobil yang realistis, serta pembeli yang masuk dan keluar. Pencahayaan golden hour, format 16:9.

Sumber gambar tidak bertanda dan referensi: https://miraflow.ai/blog/how-to-use-duct-tape-ai-model-arena-gpt-image-2-guide

Artikel ini dari akun WeChat "APPSO", penulis: Menemukan Produk Masa Depan

Tiền kỹ thuật số thịnh hành

Câu hỏi Liên quan

QApa yang membuat GPT Image 2 berbeda dari model pembuatan gambar AI sebelumnya seperti DALL-E 3 atau Nano Banana?

AGPT Image 2 unggul dalam rendering teks yang akurat (termasuk aksara non-Latin seperti bahasa Tionghoa), pemahaman pengetahuan dunia nyata, dan kemampuan menghasilkan gambar antarmuka pengguna yang realistis. Ini mengatasi kelemahan utama model sebelumnya seperti kesalahan penulisan teks dan ketidakkonsistenan visual.

QMengapa screenshot tidak lagi dapat diandalkan sebagai bukti dengan hadirnya GPT Image 2?

AKarena GPT Image 2 dapat menghasilkan gambar yang sangat realistis seperti screenshot aplikasi, dokumen identitas, atau antarmuka website dengan teks dan tata letak yang sempurna, sehingga memudahkan pembuatan konten palsu yang sulit dibedakan dari aslinya.

QApa saja keunggulan GPT Image 2 dibandingkan Midjourney berdasarkan pengujian LM Arena?

ABerdasarkan LM Arena, GPT Image 2 mengungguli Midjourney dalam empat aspek: rendering teks, kepatuhan pada instruksi, realisme foto, dan pemahaman pengetahuan dunia. Midjourney hanya unggul dalam kontrol gaya artistik dan estetika.

QBagaimana cara mengakses GPT Image 2 untuk dicoba sebelum rilis resminya?

APengguna dapat mencoba mengaksesnya melalui platform evaluasi LM Arena (https://arena.ai) karena model ini sedang dalam fase A/B testing. Beberapa pengguna ChatGPT juga mungkin mendapatkan akses acak.

QApa contoh prompt yang efektif untuk menghasilkan gambar UI realistis menggunakan GPT Image 2?

AContoh prompt: 'Foto screenshot aplikasi perbankan seluler yang terlihat realistis, menampilkan riwayat transaksi dengan tanggal, jumlah, dan nama merchant yang jelas. Layar iPhone 16, latar belakang kedai kopi, dipegang secara alami.'

Nội dung Liên quan

Hàn Quốc Hành Động Quy Định Chuyển Tiền Xuyên Biên Giới Bằng Tiền Mã Hóa Theo Khuôn Khổ Mới

Hàn Quốc dự kiến đưa các công ty fintech vào khuôn khổ cấp phép mới cho chuyển tiền bằng tài sản ảo, có hiệu lực từ tháng 12. Theo quy định sửa đổi, các công ty thực hiện chuyển tiền xuyên biên giới qua tài sản ảo phải đăng ký với Bộ Kinh tế & Tài chính và báo cáo giao dịch qua hệ thống hối đoái. Khung pháp lý này được lập ra để đưa các giao dịch dựa trên tiền mã hóa vào diện giám sát chính thức, nhằm ngăn chặn rửa tiền và tội phạm do nhiều giao dịch trước đây hoạt động ngoài hệ thống giám sát. Ban đầu, quy định chỉ giới hạn cho các sàn giao dịch tiền mã hóa như Upbit hay Bithumb. Tuy nhiên, ngân hàng trung ương Hàn Quốc cho biết có thể mở rộng đối tượng đủ điều kiện sang các thực thể phi truyền thống nếu họ đáp ứng yêu cầu. Bộ Kinh tế & Tài chính và Ngân hàng Trung ương đang phối hợp với các bên để hoàn thiện quy tắc thực thi trước tháng 12. Động thái này nằm trong bối cảnh Hàn Quốc đang tăng cường giám sát tài sản số, bao gồm cả việc sắp công bố quy tắc mới về chứng khoán token hóa vào tháng 7.

TheNewsCrypto1 giờ trước

Hàn Quốc Hành Động Quy Định Chuyển Tiền Xuyên Biên Giới Bằng Tiền Mã Hóa Theo Khuôn Khổ Mới

TheNewsCrypto1 giờ trước

Microsoft Xác Định Phần Mềm Độc Hại Mới Nhắm Vào Địa Chỉ Ví Và Khóa Riêng Tư

Vào tháng 2/2026, Microsoft đã phát hiện một chiến dịch mã độc nhắm mục tiêu vào người dùng tiền điện tử, được đặt tên là Trojan/CryptoBandits.A. Mã độc này lây lan chủ yếu qua các file shortcut .lnk độc hại trên ổ USB. Sau khi xâm nhập hệ thống, phần mềm độc hại hoạt động như một "crypto clipper". Nó liên tục theo dõi nội dung clipboard để tìm kiếm các cụm từ khôi phục ví (12 hoặc 24 từ), khóa cá nhân Bitcoin/Ethereum và địa chỉ ví. Khi phát hiện, nó sẽ thay thế địa chỉ ví người dùng sao chép bằng địa chỉ do kẻ tấn công kiểm soát, đánh cắp tiền. Ngoài ra, mã độc còn chụp màn hình, thực thi lệnh từ xa và duy trì quyền truy cập qua các tác vụ đã lên lịch. Điểm đáng chú ý là mã độc không cần máy chủ điều khiển trực tiếp mà sử dụng Windows Script Host, ActiveX và một proxy Tor ẩn để giao tiếp. Microsoft khuyến nghị các tổ chức vô hiệu hóa tính năng auto-run, hạn chế script từ USB và giám sát các hành vi đáng ngờ như hoạt động proxy localhost:9050, theo dõi clipboard hay chụp màn hình bằng PowerShell. Chiến dịch này cho thấy mối đe dọa ngày càng tinh vi đối với lĩnh vực tiền điện tử.

TheNewsCrypto1 giờ trước

Microsoft Xác Định Phần Mềm Độc Hại Mới Nhắm Vào Địa Chỉ Ví Và Khóa Riêng Tư

TheNewsCrypto1 giờ trước

Không có đội ngũ bán hàng vẫn thu về 20 triệu đô la, AI nhân viên Viktor dựa vào điều gì để chinh phục 30.000 doanh nghiệp?

AI nhân viên Viktor đạt doanh thu 20 triệu USD/năm với hơn 30.000 doanh nghiệp mà không cần đội ngũ bán hàng, bằng cách nào? Sản phẩm "Tier 3 AI Coworker" này, do đội ngũ từ DeepMind phát triển, hoạt động như một nhân viên kỹ thuật số. Người dùng chỉ cần đề cập @Viktor trong Slack hoặc Teams và yêu cầu bằng ngôn ngữ tự nhiên (ví dụ: tạo báo cáo bán hàng), nó sẽ tự động truy cập CRM, tạo biểu đồ và gửi kết quả. Ngoài phản hồi, Viktor còn tự động kích hoạt tác vụ như đối chiếu sổ sách ban đêm hay tổng hợp dữ liệu từ nhiều công cụ để làm PowerPoint. Thành công của Viktor đến từ mô hình PLG (Product-Led Growth) thuần túy. Thay vì bán theo số ghế, họ tính phí theo tín dụng hoặc nhiệm vụ, giúp giảm chi phí thử nghiệm. Người dùng có 100 USD miễn phí để trải nghiệm, từ đó lan truyền tự nhiên trong nội bộ. Viktor phá vỡ rào cản "kỹ thuật nhắc lệnh" (prompt engineering) bằng cách chuyển từ hỗ trợ soạn thảo sang thực thi đầu-cuối. Tuy nhiên, cơ chế ra quyết định tự động cũng tiềm ẩn rủi ro khi hiểu sai yêu cầu mơ hồ. Sản phẩm đang chuyển từ Slack sang Microsoft Teams (3.2 tỷ người dùng), đối mặt với thách thức tuân thủ và kiểm soát của bộ phận IT tại các tập đoàn lớn. Rào cản chính là cân bằng giữa tự động hóa hoàn toàn và kiểm soát rủi ro (như ghi sai dữ liệu), đòi hỏi khung quản trị chặt chẽ về quyền hạn, nhật ký kiểm toán để xây dựng lòng tin.

marsbit2 giờ trước

Không có đội ngũ bán hàng vẫn thu về 20 triệu đô la, AI nhân viên Viktor dựa vào điều gì để chinh phục 30.000 doanh nghiệp?

marsbit2 giờ trước

Phương án mua lại Manus hé lộ: Bên đầu tư Trung Quốc dự kiến bỏ ra 2 tỷ USD mua lại cổ phần, lộ trình IPO tại Hồng Kông dần sáng tỏ

Bài báo ngày 18/6 từ The Information tiết lộ, các nhà đầu tư Trung Quốc ban đầu của Manus, bao gồm Tencent, Sequoia China và ZhenFund, có kế hoạch mua lại công ty từ Meta với giá 20 tỷ USD, bằng đúng số tiền Meta đã chi trả vào tháng 12 năm ngoái. Động thái này là phản ứng trực tiếp sau khi cơ quan chức năng Trung Quốc vào tháng 4 ra lệnh dừng thương vụ mua lại do lo ngại an ninh. Theo kế hoạch, Manus sẽ được tái cấu trúc thành một doanh nghiệp liên doanh trong nước để đáp ứng các quy định và mở đường cho một đợt IPO tiềm năng tại Hong Kong. Các nhà đầu tư Trung Quốc dự kiến sẽ tăng vốn bằng USD. Benchmark, một nhà đầu tư khác, sẽ không tham gia mua lại, dẫn đến việc cổ phần của Manus tập trung nhiều hơn vào tay các quỹ Trung Quốc. Manus đã chứng kiến tốc độ tăng trưởng doanh thu ấn tượng, từ mức 1 tỷ USD khi bị mua lại lên 4-5 tỷ USD hiện tại, củng cố niềm tin của các nhà đầu tư vào việc mua lại theo giá cũ. Các điều khoản chi tiết như tỷ lệ góp vốn và cơ cấu công ty liên doanh vẫn đang được đàm phán. Kịch bản "mua lại + liên doanh + IPO tại Hong Kong" này có thể trở thành một khuôn mẫu tham khảo cho các startup AI Trung Quốc trong các thương vụ M&A xuyên biên giới.

marsbit2 giờ trước

Phương án mua lại Manus hé lộ: Bên đầu tư Trung Quốc dự kiến bỏ ra 2 tỷ USD mua lại cổ phần, lộ trình IPO tại Hồng Kông dần sáng tỏ

marsbit2 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

Làm thế nào để Mua BANANA

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Banana Gun (BANANA) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Banana Gun (BANANA) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Banana Gun (BANANA) của BạnSau khi mua Banana Gun (BANANA), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Banana Gun (BANANA)Giao dịch Banana Gun (BANANA) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 243Xuất bản vào 2024.12.11Cập nhật vào 2026.06.02

Làm thế nào để Mua BANANA

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của BANANA (BANANA) được trình bày dưới đây.

活动图片