Model Pembuat Gambar yang Lebih Hebat dari Nano Banana Bocor, Screenshot Bukan Lagi Bukti | Dilengkapi Prompt

marsbitОпубликовано 2026-04-19Обновлено 2026-04-19

Введение

Model gambar AI terbaru OpenAI, yang diduga bernama GPT Image 2, telah bocor dan menunjukkan peningkatan signifikan dalam hal rendering teks, termasuk aksara non-Latin seperti bahasa Tionghoa. Model ini dapat menghasilkan gambar yang sangat realistis, seperti screenshot antarmuka pengguna, label produk, dan bahkan dokumen identitas yang tampak asli. Kemampuan ini tidak hanya berguna untuk desainer dan pembuat konten, tetapi juga memunculkan kekhawatiran bahwa screenshot tidak lagi dapat dijadikan bukti yang andal. Model ini dilaporkan mengungguli model lain seperti Midjourney dalam hal rendering teks, pemahaman instruksi, dan pengetahuan dunia. Meskipun belum secara resmi diumumkan, model ini sedang dalam tahap A/B testing dan diperkirakan akan diluncurkan resmi sekitar Mei 2026. Pengguna dapat mencobanya di platform LM Arena dengan prompt tertentu untuk hasil terbaik.

Apakah kesanmu tentang pembuatan gambar dari teks masih tertinggal di Nano Banana?

Tapi nak, zaman sudah berubah lagi.

@johnAGI168 https://x.com/johnAGI168/status/2044781168151724067

@0115hippo https://x.com/0115hippo/status/2044722124611539160

Awal April, tiga model gambar anonim muncul di platform evaluasi LM Arena, dengan kode maskingtape-alpha, packingtape-alpha, gaffertape-alpha. Beberapa jam kemudian mereka menghilang.

OpenAI secara resmi belum mengumumkan model ini, tetapi berdasarkan metadata yang dikembalikan API dan catatan pengujian dari sisi pengguna, model ini sudah memiliki nama yang diterima luas: GPT Image 2.

Screenshot Tidak Bisa Lagi Dianggap Bukti

Beberapa tahun terakhir, salah satu kelemahan paling mencolok dari model pembuat gambar AI adalah teks dalam gambar. Di era DALL-E 3, jika kamu memintanya menulis "Hello" di gambar, yang keluar mungkin "Hellp" atau bahkan "Hl10", huruf-hurufnya miring seperti mabuk. GPT Image 1 jauh lebih baik, bisa menangani label bahasa Inggris sederhana. Sampai GPT Image 1.5, akurasi rendering teks Inggrisnya sudah mendekati 95%, tetapi masih memiliki kelemahan jelas pada sistem non-alfabet Latin seperti bahasa Cina, Jepang, Korea.

Namun, gambar sampel bocoran GPT Image 2 mengubah kesan ini.

@MrLarus https://x.com/MrLarus/status/2044824800909054181

@akokoi1 https://x.com/akokoi1/status/2044789531615056175

Teks dalam gambar, apa adanya. Bahasa Cina jelas, bentuk huruf akurat, guratan lengkap. Ada yang menguji menghasilkan gambar seperti KTP, nama, alamat, nomor dokumen semuanya dirender dengan benar, tata letak rapi, sekilas terlihat seperti foto dokumen asli.

Ini kabar baik. Kemajuan rendering teks berarti menghasilkan infografik, poster, kemasan produk, bagan dengan tata letak kompleks, menjadi lebih andal.

Tapi setiap koin memiliki dua sisi. Model yang bisa menghasilkan gambar mirip dokumen asli, merender screenshot UI dengan tepat, secara alami juga membuat hal "screenshot bisa dijadikan bukti" semakin dipertanyakan.

Dibandingkan, ini juga perbedaan inti antara seri GPT Image dan model lainnya. Midjourney hingga kini belum berbuat banyak dalam rendering teks, seri Stable Diffusion juga masalah lama. Berdasarkan hasil tes Arena yang bocor, GPT Image 2 melampaui Midjourney dalam empat dimensi: rendering teks, mengikuti instruksi, realisme foto, dan pengetahuan dunia, keunggulan Midjourney terutama tetap ada pada kontrol gaya seni dan estetika.

Apakah Ia Benar-Benar Tahu Seperti Apa Dunia Ini?

Seorang penguji meminta model menghasilkan halaman harga produk GPT-8 hipotetis, hasilnya, tata letaknya memang bergaya situs web OpenAI, posisi tombol dan pemilihan font seperti diambil dari antarmuka nyata, logika hierarki tabel harga juga benar.

GPT Image 2 dapat menghasilkan gambar yang sangat mirip dengan antarmuka perangkat lunak nyata, termasuk jendela browser, antarmuka aplikasi seluler, bagan visualisasi data, fidelity-nya tidak dapat dibandingkan dengan produk generasi sebelumnya.

@johnAGI168 https://x.com/johnAGI168/status/2044781168151724067

@levelsio https://x.com/levelsio/status/2040333489476681758

Ini akan membawa beberapa kegunaan praktis yang sangat menarik. Saat mendesain prototipe produk, desainer tidak perlu membuka Figma dulu untuk menggambar banyak kerangka, langsung menggunakan deskripsi teks untuk antarmuka yang diinginkan, yang keluar adalah gambar referensi yang bisa digunakan untuk diskusi dengan tim. Saat membuat Deck untuk investor, tidak perlu menunggu insinyur menulis kode untuk menampilkan "screenshot produk". Saat menulis dokumentasi, contoh antarmuka untuk gambar pendamping dapat langsung dihasilkan, tidak perlu memikirkan dari mana mengambil screenshot di depan halaman kosong.

@marmaduke091 https://x.com/marmaduke091/status/2040338311873515597

Pembuatan Gambar, Bukan Hanya "Membuat Gambar" Lagi

OpenAI telah mengumumkan bahwa DALL-E 2 dan DALL-E 3 akan secara resmi berhenti beroperasi pada 12 Mei 2026. DALL-E 3 dari Azure OpenAI sudah pensiun lebih awal pada bulan Februari.

DALL-E adalah tempat banyak orang pertama kali mengenal pembuatan gambar AI, dari karya-karya buram awal hingga hari ini, hanya dalam beberapa tahun.

Sementara itu, Google, yang baru saja memantapkan posisinya di industri dengan Nano Banana Pro awal 2026, mungkin akan merasakan tekanan. Laporan pengujian awal menunjukkan bahwa GPT Image 2 secara bersamaan melampaui Nano Banana Pro dalam tiga dimensi: realisme, rendering teks, dan pengetahuan dunia, tiga kemenangan beruntun seperti ini tidak umum.

Bagi para pencipta, perasaannya kompleks. Ilustrator, desainer grafis, fotografer, bukan pertama kalinya menghadapi topik ini. Sejak peluncuran GPT Image 1, jumlah posisi desain grafis freelance telah turun sekitar 18%. AI memang dalam beberapa skenario telah menggantikan keputusan "Saya ingin mempekerjakan seseorang untuk melakukan ini", tetapi juga menciptakan cara kerja baru, membuat apa yang bisa dilakukan satu orang menjadi lebih banyak.

Kecepatan evolusi model pembuat gambar, sudah tidak memberikan banyak waktu adaptasi lagi. GPT Image 1 dari上线 ke 1.5, hanya beberapa bulan. 1.5 ke 2, mungkin hanya setengah tahun. Setiap generasi menyelesaikan kelemahan inti generasi sebelumnya, sekaligus membuka kemungkinan baru.

GPT Image 2 sekarang masih dalam tahap pengujian A/B, beberapa pengguna ChatGPT sudah secara acak mendapatkan akses. Jendela waktu rilis resmi, diprediksi secara umum sekitar Mei, bertepatan dengan pensiunnya DALL-E. Jika ingin mencoba lebih awal, saat ini bisa mencoba peruntungan di platform evaluasi LM Arena.

Alamat Tes: https://arena.ai

Berdasarkan umpan balik komunitas dan keunggulan model yang diketahui, template prompt berikut dapat memaksimalkan peluang keberhasilanmu:

Prompt UI/Screenshot: Screenshot aplikasi bank seluler yang fotorealistik, dengan jelas menampilkan riwayat transaksi, di mana tanggal, jumlah, dan nama merchant terbaca jelas. Layar iPhone 16, memegang ponsel secara alami, latar belakang kedai kopi.

Prompt Label Produk: Foto produk botol bir kerajinan fotorealistik, detail label jelas, menampilkan nama pabrik bir "Oakridge Brewing Co.", alkohol 6.8%, logo pegunungan dan daftar bahan. Pencahayaan studio, latar belakang putih.

Prompt Tanda/Logo: Foto pemandangan jalanan lorong Tokyo di malam hari, terlihat beberapa papan neon bilingual Jepang-Inggris, termasuk papan ramen bertuliskan "Ichiban Ramen — Est. 1987", papan bar karaoke, dan berbagai papan iklan bercahaya. Trotoar basah setelah hujan memantulkan cahaya.

Prompt Antarmuka/Pengetahuan Dunia: Screenshot video YouTube yang fotorealistik, menampilkan video berjudul "Cara Merakit Komputer di Tahun 2026", video tersebut memiliki 2,3 juta penayangan, dilengkapi bagian komentar yang realistis, video rekomendasi bilah samping, dan informasi saluran. Tampilan desktop browser.

Prompt Pemicu Layar Lebar: Ini adalah foto layar lebar yang sinematik, memotret eksterior toko IKEA saat senja, menampilkan papan IKEA bercahaya, parkiran dengan mobil yang realistis, serta pembeli yang masuk dan keluar. Pencahayaan golden hour, format 16:9.

Sumber gambar tidak bertanda dan referensi: https://miraflow.ai/blog/how-to-use-duct-tape-ai-model-arena-gpt-image-2-guide

Artikel ini dari akun WeChat "APPSO", penulis: Menemukan Produk Masa Depan

Трендовые криптовалюты

Связанные с этим вопросы

QApa yang membuat GPT Image 2 berbeda dari model pembuatan gambar AI sebelumnya seperti DALL-E 3 atau Nano Banana?

AGPT Image 2 unggul dalam rendering teks yang akurat (termasuk aksara non-Latin seperti bahasa Tionghoa), pemahaman pengetahuan dunia nyata, dan kemampuan menghasilkan gambar antarmuka pengguna yang realistis. Ini mengatasi kelemahan utama model sebelumnya seperti kesalahan penulisan teks dan ketidakkonsistenan visual.

QMengapa screenshot tidak lagi dapat diandalkan sebagai bukti dengan hadirnya GPT Image 2?

AKarena GPT Image 2 dapat menghasilkan gambar yang sangat realistis seperti screenshot aplikasi, dokumen identitas, atau antarmuka website dengan teks dan tata letak yang sempurna, sehingga memudahkan pembuatan konten palsu yang sulit dibedakan dari aslinya.

QApa saja keunggulan GPT Image 2 dibandingkan Midjourney berdasarkan pengujian LM Arena?

ABerdasarkan LM Arena, GPT Image 2 mengungguli Midjourney dalam empat aspek: rendering teks, kepatuhan pada instruksi, realisme foto, dan pemahaman pengetahuan dunia. Midjourney hanya unggul dalam kontrol gaya artistik dan estetika.

QBagaimana cara mengakses GPT Image 2 untuk dicoba sebelum rilis resminya?

APengguna dapat mencoba mengaksesnya melalui platform evaluasi LM Arena (https://arena.ai) karena model ini sedang dalam fase A/B testing. Beberapa pengguna ChatGPT juga mungkin mendapatkan akses acak.

QApa contoh prompt yang efektif untuk menghasilkan gambar UI realistis menggunakan GPT Image 2?

AContoh prompt: 'Foto screenshot aplikasi perbankan seluler yang terlihat realistis, menampilkan riwayat transaksi dengan tanggal, jumlah, dan nama merchant yang jelas. Layar iPhone 16, latar belakang kedai kopi, dipegang secara alami.'

Похожее

Южная Корея предпринимает шаги по регулированию трансграничных криптовалютных переводов в рамках новой системы

Южная Корея планирует включить финтех-компании в новую систему лицензирования трансграничных переводов виртуальных активов, которая должна быть введена в декабре. Согласно поправкам в Закон о валютных операциях, компаниям, осуществляющим такие переводы, необходимо будет зарегистрироваться в Министерстве экономики и финансов и отчитываться через национальную систему валютной отчётности. Это сделано для того, чтобы вывести криптовалютные переводы из-под неформального надзора и снизить риски отмывания денег. Изначально ожидалось, что доступ к системе получат в основном криптобиржи, такие как Upbit и Bithumb. Однако регуляторы, включая Банк Кореи, рассматривают возможность расширения круга участников, включив в него нетрадиционные криптоплатформы и финтех-фирмы, если они смогут эффективно осуществлять переводы. Министерство экономики и финансов и Банк Кореи совместно с отраслевыми участниками разрабатывают финальные правила реализации рамок регулирования до их запуска в декабре. Это происходит на фоне усиления надзора за цифровыми активами в стране, включая разработку правил для токенизированных ценных бумаг.

TheNewsCrypto1 ч. назад

Южная Корея предпринимает шаги по регулированию трансграничных криптовалютных переводов в рамках новой системы

TheNewsCrypto1 ч. назад

Мэтт Дэймон выступит на Ripple Swell, поскольку продвижение RLUSD от Water.org привлекает внимание

Мэтт Дэймон выступит на конференции Ripple Swell 2026 в Нью-Йорке в качестве основного докладчика. Он является соучредителем некоммерческой организации Water.org, которая недавно запустила кампанию Get Blue для расширения доступа к безопасной воде и санитарии. Ripple указана в материалах кампании как эксклюзивный партнер по цифровым активам и платежам. Партнерство предполагает использование Ripple Payments и стейблкоина Ripple USD (RLUSD) для более эффективного и дешевого перемещения средств микрофинансовым партнерам в развивающихся странах. Это сотрудничество представляет RLUSD в новом свете — не как инструмент для торговли или расчетов, а как часть платежной инфраструктуры для гуманитарных целей. Участие знаменитости помогает Ripple выйти на более широкую аудиторию и представить стейблкоин как практическое решение для филантропии, где важны скорость и низкая стоимость транзакций. Однако важно отметить, что ключевая работа по решению водного кризиса остается за местными партнерами Water.org.

bitcoinist1 ч. назад

Мэтт Дэймон выступит на Ripple Swell, поскольку продвижение RLUSD от Water.org привлекает внимание

bitcoinist1 ч. назад

Microsoft выявляет новое крипто-вредоносное ПО, нацеленное на адреса кошельков и приватные ключи

В феврале 2026 года Microsoft Threat Intelligence обнаружила новую вредоносную кампанию, нацеленную на пользователей криптовалют. Вредоносная программа, классифицируемая как Trojan/CryptoBandits.A, распространяется через зараженные USB-накопители с помощью файлов .lnk. Особенность этой атаки заключается в использовании технологии Windows Script Host и ActiveX для запуска упакованного Tor-прокси без необходимости в установщике или обычных управляющих серверах. После заражения система подключается к серверам в сети Tor через локальный SOCKS5-прокси. Основная функция вредоноса — слежка за буфером обмена. Он ищет и крадет сид-фразы (12 и 24 слова), приватные ключи Bitcoin и Ethereum, а также адреса кошельков. Обнаружив скопированный адрес, программа подменяет его на адрес, контролируемый злоумышленниками, что позволяет перехватывать переводы. Кроме того, программа делает скриншоты экрана и отправляет их через Tor, что дает атакующим информацию о балансах и активности пользователей. Угроза также обладает возможностью удаленного выполнения кода и обеспечивает свое постоянство в системе через планировщик заданий. В качестве мер защиты Microsoft рекомендует отключать автозапуск для USB, ограничивать использование сценариев и исполняемых ярлыков с внешних накопителей, а также отслеживать подозрительную активность, такую как выполнение JavaScript, работу прокси на localhost:9050 и мониторинг буфера обмена.

TheNewsCrypto1 ч. назад

Microsoft выявляет новое крипто-вредоносное ПО, нацеленное на адреса кошельков и приватные ключи

TheNewsCrypto1 ч. назад

Без отдела продаж и с оборотом в 20 миллионов долларов: как AI-сотрудник Viktor привлек 30 000 компаний?

Традиционное корпоративное ПО требует обширных продаж и долгого внедрения. ИИ-сотрудник Viktor, разработанный командой с опытом в DeepMind, бросает вызов этому подходу. Он позиционируется как «коллега третьего уровня» (Tier 3 AI Coworker), способный на сквозное выполнение задач, а не просто на помощь. Пользователи могут упоминать его в Slack или Microsoft Teams, давая задания на естественном языке, например, «подготовь отчёт по продажам». Viktor самостоятельно подключается к CRM, генерирует графики и отправляет результат. Без отдела продаж и длительных проектов внедрения, через модель роста, управляемую продуктом (PLG), Viktor достиг $20 млн годового дохода, обслужив 30 000 компаний на платформе Slack. Ключом стал минимальный порог входа: бесплатный кредит в $100 и оплата за фактически выполненные задачи, а не за лицензии на сотрудников. Теперь продукт доступен в Microsoft Teams, открывая доступ к 320 млн пользователей. Viktor устраняет барьер сложных промптов, выполняя работу от начала до конца, и может работать автономно, например, проводя сверку счетов ночью или создавая презентации из данных разных систем. Он запоминает коррекции и контекст, становясь «слоем процессов» компании. Однако переход в корпоративную среду Teams сталкивается с проблемами соответствия и безопасности. Полная автоматизация вызывает опасения из-за «чёрного ящика» решений и рисков ошибок с доступом к критическим системам. Баланс между эффективностью и контролем остаётся главным вызовом для внедрения ИИ-сотрудников в бизнес-процессы. Viktor демонстрирует привлекательность модели с нулевым порогом входа, но для масштабирования в крупных организациях необходимы доверие и надёжные рамки управления.

marsbit2 ч. назад

Без отдела продаж и с оборотом в 20 миллионов долларов: как AI-сотрудник Viktor привлек 30 000 компаний?

marsbit2 ч. назад

Интервью с сооснователем CoreWeave: Спрос на ИИ, кажется, «обостряется» с каждым днём

Интервью с руководителями CoreWeave показало, что спрос на ИИ-инфраструктуру продолжает стремительно расти. Согласно Brannin McBee и Nick Robbins, запросы на вычислительные мощности не только не снижаются, но и «обостряются каждый день новыми способами». Особенно заметен всплеск в сегментах агентного ИИ и инференса, что увеличивает важность не только GPU, но и CPU, а также систем хранения данных. CoreWeave, обладающая уникальным положением на рынке и обслуживающая ведущие компании вроде OpenAI, Anthropic, Meta и NVIDIA, видит структурные изменения в нагрузках. Основное узкое место смещается с доступности GPU на более комплексные инфраструктурные проблемы: наличие подготовленных дата-центров («powered shells»), логистика, квалифицированные кадры и общая способность к исполнению проектов. Компания строит свой бизнес, ориентируясь на четкие требования клиентов, и уже адаптировала архитектуру своих дата-центров под растущие потребности в CPU и памяти. Что касается конкуренции, CoreWeave выделяется репутацией, подтвержденной независимыми рейтингами, и способностью быстро разворачивать высокопроизводительные системы. В ближайшие годы ожидается массовое развертывание новых платформ, таких как Vera Rubin, при этом модель ценообразования CoreWeave защищает ее маржу от волатильности стоимости компонентов, таких как HBM.

marsbit2 ч. назад

Интервью с сооснователем CoreWeave: Спрос на ИИ, кажется, «обостряется» с каждым днём

marsbit2 ч. назад

Торговля

Спот
Фьючерсы

Популярные статьи

Как купить BANANA

Добро пожаловать на HTX.com! Мы сделали приобретение Banana Gun (BANANA) простым и удобным. Следуйте нашему пошаговому руководству и отправляйтесь в свое крипто-путешествие.Шаг 1: Создайте аккаунт на HTXИспользуйте свой адрес электронной почты или номер телефона, чтобы зарегистрироваться и бесплатно создать аккаунт на HTX. Пройдите удобную регистрацию и откройте для себя весь функционал.Создать аккаунтШаг 2: Перейдите в Купить криптовалюту и выберите свой способ оплатыКредитная/Дебетовая Карта: Используйте свою карту Visa или Mastercard для мгновенной покупки Banana Gun (BANANA).Баланс: Используйте средства с баланса вашего аккаунта HTX для простой торговли.Третьи Лица: Мы добавили популярные способы оплаты, такие как Google Pay и Apple Pay, для повышения удобства.P2P: Торгуйте напрямую с другими пользователями на HTX.Внебиржевая Торговля (OTC): Мы предлагаем индивидуальные услуги и конкурентоспособные обменные курсы для трейдеров.Шаг 3: Хранение Banana Gun (BANANA)После приобретения вами Banana Gun (BANANA) храните их в своем аккаунте на HTX. В качестве альтернативы вы можете отправить их куда-либо с помощью перевода в блокчейне или использовать для торговли с другими криптовалютами.Шаг 4: Торговля Banana Gun (BANANA)С легкостью торгуйте Banana Gun (BANANA) на спотовом рынке HTX. Просто зайдите в свой аккаунт, выберите торговую пару, совершайте сделки и следите за ними в режиме реального времени. Мы предлагаем удобный интерфейс как для начинающих, так и для опытных трейдеров.

448 просмотров всегоОпубликовано 2024.03.29Обновлено 2026.06.02

Как купить BANANA

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на BANANA (BANANA) представлены ниже.

活动图片