Pembodohan GPT-5.5 Terbongkar, Dokumen Resmi OpenAI Akui

marsbitDipublikasikan tanggal 2026-05-27Terakhir diperbarui pada 2026-05-27

Abstrak

**Intisari: GPT-5.5 Ketahuan 'Bodoh Tiba-tiba', Dokumen OpenAI Akui Penggantian Model Diam-diam** Pengguna melaporkan ChatGPT dengan mode "GPT-5.5 Extended Thinking" tiba-tiba menjadi lebih lamban dan kurang akurat setelah digunakan beberapa jam, meski label model di antarmuka tetap sama. Kecurigaan bahwa model yang lebih canggih diam-diam diganti dengan versi yang lebih sederhana (seperti 'mini') dikonfirmasi oleh dokumen bantuan resmi OpenAI. Dokumen tersebut menyatakan bahwa untuk pengguna ChatGPT Plus, setelah 160 permintaan dalam 3 jam, sistem akan *secara diam-diam* beralih ke model mini hingga kuota reset. Tidak ada pemberitahuan atau perubahan label. Pengguna Pro juga melaporkan mode 'Heavy Thinking' mereka mengalami degradasi atau pembatasan kapasitas saat beban server tinggi, juga tanpa peringatan. Bukti lain muncul dari pengujian pengembang: ketika ditanya tanggal cutoff data pelatihan, model yang seharusnya GPT-5.5 Thinking menjawab dengan tanggal yang cocok untuk versi Instant, mengindikasikan pergantian. Insiden serupa dengan trace command juga pernah terjadi pada GPT-5.3 Codex awal tahun ini, di mana model yang diminta tidak sesuai dengan yang dilayani. Keluhan tentang penurunan kualitas (atau "lobotomisasi") telah menyertai setiap rilis besar OpenAI sejak GPT-5. Meski status laporan sering ditandai "terselesaikan", keluhan baru terus bermunculan. Analis menduga praktik ini didorong oleh tekanan biaya komputasi. Ironisnya, sementara pengguna GPT-5.5 berjuan...

【Panduan】GPT-5.5 Terbongkar Melakukan "Pemikiran Palsu", Diganti Diam-Diam dengan Mini Setelah Dua Jam Digunakan, Biaya $200 Per Bulan Hanya untuk "Otak Schrödinger". Perintah Trace Jadi Bukti Nyata, Dokumen Resmi Sendiri yang Mengakui. Netizen Berbondong-bondong Mengeluh: OpenAI, Siapa yang Kau Tipu?

ChatGPT Kembali Dituduh "Bodoh"!

Baru-baru ini, X (sebelumnya Twitter) gempar duluan.

Netizen Lisan al Gaib menemukan, setelah menggunakan GPT-5.5 selama satu atau dua jam, tiba-tiba menjadi bodoh. Setiap permintaan dijawab dalam sekejap, kualitasnya anjlok drastis.

Tapi yang ditampilkan di antarmuka, tetap "GPT-5.5 Extended Thinking".

Artinya, label "berpikir" masih terpasang, tapi proses berpikirnya sendiri sudah hilang.

$200/Bulan, Hanya untuk "Model Schrödinger"

Di forum pengembang OpenAI, sebuah postingan keluhan meledak bersamaan.

Agentify.sh menyatakan, GPT-5.5 tiba-tiba kehilangan kemampuan mengikuti instruksi saat digunakan.

Melihatnya dengan bersemangat mengumumkan "sudah diperbaiki", ternyata kualitas kodenya buruk sampai memicu rollback besar-besaran.

Tugas UI yang sebelumnya mudah diselesaikan oleh 5.5-med, sekarang bahkan modifikasi paling sederhana pun tidak bisa.

Naik ke 5.5-high, percuma. Naik lagi ke xhigh, tetap tidak bisa.

Dan xhigh yang dulu bisa bertahan beberapa jam, sekarang jelas memendek.

Begitu postingan muncul, bagian balasan langsung meledak.

Ada yang langsung kembali ke 5.4.

Ada yang menggunakan tier tertinggi xhigh, tapi "jelas lebih payah dibanding minggu lalu, tugas panjang sering salah, sama sekali tidak mengikuti alur kerja".

Ada yang melaporkan situasi yang lebih aneh, "kueri sederhana juga muter-muter lama, kalau kau hentikan untuk mengoreksi arah, dia langsung mengabaikanmu, terus lanjut sesuai rencana salah sebelumnya".

Benar, semua orang menggambarkan fenomena yang sama — otak GPT, entah kapan sudah diam-diam diganti.

Performanya GPT-5.5 sekarang sama saja dengan 5.3, tidak berlebihan. Beberapa hari pertama masih luar biasa mengagumkan, sekarang sama sekali tidak menemukan bayangan model awal itu.

Bukan Khayalan, OpenAI Sendiri yang Menulisnya Hitam di Atas Putih

Untuk memverifikasi, Lisan al Gaib khusus membuat tes perbandingan.

Akun yang sama, di sisi ChatGPT menggunakan Extended Thinking hasilnya sampah semua, begitu pindah ke sisi Codex menggunakan xhigh, langsung normal kembali.

Dengan kata-katanya sendiri, Codex "pintarnya 4 miliar kali lipat dari benda ini".

Pengembang Andrew Curran punya trik jitu — tanya langsung ke model "Kapan tanggal cutoff data latihanmu?"

Model menjawab, Agustus 2025.

Masalahnya, tanggal cutoff GPT-5.5 Thinking adalah Desember. Agustus, adalah tanggal cutoff versi Instant!

Artinya, dia memilih Thinking, tapi sistem yang menjalankan sebenarnya adalah Instant.

Label model di antarmuka tidak berubah satu huruf pun, tapi model di balik layar sudah diam-diam diganti......

Lucunya, kali ini OpenAI justru dalam dokumen bantuannya sendiri yang memberikan bukti nyata untuk pengguna.

Menurut penjelasan resmi dari OpenAI Help Center, pengguna Plus maksimal mengirim 160 pesan GPT-5.5 setiap 3 jam.

Setelah habis, sistem akan diam-diam beralih ke model mini, sampai kuota direset.

Perhatikan kata "diam-diam".

Tidak ada pemberitahuan pop-up, tidak ada perubahan label model, tidak ada umpan balik visual apa pun.

Kau kira masih menggunakan model unggulan, di seberang sudah diam-diam diganti jadi mini.

Pengguna Pro juga jangan senang dulu.

Mode pemikiran Heavy, tier penalaran tertinggi eksklusif untuk Pro, saat beban server tinggi, juga akan dibatasi kapasitasnya. Juga tanpa peringatan.

Dengan kata lain, langganan Pro $200/bulan, membeli layanan yang sewaktu-waktu bisa "ditukar kacang dengan keledai".

Operasi "label tidak berubah, otak sudah berganti" seperti ini, di sisi Codex bahkan sudah lebih dulu ketahuan.

Februari tahun ini, sebuah issue muncul di GitHub, seorang pengguna Pro menggunakan perintah trace menemukan, yang dimintanya adalah GPT-5.3 Codex, model yang dikembalikan sebenarnya adalah GPT-5.2.

Bukan 5.2 Codex sekalipun, tapi versi dasar 5.2 yang lebih rendah.

Dia memposting perintah reproduksi:

  • RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
  • Output: gpt-5.2-2025-12-11
  • Harapan: gpt-5.3-codex

Beberapa pengguna Pro mengonfirmasi degradasi yang sama di issue yang sama.

Dan degradasi ini "lengket", tidak pulih sendiri, juga tanpa penjelasan apa pun.

Bahkan, pada hari perilisan GPT-5.5 di bulan April, ada juga pengguna yang melaporkan kecepatan mode Fast sama dengan Standard, tapi penagihan tetap sesuai Fast.

Tugas sederhana berjalan 7 menit 49 detik, normalnya seharusnya 5-6 menit.

OpenAI Mengakui, Lalu Tidak Ada Kelanjutannya

15 Mei, halaman status OpenAI muncul sebuah catatan.

Penurunan Performa GPT5.5, kami sedang menyelidiki masalah penurunan performa GPT-5.5 yang dilaporkan sebagian pengguna.

17 Mei, status diperbarui menjadi "Terselesaikan".

Tapi dari garis waktu postingan forum, keluhan pembodohan tanggal 24-26 Mei lebih dahsyat dibanding gelombang tanggal 15 Mei.

Entah masalah yang "terselesaikan" muncul kembali, atau memang tidak pernah benar-benar diselesaikan.

Setiap Peningkatan adalah "Kontroversi Pembodohan"

Meski setiap perusahaan akan menghadapi keluhan "model jadi bodoh", tapi OpenAI dari GPT-5 sampai GPT-5.5 setiap pembaruan, tidak pernah absen.

Setiap kali OpenAI bilang sedang diselidiki, setiap kali bilang sudah diselesaikan, lalu versi berikutnya berlanjut.

Agustus 2025, GPT-5 Perdana. Judul hot post Reddit langsung "GPT-5 Payah Banget". Pengguna mengeluh balasan pendek, lebih banyak penolakan, lebih sedikit kepribadian.

OpenAI terpaksa memulihkan opsi GPT-4o secara darurat. Altman di Reddit AMA secara pribadi mengakui "lebih berguncang dari yang kami perkirakan".

Desember 2025, GPT-5.2. Kualitas terjemahan mundur, mengarang API yang tidak ada, menolak menjalankan instruksi gaya yang bisa diselesaikan 5.1 dengan mudah.

Februari 2026, GPT-5.3-Codex. Pengguna Pro didowngrade diam-diam ke 5.2, perintah trace jadi bukti nyata.

Maret 2026, GPT-5.4. Forum komunitas OpenAI muncul postingan "GPT-5.4 Jelas Mundur di Codex", balasan netizen semuanya mengonfirmasi.

Awal Mei 2026, GPT-5.5 Instant Dirilis. Panjang balasan memendek 30%, emoji hampir hilang. Netizen menyimpulkan: akurasi meningkat, tapi suhu menghilang.

Akhir Mei 2026, alias sekarang. Keluhan pembodohan mode Thinking kembali meledak.

Lisan al Gaib mengungkapkan, sejak GPT-5 dirilis dan dia memimpin pertempuran merebut kuota ChatGPT Plus, "setiap minggu akan menerima DM seperti ini".

Yang terbaru adalah seseorang meminta bantuannya untuk mengembalikan xhigh/heavy thinking.

Hari Terkuat Saat Benchmark, Adalah Hari Peluncuran

chatgptdisaster.com mengumpulkan 1087 keluhan pengguna yang telah diverifikasi, salah satu skenario yang berulang kali disebut adalah "lapisan routing gagal", UI menampilkan GPT-5.5 Pro, outputnya sepenuhnya barang kelas lain.

Pengguna menggambarkan pola yang dapat direproduksi, setelah sesi panjang model mulai "benar-benar mengabaikan apa yang kau katakan", tapi pemilih model masih menggantung label spesifikasi tertinggi.

Catatan kaki paling absurd adalah, mekanisme pengguna Plus otomatis beralih ke mini setelah 160 pesan/3 jam habis, dalam dokumen resmi OpenAI digambarkan sebagai sebuah "fitur".

Mengapa bisa begitu? Analisis Lisan al Gaib menganggap, jawabannya cuma dua kata: hemat biaya.

Pengetatan daya komputasi dan kemampuan menghasilkan laba memengaruhi setiap orang. Di mana-mana berhemat mati-matian, tidak melewatkan satu pun kesempatan menghemat uang.

Namun, di minggu yang sama ketika pengguna GPT-5.5 mengeluh bersama-sama, bayangan GPT-5.6 sudah muncul di log backend Codex.

Kode internal iris-alpha, konteks 1.5 juta Token, probabilitas rilis Juni yang diberikan Polymarket lebih dari 85%.

Di satu sisi pengguna 5.5 bahkan pengalaman dasar tidak bisa dipertahankan, di sisi lain 5.6 sudah diam-diam berlari lalu lintas nyata di backend.

Inilah kompetisi ASI tahun 2026.

Kecepatan membuat model baru semakin cepat, tapi membuat model lama berjalan baik menyelesaikan satu sesi semakin sulit.

Hari terkuat saat benchmark adalah hari peluncuran, setiap hari setelahnya adalah GPT Schrödinger.

Referensi: https://x.com/scaling01/status/2058643470357590058?s=20

Artikel ini berasal dari akun WeChat publik "新智元", penulis: ASI启示录; editor: 摩西

Bacaan Terkait

Pesta Triliunan Penjual Memori, Laba Pembeli Memori Tergilas

**Ringkasan: Pesta Triliunan Penjual Memori, Laba Pembeli Terpangkas** Pada 26 Mei, dua peristiwa kontras terjadi: laba bersih disesuaikan Xiaomi anjlok 43,1%, sementara saham Micron melonjak 19% dan valuasinya menembus US$1 triliun. Micron mendapat revaluasi besar dari analis seperti UBS dan JP Morgan, yang berargumen bahwa perjanjian jangka panjang (LTA) dengan raksasa cloud untuk suplai chip AI (seperti HBM dan DDR5) dapat menghilangkan siklus volatilitas industri memori. Mereka memperkirakan valuasi bergeser dari saham siklus menjadi seperti utilitas. Namun, peningkatan tajam harga memori ini menyakiti pembeli seperti Xiaomi. Biaya memori untuk satu ponsel naik sekitar 1.500 yuan, memaksa Xiaomi mengurangi model entry-level. Pasar memori kini terpecah: lapisan AI (HBM, server) sangat ketat dengan kontrak jangka panjang; lapisan ponsel/ponsel pintar menghadapi kenaikan harga paksa karena kapasitas dialihkan ke AI; sementara lapisan ritel PC (DDR5, SSD) justru turun karena penjualan persediaan. Meski narasi "siklus super" kuat, artikel mempertanyakan ketahanan LTA jika permintaan AI melambat. Ekspansi kapasitas besar-besaran oleh Micron dan lainnya berisiko menciptakan kelebihan suplai di masa depan. Keuntungan Micron saat ini didorong terutama oleh kenaikan harga, bukan volume, menjadikannya rentan jika siklus berbalik. Artikel mengingatkan bahwa menggunakan laba puncak siklus untuk valuasi bisa menjadi jebakan klasik.

marsbit19m yang lalu

Pesta Triliunan Penjual Memori, Laba Pembeli Memori Tergilas

marsbit19m yang lalu

Para Dewa Saham Generasi Ini yang Berkecimpung di Pasar AS Sudah Tidak Lagi Melihat Laporan Keuangan

Para dewa saham baru di AS tahun 2026 tidak lagi melihat laporan keuangan. Mereka fokus pada "penargetan rantai pasokan" dan saham mikrokapitalisasi yang diabaikan oleh analis Wall Street. Figur seperti Leopold Aschenbrenner, yang mengubah $200 juta menjadi $14 miliar, dan Serenity dari forum Reddit WallStreetBets (WSB), menjadi simbol tren ini. Serenity, misalnya, berhasil memprediksi kenaikan saham AXTI dari $15 menjadi mendekati $150 dengan menganalisis posisi monopoli perusahaannya di bahan substrat fosfor indium untuk industri AI. Budaya ini berkembang dari WSB ke platform seperti X (Twitter) dan Substack. Akun-akun seperti KawzInvests, PhotonCap, dan u/imacompnerd (yang sukses dengan saham DOCN DigitalOcean) mewakili generasi baru investor. Mereka tidak menganalisis laporan keuangan klasik, tetapi mendalami siklus sertifikasi pelanggan, detail rute teknologi, dan titik kritis dalam rantai pasokan industri yang sedang berkembang pesat, terutama AI. Mereka mencari perusahaan kecil yang kurang diliput, namun memegang peran kunci di hulu industri besar. Saham mikrokap ini menarik bagi trader retail karena likuiditasnya yang rendah membuat sulit bagi lembaga keuangan besar untuk masuk, menciptakan peluang "alfa". Namun, pendekatan ini juga mirip dengan ekonomi perhatian (attention economy), di mana narasi kuat dapat mendorong harga sebelum fundamental terbukti, dan berisiko mengalami kerumunan saat keluar. Intinya, tren ini mencerminkan pergeseran dari investasi nilai ala Buffett menuju analisis tematik dan industri yang mendalam, didorong oleh komunitas online dan disiplin baru dalam menemukan aset yang kurang diperhatikan di tengah demam AI.

marsbit22m yang lalu

Para Dewa Saham Generasi Ini yang Berkecimpung di Pasar AS Sudah Tidak Lagi Melihat Laporan Keuangan

marsbit22m yang lalu

Pesta Triliunan Penjual Memori, Laba Pembeli Memori Terpotong Separuh

**Ringkasan: Pesta Triliunan Penjual Memori, Laba Pembeli Memori Anjlok** Pada 26 Mei, dua peristiwa kontras terjadi. Xiaomi merilis laporan keuangan Q1 2026 dengan laba turun drastis. Presidennya, Lu Weibing, menyalahkan kenaikan harga memori hampir 4x yang menambah biaya sekitar 1500 RMB per ponsel. Di sisi lain, Micron Technology melonjak 19%, valuasinya tembus $1 triliun, didorong laporan analis bullish dari berbagai bank seperti UBS dan Citi. Narasi utama di balik kenaikan Micron adalah **AI** dan munculnya **Perjanjian Jangka Panjang (LTA)**. Vendor cloud besar seperti Microsoft dan Google dikabarkan menandatangani kontrak 3-5 tahun untuk mengunci pasokan HBM dan DDR5, lengkap dengan uang muka. Ini diklaim dapat mengurangi siklus boom-and-bust tradisional industri memori, dan mengubah valuasi perusahaan dari saham siklus menjadi mirip utilitas infrastruktur. Namun, pasar memori saat ini sangat terfragmentasi: 1. **Memori AI (HBM, DDR5 server)**: Kelangkaan ekstrem, harga meroket, LTA berlaku. 2. **Memori ponsel**: Juga naik tajam, memeras margin produsen seperti Xiaomi yang terpaksa menyerap biaya. 3. **Memori PC ritel**: Justru mengalami koreksi harga karena penjualan inventaris. Kesenjangan ini mencerminkan prioritas produsen memori: mengalihkan kapasitas ke segmen AI yang lebih menguntungkan. Pertumbuhan pendapatan Micron saat ini lebih didorong kenaikan harga (ASP) daripada volume penjualan. Pertanyaan kritis: **Apakah LTA benar-benar dapat menghilangkan siklus?** Optimisme bergantung pada permintaan AI yang terus meledak. Jika pertumbuhan belanja modal AI melambat, dan kapasitas baru dari ekspansi agresif Micron & pesaing mulai beroperasi, keseimbangan pasokan-permintaan bisa berbalik dengan cepat. Sejarah pasar komoditas menunjukkan kontrak jangka panjang paling rentan justru saat paling dibutuhkan. Saat seluruh Wall Street berseru "kali ini berbeda," ada baiknya mengingat pelajaran dari gelembung masa lalu, seperti Cisco di era dot-com. Pesta mungkin masih berlanjut, tetapi kewaspadaan tetap diperlukan.

链捕手28m yang lalu

Pesta Triliunan Penjual Memori, Laba Pembeli Memori Terpotong Separuh

链捕手28m yang lalu

Perusahaan DAT yang Dimasukkan ke Indeks Russell, Tidak Bisa Menyelamatkan Ethereum

Penulis: Eric, Foresight News FTSE Russell telah merilis daftar awal untuk Indeks Russell 3000 2026, mencakup beberapa saham terkait kripto seperti CoreWeave (CRWV), Iren Limited (IREN), Galaxy Digital Holdings (GLXY), serta perusahaan DAT (Digital Asset Treasury) Ethereum BitMine (BMNR), Sharplink (SBET), dan perusahaan DAT SOL Forward Industries (FWDI). Jika tidak ada perubahan hingga 29 Juni, dana pasif miliaran dolar yang melacak indeks Russell akan mengalokasikan aset ke saham-saham ini, terlepas dari sikap pribadi manajer investasi terhadap kripto. Ini berita baik bagi investor saham kripto, tetapi belum tentu untuk aset kripto itu sendiri. Penambahan ke indeks Russell biasanya mendorong kenaikan harga saham jangka pendek karena pembelian wajib oleh dana pasif. Bagi perusahaan DAT, kenaikan harga saham dapat memudahkan penerbitan saham baru untuk membeli lebih banyak aset kripto. Namun, aliran dana ini mungkin tidak langsung mendukung harga ETH. David Hoffman, pendiri Bankless, baru-baru ini menjual seluruh kepemilikannya di ETH, bukan karena pesimis terhadap jaringan Ethereum, tetapi karena mempertanyakan narasi "ETH sebagai mata uang". Ia berpendapat bahwa Ethereum adalah infrastruktur publik yang memberikan ruang blokir aman dengan biaya rendah, sehingga kesuksesan jaringan tidak sepenuhnya tercermin pada harga ETH. Nilai banyak ditangkap oleh lapisan aplikasi dan L2, sementara ETH hanya mendapat porsi kecil. Meski BitMine telah membeli 3,6–3,7 juta ETH dalam 9 bulan terakhir, harga ETH turun hampir 60% dari rekor tertingginya. Integrasi keuangan tradisional dan aset digital melalui indeks Russell adalah tonggak penting, tetapi bagi DAT, masuknya dana tidak serta-merta menguntungkan aset kripto dasar. Narasi nilai token perlu diperbarui di luar logika pendapatan jaringan dan buyback.

marsbit1j yang lalu

Perusahaan DAT yang Dimasukkan ke Indeks Russell, Tidak Bisa Menyelamatkan Ethereum

marsbit1j yang lalu

OS yang Diagenkan: Bukan AI yang Diperebutkan, Melainkan Fondasi

**Ringkasan: OS yang Diagenkan - Bukan Hanya AI, Tapi Fondasi yang Diadu** Setelah Google I/O 2026, tren utama sistem operasi (OS) perangkat ujung seperti Android, iOS, HarmonyOS, dan Windows adalah transformasi menjadi "sistem cerdas" dengan kemampuan Agen AI yang tertanam di lapisan OS. Namun, pertunjukan fitur di panggung hanya puncak gunung es. Kunci kompetisi sebenarnya terletak pada tiga lapisan fondasi yang mendukung OS Agen berjalan andal: 1. **Runtime AI Tingkat Sistem**: Bertindak sebagai pusat penjadwalan kecerdasan di ujung, seperti AICore di Android atau Foundation Models di Apple. Ia mengelola sumber daya, mengekspos kemampuan AI ke aplikasi, dan memungkinkan Agen beroperasi sebagai layanan sistem, bukan sekadar fitur aplikasi. 2. **Chip yang Dikendalikan (Controllable Chip)**: Seperti Tensor Google, Apple Silicon, atau Kirin Huawei. Kendali atas desain perangkat keras memungkinkan optimasi mendalam dengan perangkat lunak dan model, menentukan batas atas efisiensi, kinerja, dan konsumsi daya Agen di ujung. 3. **Matriks Model Ujung-Awan**: Sumber "kecerdasan" perangkat. Model di ujung (seperti Gemini Nano, model dasar Apple ~3B) menangani tugas sehari-hari dengan latensi rendah, privasi, dan stabilitas, didukung oleh model awan untuk tugas kompleks. Model ujung yang dikembangkan sendiri sangat penting untuk optimasi khusus perangkat keras. Ketiga lapisan ini saling bertaut. Sinergi yang dalam menciptakan diferensiasi produk nyata: **latensi dan daya responsif, privasi yang dapat dipercaya** (prioritas pemrosesan ujung), **konteks tingkat sistem**, dan **keandalan sebagai layanan sistem**. Apple Intelligence dan ekosistem Huawei menunjukkan paradigma ini. Selain fondasi, variabel kunci lain membentuk tembok pertahanan jangka panjang, seperti kemampuan interaksi Agen dengan Aplikasi (melalui API seperti AppFunctions atau App Intents) dan **perlindungan privasi** yang menjadi nilai inti dan prasyarat kepercayaan pengguna. Pergeseran ini tidak hanya mengubah OS, tetapi juga berpotensi mendistribusikan kembali aliran trafik di ujung perangkat. Kemampuan intinya meluas melampaui ponsel dan PC, merambah ke IoT, kendaraan, dan perangkat yang dapat dikenakan melalui ekosistem multi-perangkat masing-masing vendor. Pertarungan ini dimenangkan bukan dalam presentasi singkat, tetapi melalui pengembangan bertahun-tahun di tingkat chip, model, dan runtime.

marsbit1j yang lalu

OS yang Diagenkan: Bukan AI yang Diperebutkan, Melainkan Fondasi

marsbit1j yang lalu

Trading

Spot
Futures
活动图片