【Panduan】GPT-5.5 Terbongkar Melakukan "Pemikiran Palsu", Diganti Diam-Diam dengan Mini Setelah Dua Jam Digunakan, Biaya $200 Per Bulan Hanya untuk "Otak Schrödinger". Perintah Trace Jadi Bukti Nyata, Dokumen Resmi Sendiri yang Mengakui. Netizen Berbondong-bondong Mengeluh: OpenAI, Siapa yang Kau Tipu?
ChatGPT Kembali Dituduh "Bodoh"!
Baru-baru ini, X (sebelumnya Twitter) gempar duluan.
Netizen Lisan al Gaib menemukan, setelah menggunakan GPT-5.5 selama satu atau dua jam, tiba-tiba menjadi bodoh. Setiap permintaan dijawab dalam sekejap, kualitasnya anjlok drastis.
Tapi yang ditampilkan di antarmuka, tetap "GPT-5.5 Extended Thinking".
Artinya, label "berpikir" masih terpasang, tapi proses berpikirnya sendiri sudah hilang.
$200/Bulan, Hanya untuk "Model Schrödinger"
Di forum pengembang OpenAI, sebuah postingan keluhan meledak bersamaan.
Agentify.sh menyatakan, GPT-5.5 tiba-tiba kehilangan kemampuan mengikuti instruksi saat digunakan.
Melihatnya dengan bersemangat mengumumkan "sudah diperbaiki", ternyata kualitas kodenya buruk sampai memicu rollback besar-besaran.
Tugas UI yang sebelumnya mudah diselesaikan oleh 5.5-med, sekarang bahkan modifikasi paling sederhana pun tidak bisa.
Naik ke 5.5-high, percuma. Naik lagi ke xhigh, tetap tidak bisa.
Dan xhigh yang dulu bisa bertahan beberapa jam, sekarang jelas memendek.
Begitu postingan muncul, bagian balasan langsung meledak.
Ada yang langsung kembali ke 5.4.
Ada yang menggunakan tier tertinggi xhigh, tapi "jelas lebih payah dibanding minggu lalu, tugas panjang sering salah, sama sekali tidak mengikuti alur kerja".
Ada yang melaporkan situasi yang lebih aneh, "kueri sederhana juga muter-muter lama, kalau kau hentikan untuk mengoreksi arah, dia langsung mengabaikanmu, terus lanjut sesuai rencana salah sebelumnya".
Benar, semua orang menggambarkan fenomena yang sama — otak GPT, entah kapan sudah diam-diam diganti.
Performanya GPT-5.5 sekarang sama saja dengan 5.3, tidak berlebihan. Beberapa hari pertama masih luar biasa mengagumkan, sekarang sama sekali tidak menemukan bayangan model awal itu.
Bukan Khayalan, OpenAI Sendiri yang Menulisnya Hitam di Atas Putih
Untuk memverifikasi, Lisan al Gaib khusus membuat tes perbandingan.
Akun yang sama, di sisi ChatGPT menggunakan Extended Thinking hasilnya sampah semua, begitu pindah ke sisi Codex menggunakan xhigh, langsung normal kembali.
Dengan kata-katanya sendiri, Codex "pintarnya 4 miliar kali lipat dari benda ini".
Pengembang Andrew Curran punya trik jitu — tanya langsung ke model "Kapan tanggal cutoff data latihanmu?"
Model menjawab, Agustus 2025.
Masalahnya, tanggal cutoff GPT-5.5 Thinking adalah Desember. Agustus, adalah tanggal cutoff versi Instant!
Artinya, dia memilih Thinking, tapi sistem yang menjalankan sebenarnya adalah Instant.
Label model di antarmuka tidak berubah satu huruf pun, tapi model di balik layar sudah diam-diam diganti......
Lucunya, kali ini OpenAI justru dalam dokumen bantuannya sendiri yang memberikan bukti nyata untuk pengguna.
Menurut penjelasan resmi dari OpenAI Help Center, pengguna Plus maksimal mengirim 160 pesan GPT-5.5 setiap 3 jam.
Setelah habis, sistem akan diam-diam beralih ke model mini, sampai kuota direset.
Perhatikan kata "diam-diam".
Tidak ada pemberitahuan pop-up, tidak ada perubahan label model, tidak ada umpan balik visual apa pun.
Kau kira masih menggunakan model unggulan, di seberang sudah diam-diam diganti jadi mini.
Pengguna Pro juga jangan senang dulu.
Mode pemikiran Heavy, tier penalaran tertinggi eksklusif untuk Pro, saat beban server tinggi, juga akan dibatasi kapasitasnya. Juga tanpa peringatan.
Dengan kata lain, langganan Pro $200/bulan, membeli layanan yang sewaktu-waktu bisa "ditukar kacang dengan keledai".
Operasi "label tidak berubah, otak sudah berganti" seperti ini, di sisi Codex bahkan sudah lebih dulu ketahuan.
Februari tahun ini, sebuah issue muncul di GitHub, seorang pengguna Pro menggunakan perintah trace menemukan, yang dimintanya adalah GPT-5.3 Codex, model yang dikembalikan sebenarnya adalah GPT-5.2.
Bukan 5.2 Codex sekalipun, tapi versi dasar 5.2 yang lebih rendah.
Dia memposting perintah reproduksi:
- RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
- Output: gpt-5.2-2025-12-11
- Harapan: gpt-5.3-codex
Beberapa pengguna Pro mengonfirmasi degradasi yang sama di issue yang sama.
Dan degradasi ini "lengket", tidak pulih sendiri, juga tanpa penjelasan apa pun.
Bahkan, pada hari perilisan GPT-5.5 di bulan April, ada juga pengguna yang melaporkan kecepatan mode Fast sama dengan Standard, tapi penagihan tetap sesuai Fast.
Tugas sederhana berjalan 7 menit 49 detik, normalnya seharusnya 5-6 menit.
OpenAI Mengakui, Lalu Tidak Ada Kelanjutannya
15 Mei, halaman status OpenAI muncul sebuah catatan.
Penurunan Performa GPT5.5, kami sedang menyelidiki masalah penurunan performa GPT-5.5 yang dilaporkan sebagian pengguna.
17 Mei, status diperbarui menjadi "Terselesaikan".
Tapi dari garis waktu postingan forum, keluhan pembodohan tanggal 24-26 Mei lebih dahsyat dibanding gelombang tanggal 15 Mei.
Entah masalah yang "terselesaikan" muncul kembali, atau memang tidak pernah benar-benar diselesaikan.
Setiap Peningkatan adalah "Kontroversi Pembodohan"
Meski setiap perusahaan akan menghadapi keluhan "model jadi bodoh", tapi OpenAI dari GPT-5 sampai GPT-5.5 setiap pembaruan, tidak pernah absen.
Setiap kali OpenAI bilang sedang diselidiki, setiap kali bilang sudah diselesaikan, lalu versi berikutnya berlanjut.
Agustus 2025, GPT-5 Perdana. Judul hot post Reddit langsung "GPT-5 Payah Banget". Pengguna mengeluh balasan pendek, lebih banyak penolakan, lebih sedikit kepribadian.
OpenAI terpaksa memulihkan opsi GPT-4o secara darurat. Altman di Reddit AMA secara pribadi mengakui "lebih berguncang dari yang kami perkirakan".
Desember 2025, GPT-5.2. Kualitas terjemahan mundur, mengarang API yang tidak ada, menolak menjalankan instruksi gaya yang bisa diselesaikan 5.1 dengan mudah.
Februari 2026, GPT-5.3-Codex. Pengguna Pro didowngrade diam-diam ke 5.2, perintah trace jadi bukti nyata.
Maret 2026, GPT-5.4. Forum komunitas OpenAI muncul postingan "GPT-5.4 Jelas Mundur di Codex", balasan netizen semuanya mengonfirmasi.
Awal Mei 2026, GPT-5.5 Instant Dirilis. Panjang balasan memendek 30%, emoji hampir hilang. Netizen menyimpulkan: akurasi meningkat, tapi suhu menghilang.
Akhir Mei 2026, alias sekarang. Keluhan pembodohan mode Thinking kembali meledak.
Lisan al Gaib mengungkapkan, sejak GPT-5 dirilis dan dia memimpin pertempuran merebut kuota ChatGPT Plus, "setiap minggu akan menerima DM seperti ini".
Yang terbaru adalah seseorang meminta bantuannya untuk mengembalikan xhigh/heavy thinking.
Hari Terkuat Saat Benchmark, Adalah Hari Peluncuran
chatgptdisaster.com mengumpulkan 1087 keluhan pengguna yang telah diverifikasi, salah satu skenario yang berulang kali disebut adalah "lapisan routing gagal", UI menampilkan GPT-5.5 Pro, outputnya sepenuhnya barang kelas lain.
Pengguna menggambarkan pola yang dapat direproduksi, setelah sesi panjang model mulai "benar-benar mengabaikan apa yang kau katakan", tapi pemilih model masih menggantung label spesifikasi tertinggi.
Catatan kaki paling absurd adalah, mekanisme pengguna Plus otomatis beralih ke mini setelah 160 pesan/3 jam habis, dalam dokumen resmi OpenAI digambarkan sebagai sebuah "fitur".
Mengapa bisa begitu? Analisis Lisan al Gaib menganggap, jawabannya cuma dua kata: hemat biaya.
Pengetatan daya komputasi dan kemampuan menghasilkan laba memengaruhi setiap orang. Di mana-mana berhemat mati-matian, tidak melewatkan satu pun kesempatan menghemat uang.
Namun, di minggu yang sama ketika pengguna GPT-5.5 mengeluh bersama-sama, bayangan GPT-5.6 sudah muncul di log backend Codex.
Kode internal iris-alpha, konteks 1.5 juta Token, probabilitas rilis Juni yang diberikan Polymarket lebih dari 85%.
Di satu sisi pengguna 5.5 bahkan pengalaman dasar tidak bisa dipertahankan, di sisi lain 5.6 sudah diam-diam berlari lalu lintas nyata di backend.
Inilah kompetisi ASI tahun 2026.
Kecepatan membuat model baru semakin cepat, tapi membuat model lama berjalan baik menyelesaikan satu sesi semakin sulit.
Hari terkuat saat benchmark adalah hari peluncuran, setiap hari setelahnya adalah GPT Schrödinger.
Referensi: https://x.com/scaling01/status/2058643470357590058?s=20
Artikel ini berasal dari akun WeChat publik "新智元", penulis: ASI启示录; editor: 摩西





















