Pembodohan GPT-5.5 Terbongkar, Dokumen Resmi OpenAI Akui

marsbitDipublikasikan tanggal 2026-05-27Terakhir diperbarui pada 2026-05-27

Abstrak

**Intisari: GPT-5.5 Ketahuan 'Bodoh Tiba-tiba', Dokumen OpenAI Akui Penggantian Model Diam-diam** Pengguna melaporkan ChatGPT dengan mode "GPT-5.5 Extended Thinking" tiba-tiba menjadi lebih lamban dan kurang akurat setelah digunakan beberapa jam, meski label model di antarmuka tetap sama. Kecurigaan bahwa model yang lebih canggih diam-diam diganti dengan versi yang lebih sederhana (seperti 'mini') dikonfirmasi oleh dokumen bantuan resmi OpenAI. Dokumen tersebut menyatakan bahwa untuk pengguna ChatGPT Plus, setelah 160 permintaan dalam 3 jam, sistem akan *secara diam-diam* beralih ke model mini hingga kuota reset. Tidak ada pemberitahuan atau perubahan label. Pengguna Pro juga melaporkan mode 'Heavy Thinking' mereka mengalami degradasi atau pembatasan kapasitas saat beban server tinggi, juga tanpa peringatan. Bukti lain muncul dari pengujian pengembang: ketika ditanya tanggal cutoff data pelatihan, model yang seharusnya GPT-5.5 Thinking menjawab dengan tanggal yang cocok untuk versi Instant, mengindikasikan pergantian. Insiden serupa dengan trace command juga pernah terjadi pada GPT-5.3 Codex awal tahun ini, di mana model yang diminta tidak sesuai dengan yang dilayani. Keluhan tentang penurunan kualitas (atau "lobotomisasi") telah menyertai setiap rilis besar OpenAI sejak GPT-5. Meski status laporan sering ditandai "terselesaikan", keluhan baru terus bermunculan. Analis menduga praktik ini didorong oleh tekanan biaya komputasi. Ironisnya, sementara pengguna GPT-5.5 berjuan...

【Panduan】GPT-5.5 Terbongkar Melakukan "Pemikiran Palsu", Diganti Diam-Diam dengan Mini Setelah Dua Jam Digunakan, Biaya $200 Per Bulan Hanya untuk "Otak Schrödinger". Perintah Trace Jadi Bukti Nyata, Dokumen Resmi Sendiri yang Mengakui. Netizen Berbondong-bondong Mengeluh: OpenAI, Siapa yang Kau Tipu?

ChatGPT Kembali Dituduh "Bodoh"!

Baru-baru ini, X (sebelumnya Twitter) gempar duluan.

Netizen Lisan al Gaib menemukan, setelah menggunakan GPT-5.5 selama satu atau dua jam, tiba-tiba menjadi bodoh. Setiap permintaan dijawab dalam sekejap, kualitasnya anjlok drastis.

Tapi yang ditampilkan di antarmuka, tetap "GPT-5.5 Extended Thinking".

Artinya, label "berpikir" masih terpasang, tapi proses berpikirnya sendiri sudah hilang.

$200/Bulan, Hanya untuk "Model Schrödinger"

Di forum pengembang OpenAI, sebuah postingan keluhan meledak bersamaan.

Agentify.sh menyatakan, GPT-5.5 tiba-tiba kehilangan kemampuan mengikuti instruksi saat digunakan.

Melihatnya dengan bersemangat mengumumkan "sudah diperbaiki", ternyata kualitas kodenya buruk sampai memicu rollback besar-besaran.

Tugas UI yang sebelumnya mudah diselesaikan oleh 5.5-med, sekarang bahkan modifikasi paling sederhana pun tidak bisa.

Naik ke 5.5-high, percuma. Naik lagi ke xhigh, tetap tidak bisa.

Dan xhigh yang dulu bisa bertahan beberapa jam, sekarang jelas memendek.

Begitu postingan muncul, bagian balasan langsung meledak.

Ada yang langsung kembali ke 5.4.

Ada yang menggunakan tier tertinggi xhigh, tapi "jelas lebih payah dibanding minggu lalu, tugas panjang sering salah, sama sekali tidak mengikuti alur kerja".

Ada yang melaporkan situasi yang lebih aneh, "kueri sederhana juga muter-muter lama, kalau kau hentikan untuk mengoreksi arah, dia langsung mengabaikanmu, terus lanjut sesuai rencana salah sebelumnya".

Benar, semua orang menggambarkan fenomena yang sama — otak GPT, entah kapan sudah diam-diam diganti.

Performanya GPT-5.5 sekarang sama saja dengan 5.3, tidak berlebihan. Beberapa hari pertama masih luar biasa mengagumkan, sekarang sama sekali tidak menemukan bayangan model awal itu.

Bukan Khayalan, OpenAI Sendiri yang Menulisnya Hitam di Atas Putih

Untuk memverifikasi, Lisan al Gaib khusus membuat tes perbandingan.

Akun yang sama, di sisi ChatGPT menggunakan Extended Thinking hasilnya sampah semua, begitu pindah ke sisi Codex menggunakan xhigh, langsung normal kembali.

Dengan kata-katanya sendiri, Codex "pintarnya 4 miliar kali lipat dari benda ini".

Pengembang Andrew Curran punya trik jitu — tanya langsung ke model "Kapan tanggal cutoff data latihanmu?"

Model menjawab, Agustus 2025.

Masalahnya, tanggal cutoff GPT-5.5 Thinking adalah Desember. Agustus, adalah tanggal cutoff versi Instant!

Artinya, dia memilih Thinking, tapi sistem yang menjalankan sebenarnya adalah Instant.

Label model di antarmuka tidak berubah satu huruf pun, tapi model di balik layar sudah diam-diam diganti......

Lucunya, kali ini OpenAI justru dalam dokumen bantuannya sendiri yang memberikan bukti nyata untuk pengguna.

Menurut penjelasan resmi dari OpenAI Help Center, pengguna Plus maksimal mengirim 160 pesan GPT-5.5 setiap 3 jam.

Setelah habis, sistem akan diam-diam beralih ke model mini, sampai kuota direset.

Perhatikan kata "diam-diam".

Tidak ada pemberitahuan pop-up, tidak ada perubahan label model, tidak ada umpan balik visual apa pun.

Kau kira masih menggunakan model unggulan, di seberang sudah diam-diam diganti jadi mini.

Pengguna Pro juga jangan senang dulu.

Mode pemikiran Heavy, tier penalaran tertinggi eksklusif untuk Pro, saat beban server tinggi, juga akan dibatasi kapasitasnya. Juga tanpa peringatan.

Dengan kata lain, langganan Pro $200/bulan, membeli layanan yang sewaktu-waktu bisa "ditukar kacang dengan keledai".

Operasi "label tidak berubah, otak sudah berganti" seperti ini, di sisi Codex bahkan sudah lebih dulu ketahuan.

Februari tahun ini, sebuah issue muncul di GitHub, seorang pengguna Pro menggunakan perintah trace menemukan, yang dimintanya adalah GPT-5.3 Codex, model yang dikembalikan sebenarnya adalah GPT-5.2.

Bukan 5.2 Codex sekalipun, tapi versi dasar 5.2 yang lebih rendah.

Dia memposting perintah reproduksi:

  • RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
  • Output: gpt-5.2-2025-12-11
  • Harapan: gpt-5.3-codex

Beberapa pengguna Pro mengonfirmasi degradasi yang sama di issue yang sama.

Dan degradasi ini "lengket", tidak pulih sendiri, juga tanpa penjelasan apa pun.

Bahkan, pada hari perilisan GPT-5.5 di bulan April, ada juga pengguna yang melaporkan kecepatan mode Fast sama dengan Standard, tapi penagihan tetap sesuai Fast.

Tugas sederhana berjalan 7 menit 49 detik, normalnya seharusnya 5-6 menit.

OpenAI Mengakui, Lalu Tidak Ada Kelanjutannya

15 Mei, halaman status OpenAI muncul sebuah catatan.

Penurunan Performa GPT5.5, kami sedang menyelidiki masalah penurunan performa GPT-5.5 yang dilaporkan sebagian pengguna.

17 Mei, status diperbarui menjadi "Terselesaikan".

Tapi dari garis waktu postingan forum, keluhan pembodohan tanggal 24-26 Mei lebih dahsyat dibanding gelombang tanggal 15 Mei.

Entah masalah yang "terselesaikan" muncul kembali, atau memang tidak pernah benar-benar diselesaikan.

Setiap Peningkatan adalah "Kontroversi Pembodohan"

Meski setiap perusahaan akan menghadapi keluhan "model jadi bodoh", tapi OpenAI dari GPT-5 sampai GPT-5.5 setiap pembaruan, tidak pernah absen.

Setiap kali OpenAI bilang sedang diselidiki, setiap kali bilang sudah diselesaikan, lalu versi berikutnya berlanjut.

Agustus 2025, GPT-5 Perdana. Judul hot post Reddit langsung "GPT-5 Payah Banget". Pengguna mengeluh balasan pendek, lebih banyak penolakan, lebih sedikit kepribadian.

OpenAI terpaksa memulihkan opsi GPT-4o secara darurat. Altman di Reddit AMA secara pribadi mengakui "lebih berguncang dari yang kami perkirakan".

Desember 2025, GPT-5.2. Kualitas terjemahan mundur, mengarang API yang tidak ada, menolak menjalankan instruksi gaya yang bisa diselesaikan 5.1 dengan mudah.

Februari 2026, GPT-5.3-Codex. Pengguna Pro didowngrade diam-diam ke 5.2, perintah trace jadi bukti nyata.

Maret 2026, GPT-5.4. Forum komunitas OpenAI muncul postingan "GPT-5.4 Jelas Mundur di Codex", balasan netizen semuanya mengonfirmasi.

Awal Mei 2026, GPT-5.5 Instant Dirilis. Panjang balasan memendek 30%, emoji hampir hilang. Netizen menyimpulkan: akurasi meningkat, tapi suhu menghilang.

Akhir Mei 2026, alias sekarang. Keluhan pembodohan mode Thinking kembali meledak.

Lisan al Gaib mengungkapkan, sejak GPT-5 dirilis dan dia memimpin pertempuran merebut kuota ChatGPT Plus, "setiap minggu akan menerima DM seperti ini".

Yang terbaru adalah seseorang meminta bantuannya untuk mengembalikan xhigh/heavy thinking.

Hari Terkuat Saat Benchmark, Adalah Hari Peluncuran

chatgptdisaster.com mengumpulkan 1087 keluhan pengguna yang telah diverifikasi, salah satu skenario yang berulang kali disebut adalah "lapisan routing gagal", UI menampilkan GPT-5.5 Pro, outputnya sepenuhnya barang kelas lain.

Pengguna menggambarkan pola yang dapat direproduksi, setelah sesi panjang model mulai "benar-benar mengabaikan apa yang kau katakan", tapi pemilih model masih menggantung label spesifikasi tertinggi.

Catatan kaki paling absurd adalah, mekanisme pengguna Plus otomatis beralih ke mini setelah 160 pesan/3 jam habis, dalam dokumen resmi OpenAI digambarkan sebagai sebuah "fitur".

Mengapa bisa begitu? Analisis Lisan al Gaib menganggap, jawabannya cuma dua kata: hemat biaya.

Pengetatan daya komputasi dan kemampuan menghasilkan laba memengaruhi setiap orang. Di mana-mana berhemat mati-matian, tidak melewatkan satu pun kesempatan menghemat uang.

Namun, di minggu yang sama ketika pengguna GPT-5.5 mengeluh bersama-sama, bayangan GPT-5.6 sudah muncul di log backend Codex.

Kode internal iris-alpha, konteks 1.5 juta Token, probabilitas rilis Juni yang diberikan Polymarket lebih dari 85%.

Di satu sisi pengguna 5.5 bahkan pengalaman dasar tidak bisa dipertahankan, di sisi lain 5.6 sudah diam-diam berlari lalu lintas nyata di backend.

Inilah kompetisi ASI tahun 2026.

Kecepatan membuat model baru semakin cepat, tapi membuat model lama berjalan baik menyelesaikan satu sesi semakin sulit.

Hari terkuat saat benchmark adalah hari peluncuran, setiap hari setelahnya adalah GPT Schrödinger.

Referensi: https://x.com/scaling01/status/2058643470357590058?s=20

Artikel ini berasal dari akun WeChat publik "新智元", penulis: ASI启示录; editor: 摩西

Bacaan Terkait

Sembilan Tahun Saya Menjadi VC di Web3: Dana Asia Sedang Menjalani 'Mode Neraka'

Penulis asli: Joe Zhou, Foresight News Banyak Crypto VC Asia telah menghilang. Pada tahun 2025, pasar Web3 mendingin drastis, dengan sangat sedikit VC yang tetap aktif dan berinvestasi secara konsisten. Jocy, pendiri IOSG yang telah sembilan tahun menjadi VC di Web3 dan melewati tiga siklus bear/bull, menjelaskan bahwa logika investasi Crypto VC telah berubah total. IOSG kini menyesuaikan portofolionya menjadi 50% pasar primer, 30% post-TGE, dan 20% OTC untuk manajemen likuiditas dan jalur exit DPI yang lebih baik bagi LP. VC Asia sedang mengalami "mode neraka" karena pasar pendanaan yang sangat sulit, memaksa mereka untuk lebih tepat sasaran dan hanya berfokus pada proyek top. Di sisi lain, ini adalah peluang bagi dana yang digerakkan oleh riset mendalam. Masalah terbesar industri Crypto adalah seringnya token terlepas dari nilai sebenarnya. Tren baru mendorong keterikatan yang jelas antara token dan nilai protokol, seperti yang dilakukan Uniswap, Hyperliquid, dan Morpho (investasi IOSG), dengan mekanisme seperti pembelian kembali token untuk menciptakan aset dasar yang bernilai. Logika investasi sekarang harus kembali ke bisnis itu sendiri – menganalisis metrik nyata seperti retensi pengguna, pendapatan, dan arus kas. IOSG memusatkan tembakan pada dua area: infrastruktur keuangan dengan pendapatan nyata (mis., stablecoin, pinjaman) dan persimpangan AI-Crypto (infrastruktur AI asli crypto). Perasaan utama Jocy adalah bahwa perusahaan-perusahaan hebat sering lahir justru di saat-saat paling pesimis dalam industri. Saat gelembung pecah, orang-orang yang bertahan akan membentuk masa depan.

marsbit27m yang lalu

Sembilan Tahun Saya Menjadi VC di Web3: Dana Asia Sedang Menjalani 'Mode Neraka'

marsbit27m yang lalu

Hasil 30 Tahun Obligasi AS Kembali Tembus 5%, Era 'Semuanya Murah' Telah Berakhir

Yield 30 tahun obligasi Amerika Serikat kembali menembus 5%, menandakan reaksi pasar yang berbeda dari tahun 2023. Investor mulai sungguh-sungguh menerima kenyataan bahwa suku bunga tinggi akan berlangsung lama. Di baliknya, terjadi perubahan struktural mendasar: tiga pilar yang mendukung inflasi dan suku bunga rendah di AS selama 50 tahun terakhir—modal murah, tenaga kerja murah, energi murah—sedang runtuh bersamaan. Dari modal: deglobalisasi dan pengurangan pembeli internasional dalam lelang obligasi AS. Dari energi: ketegangan geopolitik dan pergeseran menuju energi bersih. Dari tenaga kerja: kekurangan pekerja, serikat buruh, dan imigrasi yang ketat mendorong kenaikan upah, meski sebagian diimbangi biaya asuransi kesehatan dan potensi dampak AI. Faktor jangka panjang seperti utang pemerintah yang meningkat, geopolitik, dan populisme juga menambah premi risiko, mendorong yield jangka panjang lebih tinggi. Arah perkembangan Kecerdasan Buatan (AI) menjadi variabel paling tidak pasti. Dalam skenario optimis, AI meningkatkan produktivitas dan mengurangi utang serta inflasi. Dalam skenario pesimis, AI justru menjadi alat pemotongan biaya dan menciptakan tekanan inflasi baru melalui konsumsi sumber daya yang masif, sementara pemerintah harus menanggung biaya sosial pekerja yang tergantikan. Intinya, era "segala sesuatu murah" telah berakhir. Bagi investor yang seluruh kariernya dibentuk dalam lingkungan suku bunga rendah, meninggalkan ekspektasi lama dan menyesuaikan diri dengan realitas baru ini merupakan tantangan yang tidak mudah.

marsbit35m yang lalu

Hasil 30 Tahun Obligasi AS Kembali Tembus 5%, Era 'Semuanya Murah' Telah Berakhir

marsbit35m yang lalu

Trading

Spot
Futures
活动图片