Pembodohan GPT-5.5 Terbongkar, Dokumen Resmi OpenAI Akui

marsbitDipublikasikan tanggal 2026-05-27Terakhir diperbarui pada 2026-05-27

Abstrak

**Intisari: GPT-5.5 Ketahuan 'Bodoh Tiba-tiba', Dokumen OpenAI Akui Penggantian Model Diam-diam** Pengguna melaporkan ChatGPT dengan mode "GPT-5.5 Extended Thinking" tiba-tiba menjadi lebih lamban dan kurang akurat setelah digunakan beberapa jam, meski label model di antarmuka tetap sama. Kecurigaan bahwa model yang lebih canggih diam-diam diganti dengan versi yang lebih sederhana (seperti 'mini') dikonfirmasi oleh dokumen bantuan resmi OpenAI. Dokumen tersebut menyatakan bahwa untuk pengguna ChatGPT Plus, setelah 160 permintaan dalam 3 jam, sistem akan *secara diam-diam* beralih ke model mini hingga kuota reset. Tidak ada pemberitahuan atau perubahan label. Pengguna Pro juga melaporkan mode 'Heavy Thinking' mereka mengalami degradasi atau pembatasan kapasitas saat beban server tinggi, juga tanpa peringatan. Bukti lain muncul dari pengujian pengembang: ketika ditanya tanggal cutoff data pelatihan, model yang seharusnya GPT-5.5 Thinking menjawab dengan tanggal yang cocok untuk versi Instant, mengindikasikan pergantian. Insiden serupa dengan trace command juga pernah terjadi pada GPT-5.3 Codex awal tahun ini, di mana model yang diminta tidak sesuai dengan yang dilayani. Keluhan tentang penurunan kualitas (atau "lobotomisasi") telah menyertai setiap rilis besar OpenAI sejak GPT-5. Meski status laporan sering ditandai "terselesaikan", keluhan baru terus bermunculan. Analis menduga praktik ini didorong oleh tekanan biaya komputasi. Ironisnya, sementara pengguna GPT-5.5 berjuan...

【Panduan】GPT-5.5 Terbongkar Melakukan "Pemikiran Palsu", Diganti Diam-Diam dengan Mini Setelah Dua Jam Digunakan, Biaya $200 Per Bulan Hanya untuk "Otak Schrödinger". Perintah Trace Jadi Bukti Nyata, Dokumen Resmi Sendiri yang Mengakui. Netizen Berbondong-bondong Mengeluh: OpenAI, Siapa yang Kau Tipu?

ChatGPT Kembali Dituduh "Bodoh"!

Baru-baru ini, X (sebelumnya Twitter) gempar duluan.

Netizen Lisan al Gaib menemukan, setelah menggunakan GPT-5.5 selama satu atau dua jam, tiba-tiba menjadi bodoh. Setiap permintaan dijawab dalam sekejap, kualitasnya anjlok drastis.

Tapi yang ditampilkan di antarmuka, tetap "GPT-5.5 Extended Thinking".

Artinya, label "berpikir" masih terpasang, tapi proses berpikirnya sendiri sudah hilang.

$200/Bulan, Hanya untuk "Model Schrödinger"

Di forum pengembang OpenAI, sebuah postingan keluhan meledak bersamaan.

Agentify.sh menyatakan, GPT-5.5 tiba-tiba kehilangan kemampuan mengikuti instruksi saat digunakan.

Melihatnya dengan bersemangat mengumumkan "sudah diperbaiki", ternyata kualitas kodenya buruk sampai memicu rollback besar-besaran.

Tugas UI yang sebelumnya mudah diselesaikan oleh 5.5-med, sekarang bahkan modifikasi paling sederhana pun tidak bisa.

Naik ke 5.5-high, percuma. Naik lagi ke xhigh, tetap tidak bisa.

Dan xhigh yang dulu bisa bertahan beberapa jam, sekarang jelas memendek.

Begitu postingan muncul, bagian balasan langsung meledak.

Ada yang langsung kembali ke 5.4.

Ada yang menggunakan tier tertinggi xhigh, tapi "jelas lebih payah dibanding minggu lalu, tugas panjang sering salah, sama sekali tidak mengikuti alur kerja".

Ada yang melaporkan situasi yang lebih aneh, "kueri sederhana juga muter-muter lama, kalau kau hentikan untuk mengoreksi arah, dia langsung mengabaikanmu, terus lanjut sesuai rencana salah sebelumnya".

Benar, semua orang menggambarkan fenomena yang sama — otak GPT, entah kapan sudah diam-diam diganti.

Performanya GPT-5.5 sekarang sama saja dengan 5.3, tidak berlebihan. Beberapa hari pertama masih luar biasa mengagumkan, sekarang sama sekali tidak menemukan bayangan model awal itu.

Bukan Khayalan, OpenAI Sendiri yang Menulisnya Hitam di Atas Putih

Untuk memverifikasi, Lisan al Gaib khusus membuat tes perbandingan.

Akun yang sama, di sisi ChatGPT menggunakan Extended Thinking hasilnya sampah semua, begitu pindah ke sisi Codex menggunakan xhigh, langsung normal kembali.

Dengan kata-katanya sendiri, Codex "pintarnya 4 miliar kali lipat dari benda ini".

Pengembang Andrew Curran punya trik jitu — tanya langsung ke model "Kapan tanggal cutoff data latihanmu?"

Model menjawab, Agustus 2025.

Masalahnya, tanggal cutoff GPT-5.5 Thinking adalah Desember. Agustus, adalah tanggal cutoff versi Instant!

Artinya, dia memilih Thinking, tapi sistem yang menjalankan sebenarnya adalah Instant.

Label model di antarmuka tidak berubah satu huruf pun, tapi model di balik layar sudah diam-diam diganti......

Lucunya, kali ini OpenAI justru dalam dokumen bantuannya sendiri yang memberikan bukti nyata untuk pengguna.

Menurut penjelasan resmi dari OpenAI Help Center, pengguna Plus maksimal mengirim 160 pesan GPT-5.5 setiap 3 jam.

Setelah habis, sistem akan diam-diam beralih ke model mini, sampai kuota direset.

Perhatikan kata "diam-diam".

Tidak ada pemberitahuan pop-up, tidak ada perubahan label model, tidak ada umpan balik visual apa pun.

Kau kira masih menggunakan model unggulan, di seberang sudah diam-diam diganti jadi mini.

Pengguna Pro juga jangan senang dulu.

Mode pemikiran Heavy, tier penalaran tertinggi eksklusif untuk Pro, saat beban server tinggi, juga akan dibatasi kapasitasnya. Juga tanpa peringatan.

Dengan kata lain, langganan Pro $200/bulan, membeli layanan yang sewaktu-waktu bisa "ditukar kacang dengan keledai".

Operasi "label tidak berubah, otak sudah berganti" seperti ini, di sisi Codex bahkan sudah lebih dulu ketahuan.

Februari tahun ini, sebuah issue muncul di GitHub, seorang pengguna Pro menggunakan perintah trace menemukan, yang dimintanya adalah GPT-5.3 Codex, model yang dikembalikan sebenarnya adalah GPT-5.2.

Bukan 5.2 Codex sekalipun, tapi versi dasar 5.2 yang lebih rendah.

Dia memposting perintah reproduksi:

  • RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
  • Output: gpt-5.2-2025-12-11
  • Harapan: gpt-5.3-codex

Beberapa pengguna Pro mengonfirmasi degradasi yang sama di issue yang sama.

Dan degradasi ini "lengket", tidak pulih sendiri, juga tanpa penjelasan apa pun.

Bahkan, pada hari perilisan GPT-5.5 di bulan April, ada juga pengguna yang melaporkan kecepatan mode Fast sama dengan Standard, tapi penagihan tetap sesuai Fast.

Tugas sederhana berjalan 7 menit 49 detik, normalnya seharusnya 5-6 menit.

OpenAI Mengakui, Lalu Tidak Ada Kelanjutannya

15 Mei, halaman status OpenAI muncul sebuah catatan.

Penurunan Performa GPT5.5, kami sedang menyelidiki masalah penurunan performa GPT-5.5 yang dilaporkan sebagian pengguna.

17 Mei, status diperbarui menjadi "Terselesaikan".

Tapi dari garis waktu postingan forum, keluhan pembodohan tanggal 24-26 Mei lebih dahsyat dibanding gelombang tanggal 15 Mei.

Entah masalah yang "terselesaikan" muncul kembali, atau memang tidak pernah benar-benar diselesaikan.

Setiap Peningkatan adalah "Kontroversi Pembodohan"

Meski setiap perusahaan akan menghadapi keluhan "model jadi bodoh", tapi OpenAI dari GPT-5 sampai GPT-5.5 setiap pembaruan, tidak pernah absen.

Setiap kali OpenAI bilang sedang diselidiki, setiap kali bilang sudah diselesaikan, lalu versi berikutnya berlanjut.

Agustus 2025, GPT-5 Perdana. Judul hot post Reddit langsung "GPT-5 Payah Banget". Pengguna mengeluh balasan pendek, lebih banyak penolakan, lebih sedikit kepribadian.

OpenAI terpaksa memulihkan opsi GPT-4o secara darurat. Altman di Reddit AMA secara pribadi mengakui "lebih berguncang dari yang kami perkirakan".

Desember 2025, GPT-5.2. Kualitas terjemahan mundur, mengarang API yang tidak ada, menolak menjalankan instruksi gaya yang bisa diselesaikan 5.1 dengan mudah.

Februari 2026, GPT-5.3-Codex. Pengguna Pro didowngrade diam-diam ke 5.2, perintah trace jadi bukti nyata.

Maret 2026, GPT-5.4. Forum komunitas OpenAI muncul postingan "GPT-5.4 Jelas Mundur di Codex", balasan netizen semuanya mengonfirmasi.

Awal Mei 2026, GPT-5.5 Instant Dirilis. Panjang balasan memendek 30%, emoji hampir hilang. Netizen menyimpulkan: akurasi meningkat, tapi suhu menghilang.

Akhir Mei 2026, alias sekarang. Keluhan pembodohan mode Thinking kembali meledak.

Lisan al Gaib mengungkapkan, sejak GPT-5 dirilis dan dia memimpin pertempuran merebut kuota ChatGPT Plus, "setiap minggu akan menerima DM seperti ini".

Yang terbaru adalah seseorang meminta bantuannya untuk mengembalikan xhigh/heavy thinking.

Hari Terkuat Saat Benchmark, Adalah Hari Peluncuran

chatgptdisaster.com mengumpulkan 1087 keluhan pengguna yang telah diverifikasi, salah satu skenario yang berulang kali disebut adalah "lapisan routing gagal", UI menampilkan GPT-5.5 Pro, outputnya sepenuhnya barang kelas lain.

Pengguna menggambarkan pola yang dapat direproduksi, setelah sesi panjang model mulai "benar-benar mengabaikan apa yang kau katakan", tapi pemilih model masih menggantung label spesifikasi tertinggi.

Catatan kaki paling absurd adalah, mekanisme pengguna Plus otomatis beralih ke mini setelah 160 pesan/3 jam habis, dalam dokumen resmi OpenAI digambarkan sebagai sebuah "fitur".

Mengapa bisa begitu? Analisis Lisan al Gaib menganggap, jawabannya cuma dua kata: hemat biaya.

Pengetatan daya komputasi dan kemampuan menghasilkan laba memengaruhi setiap orang. Di mana-mana berhemat mati-matian, tidak melewatkan satu pun kesempatan menghemat uang.

Namun, di minggu yang sama ketika pengguna GPT-5.5 mengeluh bersama-sama, bayangan GPT-5.6 sudah muncul di log backend Codex.

Kode internal iris-alpha, konteks 1.5 juta Token, probabilitas rilis Juni yang diberikan Polymarket lebih dari 85%.

Di satu sisi pengguna 5.5 bahkan pengalaman dasar tidak bisa dipertahankan, di sisi lain 5.6 sudah diam-diam berlari lalu lintas nyata di backend.

Inilah kompetisi ASI tahun 2026.

Kecepatan membuat model baru semakin cepat, tapi membuat model lama berjalan baik menyelesaikan satu sesi semakin sulit.

Hari terkuat saat benchmark adalah hari peluncuran, setiap hari setelahnya adalah GPT Schrödinger.

Referensi: https://x.com/scaling01/status/2058643470357590058?s=20

Artikel ini berasal dari akun WeChat publik "新智元", penulis: ASI启示录; editor: 摩西

Bacaan Terkait

Hasil 30 Tahun Obligasi AS Kembali Tembus 5%, Era 'Semuanya Murah' Telah Berakhir

Yield 30 tahun obligasi Amerika Serikat kembali menembus 5%, menandakan reaksi pasar yang berbeda dari tahun 2023. Investor mulai sungguh-sungguh menerima kenyataan bahwa suku bunga tinggi akan berlangsung lama. Di baliknya, terjadi perubahan struktural mendasar: tiga pilar yang mendukung inflasi dan suku bunga rendah di AS selama 50 tahun terakhir—modal murah, tenaga kerja murah, energi murah—sedang runtuh bersamaan. Dari modal: deglobalisasi dan pengurangan pembeli internasional dalam lelang obligasi AS. Dari energi: ketegangan geopolitik dan pergeseran menuju energi bersih. Dari tenaga kerja: kekurangan pekerja, serikat buruh, dan imigrasi yang ketat mendorong kenaikan upah, meski sebagian diimbangi biaya asuransi kesehatan dan potensi dampak AI. Faktor jangka panjang seperti utang pemerintah yang meningkat, geopolitik, dan populisme juga menambah premi risiko, mendorong yield jangka panjang lebih tinggi. Arah perkembangan Kecerdasan Buatan (AI) menjadi variabel paling tidak pasti. Dalam skenario optimis, AI meningkatkan produktivitas dan mengurangi utang serta inflasi. Dalam skenario pesimis, AI justru menjadi alat pemotongan biaya dan menciptakan tekanan inflasi baru melalui konsumsi sumber daya yang masif, sementara pemerintah harus menanggung biaya sosial pekerja yang tergantikan. Intinya, era "segala sesuatu murah" telah berakhir. Bagi investor yang seluruh kariernya dibentuk dalam lingkungan suku bunga rendah, meninggalkan ekspektasi lama dan menyesuaikan diri dengan realitas baru ini merupakan tantangan yang tidak mudah.

marsbit7m yang lalu

Hasil 30 Tahun Obligasi AS Kembali Tembus 5%, Era 'Semuanya Murah' Telah Berakhir

marsbit7m yang lalu

Studi Terbaru BIS: Stablecoin dan Masa Depan Lanskap Moneter Global

Studi BIS Terbaru: Masa Depan Stablecoin dan Lanskap Moneter Global Stablecoin telah berevolusi dari alat khusus di ekosistem kripto menjadi aset digital baru dengan fungsi pembayaran lintas batas dan penyimpan nilai, secara mendalam memengaruhi lanskap moneter internasional. Laporan BIS menganalisis karakteristik, mekanisme, dan dampak stablecoin terhadap sistem moneter internasional, serta mengusulkan tiga skenario masa depan dan arah regulasi. Pasar stablecoin didominasi oleh stablecoin berdenominasi dolar AS (mencapai 98% dari total kapitalisasi pasar), dengan USDT dan USDC memegang kendali. Aplikasi utamanya masih dalam ekosistem kripto (trading dan DeFi). Mekanisme operasinya mengikuti pola "sirkulasi on-chain + cadangan off-chain", yang pada dasarnya merupakan klaim swasta terhadap dolar AS lepas pantai dalam bentuk digital. Ini berbeda dari pasar Eurodolar tradisional karena tidak memiliki dukungan likuiditas bank sentral, sehingga stabilitasnya bergantung sepenuhnya pada kualitas aset cadangan. Dampak globalnya signifikan, terutama bagi negara ekonomi berkembang dan berkembang (EMDE). Stablecoin dolar AS menjadi saluran utama "digital dollarization", memfasilitasi pelarian modal dan melemahkan kedaulatan moneter serta efektivitas kebijakan di negara-negara dengan inflasi tinggi. Fungsi utamanya terlihat pada penyimpan nilai dan media transaksi sektor swasta, sementara fungsinya sebagai unit hitung dan penggunaan di sektor resmi masih terbatas. Laporan ini menguraikan tiga skenario masa depan: 1. **Skenario 1: Adopsi Terbatas** (Skenario dasar): Stablecoin tetap terbatas pada ekosistem kripto dengan sedikit penetrasi ekonomi riil. 2. **Skenario 2: Digital Dollarization** (Skenario berisiko tinggi): Stablecoin dolar AS menjadi standar de facto untuk pembayaran ritel lintas batas di EMDE, mengikis kedaulatan moneter secara signifikan. 3. **Skenario 3: Integrasi Stablecoin Mata Uang Lokal** (Skenario ideal): Negara-negara mengembangkan stablecoin mata uang lokal yang diatur dan terhubung dengan sistem pembayaran domestik dan CBDC untuk meningkatkan efisiensi tanpa risiko substitusi mata uang asing. Tantangan regulasi memerlukan kolaborasi global. Rekomendasi kebijakan inti mencakup: standar regulasi global yang seragam, penguatan kerja sama lintas batas, peningkatan pertahanan domestik (termasuk pengembangan CBDC) di EMDE, dan pencegahan aktivitas ilegal. Kesimpulannya, stablecoin adalah kekuatan struktural yang dapat memperkuat hegemoni dolar AS dalam jangka pendek namun masa depannya bergantung pada respons regulasi, inovasi instrumen digital lokal, dan jalur adopsi pasar.

链捕手42m yang lalu

Studi Terbaru BIS: Stablecoin dan Masa Depan Lanskap Moneter Global

链捕手42m yang lalu

Perusahaan Satu Orang 'Meledak': Ada yang Untung Rp1 Miliar Setahun, Ada yang Pendapatan Menyusut 90%

"Perusahaan Perorangan" (OPC) yang didukung AI—model bisnis di mana individu menggunakan alat untuk berwirausaha secara mandiri—sedang populer. Tahun 2026 disebut sebagai tahun pertama era OPC. Meskipun AI menurunkan hambatan dan biaya, kesuksesan tidak dijamin. Statistik menunjukkan 52.7% OPC berpenghasilan di bawah 7.000 yuan per bulan. **Zhang Sir (Pengembangan Game):** Dalam setahun, ia mengembangkan 6 game interaksi *bullet chat*, dengan pendapatan bersih pribadi 80-100 juta yuan. AI menggantikan 70% pekerjaan seni dan membantu penulisan kode, memangkas biaya produksi menjadi 1.000-1.500 yuan per game dan siklus pengembangan menjadi 15 hari. **Oktober (Pengembangan Material, Jepang):** Setelah mendirikan OPC, pendapatan bulanannya tiga kali lipat rata-rata pekerja kantoran seusianya di Jepang. AI digunakan untuk penerjemahan, desain, pemrosesan pesanan, dan konsultasi hukum. Pasar Jepang yang tidak terlalu kompetitif memberi peluang, meski hambatan industri tinggi. **Xiao Tao (Bioteknologi):** Melayani klien B2B dengan algoritma AI untuk mengoptimasi formula media kultur sel, ia menggandakan pendapatan dibanding pekerjaan penuh waktu. AI Agent menangani 80% pekerjaan repetitif. Ia menekankan pentingnya sumber daya klien dan kemampuan non-teknis. **A Yuan (E-niaga Lintas Batas):** Mantan karyawan *big tech* yang beralih ke e-niaga Amerika Latin. AI menggantikan 60% pekerjaan, seperti pemilihan produk dan pembuatan konten. Namun, pendapatannya turun 90% dibanding gaji sebelumnya. Ia memperingatkan agar tidak tergesa-gesa berwirausaha, tetapi mengakui nilai pembelajaran yang besar dari pengalaman langsung. Intinya: AI memberdayakan OPC dengan efisiensi biaya dan produksi, tetapi kesuksesan bergantung pada keahlian, pengalaman industri, sumber daya klien, dan kemampuan adaptasi pasar.

marsbit50m yang lalu

Perusahaan Satu Orang 'Meledak': Ada yang Untung Rp1 Miliar Setahun, Ada yang Pendapatan Menyusut 90%

marsbit50m yang lalu

Trading

Spot
Futures
活动图片