Pembodohan GPT-5.5 Terbongkar, Dokumen Resmi OpenAI Akui

marsbitDipublikasikan tanggal 2026-05-27Terakhir diperbarui pada 2026-05-27

Abstrak

**Intisari: GPT-5.5 Ketahuan 'Bodoh Tiba-tiba', Dokumen OpenAI Akui Penggantian Model Diam-diam** Pengguna melaporkan ChatGPT dengan mode "GPT-5.5 Extended Thinking" tiba-tiba menjadi lebih lamban dan kurang akurat setelah digunakan beberapa jam, meski label model di antarmuka tetap sama. Kecurigaan bahwa model yang lebih canggih diam-diam diganti dengan versi yang lebih sederhana (seperti 'mini') dikonfirmasi oleh dokumen bantuan resmi OpenAI. Dokumen tersebut menyatakan bahwa untuk pengguna ChatGPT Plus, setelah 160 permintaan dalam 3 jam, sistem akan *secara diam-diam* beralih ke model mini hingga kuota reset. Tidak ada pemberitahuan atau perubahan label. Pengguna Pro juga melaporkan mode 'Heavy Thinking' mereka mengalami degradasi atau pembatasan kapasitas saat beban server tinggi, juga tanpa peringatan. Bukti lain muncul dari pengujian pengembang: ketika ditanya tanggal cutoff data pelatihan, model yang seharusnya GPT-5.5 Thinking menjawab dengan tanggal yang cocok untuk versi Instant, mengindikasikan pergantian. Insiden serupa dengan trace command juga pernah terjadi pada GPT-5.3 Codex awal tahun ini, di mana model yang diminta tidak sesuai dengan yang dilayani. Keluhan tentang penurunan kualitas (atau "lobotomisasi") telah menyertai setiap rilis besar OpenAI sejak GPT-5. Meski status laporan sering ditandai "terselesaikan", keluhan baru terus bermunculan. Analis menduga praktik ini didorong oleh tekanan biaya komputasi. Ironisnya, sementara pengguna GPT-5.5 berjuan...

【Panduan】GPT-5.5 Terbongkar Melakukan "Pemikiran Palsu", Diganti Diam-Diam dengan Mini Setelah Dua Jam Digunakan, Biaya $200 Per Bulan Hanya untuk "Otak Schrödinger". Perintah Trace Jadi Bukti Nyata, Dokumen Resmi Sendiri yang Mengakui. Netizen Berbondong-bondong Mengeluh: OpenAI, Siapa yang Kau Tipu?

ChatGPT Kembali Dituduh "Bodoh"!

Baru-baru ini, X (sebelumnya Twitter) gempar duluan.

Netizen Lisan al Gaib menemukan, setelah menggunakan GPT-5.5 selama satu atau dua jam, tiba-tiba menjadi bodoh. Setiap permintaan dijawab dalam sekejap, kualitasnya anjlok drastis.

Tapi yang ditampilkan di antarmuka, tetap "GPT-5.5 Extended Thinking".

Artinya, label "berpikir" masih terpasang, tapi proses berpikirnya sendiri sudah hilang.

$200/Bulan, Hanya untuk "Model Schrödinger"

Di forum pengembang OpenAI, sebuah postingan keluhan meledak bersamaan.

Agentify.sh menyatakan, GPT-5.5 tiba-tiba kehilangan kemampuan mengikuti instruksi saat digunakan.

Melihatnya dengan bersemangat mengumumkan "sudah diperbaiki", ternyata kualitas kodenya buruk sampai memicu rollback besar-besaran.

Tugas UI yang sebelumnya mudah diselesaikan oleh 5.5-med, sekarang bahkan modifikasi paling sederhana pun tidak bisa.

Naik ke 5.5-high, percuma. Naik lagi ke xhigh, tetap tidak bisa.

Dan xhigh yang dulu bisa bertahan beberapa jam, sekarang jelas memendek.

Begitu postingan muncul, bagian balasan langsung meledak.

Ada yang langsung kembali ke 5.4.

Ada yang menggunakan tier tertinggi xhigh, tapi "jelas lebih payah dibanding minggu lalu, tugas panjang sering salah, sama sekali tidak mengikuti alur kerja".

Ada yang melaporkan situasi yang lebih aneh, "kueri sederhana juga muter-muter lama, kalau kau hentikan untuk mengoreksi arah, dia langsung mengabaikanmu, terus lanjut sesuai rencana salah sebelumnya".

Benar, semua orang menggambarkan fenomena yang sama — otak GPT, entah kapan sudah diam-diam diganti.

Performanya GPT-5.5 sekarang sama saja dengan 5.3, tidak berlebihan. Beberapa hari pertama masih luar biasa mengagumkan, sekarang sama sekali tidak menemukan bayangan model awal itu.

Bukan Khayalan, OpenAI Sendiri yang Menulisnya Hitam di Atas Putih

Untuk memverifikasi, Lisan al Gaib khusus membuat tes perbandingan.

Akun yang sama, di sisi ChatGPT menggunakan Extended Thinking hasilnya sampah semua, begitu pindah ke sisi Codex menggunakan xhigh, langsung normal kembali.

Dengan kata-katanya sendiri, Codex "pintarnya 4 miliar kali lipat dari benda ini".

Pengembang Andrew Curran punya trik jitu — tanya langsung ke model "Kapan tanggal cutoff data latihanmu?"

Model menjawab, Agustus 2025.

Masalahnya, tanggal cutoff GPT-5.5 Thinking adalah Desember. Agustus, adalah tanggal cutoff versi Instant!

Artinya, dia memilih Thinking, tapi sistem yang menjalankan sebenarnya adalah Instant.

Label model di antarmuka tidak berubah satu huruf pun, tapi model di balik layar sudah diam-diam diganti......

Lucunya, kali ini OpenAI justru dalam dokumen bantuannya sendiri yang memberikan bukti nyata untuk pengguna.

Menurut penjelasan resmi dari OpenAI Help Center, pengguna Plus maksimal mengirim 160 pesan GPT-5.5 setiap 3 jam.

Setelah habis, sistem akan diam-diam beralih ke model mini, sampai kuota direset.

Perhatikan kata "diam-diam".

Tidak ada pemberitahuan pop-up, tidak ada perubahan label model, tidak ada umpan balik visual apa pun.

Kau kira masih menggunakan model unggulan, di seberang sudah diam-diam diganti jadi mini.

Pengguna Pro juga jangan senang dulu.

Mode pemikiran Heavy, tier penalaran tertinggi eksklusif untuk Pro, saat beban server tinggi, juga akan dibatasi kapasitasnya. Juga tanpa peringatan.

Dengan kata lain, langganan Pro $200/bulan, membeli layanan yang sewaktu-waktu bisa "ditukar kacang dengan keledai".

Operasi "label tidak berubah, otak sudah berganti" seperti ini, di sisi Codex bahkan sudah lebih dulu ketahuan.

Februari tahun ini, sebuah issue muncul di GitHub, seorang pengguna Pro menggunakan perintah trace menemukan, yang dimintanya adalah GPT-5.3 Codex, model yang dikembalikan sebenarnya adalah GPT-5.2.

Bukan 5.2 Codex sekalipun, tapi versi dasar 5.2 yang lebih rendah.

Dia memposting perintah reproduksi:

RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
Output: gpt-5.2-2025-12-11
Harapan: gpt-5.3-codex

Beberapa pengguna Pro mengonfirmasi degradasi yang sama di issue yang sama.

Dan degradasi ini "lengket", tidak pulih sendiri, juga tanpa penjelasan apa pun.

Bahkan, pada hari perilisan GPT-5.5 di bulan April, ada juga pengguna yang melaporkan kecepatan mode Fast sama dengan Standard, tapi penagihan tetap sesuai Fast.

Tugas sederhana berjalan 7 menit 49 detik, normalnya seharusnya 5-6 menit.

OpenAI Mengakui, Lalu Tidak Ada Kelanjutannya

15 Mei, halaman status OpenAI muncul sebuah catatan.

Penurunan Performa GPT5.5, kami sedang menyelidiki masalah penurunan performa GPT-5.5 yang dilaporkan sebagian pengguna.

17 Mei, status diperbarui menjadi "Terselesaikan".

Tapi dari garis waktu postingan forum, keluhan pembodohan tanggal 24-26 Mei lebih dahsyat dibanding gelombang tanggal 15 Mei.

Entah masalah yang "terselesaikan" muncul kembali, atau memang tidak pernah benar-benar diselesaikan.

Setiap Peningkatan adalah "Kontroversi Pembodohan"

Meski setiap perusahaan akan menghadapi keluhan "model jadi bodoh", tapi OpenAI dari GPT-5 sampai GPT-5.5 setiap pembaruan, tidak pernah absen.

Setiap kali OpenAI bilang sedang diselidiki, setiap kali bilang sudah diselesaikan, lalu versi berikutnya berlanjut.

Agustus 2025, GPT-5 Perdana. Judul hot post Reddit langsung "GPT-5 Payah Banget". Pengguna mengeluh balasan pendek, lebih banyak penolakan, lebih sedikit kepribadian.

OpenAI terpaksa memulihkan opsi GPT-4o secara darurat. Altman di Reddit AMA secara pribadi mengakui "lebih berguncang dari yang kami perkirakan".

Desember 2025, GPT-5.2. Kualitas terjemahan mundur, mengarang API yang tidak ada, menolak menjalankan instruksi gaya yang bisa diselesaikan 5.1 dengan mudah.

Februari 2026, GPT-5.3-Codex. Pengguna Pro didowngrade diam-diam ke 5.2, perintah trace jadi bukti nyata.

Maret 2026, GPT-5.4. Forum komunitas OpenAI muncul postingan "GPT-5.4 Jelas Mundur di Codex", balasan netizen semuanya mengonfirmasi.

Awal Mei 2026, GPT-5.5 Instant Dirilis. Panjang balasan memendek 30%, emoji hampir hilang. Netizen menyimpulkan: akurasi meningkat, tapi suhu menghilang.

Akhir Mei 2026, alias sekarang. Keluhan pembodohan mode Thinking kembali meledak.

Lisan al Gaib mengungkapkan, sejak GPT-5 dirilis dan dia memimpin pertempuran merebut kuota ChatGPT Plus, "setiap minggu akan menerima DM seperti ini".

Yang terbaru adalah seseorang meminta bantuannya untuk mengembalikan xhigh/heavy thinking.

Hari Terkuat Saat Benchmark, Adalah Hari Peluncuran

chatgptdisaster.com mengumpulkan 1087 keluhan pengguna yang telah diverifikasi, salah satu skenario yang berulang kali disebut adalah "lapisan routing gagal", UI menampilkan GPT-5.5 Pro, outputnya sepenuhnya barang kelas lain.

Pengguna menggambarkan pola yang dapat direproduksi, setelah sesi panjang model mulai "benar-benar mengabaikan apa yang kau katakan", tapi pemilih model masih menggantung label spesifikasi tertinggi.

Catatan kaki paling absurd adalah, mekanisme pengguna Plus otomatis beralih ke mini setelah 160 pesan/3 jam habis, dalam dokumen resmi OpenAI digambarkan sebagai sebuah "fitur".

Mengapa bisa begitu? Analisis Lisan al Gaib menganggap, jawabannya cuma dua kata: hemat biaya.

Pengetatan daya komputasi dan kemampuan menghasilkan laba memengaruhi setiap orang. Di mana-mana berhemat mati-matian, tidak melewatkan satu pun kesempatan menghemat uang.

Namun, di minggu yang sama ketika pengguna GPT-5.5 mengeluh bersama-sama, bayangan GPT-5.6 sudah muncul di log backend Codex.

Kode internal iris-alpha, konteks 1.5 juta Token, probabilitas rilis Juni yang diberikan Polymarket lebih dari 85%.

Di satu sisi pengguna 5.5 bahkan pengalaman dasar tidak bisa dipertahankan, di sisi lain 5.6 sudah diam-diam berlari lalu lintas nyata di backend.

Inilah kompetisi ASI tahun 2026.

Kecepatan membuat model baru semakin cepat, tapi membuat model lama berjalan baik menyelesaikan satu sesi semakin sulit.

Hari terkuat saat benchmark adalah hari peluncuran, setiap hari setelahnya adalah GPT Schrödinger.

Referensi: https://x.com/scaling01/status/2058643470357590058?s=20

Artikel ini berasal dari akun WeChat publik "新智元", penulis: ASI启示录; editor: 摩西

Bacaan Terkait

Dialog dengan Ray Dalio: Saat Ini Berada dalam Gelembung AI, 1% Portofolio Investasi Adalah Bitcoin

Sumber: The Diary Of A CEO Ray Dalio, pendiri Bridgewater Associates yang meramalkan krisis keuangan 2008, memperingatkan bahwa ledakan AI saat ini menunjukkan tanda-tanda klasik gelembung ekonomi yang dapat pecah dan memicu resesi. Dalam wawancara podcast, dia menjelaskan dinamika "siklus besar" yang didorong oleh ketimpangan kekayaan, defisit pemerintah, dan perubahan geopolitik. Dalio mengidentifikasi pola di mana antusiasme berlebihan terhadap teknologi revolusioner baru, seperti AI, menyebabkan harga aset melambung dan pinjaman berlebihan. Ketika kondisi berubah (seperti kenaikan suku bunga atau kebutuhan tunai), gelembung ini dapat pecah, menyebabkan penurunan harga aset, kerugian luas, dan kontraksi ekonomi. Untuk melindungi kekayaan di masa ketidakpastian, Dalio sangat menekankan pentingnya **diversifikasi portofolio**—termasuk saham, obligasi, emas, dan real estat—daripada mengandalkan uang tunai saja. Dia mengungkapkan bahwa sekitar **1% portofolionya adalah Bitcoin**, yang diakuinya sebagai aset keras, tetapi dia lebih menyukai **emas fisik** karena sejarahnya sebagai penyimpan nilai dan aset bebas liabilitas. Mengenai dampak AI, Dalio percaya bahwa teknologi ini akan menggantikan tidak hanya tenaga fisik tetapi juga kemampuan kognitif manusia, berpotensi memperlebar kesenjangan antara pemilik modal dan pekerja. Masa depan akan menguntungkan mereka yang dapat memadukan kecerdasan manusia (seperti emosi dan intuisi) dengan kemitraan AI. Secara geopolitik, Dalio menggambarkan dunia yang memasuki fase "penurunan" dalam tatanan global, dengan Amerika Serikat menghadapi tantangan internal dan eksternal, termasuk konflik seperti di Iran yang mengungkap kelemahannya. Dia memprediksi dunia mungkin menjadi lebih terregionalisasi di masa depan. Secara keseluruhan, kunci untuk navigasi melalui periode kompleks ini adalah pemahaman akan pola sejarah, adaptasi, dan diversifikasi yang cermat.

marsbit20m yang lalu

Dialog dengan Ray Dalio: Saat Ini Berada dalam Gelembung AI, 1% Portofolio Investasi Adalah Bitcoin

marsbit20m yang lalu

Rekor! Beli Bersih Asing 7,2 Triliun Won dalam Sehari, Wall Street: Tekanan Likuiditas di Pasar Saham Korea Telah Mereda

**Ringkasan: Rekor Pembelian Asing dan Peningkatan Likuiditas di Pasar Saham Korea** Aliran modal asing menunjukkan perubahan signifikan di pasar saham Korea (KOSPI). Pada 31 Juli, investor asing melakukan pembelian bersih rekor sebesar 7,2 triliun Won Korea dalam sehari, menandai pembalikan dari tren penjualan bersih besar-besaran dalam beberapa bulan terakhir. Secara bulanan, penjualan bersih asing menyusut drastis menjadi 9,8 triliun Won di Juli, turun dari 48,4 triliun dan 44,5 triliun Won pada Juni dan Mei. Tekanan penjualan dari lembaga domestik juga mereda. Dana pensiun dan reksa dana domestik justru menjadi pembeli bersih 1,0 triliun Won di Juli, setelah dua bulan sebelumnya menjadi penjual bersih. Faktor pendukung lainnya adalah peraturan baru dari Komisi Jasa Keuangan (FSC) yang memberlakukan syarat lebih ketat bagi investor ritel untuk masuk ke ETF leverage saham tunggal, yang langsung mengurangi volume perdagangan instrumen tersebut hingga sekitar 50%. Kebijakan ini diperkirakan dapat menekan volatilitas pasar. Citigroup mempertahankan target indeks KOSPI di level 10.000 poin, menyoroti memudarnya angin penentu likuiditas. Analis mereka menilai faktor fundamental seperti industri chip memori yang solid, valuasi historis yang rendah, fundamental ekonomi Korea yang kuat, dan dukungan kebijakan berpotensi menjadi pendorong bagi pasar.

marsbit21m yang lalu

Rekor! Beli Bersih Asing 7,2 Triliun Won dalam Sehari, Wall Street: Tekanan Likuiditas di Pasar Saham Korea Telah Mereda

marsbit21m yang lalu

Pembaruan! AI Generasi Berikut OpenAI Pecahkan 10 Masalah Kelas Medali Fields

**OpenAI Model Astra Pecahkan 10 Masalah Matematika Kelas Fields Medal!** OpenAI mengumumkan terobosan besar dari model internal terbarunya, Astra. Model ini dilaporkan telah membuat kemajuan signifikan dalam **10 masalah matematika yang belum terpecahkan**, dengan biaya komputasi hanya sekitar **$2000**. Hasilnya dipublikasikan dalam makalah setebal 249 halaman. Beberapa pencapaian utama meliputi: 1. **Menyelesaikan masalah "non-sofic group"** yang diajukan Mikhail Gromov tahun 1999, dengan membangun contoh kelompok yang tak hingga dan finitely presented yang bukan sofic. Ini dianggap sebagai kemajuan bersejarah. 2. **Memecahkan batas lama dalam masalah pengepakan bola berdimensi tinggi** (sphere packing), meningkatkan batas yang telah bertahan sejak 1978 untuk dimensi tak hingga. 3. **Menyangkal dugaan "Connes Rigidity"** dengan membangun keluarga tak terhitung dari kelompok berbeda yang menghasilkan aljabar von Neumann yang sama persis. Semua bukti telah diverifikasi menggunakan asisten pembuktian formal Lean 4, memastikan ketepatannya. Para ahli matematika menyebut temuan ini sebagai **momen bersejarah**, setara dengan prestasi penghargaan Fields Medal, dan menandai kemampuan AI untuk melakukan penalaran matematika mendalam di berbagai bidang. OpenAI juga membagikan proses penalaran model, menunjukkan langkah maju yang besar menuju AGI (Artificial General Intelligence).

marsbit1j yang lalu

Pembaruan! AI Generasi Berikut OpenAI Pecahkan 10 Masalah Kelas Medali Fields

marsbit1j yang lalu

Bagaimana Membuat Diri Sendiri Tak Tergantikan oleh Kecerdasan Buatan

**Ringkasan: Bagaimana Membuat Diri Anda Tak Tergantikan oleh AI** Artikel ini membahas ancaman nyata dalam era AI: bukan kehilangan pekerjaan, tetapi "perbudakan gaji"—ketergantungan pada sistem dan orang lain untuk bertahan hidup. Solusinya adalah menjadi "individu super" yang "tak bisa dipekerjakan" dengan membangun bisnis atau karya sendiri. Kunci untuk bertahan dan berkembang di masa depan bukan sekadar keterampilan teknis, tetapi menguasai lima elemen yang sulit digantikan AI: 1. **Otonomi (Agency):** Kemampuan bertindak tanpa menunggu perintah. 2. **Rasa (Taste):** Pengalaman untuk mengetahui apa yang bernilai untuk ditawarkan. 3. **Kemampuan Persuasi (Persuasion):** Keterampilan menarik perhatian dan pengakuan. 4. **Ketekunan (Persistence):** Memahami bahwa kegagalan adalah bagian dari proses. 5. **Iterasi (Iteration):** Kemampuan memperbaiki kesalahan berdasarkan umpan balik. Lima elemen ini dapat dikembangkan dengan **membuat konten** (media). Dibandingkan pemrograman (code), konten lebih unggul karena nilainya subjektif, membutuhkan penilaian manusia, dan merupakan alat distribusi yang ampuh untuk membangun koneksi dan otoritas. Untuk memulai transformasi: 1. **Ubah lingkungan** Anda secara drastis untuk memicu perubahan identitas. 2. **Gali "bahan mentah"** Anda: Identifikasi pengetahuan mendalam, masalah yang pernah Anda selesaikan, dan minat unik masa kecil Anda. 3. **Temukan "poros pemikiran balik"**: Tentukan pendapat kontra-intuitif atau keyakinan Anda yang bertentangan dengan arus utama dalam bidang Anda. 4. **Luncurkan ide pertama** Anda besok. Gabungkan jawaban dari langkah 2 dan 3, lalu publikasikan. Umpan balik nyata dari dunia adalah guru terbaik. Intinya, bangunlah *karier seumur hidup* yang autentik berdasarkan pengalaman dan sudut pandang unik Anda. Dengan memanfaatkan AI sebagai alat dan fokus pada pengembangan diri yang tak tergantikan, Anda dapat mengambil kendali atas hidup dan masa depan Anda.

marsbit2j yang lalu

Bagaimana Membuat Diri Sendiri Tak Tergantikan oleh Kecerdasan Buatan

marsbit2j yang lalu

Kunci Bitcoin Disimpan Offline Berkat Lemparan Dadu, Tetapi Tidak Semua Orang Akan Melakukannya

Berdasarkan insiden kerentanan generator angka acak pada perangkat hardware wallet Coldcard, artikel ini membahas metode pembuatan kunci Bitcoin menggunakan dadu untuk menghasilkan entropi mandiri. Claude Shannon mengukur ketidakpastian dengan konsep entropi, di mana satu lemparan dadu enam sisi setara dengan sekitar 2,585 bit. Praktik melempar dadu 50 hingga 99 kali dapat menghasilkan frasa pemulihan 12 kata yang aman (128 bit entropi), melampaui ketergantungan pada generator perangkat. Namun, insiden Coldcard mengungkap bahwa meskipun seed utama dibuat dari dadu aman, fungsi lain seperti dompet kertas, kunci kloning, dan password masih berpotensi menggunakan generator cacat. Peneliti keamanan Kevin Loaec menekankan bahwa perlindungan hanya berlaku untuk seed utama, bukan keseluruhan sistem. Proses manual ini membutuhkan ketelitian tinggi, rentan kesalahan, dan tidak praktis bagi kebanyakan pengguna baru. Oleh karena itu, meski kuat secara matematis, metode ini lebih cocok untuk pengguna berpengalaman. Artikel menyarankan pemilik Coldcard untuk memperbarui firmware, memeriksa fungsi yang pernah digunakan, dan mempertimbangkan skema multisignature dengan perangkat dari produsen berbeda untuk mitigasi risiko. Tujuan jangka panjang adalah perangkat yang dapat menghasilkan keacakan kuat secara mandiri, tanpa memerlukan prosedur rumit dari pengguna.

cryptonews.ru5j yang lalu

Kunci Bitcoin Disimpan Offline Berkat Lemparan Dadu, Tetapi Tidak Semua Orang Akan Melakukannya

cryptonews.ru5j yang lalu

Trading

Spot

Pembodohan GPT-5.5 Terbongkar, Dokumen Resmi OpenAI Akui

Abstrak

$200/Bulan, Hanya untuk "Model Schrödinger"

Bukan Khayalan, OpenAI Sendiri yang Menulisnya Hitam di Atas Putih

OpenAI Mengakui, Lalu Tidak Ada Kelanjutannya

Setiap Peningkatan adalah "Kontroversi Pembodohan"

Hari Terkuat Saat Benchmark, Adalah Hari Peluncuran

Bacaan Terkait

Dialog dengan Ray Dalio: Saat Ini Berada dalam Gelembung AI, 1% Portofolio Investasi Adalah Bitcoin

Rekor! Beli Bersih Asing 7,2 Triliun Won dalam Sehari, Wall Street: Tekanan Likuiditas di Pasar Saham Korea Telah Mereda

Pembaruan! AI Generasi Berikut OpenAI Pecahkan 10 Masalah Kelas Medali Fields

Bagaimana Membuat Diri Sendiri Tak Tergantikan oleh Kecerdasan Buatan

Kunci Bitcoin Disimpan Offline Berkat Lemparan Dadu, Tetapi Tidak Semua Orang Akan Melakukannya

Trading

Kategori Populer

Tag Populer