Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

链捕手Dipublikasikan tanggal 2026-05-31Terakhir diperbarui pada 2026-05-31

Abstrak

Tiga tahun kemudian: Meninjau Kembali 20 Prediksi ChatGPT Saya pada 2023 Pada Maret 2023, penulis Wang Jianshuo membuat 20 prediksi intuitif tentang ChatGPT dan AI masa depan. Kini, di Mei 2026, sebuah sistem AI yang terdiri dari 41 agen menganalisis prediksi-prediksi tersebut berdasarkan data terkini. Hasilnya menunjukkan pola menarik. **Yang Terbukti Benar (Secara Umum):** * **RAG dan Arsitektur Pencarian (✅):** Solusi utama untuk pengetahuan dan halusinasi adalah dengan menambahkan "contekan" (RAG), bukan mengubah model. Arsitektur pencarian + LLM kini menjadi standar. * **LUI sebagai Benua Baru (🟢):** Antarmuka Pengguna Bahasa Alami (LUI) adalah lapisan interaksi baru yang besar, melahirkan industri agen dan protokol seperti MCP. * **Jaringan Robot dan Sistem Pengalamatan Baru (🟢):** Agen akan berkomunikasi otomatis dengan bahasa alami. Protokol seperti MCP dan ANP sedang mewujudkannya. * **Model Besar Tiongkok (🟢):** Model-model seperti DeepSeek dan Qwen telah mengejar ketertinggalan performa, meski dengan investasi lebih kecil. * **Tidak Ada Kesadaran, Tes Turing Hanya Ukur Penampilan (🟢):** AI tidak memiliki kesadaran. Tes Turing hanya mengukur ilusi kesadaran. * **Prediksi Lain yang Benar:** ChatGPT bukan AGI, tapi lompatan besar; gelombang pengangguran besar tidak terjadi; tahun besar untuk startup; momen "browser 1994" telah tiba. **Yang Kurang Tepat atau Salah:** * **Parameter GPT-4 (❌):** Prediksi 100 triliun parameter salah. Estimasi terbaru ...

Penulis: Wang Jianshuo

6 Maret 2023, ChatGPT baru keluar, GPT-4 belum dirilis, saya dan Sarah melakukan sebuah wawancara tentang ChatGPT—episode ketiga dari seri "Bahasa Sederhana" Traders' Talk (Podcast "Membahas ChatGPT dengan Bahasa Sederhana" sudah dirilis, selamat mendengarkan).

Saat itu ChatGPT baru saja muncul, sangat sedikit orang yang benar-benar menggunakannya langsung. Wawancara yang berlangsung tiga jam itu kemudian menggantung di posisi pertama kategori ChatGPT di aplikasi Xiaoyu Zhou. Di dalamnya, saya melontarkan sekitar dua puluh lebih penilaian dan prediksi sekaligus, hanya mengandalkan intuisi dan informasi terbatas, tanpa banyak data. Naskah lengkap wawancara itu masih tersimpan di akun publik.

Sekarang adalah akhir Mei 2026, tiga tahun telah berlalu, AI telah tumbuh menjadi sesuatu yang tak terbayangkan dulu.

Saya ingin melakukan satu hal: mengangkat satu per satu dua puluh butir penilaian itu, lalu dengan data terbaru yang bisa ditemukan hari ini, melakukan pencocokan secara objektif. Untuk melihat jelas bagaimana dunia berubah dalam tiga tahun, dan juga melihat dengan jelas bagian mana yang dulu saya tebak tepat, dan mana yang meleset.

Agar tidak memihak, kali ini pencocokan ini saya serahkan kepada AI untuk melakukannya: memasukkan naskah wawancara lama ke dalam sebuah workflow, dan membiarkannya menjalankan 41 agent Opus 4.8, pertama-tama memecah dua puluh butir penilaian itu satu per satu, lalu masing-masing melakukan pencarian daring untuk data terbaru, saling melakukan verifikasi silang per butir, akhirnya memberi penilaian pada Wang Jianshuo tiga tahun lalu. Sekumpulan agent ini menghabiskan sekitar 20 menit, menghabiskan 1.4 juta token (setara dengan sekitar $35), dan menghasilkan laporan di bawah ini. Penilaian-penilaian ini berasal dari mereka, bukan dari saya. Tanggal patokan ditetapkan pada Mei 2026.

Satu. Papan Skor

Simbol keputusan: ✅ Benar · 🟢 Benar Secara Umum · 🟡 Benar Sebagian · ❌ Salah

Sekilas, sebagian besar arah besar yang ditetapkan Wang Jianshuo dulu bertahan, yang benar-benar bisa dihitung salah keras hanya satu—mengatakan GPT-4 memiliki 100T parameter. Tetapi detail tersembunyi dalam hal-hal kecil: di balik hampir setiap butir yang "benar", terselip ekor yang dulu tidak tebak dengan tepat. Dari dua puluh butir, tidak ada satupun yang murni "masih belum pasti", tiga tahun cukup lama, sebagian besar hal sudah memiliki kecenderungan jawaban. Di bawah ini akan dijelaskan secara detail per kelompok.

Dua. Yang Tertebak Benar

Kesamaan kelompok ini adalah: Arah, mekanisme, bahkan ritme waktu yang dinilai Wang Jianshuo dulu semuanya tepat, salahnya hanya pada "tingkat" dan "pernyataan absolut".

RAG dan Arsitektur Pencarian (Pandangan 2, 3)

> Tahun 2023 Wang Jianshuo berkata: Metode utama menyelesaikan pengetahuan dan halusinasi bukan dengan mengubah model, tetapi dengan memasukkan pengetahuan melalui vektor pencarian sebagai "contekan"; arsitektur yang benar adalah mesin pencari melakukan pencarian, lalu hasilnya diberikan kepada LLM.

Inilah standar faktual semua produk AI hari ini. RAG menjadi arsitektur default AI perusahaan, OpenAI, Google, Anthropic semuanya menjadikannya kemampuan tingkat platform; ChatGPT Search secara harfiah adalah "pertama menggunakan indeks Bing untuk pencarian, hasilnya diberikan ke GPT, lalu menghasilkan jawaban dengan referensi". Google AI Overviews menggunakan grounding mencapai sekitar 2 miliar pengguna aktif bulanan, Perplexity sebagai perusahaan yang murni mengandalkan arsitektur ini valuasinya mencapai sekitar $200 miliar.

Saat GPT-4 belum dirilis, industri berasumsi default "menyuntikkan pengetahuan melalui fine-tuning", yang dia pertaruhkan adalah "tidak menyentuh parameter model, pencarian eksternal", mekanisme dan waktunya benar.

Harus jujur: Yang dia bayangkan adalah "pencarian statis sekali pakai", sementara realitas lebih kompleks—konteks panjang, GraphRAG, retrieval agentic semuanya datang untuk memperkuat. Debat "RAG sudah mati" tahun 2026 itu justru membuktikan arah besarnya tidak mati, yang diingkari hanyalah "pencarian sederhana sekali pakai", kesimpulannya adalah meningkatkan menjadi pencarian hybrid, bukan mundur kembali mengubah parameter model. Satu hal lagi: Istilah RAG sudah muncul dalam makalah Meta tahun 2020, bukan ciptaannya—dia hanya tepat mempertaruhkan bahwa itu akan menjadi mainstream pada periode jendela peluang.

LUI adalah Benua Baru (Pandangan 7)

> Tahun 2023 Wang Jianshuo berkata: Hal terhebat ChatGPT bukan AIGC, tetapi membuka LUI (Antarmuka Pengguna Bahasa Alami), akan seperti GUI dulu merekonstruksi interaksi manusia-komputer, menciptakan industri baru yang jauh lebih besar daripada "membuat model besar" itu sendiri.

Bagian "benua baru" ini hampir seluruhnya tepat. Bahasa alami menjadi lapisan interaksi utama massa (ChatGPT 900 juta pengguna aktif mingguan), dan menciptakan industri independen baru—agent, coding agent, lapisan protokol semuanya terwujud. Kalimat paling spesifik "jauh lebih besar daripada membuat model itu sendiri" terbukti kuat: Protokol MCP menjadi "standar sistem operasi" era LUI, tahun 2025 diadopsi secara menyeluruh oleh OpenAI, Google, Microsoft, akhir tahun dipindahkan ke Linux Foundation; Claude Code sebagai produk tunggal saja mencapai pendapatan tahunan sekitar $2.5 miliar.

Tetapi dia menggunakan kata-kata kuat seperti "merekonstruksi, menggantikan GUI", tiga tahun kemudian melihatnya adalah koeksistensi tumpang tindih, bukan menggantikan. Tiga contoh tandingan sangat keras: Laporan MIT menunjukkan 95% pilot GenAI perusahaan tidak memiliki ROI yang terukur; computer-use agent yang beroperasi langsung pada antarmuka di set pengujian, model teratas hanya sekitar 78%, baru menyentuh baseline manusia; perangkat keras bahasa murni tanpa layar hampir semuanya gagal total (Humane Pin tahun 2025 ditutup permanen). Pernyataan yang lebih tepat adalah: LUI adalah lapisan interaksi baru yang ditumpangkan di atas GUI.

Jaringan Robot dan Pencarian Alamat Baru (Pandangan 9)

> Tahun 2023 Wang Jianshuo berkata: Sekitar sepuluh tahun ke depan akan muncul "jaringan robot"—agent saling berjabat tangan secara otomatis dengan bahasa alami, saling memanggil, tidak memerlukan API tradisional lagi; akan lahir satu set sistem pencarian domain nama baru. Hal ini "dapat diselesaikan dalam dua tiga tahun".

Arahnya tepat dengan mengejutkan. MCP, A2A (sudah disumbangkan ke Linux Foundation, didukung 150+ organisasi) menyelesaikan pemanggilan silang antar agent; Agent Network Protocol langsung berdasarkan DID W3C untuk "pencarian alamat agent tanpa otoritas pusat", tujuannya adalah "jaringan kolaborasi miliaran agent"—ini sangat isomorfik dengan "sistem domain nama baru" yang dia katakan.

Dua tempat perlu diperbaiki: Pertama, "tidak memerlukan API lagi" tidak terbukti, protokol utama dasarnya adalah skema terstruktur, pada dasarnya menambahkan satu lapisan standar di atas API; Kedua, "diselesaikan dalam dua tiga tahun" tidak terwujud, data Gartner menunjukkan hingga 2026 hanya sekitar 17% organisasi yang benar-benar menerapkan agent. Menariknya, dulu sebenarnya dia melapisi perkataannya—prototipe "dua tiga tahun", matang "sekitar sepuluh tahun". Ritme prototipe tepat, siklus kematangan memang tingkat sepuluh tahun. Melihat kedua lapisan itu terpisah, kualitas butir ini lebih tinggi daripada tampilannya.

China Pasti Dapat Membuat Model Besar yang Dapat Digunakan (Pandangan 10, 20)

> Tahun 2023 Wang Jianshuo berkata: China pasti dapat membuat model besar yang dapat digunakan, kesenjangan dengan yang terdepan akan dengan cepat menyusut dalam sekitar tiga tahun (analogi browser Qihoo mengejar Netscape).

Timeline butir ini sesuai dengan mengejutkan. Stanford 2026 AI Index mengukur, kesenjangan benchmark antara model top China-AS dari 17.5–31.6 poin persentase pada Mei 2023, menyusut menjadi 2.7%; sedangkan investasi AI swasta AS adalah sekitar 23 kali lipat China—dengan input jauh lebih kecil mencapai penyusutan. DeepSeek, Qwen, Kimi, GLM menjadi mainstream global, ekosistem open source bahkan memimpin.

Tetapi kata "cepat" terlalu optimis—kematangan sesungguhnya terjadi sekitar 14 bulan kemudian, bukan "beberapa bulan". Dan ini adalah mengejar kegunaan, bukan mendefinisikan batas depan: Hingga awal 2026 masih belum ada model China yang melampaui OpenAI o3. Dalam pandangan 20 dia jelas salah: Penilaian "pintu terbuka tidak akan menutup" dibantah langsung oleh OpenAI yang secara aktif memutus API ke China pada Juli 2024, pintu ditutup oleh penyedia; dia menyebut Ernie Bot sebagai pemimpin yang justru tertinggal, yang benar-benar mengambil alih adalah DeepSeek, Doubao, Qwen yang dulu tidak menonjol.

Tidak Ada Kesadaran, Tes Turing Hanya Menguji Penampilan (Pandangan 13)

> Tahun 2023 Wang Jianshuo berkata: ChatGPT tidak memiliki kesadaran, itu adalah "pembicara tidak bermaksud, pendengar yang berlebihan"; tes Turing memang hanya menguji "apakah membuatmu mengira dia memilikinya", bukan dia benar-benar memilikinya.

Penilaian inti "menguji penampilan" ini sangat kuat, bahkan dibuktikan secara ironis oleh sebuah eksperimen: Dalam tes Turing UC San Diego 2025, GPT-4.5 dengan petunjuk "memerankan persona" dinilai sebagai manusia sebanyak 73%, lebih tinggi dari manusia sungguhan, tetapi hanya mengandalkan keterampilan akting—ini adalah anotasi terbaik untuk "hanya menguji apakah membuatmu mengira dia memilikinya".

Yang perlu ditambahkan: Pernyataan absolut kuat "mesin pasti tidak memiliki kesadaran" ini, dalam tiga tahun didorong ke area abu-abu. Anthropic mendirikan posisi riset "kesejahteraan model", memberikan probabilitas kesadaran sekitar 15%–20%, bahkan menambahkan fungsi "secara aktif mengakhiri percakapan yang disalahgunakan" untuk Claude. Ini mengubah "sama sekali tidak" menjadi "probabilitas rendah tetapi tidak bisa dikesampingkan". Namun semuanya berdasarkan "mungkin, harus diasumsikan" bukan "sudah terbukti", intinya tidak dibantah, hanya nada perkataan dulu terlalu penuh.

Lainnya yang Tertebak Benar (Pandangan 6, 11, 12, 16, 18, 19)

Bukan AGI tetapi Langkah Besar
: Keduanya bertahan. Altman sendiri di era GPT-5 masih berkata "bukan AGI, kekurangan pembelajaran berkelanjutan"; sementara medali emas IMO, ARC-AGI dari hampir nol menjadi 85%, "melangkah besar" tidak terbantahkan.
Tidak Akan Ada Gelombang Pengangguran
: April 2026 tingkat pengangguran AS hanya 4.3%. Titik buta adalah "distribusi"—penelitian Stanford menunjukkan, yang justru diambil adalah anak tangga karir tingkat pertama, pemula muda usia 22–25 tahun, mekanisme "terserap dengan lancar" gagal pada mereka.
Tidak Akan Tenggelam oleh Sampah AI
: Arah kesejahteraan bersih benar, tetapi dia sangat meremehkan besaran—konten AI sudah mencapai sekitar 52% dari halaman web baru, "AI slop" menjadi kata tahunan.
Tahun Besar untuk Startup
: Titik balik gelombang tepat, xAI (didirikan Maret 2023) sudah mencapai valuasi 2300 miliar. Tetapi dia mengunci "perusahaan besar" hanya pada tahun 2023 itu terlalu sempit—OpenAI, Anthropic yang benar-benar triliunan dolar keduanya didirikan lebih awal.
Momen Browser 1994
: Peringkat relatif terbukti, OpenAI 2025 benar-benar meluncurkan browser Atlas, mengubah metafora menjadi realitas harfiah. Hanya saja difusi ChatGPT lebih dahsyat daripada browser, metaforanya terlalu konservatif.
Prompt Ditambah Fakta Menurunkan Halusinasi
: Arah terbukti, GPT-5 tanpa jaringan tanpa pencarian tingkat halusinasinya melonjak ke 47%, membuktikan secara terbalik "fakta" adalah variabel kunci. Hanya meremehkan akar penyebabnya ada pada insentif pelatihan, bukan prompt.

Tiga. Yang Tertebak Salah, Tertebak Meleset

GPT-4 adalah 100T Parameter (Pandangan 4)—Salah Total

> Tahun 2023 Wang Jianshuo berkata: (Kabar burung) GPT-4 adalah 100T parameter, sekitar 600 kali lipat dari 175B GPT-3.

Kedua angka salah. GPT-3 adalah 175B, perkiraan terbaik bocoran Juli 2023 adalah GPT-4 sekitar 1.8T, MoE 16 expert, hanya sekitar 10 kali lipat. 100T dan kenyataan berbeda sekitar 55 kali lipat besaran. Satu-satunya sumber "100T" adalah pernyataan kedua CEO Cerebras tahun 2021 yang "sekitar", Sam Altman sudah sejak Januari 2023 menegaskan langsung bahwa diagram perbandingan itu adalah "omong kosong total".

Ucapannya dulu memberi label "kabar burung", mempertahankan ketidakpastian. Lebih dalam lagi, kerangka "menggunakan kelipatan parameter untuk mengukur generasi" itu sendiri sudah ketinggalan zaman: OpenAI kemudian GPT-4.5, GPT-5 tidak lagi memublikasikan jumlah parameter. Ini satu-satunya butir salah keras dengan angka salah dan perspektif usang.

Matematika LLM (Pandangan 1)—Diagnosis Benar, Kesimpulan Pengunci Salah

> Tahun 2023 Wang Jianshuo berkata: Matematika LLM buruk adalah hakikat, membuatnya sendiri belajar matematika tidak mungkin dan tidak perlu, cara yang benar adalah memasang alat eksternal.

"Diagnosis ditambah rute alat" benar semua—akar penyebabnya memang generasi token demi token menyebabkan ketidakandalan pembulatan (makalah mekanisme 2025 secara tepat membuktikan intuisi "digit terakhir sering benar, digit tengah salah"); alat eksternal peningkatannya juga besar (o4-mini ketika diizinkan menggunakan Python, AIME 2025 mencapai 99.5%).

Salah pada kata-kata pengunci seperti "tidak mungkin, tidak perlu". "Tidak mungkin" dibuktikan salah—Juli 2025 Gemini Deep Think dan model OpenAI di IMO menggunakan bahasa alami murni, tanpa alat mendapatkan medali emas. Titik balik kunci adalah "model reasoning" yang baru muncul tahun 2024–2025, ini tidak bisa diprediksi pada Maret 2023—jadi untuk prediksi ini sebaiknya menilai arahnya dengan toleransi, bukan mencela waktu.

Penangkapan Nilai (Pandangan 8)—Pertaruhan Setengah Benar, Pernyataan Inti Terbalik

> Tahun 2023 Wang Jianshuo berkata: Nilai akhirnya akan jatuh di lapisan aplikasi, perusahaan yang membuka lapisan dasar (pembuat model) akhirnya belum tentu menghasilkan uang.

Uang memang mulai mengalir ke lapisan aplikasi (Cursor tiga tahun mencapai pendapatan tahunan 20 miliar)—ini setengah benar. Tetapi "pembuat lapisan dasar tidak menghasilkan uang" dibantah langsung oleh Nvidia: Laba bersih FY2026 sekitar $1200 miliar, kapitalisasi pasar 5 triliun+, adalah satu-satunya di pasar yang jelas menghasilkan keuntungan besar. Sedangkan lapisan model yang dia isyaratkan akan menang (OpenAI 2026 diperkirakan rugi sekitar $140 miliar) justru paling mirip dengan "lapisan dasar membakar uang tidak menghasilkan uang" yang dia katakan.

Dia tidak membedakan "lapisan dasar daya komputasi" dan "lapisan dasar model", juga tidak membedakan "pendapatan" dan "laba". Nilai pada tahun 2026 lebih ekstrem ditangkap oleh lapisan daya komputasi daripada tahun 2023, bukan berpindah ke lapisan aplikasi. Perlu ditambahkan: Yang merugi adalah penyedia cloud yang membeli chip, bukan Nvidia yang menjual chip—ini justru tempat kesalahan analogi "overbuild rel kereta api"-nya.

Hak Cipta (Pandangan 14)—Pendaftaran Benar, Menghindari Pelanggaran Salah

> Tahun 2023 Wang Jianshuo berkata: Konten buatan AI mungkin menghindari hak cipta (melindungi ekspresi bukan ide); hasil generasi mungkin tidak melanggar, juga tidak dapat didaftarkan.

"Tidak dapat didaftarkan" menjadi fakta hukum yang mapan (2025 Kantor Hak Cipta AS jelas menyatakan "hanya memasukkan prompt tidak cukup untuk mengklaim kepengarangan"). Tetapi "menghindari pelanggaran" jelas salah: Pengadilan berulang kali menentukan output AI jika mirip substansial dengan karya asli tetap melanggar hak cipta; Anthropic karena data pelatihan bajakan menyelesaikan dengan ganti rugi $1.5 miliar, ganti rugi hak cipta terbesar dalam sejarah AS. AI tidak hanya tidak "menghindari" hak cipta, malah membayar harga terbesar dalam sejarah.

Dunia Satu (Pandangan 15)—Mekanisme Benar, Tren Pertaruhan Terbalik

> Tahun 2023 Wang Jianshuo berkata: ChatGPT melakukan "rata-rata tertimbang" pada pandangan manusia, dapat melawan kapsul informasi ala TikTok, memberikan kemungkinan "dunia satu".

Lapisan mekanisme benar—2025 beberapa penelitian secara pasti membuktikan LLM menekan pandangan ke arah mayoritas, secara sistematis meremehkan minoritas. Tetapi penilaian sosialnya bertaruh terbalik: Dia sendiri menambahkan "setidaknya sekarang bukan seribu orang seribu wajah", dalam tiga tahun dibantah—OpenAI sejak April 2025 menjadikan memori lintas percakapan dan personalisasi sebagai kemampuan default, AI sedang bergerak cepat ke arah seribu orang seribu wajah. Yang lebih krusial, dia membayangkan "rata-rata tertimbang" sebagai angka konvensi dunia netral, tetapi pengukuran menunjukkan itu adalah pergeseran berarah, ditambah menjilat, dapat digunakan untuk memanipulasi posisi secara aktif—ini mengarah ke "menciptakan kapsul baru", bukan "menghilangkan polarisasi".

Perang Lokal dan Biaya (Pandangan 17)—Kualitatif Benar Semua, Kuantitatif Terbantah

> Tahun 2023 Wang Jianshuo berkata: Membuat model besar lagi akan dengan cepat menjadi "perang lokal", biaya dapat diketahui (menghilangkan jalan memutar sekitar 5-10 miliar dolar AS puncaknya), akan banyak pemain masuk.

Arah kualitatif benar dengan mengejutkan—banyak pemain masuk, cepat dikomersialkan, open source menyusul closed source, semuanya terwujud. Tetapi angka keras "5-10 miliar puncak" ini kedua ujung salah: Ujung depan sangat diremehkan (tingkat GPT-5 tahun 2026 mencapai 2-5 miliar dolar AS pelatihan, ditambah pusat data triliunan dolar dan Stargate 5000 miliar); ujung replika justru dianggap terlalu tinggi (DeepSeek menekan biaya pelatihan marjinal ke tingkat jutaan dolar AS). "Biaya" model yang sama menurut cara menghitung bisa berbeda 200 kali lipat, hanya saja tidak berada di rentang yang dia berikan.

Kemampuan Muncul (Pandangan 5)—Arah Benar, Angka dan Kerangka Salah

> Tahun 2023 Wang Jianshuo berkata: Di atas sekitar 60B parameter muncul kemampuan baru yang tidak ada dalam data mentah, dan peneliti juga tidak dapat menjelaskannya.

Intuisi arah terbukti, tetapi dua tempat ekspresi tidak bertahan: Pertama, tidak ada "ambang batas 60B" yang seragam—ambang batas nyata chain of thought sekitar 100B, kemampuan berbeda muncul pada skala 13B hingga 540B yang tidak sama; Kedua, "tidak dapat menjelaskan" pada akhir 2023 sudah ditantang oleh makalah terpilih NeurIPS—banyak "mutasi" adalah ilusi yang disebabkan oleh pemilihan metrik evaluasi, setelah mengganti metrik kontinu kurvanya halus dan dapat diprediksi. Adilnya, dulu dia mengulangi narasi yang benar-benar mainstream, yang benar-benar dapat dikoreksi adalah menganggap "60B" sebagai ambang batas keras, dan menganggap "tidak dapat menjelaskan" sebagai kesimpulan kualitatif.

Empat. Menilik Kembali Tiga Tahun, Beberapa Pola

Setelah mencocokkan satu per satu, mundur selangkah melihat, dalam dua puluh penilaian Wang Jianshuo ini tersembunyi beberapa pola yang lebih layak diingat daripada setiap butir tunggal.

Satu. Arah jauh lebih dapat diandalkan daripada angka dan tingkat. Dari dua puluh butir, semua yang menilai mekanisme dan arah (RAG, LUI, jaringan robot, tes Turing), hampir semua tepat; semua yang memberikan angka spesifik atau pernyataan pengunci (100T parameter, ambang batas 60B, biaya 5-10 miliar, matematika "tidak mungkin"), hampir semua salah. Untuk bidang yang berubah cepat, pertaruhkan arah, pertaruhkan mekanisme, sedikit pertaruhkan angka tepat, dan lebih waspada terhadap kata-kata seperti "tidak mungkin, pasti, puncak, sama sekali tidak" yang membuat perkataan penuh—ini adalah area frekuensi tinggi yang ditampar waktu.

Dua. Dalam waktu, dia cenderung melebih-lebihkan kecepatan, meremehkan tingkat. Semua yang mengatakan "cepat, diselesaikan dalam dua tiga tahun", periode matangnya umum lebih lambat; tetapi untuk plafon lompatan kemampuan justru diremehkan—matematika bisa dari "tidak mungkin" menjadi medali emas IMO, biaya depan bisa naik ke tingkat yang tak terbayangkan dulu. Satu kalimat: terlalu optimis jangka pendek, terlalu konservatif jangka panjang.

Tiga. Kesalahan paling tersembunyi, berulang muncul pada "distribusi". Bukan arah salah, tetapi hanya melihat total, mengabaikan distribusi. "Tidak akan ada gelombang pengangguran" benar, tetapi kerusakan sangat terkonsentrasi pada pemula muda; "Nilai jatuh di lapisan aplikasi" benar setengah, tetapi tidak membedakan lapisan daya komputasi dan lapisan model. Total benar, menutupi bencana distribusi—ini adalah pelajaran yang paling harus ditambahkan.

Empat. Tempat yang membuat perkataan dengan ruang, tiga tahun kemudian dapat diuji. "Kabar burung" "setidaknya sekarang" "menurunkan secara signifikan bukan menghilangkan" "prototipe dua tiga tahun, matang sekitar sepuluh tahun"—semua penilaian yang dulu membawa kata pembatas, berlapis, hari ini dilihat kembali lebih dapat bertahan. Sebaliknya, kalimat absolut yang keluar tanpa berpikir, paling mudah terbalik. Kejujuran prediksi, setengahnya berani berkata, setengah lainnya berani menandai ketidakpastian sendiri.

Lima. Beberapa masalah, tiga tahun sama sekali tidak cukup. Nilai akhirnya milik siapa, muncul bukan kebenaran berubah, mesin sebenarnya punya tidak secuil kesadaran, konteks panjang akan makan RAG—perdebatan-perdebatan ini dulu, hingga 2026 masih tetap perdebatan. Dapat membedakan "yang sudah ada jawabannya" dan "yang masih harus ditunggu", lebih penting daripada buru-buru memberi kesimpulan untuk setiap hal.

Wang Jianshuo tiga tahun lalu, mengandalkan intuisi dalam kabut sebelum GPT-4 keluar, menunjuk dua puluh arah. Hari ini setelah mencocokkan, kalimat yang paling harus diingat mungkin adalah: Melihat arah besar benar sebenarnya tidak terlalu sulit, sulitnya adalah mengakui bahwa diri sendiri dalam angka, kecepatan, dan distribusi berulang kali berpikir seenaknya. Dua puluh butir pencocokan ini, lebih tepatnya adalah memberi nilai masa lalu, lebih baik lagi adalah mendirikan beberapa aturan untuk tiga tahun ke depan. Tiga tahun berikutnya, 2029 datang lagi untuk mencocokkan sekali lagi.

Pertanyaan Terkait

QArtikel ini mencoba menilai prediksi tahun 2023 tentang ChatGPT. Apakah metode penilaian yang digunakan? Mengapa metode ini dipilih?

AMetode penilaiannya adalah 'membuat timbangan' secara objektif menggunakan AI. Penulis memberikan transkrip wawancara 2023 ke dalam sebuah workflow yang menjalankan 41 agen AI Opus 4.8. Agen-agen ini secara mandiri memisahkan 20 prediksi, mencari data terbaru secara online, memverifikasi silang, dan memberikan penilaian akhir. Metode ini dipilih untuk menghindari bias subjektif penulis dan memastikan objektivitas penilaian dengan data faktual terkini (per Mei 2026). Proses ini menghabiskan sekitar 20 menit dan 1.4 juta token.

QDari 20 prediksi Wang Jianshuo tahun 2023, area atau prediksi apa saja yang ternyata paling akurat?

APrediksi yang paling akurat cenderung pada arah dan mekanisme perkembangan teknologi, seperti: (1) Dominasi arsitektur RAG (Retrieval-Augmented Generation) untuk memasukkan pengetahuan ke dalam LLM. (2) Munculnya 'LUI' (Bahasa Alami Antarmuka Pengguna) sebagai lapisan interaksi baru yang signifikan. (3) Kemunculan 'jaringan robot' (agent network) dengan protokol komunikasi baru. (4) China mampu membuat model besar yang dapat digunakan dan mengejar ketertinggalannya. (5) ChatGPT tidak memiliki kesadaran, dan uji Turing hanya mengukur persepsi.

QKesalahan atau kekeliruan signifikan apa yang teridentifikasi dalam prediksi tahun 2023 tersebut?

ABeberapa kesalahan signifikan meliputi: (1) **Kesalahan Fakta Keras**: Mempercayai rumor bahwa parameter GPT-4 adalah 100T (padahal kenyataannya sekitar 1.8T). (2) **Pernyataan Terlalu Mutlak**: Menyatakan LLM 'tidak mungkin' belajar matematika sendiri (ternyata model penalaran murni kemudian memenangkan medali emas IMO). (3) **Kesalahan Arah Inti**: Mengira nilai akan ditangkap oleh lapisan aplikasi, bukan pembuat model dasar (kenyataannya, nilai tertinggi justru di lapisan komputasi/hardware seperti Nvidia). (4) **Kesalahan tentang Hak Cipta**: Mengira AI dapat 'menghindari' pelanggaran hak cipta (kenyataannya, ada ganti rugi dan penyelesaian kasus hak cipta terbesar karena data pelatihan AI).

QApa pola atau pelajaran umum yang bisa diambil dari hasil peninjauan kembali setelah tiga tahun ini?

APelajaran umum yang teridentifikasi adalah: (1) **Arah dan mekanisme lebih andal daripada angka dan tingkat kepastian**. Prediksi yang memberikan angka spesifik atau kata-kata mutlak (seperti 'tidak mungkin') cenderung salah. (2) **Kecenderungan melebih-lebihkan kecepatan, meremehkan skalanya**. Perkiraan waktu ('cepat', '2-3 tahun') seringkali terlalu optimis, tetapi lompatan kemampuan atau skala biaya justru melebihi perkiraan. (3) **Kesalahan tersembunyi sering ada pada 'distribusi'**. Prediksi mungkin benar secara agregat (misal, 'tidak ada gelombang pengangguran'), tetapi mengabaikan dampak buruk yang terkonsentrasi pada kelompok tertentu (misal, lulusan baru). (4) **Pernyataan yang disertai batasan atau ruang ketidakpastian lebih tahan uji waktu**.

QMenurut artikel, apa peran China dalam perkembangan AI global selama tiga tahun ini berdasarkan prediksi awal?

ABerdasarkan prediksi awal bahwa 'China pasti bisa membuat model besar yang dapat digunakan', perkembangan aktualnya menunjukkan bahwa prediksi arah ini akurat, bahkan melebihi perkiraan waktu. Laporan Stanford 2026 menunjukkan kesenjangan kemampuan antara model top China dan AS telah menyempit secara signifikan (dari 17.5–31.6 poin persentase menjadi hanya 2.7%). Pencapaian ini diraih dengan investasi yang jauh lebih kecil dibanding AS. Model-model seperti DeepSeek, Qwen, Kimi, dan GLM telah menjadi pemain global utama, dengan ekosistem sumber terbuka yang bahkan memimpin. Namun, penilaian bahwa 'pintu tidak akan tertutup' ternyata salah, karena OpenAI memutuskan akses API ke China pada Juli 2024.

Bacaan Terkait

Harga $100.000 per Bulan: Truth Social Jual Akses ke Postingan Trump ke Perusahaan Investasi

Trump Media and Technology Group (TMTG) meluncurkan layanan berlangganan premium bernama Truth API pada 1 Agustus 2026. Layanan ini memberikan akses langsung dan real-time untuk firma investasi institusional ke postingan dari akun-akun paling berpengaruh di Truth Social, termasuk akun mantan Presiden Donald Trump. Akses ini dikirim dalam milidetik, mencakup arsip sejak 2022, dan beroperasi 24/7. Menurut laporan, TMTG menawarkan langganan hingga $100.000 per bulan, dengan diskon untuk kontrak jangka panjang. Peluncuran ini mendapat kritik dari beberapa senator AS dari kedua partai. Mereka mempertanyakan etika menjual akses istimewa ke postingan seorang presiden dan meminta SEC untuk menyelidiki apakah hal ini melanggar hukum. TMTG membela diri dengan menyatakan bahwa ini adalah strategi bisnis sah untuk menghasilkan pendapatan berulang. Analisis AI dalam artikel memperingatkan risiko yang mirip dengan insiden pasar tahun 2013, di mana algoritme perdagangan bereaksi terhadap berita palsu. Truth API dapat mengubah akun Trump menjadi titik kritis sinyal pasar, yang berpotensi menjadi target peretasan atau manipulasi, tanpa mekanisme verifikasi keaslian postingan yang jelas dalam waktu nyata.

cryptonews.ru25m yang lalu

Harga $100.000 per Bulan: Truth Social Jual Akses ke Postingan Trump ke Perusahaan Investasi

cryptonews.ru25m yang lalu

Strategi Mempertahankan Dividen STRC Preferen di 12% karena Harga Masih di Bawah Par

Saham preferen STRC Strategy tetap membayar dividen 12% untuk Agustus, meskipun harganya masih di bawah nilai pari $100. Harga saham ditutup pada $89.46 di akhir Juli, mengalami kenaikan 5.42% untuk bulan tersebut. Chairman Michael Saylor menyampaikan bahwa dividen akan terus dibayar dua kali sebulan. CEO Phong Le menegaskan kembali tujuan perusahaan agar STRC diperdagangkan pada kisaran $99-$100. Perusahaan melaporkan kerugian bersih kuartal II sebesar $8.22 miliar, terutama karena kerugian belum terealisasi pada kepemilikan Bitcoinnya seiring penurunan harga kripto tersebut. Namun, Strategy telah membangun cadangan tunai sebesar $3.75 miliar untuk mendukung pembayaran dividen saham preferen dan kewajiban bunga, yang diklaim cukup untuk lebih dari dua tahun. Perusahaan juga telah membeli kembali $25 juta saham preferen STRC-nya dengan diskon dan berencana melanjutkan pembelian selama harganya di bawah $100.

cointelegraph1j yang lalu

Strategi Mempertahankan Dividen STRC Preferen di 12% karena Harga Masih di Bawah Par

cointelegraph1j yang lalu

Penarikan Bitcoin Terus Berlanjut: Penyimpanan 8 Tahun di Dompet Dingin Coldcard Berakhir dengan Nol

Dompet keras Coldcard Dihack, Aset Bitcoin Senilai $88,6 Juta Dicuri Dompet keras Coldcard mengalami kerentanan keamanan serius, menyebabkan gelombang penarikan paksa dana pengguna. Menurut Galaxy Research, total 1.367,05 BTC (sekitar $88,6 juta) telah dicuri dari 4.585 alamat yang rentan. Masalahnya bukan pada perangkat lunak (firmware), yang sudah diperbarui oleh pengembang Coinkite. Akar masalahnya ada pada seed phrase (frasa pemulihan) yang dihasilkan oleh perangkat antara Maret 2021 dan versi firmware tertentu. Kesalahan pemrograman menyebabkan generator angka acak perangkat beralih dari komponen keras ke generator perangkat lunak (Yasmarang) yang dapat diprediksi. Seed phrase yang dibuat dalam periode rentan ini dapat ditebak melalui serangan brute-force secara offline. Perangkat yang terdampak mencakup model Mk2/Mk3 (firmware 4.0.1–4.1.9), Mk4/Mk5 (sebelum v5.6.0), dan Q (sebelum v1.5.0Q). Satu-satunya cara untuk mengamankan dana adalah dengan membuat seed phrase BARU pada firmware yang telah diperbaiki dan memindahkan semua aset ke alamat baru tersebut. Memperbarui firmware saja tidak mengubah seed phrase lama yang sudah rentan. Insiden ini menghancurkan bagi investor jangka panjang. Satu korban, seorang pria 39 tahun, kehilangan 2 BTC ($130.000) yang ia kumpulkan selama 8 tahun melalui kerja keras. Ia menggunakan Bitcoin sebagai lindung nilai terhadap hiperinflasi di negaranya dan menyimpannya dengan aman di dompet dingin untuk pensiun dini. Pencurian instan ini menghancurkan rencananya dan mengungkap kerapuhan strategi 'simpan dan lupakan' meski dengan perangkat keras sekalipun. Kasus ini mengingatkan pada insiden serupa di masa lalu di mana kelemahan generator angka acak merusak keamanan kriptografi. Ini mempertanyakan asumsi bahwa penyimpanan offline selalu identik dengan keamanan mutlak.

cryptonews.ru1j yang lalu

Penarikan Bitcoin Terus Berlanjut: Penyimpanan 8 Tahun di Dompet Dingin Coldcard Berakhir dengan Nol

cryptonews.ru1j yang lalu

Korea Selatan Melihat Ledakan Volume Perdagangan 15 Altcoin!

Pertukaran cryptocurrency besar Korea Selatan, Upbit dan Bithumb, mencatat pertumbuhan signifikan dalam volume perdagangan beberapa altcoin. Dalam 24 jam terakhir, total volume perdagangan 15 altcoin populer mencapai sekitar $347,7 juta. MetaDAO (META) memimpin dengan volume perdagangan $65,84 juta hanya di Upbit. Euler (EUL) menempati posisi kedua dengan total $47,65 juta, diikuti oleh XRP dengan $38,11 juta. Altcoin lain yang juga mencatat volume tinggi antara lain ThunderCore (TT), Babylon (BABY), dan Geodnet (GEOD). Berikut adalah 15 altcoin dengan volume perdagangan tertinggi di Upbit dan Bithumb: 1) META ($65,84 juta), 2) EUL ($47,65 juta), 3) XRP ($38,11 juta), 4) TT ($35,64 juta), 5) BABY ($25,15 juta), 6) GEOD ($20,28 juta), 7) HYPER ($19,72 juta), 8) MMT ($17,67 juta), 9) ONDO ($15,65 juta), 10) SHIB ($10,55 juta), 11) DOOM ($9,61 juta), 12) BANK ($9,51 juta), 13) AKT ($7,36 juta), 14) DOGE ($7,30 juta), 15) WLD ($5,74 juta). *Ini bukan rekomendasi investasi.

cryptonews.ru3j yang lalu

Korea Selatan Melihat Ledakan Volume Perdagangan 15 Altcoin!

cryptonews.ru3j yang lalu

Perusahaan Donald Trump Menjual Lagi Sejumlah Besar Bitcoin!

Perusahaan milik Donald Trump, Trump Media & Technology Group, diduga kembali mentransfer sejumlah besar Bitcoin ke bursa kripto CryptoCom. Data analisis blockchain menunjukkan sekitar 2.628 BTC, senilai kurang lebih $165 juta, dipindahkan dari alamat yang dikaitkan dengan perusahaan tersebut. Sebelumnya, perusahaan dilaporkan membeli total 11.542 BTC dengan harga rata-rata $118.500 per koin. Sejak 2026, sekitar 7.281 BTC telah ditarik dari alamat-alamat ini, dengan sisa sekitar 4.261 BTC yang masih disimpan. Kerugian total Trump Media dari investasi Bitcoin ini, baik yang telah direalisasikan maupun belum, diperkirakan mencapai sekitar $555 juta. Penting untuk dicatat bahwa pengiriman aset ke bursa kripto tidak selalu berarti penjualan. Transfer bisa dilakukan untuk keperluan penyimpanan, pengelolaan likuiditas, atau operasi keuangan lainnya. Meski demikian, perpindahan dari dompet "dingin" ke bursa terpusat sering dianggap sebagai indikasi persiapan penjualan.

cryptonews.ru5j yang lalu