Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

链捕手Dipublikasikan tanggal 2026-05-31Terakhir diperbarui pada 2026-05-31

Abstrak

Tiga tahun kemudian: Meninjau Kembali 20 Prediksi ChatGPT Saya pada 2023 Pada Maret 2023, penulis Wang Jianshuo membuat 20 prediksi intuitif tentang ChatGPT dan AI masa depan. Kini, di Mei 2026, sebuah sistem AI yang terdiri dari 41 agen menganalisis prediksi-prediksi tersebut berdasarkan data terkini. Hasilnya menunjukkan pola menarik. **Yang Terbukti Benar (Secara Umum):** * **RAG dan Arsitektur Pencarian (✅):** Solusi utama untuk pengetahuan dan halusinasi adalah dengan menambahkan "contekan" (RAG), bukan mengubah model. Arsitektur pencarian + LLM kini menjadi standar. * **LUI sebagai Benua Baru (🟢):** Antarmuka Pengguna Bahasa Alami (LUI) adalah lapisan interaksi baru yang besar, melahirkan industri agen dan protokol seperti MCP. * **Jaringan Robot dan Sistem Pengalamatan Baru (🟢):** Agen akan berkomunikasi otomatis dengan bahasa alami. Protokol seperti MCP dan ANP sedang mewujudkannya. * **Model Besar Tiongkok (🟢):** Model-model seperti DeepSeek dan Qwen telah mengejar ketertinggalan performa, meski dengan investasi lebih kecil. * **Tidak Ada Kesadaran, Tes Turing Hanya Ukur Penampilan (🟢):** AI tidak memiliki kesadaran. Tes Turing hanya mengukur ilusi kesadaran. * **Prediksi Lain yang Benar:** ChatGPT bukan AGI, tapi lompatan besar; gelombang pengangguran besar tidak terjadi; tahun besar untuk startup; momen "browser 1994" telah tiba. **Yang Kurang Tepat atau Salah:** * **Parameter GPT-4 (❌):** Prediksi 100 triliun parameter salah. Estimasi terbaru ...

Penulis: Wang Jianshuo

6 Maret 2023, ChatGPT baru keluar, GPT-4 belum dirilis, saya dan Sarah melakukan sebuah wawancara tentang ChatGPT—episode ketiga dari seri "Bahasa Sederhana" Traders' Talk (Podcast "Membahas ChatGPT dengan Bahasa Sederhana" sudah dirilis, selamat mendengarkan).

Saat itu ChatGPT baru saja muncul, sangat sedikit orang yang benar-benar menggunakannya langsung. Wawancara yang berlangsung tiga jam itu kemudian menggantung di posisi pertama kategori ChatGPT di aplikasi Xiaoyu Zhou. Di dalamnya, saya melontarkan sekitar dua puluh lebih penilaian dan prediksi sekaligus, hanya mengandalkan intuisi dan informasi terbatas, tanpa banyak data. Naskah lengkap wawancara itu masih tersimpan di akun publik.

Sekarang adalah akhir Mei 2026, tiga tahun telah berlalu, AI telah tumbuh menjadi sesuatu yang tak terbayangkan dulu.

Saya ingin melakukan satu hal: mengangkat satu per satu dua puluh butir penilaian itu, lalu dengan data terbaru yang bisa ditemukan hari ini, melakukan pencocokan secara objektif. Untuk melihat jelas bagaimana dunia berubah dalam tiga tahun, dan juga melihat dengan jelas bagian mana yang dulu saya tebak tepat, dan mana yang meleset.

Agar tidak memihak, kali ini pencocokan ini saya serahkan kepada AI untuk melakukannya: memasukkan naskah wawancara lama ke dalam sebuah workflow, dan membiarkannya menjalankan 41 agent Opus 4.8, pertama-tama memecah dua puluh butir penilaian itu satu per satu, lalu masing-masing melakukan pencarian daring untuk data terbaru, saling melakukan verifikasi silang per butir, akhirnya memberi penilaian pada Wang Jianshuo tiga tahun lalu. Sekumpulan agent ini menghabiskan sekitar 20 menit, menghabiskan 1.4 juta token (setara dengan sekitar $35), dan menghasilkan laporan di bawah ini. Penilaian-penilaian ini berasal dari mereka, bukan dari saya. Tanggal patokan ditetapkan pada Mei 2026.

Satu. Papan Skor

Simbol keputusan: ✅ Benar · 🟢 Benar Secara Umum · 🟡 Benar Sebagian · ❌ Salah

Sekilas, sebagian besar arah besar yang ditetapkan Wang Jianshuo dulu bertahan, yang benar-benar bisa dihitung salah keras hanya satu—mengatakan GPT-4 memiliki 100T parameter. Tetapi detail tersembunyi dalam hal-hal kecil: di balik hampir setiap butir yang "benar", terselip ekor yang dulu tidak tebak dengan tepat. Dari dua puluh butir, tidak ada satupun yang murni "masih belum pasti", tiga tahun cukup lama, sebagian besar hal sudah memiliki kecenderungan jawaban. Di bawah ini akan dijelaskan secara detail per kelompok.

Dua. Yang Tertebak Benar

Kesamaan kelompok ini adalah: Arah, mekanisme, bahkan ritme waktu yang dinilai Wang Jianshuo dulu semuanya tepat, salahnya hanya pada "tingkat" dan "pernyataan absolut".

RAG dan Arsitektur Pencarian (Pandangan 2, 3)

> Tahun 2023 Wang Jianshuo berkata: Metode utama menyelesaikan pengetahuan dan halusinasi bukan dengan mengubah model, tetapi dengan memasukkan pengetahuan melalui vektor pencarian sebagai "contekan"; arsitektur yang benar adalah mesin pencari melakukan pencarian, lalu hasilnya diberikan kepada LLM.

Inilah standar faktual semua produk AI hari ini. RAG menjadi arsitektur default AI perusahaan, OpenAI, Google, Anthropic semuanya menjadikannya kemampuan tingkat platform; ChatGPT Search secara harfiah adalah "pertama menggunakan indeks Bing untuk pencarian, hasilnya diberikan ke GPT, lalu menghasilkan jawaban dengan referensi". Google AI Overviews menggunakan grounding mencapai sekitar 2 miliar pengguna aktif bulanan, Perplexity sebagai perusahaan yang murni mengandalkan arsitektur ini valuasinya mencapai sekitar $200 miliar.

Saat GPT-4 belum dirilis, industri berasumsi default "menyuntikkan pengetahuan melalui fine-tuning", yang dia pertaruhkan adalah "tidak menyentuh parameter model, pencarian eksternal", mekanisme dan waktunya benar.

Harus jujur: Yang dia bayangkan adalah "pencarian statis sekali pakai", sementara realitas lebih kompleks—konteks panjang, GraphRAG, retrieval agentic semuanya datang untuk memperkuat. Debat "RAG sudah mati" tahun 2026 itu justru membuktikan arah besarnya tidak mati, yang diingkari hanyalah "pencarian sederhana sekali pakai", kesimpulannya adalah meningkatkan menjadi pencarian hybrid, bukan mundur kembali mengubah parameter model. Satu hal lagi: Istilah RAG sudah muncul dalam makalah Meta tahun 2020, bukan ciptaannya—dia hanya tepat mempertaruhkan bahwa itu akan menjadi mainstream pada periode jendela peluang.

LUI adalah Benua Baru (Pandangan 7)

> Tahun 2023 Wang Jianshuo berkata: Hal terhebat ChatGPT bukan AIGC, tetapi membuka LUI (Antarmuka Pengguna Bahasa Alami), akan seperti GUI dulu merekonstruksi interaksi manusia-komputer, menciptakan industri baru yang jauh lebih besar daripada "membuat model besar" itu sendiri.

Bagian "benua baru" ini hampir seluruhnya tepat. Bahasa alami menjadi lapisan interaksi utama massa (ChatGPT 900 juta pengguna aktif mingguan), dan menciptakan industri independen baru—agent, coding agent, lapisan protokol semuanya terwujud. Kalimat paling spesifik "jauh lebih besar daripada membuat model itu sendiri" terbukti kuat: Protokol MCP menjadi "standar sistem operasi" era LUI, tahun 2025 diadopsi secara menyeluruh oleh OpenAI, Google, Microsoft, akhir tahun dipindahkan ke Linux Foundation; Claude Code sebagai produk tunggal saja mencapai pendapatan tahunan sekitar $2.5 miliar.

Tetapi dia menggunakan kata-kata kuat seperti "merekonstruksi, menggantikan GUI", tiga tahun kemudian melihatnya adalah koeksistensi tumpang tindih, bukan menggantikan. Tiga contoh tandingan sangat keras: Laporan MIT menunjukkan 95% pilot GenAI perusahaan tidak memiliki ROI yang terukur; computer-use agent yang beroperasi langsung pada antarmuka di set pengujian, model teratas hanya sekitar 78%, baru menyentuh baseline manusia; perangkat keras bahasa murni tanpa layar hampir semuanya gagal total (Humane Pin tahun 2025 ditutup permanen). Pernyataan yang lebih tepat adalah: LUI adalah lapisan interaksi baru yang ditumpangkan di atas GUI.

Jaringan Robot dan Pencarian Alamat Baru (Pandangan 9)

> Tahun 2023 Wang Jianshuo berkata: Sekitar sepuluh tahun ke depan akan muncul "jaringan robot"—agent saling berjabat tangan secara otomatis dengan bahasa alami, saling memanggil, tidak memerlukan API tradisional lagi; akan lahir satu set sistem pencarian domain nama baru. Hal ini "dapat diselesaikan dalam dua tiga tahun".

Arahnya tepat dengan mengejutkan. MCP, A2A (sudah disumbangkan ke Linux Foundation, didukung 150+ organisasi) menyelesaikan pemanggilan silang antar agent; Agent Network Protocol langsung berdasarkan DID W3C untuk "pencarian alamat agent tanpa otoritas pusat", tujuannya adalah "jaringan kolaborasi miliaran agent"—ini sangat isomorfik dengan "sistem domain nama baru" yang dia katakan.

Dua tempat perlu diperbaiki: Pertama, "tidak memerlukan API lagi" tidak terbukti, protokol utama dasarnya adalah skema terstruktur, pada dasarnya menambahkan satu lapisan standar di atas API; Kedua, "diselesaikan dalam dua tiga tahun" tidak terwujud, data Gartner menunjukkan hingga 2026 hanya sekitar 17% organisasi yang benar-benar menerapkan agent. Menariknya, dulu sebenarnya dia melapisi perkataannya—prototipe "dua tiga tahun", matang "sekitar sepuluh tahun". Ritme prototipe tepat, siklus kematangan memang tingkat sepuluh tahun. Melihat kedua lapisan itu terpisah, kualitas butir ini lebih tinggi daripada tampilannya.

China Pasti Dapat Membuat Model Besar yang Dapat Digunakan (Pandangan 10, 20)

> Tahun 2023 Wang Jianshuo berkata: China pasti dapat membuat model besar yang dapat digunakan, kesenjangan dengan yang terdepan akan dengan cepat menyusut dalam sekitar tiga tahun (analogi browser Qihoo mengejar Netscape).

Timeline butir ini sesuai dengan mengejutkan. Stanford 2026 AI Index mengukur, kesenjangan benchmark antara model top China-AS dari 17.5–31.6 poin persentase pada Mei 2023, menyusut menjadi 2.7%; sedangkan investasi AI swasta AS adalah sekitar 23 kali lipat China—dengan input jauh lebih kecil mencapai penyusutan. DeepSeek, Qwen, Kimi, GLM menjadi mainstream global, ekosistem open source bahkan memimpin.

Tetapi kata "cepat" terlalu optimis—kematangan sesungguhnya terjadi sekitar 14 bulan kemudian, bukan "beberapa bulan". Dan ini adalah mengejar kegunaan, bukan mendefinisikan batas depan: Hingga awal 2026 masih belum ada model China yang melampaui OpenAI o3. Dalam pandangan 20 dia jelas salah: Penilaian "pintu terbuka tidak akan menutup" dibantah langsung oleh OpenAI yang secara aktif memutus API ke China pada Juli 2024, pintu ditutup oleh penyedia; dia menyebut Ernie Bot sebagai pemimpin yang justru tertinggal, yang benar-benar mengambil alih adalah DeepSeek, Doubao, Qwen yang dulu tidak menonjol.

Tidak Ada Kesadaran, Tes Turing Hanya Menguji Penampilan (Pandangan 13)

> Tahun 2023 Wang Jianshuo berkata: ChatGPT tidak memiliki kesadaran, itu adalah "pembicara tidak bermaksud, pendengar yang berlebihan"; tes Turing memang hanya menguji "apakah membuatmu mengira dia memilikinya", bukan dia benar-benar memilikinya.

Penilaian inti "menguji penampilan" ini sangat kuat, bahkan dibuktikan secara ironis oleh sebuah eksperimen: Dalam tes Turing UC San Diego 2025, GPT-4.5 dengan petunjuk "memerankan persona" dinilai sebagai manusia sebanyak 73%, lebih tinggi dari manusia sungguhan, tetapi hanya mengandalkan keterampilan akting—ini adalah anotasi terbaik untuk "hanya menguji apakah membuatmu mengira dia memilikinya".

Yang perlu ditambahkan: Pernyataan absolut kuat "mesin pasti tidak memiliki kesadaran" ini, dalam tiga tahun didorong ke area abu-abu. Anthropic mendirikan posisi riset "kesejahteraan model", memberikan probabilitas kesadaran sekitar 15%–20%, bahkan menambahkan fungsi "secara aktif mengakhiri percakapan yang disalahgunakan" untuk Claude. Ini mengubah "sama sekali tidak" menjadi "probabilitas rendah tetapi tidak bisa dikesampingkan". Namun semuanya berdasarkan "mungkin, harus diasumsikan" bukan "sudah terbukti", intinya tidak dibantah, hanya nada perkataan dulu terlalu penuh.

Lainnya yang Tertebak Benar (Pandangan 6, 11, 12, 16, 18, 19)

  • Bukan AGI tetapi Langkah Besar
    : Keduanya bertahan. Altman sendiri di era GPT-5 masih berkata "bukan AGI, kekurangan pembelajaran berkelanjutan"; sementara medali emas IMO, ARC-AGI dari hampir nol menjadi 85%, "melangkah besar" tidak terbantahkan.
  • Tidak Akan Ada Gelombang Pengangguran
    : April 2026 tingkat pengangguran AS hanya 4.3%. Titik buta adalah "distribusi"—penelitian Stanford menunjukkan, yang justru diambil adalah anak tangga karir tingkat pertama, pemula muda usia 22–25 tahun, mekanisme "terserap dengan lancar" gagal pada mereka.
  • Tidak Akan Tenggelam oleh Sampah AI
    : Arah kesejahteraan bersih benar, tetapi dia sangat meremehkan besaran—konten AI sudah mencapai sekitar 52% dari halaman web baru, "AI slop" menjadi kata tahunan.
  • Tahun Besar untuk Startup
    : Titik balik gelombang tepat, xAI (didirikan Maret 2023) sudah mencapai valuasi 2300 miliar. Tetapi dia mengunci "perusahaan besar" hanya pada tahun 2023 itu terlalu sempit—OpenAI, Anthropic yang benar-benar triliunan dolar keduanya didirikan lebih awal.
  • Momen Browser 1994
    : Peringkat relatif terbukti, OpenAI 2025 benar-benar meluncurkan browser Atlas, mengubah metafora menjadi realitas harfiah. Hanya saja difusi ChatGPT lebih dahsyat daripada browser, metaforanya terlalu konservatif.
  • Prompt Ditambah Fakta Menurunkan Halusinasi
    : Arah terbukti, GPT-5 tanpa jaringan tanpa pencarian tingkat halusinasinya melonjak ke 47%, membuktikan secara terbalik "fakta" adalah variabel kunci. Hanya meremehkan akar penyebabnya ada pada insentif pelatihan, bukan prompt.

Tiga. Yang Tertebak Salah, Tertebak Meleset

GPT-4 adalah 100T Parameter (Pandangan 4)—Salah Total

> Tahun 2023 Wang Jianshuo berkata: (Kabar burung) GPT-4 adalah 100T parameter, sekitar 600 kali lipat dari 175B GPT-3.

Kedua angka salah. GPT-3 adalah 175B, perkiraan terbaik bocoran Juli 2023 adalah GPT-4 sekitar 1.8T, MoE 16 expert, hanya sekitar 10 kali lipat. 100T dan kenyataan berbeda sekitar 55 kali lipat besaran. Satu-satunya sumber "100T" adalah pernyataan kedua CEO Cerebras tahun 2021 yang "sekitar", Sam Altman sudah sejak Januari 2023 menegaskan langsung bahwa diagram perbandingan itu adalah "omong kosong total".

Ucapannya dulu memberi label "kabar burung", mempertahankan ketidakpastian. Lebih dalam lagi, kerangka "menggunakan kelipatan parameter untuk mengukur generasi" itu sendiri sudah ketinggalan zaman: OpenAI kemudian GPT-4.5, GPT-5 tidak lagi memublikasikan jumlah parameter. Ini satu-satunya butir salah keras dengan angka salah dan perspektif usang.

Matematika LLM (Pandangan 1)—Diagnosis Benar, Kesimpulan Pengunci Salah

> Tahun 2023 Wang Jianshuo berkata: Matematika LLM buruk adalah hakikat, membuatnya sendiri belajar matematika tidak mungkin dan tidak perlu, cara yang benar adalah memasang alat eksternal.

"Diagnosis ditambah rute alat" benar semua—akar penyebabnya memang generasi token demi token menyebabkan ketidakandalan pembulatan (makalah mekanisme 2025 secara tepat membuktikan intuisi "digit terakhir sering benar, digit tengah salah"); alat eksternal peningkatannya juga besar (o4-mini ketika diizinkan menggunakan Python, AIME 2025 mencapai 99.5%).

Salah pada kata-kata pengunci seperti "tidak mungkin, tidak perlu". "Tidak mungkin" dibuktikan salah—Juli 2025 Gemini Deep Think dan model OpenAI di IMO menggunakan bahasa alami murni, tanpa alat mendapatkan medali emas. Titik balik kunci adalah "model reasoning" yang baru muncul tahun 2024–2025, ini tidak bisa diprediksi pada Maret 2023—jadi untuk prediksi ini sebaiknya menilai arahnya dengan toleransi, bukan mencela waktu.

Penangkapan Nilai (Pandangan 8)—Pertaruhan Setengah Benar, Pernyataan Inti Terbalik

> Tahun 2023 Wang Jianshuo berkata: Nilai akhirnya akan jatuh di lapisan aplikasi, perusahaan yang membuka lapisan dasar (pembuat model) akhirnya belum tentu menghasilkan uang.

Uang memang mulai mengalir ke lapisan aplikasi (Cursor tiga tahun mencapai pendapatan tahunan 20 miliar)—ini setengah benar. Tetapi "pembuat lapisan dasar tidak menghasilkan uang" dibantah langsung oleh Nvidia: Laba bersih FY2026 sekitar $1200 miliar, kapitalisasi pasar 5 triliun+, adalah satu-satunya di pasar yang jelas menghasilkan keuntungan besar. Sedangkan lapisan model yang dia isyaratkan akan menang (OpenAI 2026 diperkirakan rugi sekitar $140 miliar) justru paling mirip dengan "lapisan dasar membakar uang tidak menghasilkan uang" yang dia katakan.

Dia tidak membedakan "lapisan dasar daya komputasi" dan "lapisan dasar model", juga tidak membedakan "pendapatan" dan "laba". Nilai pada tahun 2026 lebih ekstrem ditangkap oleh lapisan daya komputasi daripada tahun 2023, bukan berpindah ke lapisan aplikasi. Perlu ditambahkan: Yang merugi adalah penyedia cloud yang membeli chip, bukan Nvidia yang menjual chip—ini justru tempat kesalahan analogi "overbuild rel kereta api"-nya.

Hak Cipta (Pandangan 14)—Pendaftaran Benar, Menghindari Pelanggaran Salah

> Tahun 2023 Wang Jianshuo berkata: Konten buatan AI mungkin menghindari hak cipta (melindungi ekspresi bukan ide); hasil generasi mungkin tidak melanggar, juga tidak dapat didaftarkan.

"Tidak dapat didaftarkan" menjadi fakta hukum yang mapan (2025 Kantor Hak Cipta AS jelas menyatakan "hanya memasukkan prompt tidak cukup untuk mengklaim kepengarangan"). Tetapi "menghindari pelanggaran" jelas salah: Pengadilan berulang kali menentukan output AI jika mirip substansial dengan karya asli tetap melanggar hak cipta; Anthropic karena data pelatihan bajakan menyelesaikan dengan ganti rugi $1.5 miliar, ganti rugi hak cipta terbesar dalam sejarah AS. AI tidak hanya tidak "menghindari" hak cipta, malah membayar harga terbesar dalam sejarah.

Dunia Satu (Pandangan 15)—Mekanisme Benar, Tren Pertaruhan Terbalik

> Tahun 2023 Wang Jianshuo berkata: ChatGPT melakukan "rata-rata tertimbang" pada pandangan manusia, dapat melawan kapsul informasi ala TikTok, memberikan kemungkinan "dunia satu".

Lapisan mekanisme benar—2025 beberapa penelitian secara pasti membuktikan LLM menekan pandangan ke arah mayoritas, secara sistematis meremehkan minoritas. Tetapi penilaian sosialnya bertaruh terbalik: Dia sendiri menambahkan "setidaknya sekarang bukan seribu orang seribu wajah", dalam tiga tahun dibantah—OpenAI sejak April 2025 menjadikan memori lintas percakapan dan personalisasi sebagai kemampuan default, AI sedang bergerak cepat ke arah seribu orang seribu wajah. Yang lebih krusial, dia membayangkan "rata-rata tertimbang" sebagai angka konvensi dunia netral, tetapi pengukuran menunjukkan itu adalah pergeseran berarah, ditambah menjilat, dapat digunakan untuk memanipulasi posisi secara aktif—ini mengarah ke "menciptakan kapsul baru", bukan "menghilangkan polarisasi".

Perang Lokal dan Biaya (Pandangan 17)—Kualitatif Benar Semua, Kuantitatif Terbantah

> Tahun 2023 Wang Jianshuo berkata: Membuat model besar lagi akan dengan cepat menjadi "perang lokal", biaya dapat diketahui (menghilangkan jalan memutar sekitar 5-10 miliar dolar AS puncaknya), akan banyak pemain masuk.

Arah kualitatif benar dengan mengejutkan—banyak pemain masuk, cepat dikomersialkan, open source menyusul closed source, semuanya terwujud. Tetapi angka keras "5-10 miliar puncak" ini kedua ujung salah: Ujung depan sangat diremehkan (tingkat GPT-5 tahun 2026 mencapai 2-5 miliar dolar AS pelatihan, ditambah pusat data triliunan dolar dan Stargate 5000 miliar); ujung replika justru dianggap terlalu tinggi (DeepSeek menekan biaya pelatihan marjinal ke tingkat jutaan dolar AS). "Biaya" model yang sama menurut cara menghitung bisa berbeda 200 kali lipat, hanya saja tidak berada di rentang yang dia berikan.

Kemampuan Muncul (Pandangan 5)—Arah Benar, Angka dan Kerangka Salah

> Tahun 2023 Wang Jianshuo berkata: Di atas sekitar 60B parameter muncul kemampuan baru yang tidak ada dalam data mentah, dan peneliti juga tidak dapat menjelaskannya.

Intuisi arah terbukti, tetapi dua tempat ekspresi tidak bertahan: Pertama, tidak ada "ambang batas 60B" yang seragam—ambang batas nyata chain of thought sekitar 100B, kemampuan berbeda muncul pada skala 13B hingga 540B yang tidak sama; Kedua, "tidak dapat menjelaskan" pada akhir 2023 sudah ditantang oleh makalah terpilih NeurIPS—banyak "mutasi" adalah ilusi yang disebabkan oleh pemilihan metrik evaluasi, setelah mengganti metrik kontinu kurvanya halus dan dapat diprediksi. Adilnya, dulu dia mengulangi narasi yang benar-benar mainstream, yang benar-benar dapat dikoreksi adalah menganggap "60B" sebagai ambang batas keras, dan menganggap "tidak dapat menjelaskan" sebagai kesimpulan kualitatif.

Empat. Menilik Kembali Tiga Tahun, Beberapa Pola

Setelah mencocokkan satu per satu, mundur selangkah melihat, dalam dua puluh penilaian Wang Jianshuo ini tersembunyi beberapa pola yang lebih layak diingat daripada setiap butir tunggal.

Satu. Arah jauh lebih dapat diandalkan daripada angka dan tingkat. Dari dua puluh butir, semua yang menilai mekanisme dan arah (RAG, LUI, jaringan robot, tes Turing), hampir semua tepat; semua yang memberikan angka spesifik atau pernyataan pengunci (100T parameter, ambang batas 60B, biaya 5-10 miliar, matematika "tidak mungkin"), hampir semua salah. Untuk bidang yang berubah cepat, pertaruhkan arah, pertaruhkan mekanisme, sedikit pertaruhkan angka tepat, dan lebih waspada terhadap kata-kata seperti "tidak mungkin, pasti, puncak, sama sekali tidak" yang membuat perkataan penuh—ini adalah area frekuensi tinggi yang ditampar waktu.

Dua. Dalam waktu, dia cenderung melebih-lebihkan kecepatan, meremehkan tingkat. Semua yang mengatakan "cepat, diselesaikan dalam dua tiga tahun", periode matangnya umum lebih lambat; tetapi untuk plafon lompatan kemampuan justru diremehkan—matematika bisa dari "tidak mungkin" menjadi medali emas IMO, biaya depan bisa naik ke tingkat yang tak terbayangkan dulu. Satu kalimat: terlalu optimis jangka pendek, terlalu konservatif jangka panjang.

Tiga. Kesalahan paling tersembunyi, berulang muncul pada "distribusi". Bukan arah salah, tetapi hanya melihat total, mengabaikan distribusi. "Tidak akan ada gelombang pengangguran" benar, tetapi kerusakan sangat terkonsentrasi pada pemula muda; "Nilai jatuh di lapisan aplikasi" benar setengah, tetapi tidak membedakan lapisan daya komputasi dan lapisan model. Total benar, menutupi bencana distribusi—ini adalah pelajaran yang paling harus ditambahkan.

Empat. Tempat yang membuat perkataan dengan ruang, tiga tahun kemudian dapat diuji. "Kabar burung" "setidaknya sekarang" "menurunkan secara signifikan bukan menghilangkan" "prototipe dua tiga tahun, matang sekitar sepuluh tahun"—semua penilaian yang dulu membawa kata pembatas, berlapis, hari ini dilihat kembali lebih dapat bertahan. Sebaliknya, kalimat absolut yang keluar tanpa berpikir, paling mudah terbalik. Kejujuran prediksi, setengahnya berani berkata, setengah lainnya berani menandai ketidakpastian sendiri.

Lima. Beberapa masalah, tiga tahun sama sekali tidak cukup. Nilai akhirnya milik siapa, muncul bukan kebenaran berubah, mesin sebenarnya punya tidak secuil kesadaran, konteks panjang akan makan RAG—perdebatan-perdebatan ini dulu, hingga 2026 masih tetap perdebatan. Dapat membedakan "yang sudah ada jawabannya" dan "yang masih harus ditunggu", lebih penting daripada buru-buru memberi kesimpulan untuk setiap hal.

Wang Jianshuo tiga tahun lalu, mengandalkan intuisi dalam kabut sebelum GPT-4 keluar, menunjuk dua puluh arah. Hari ini setelah mencocokkan, kalimat yang paling harus diingat mungkin adalah: Melihat arah besar benar sebenarnya tidak terlalu sulit, sulitnya adalah mengakui bahwa diri sendiri dalam angka, kecepatan, dan distribusi berulang kali berpikir seenaknya. Dua puluh butir pencocokan ini, lebih tepatnya adalah memberi nilai masa lalu, lebih baik lagi adalah mendirikan beberapa aturan untuk tiga tahun ke depan. Tiga tahun berikutnya, 2029 datang lagi untuk mencocokkan sekali lagi.

Pertanyaan Terkait

QArtikel ini mencoba menilai prediksi tahun 2023 tentang ChatGPT. Apakah metode penilaian yang digunakan? Mengapa metode ini dipilih?

AMetode penilaiannya adalah 'membuat timbangan' secara objektif menggunakan AI. Penulis memberikan transkrip wawancara 2023 ke dalam sebuah workflow yang menjalankan 41 agen AI Opus 4.8. Agen-agen ini secara mandiri memisahkan 20 prediksi, mencari data terbaru secara online, memverifikasi silang, dan memberikan penilaian akhir. Metode ini dipilih untuk menghindari bias subjektif penulis dan memastikan objektivitas penilaian dengan data faktual terkini (per Mei 2026). Proses ini menghabiskan sekitar 20 menit dan 1.4 juta token.

QDari 20 prediksi Wang Jianshuo tahun 2023, area atau prediksi apa saja yang ternyata paling akurat?

APrediksi yang paling akurat cenderung pada arah dan mekanisme perkembangan teknologi, seperti: (1) Dominasi arsitektur RAG (Retrieval-Augmented Generation) untuk memasukkan pengetahuan ke dalam LLM. (2) Munculnya 'LUI' (Bahasa Alami Antarmuka Pengguna) sebagai lapisan interaksi baru yang signifikan. (3) Kemunculan 'jaringan robot' (agent network) dengan protokol komunikasi baru. (4) China mampu membuat model besar yang dapat digunakan dan mengejar ketertinggalannya. (5) ChatGPT tidak memiliki kesadaran, dan uji Turing hanya mengukur persepsi.

QKesalahan atau kekeliruan signifikan apa yang teridentifikasi dalam prediksi tahun 2023 tersebut?

ABeberapa kesalahan signifikan meliputi: (1) **Kesalahan Fakta Keras**: Mempercayai rumor bahwa parameter GPT-4 adalah 100T (padahal kenyataannya sekitar 1.8T). (2) **Pernyataan Terlalu Mutlak**: Menyatakan LLM 'tidak mungkin' belajar matematika sendiri (ternyata model penalaran murni kemudian memenangkan medali emas IMO). (3) **Kesalahan Arah Inti**: Mengira nilai akan ditangkap oleh lapisan aplikasi, bukan pembuat model dasar (kenyataannya, nilai tertinggi justru di lapisan komputasi/hardware seperti Nvidia). (4) **Kesalahan tentang Hak Cipta**: Mengira AI dapat 'menghindari' pelanggaran hak cipta (kenyataannya, ada ganti rugi dan penyelesaian kasus hak cipta terbesar karena data pelatihan AI).

QApa pola atau pelajaran umum yang bisa diambil dari hasil peninjauan kembali setelah tiga tahun ini?

APelajaran umum yang teridentifikasi adalah: (1) **Arah dan mekanisme lebih andal daripada angka dan tingkat kepastian**. Prediksi yang memberikan angka spesifik atau kata-kata mutlak (seperti 'tidak mungkin') cenderung salah. (2) **Kecenderungan melebih-lebihkan kecepatan, meremehkan skalanya**. Perkiraan waktu ('cepat', '2-3 tahun') seringkali terlalu optimis, tetapi lompatan kemampuan atau skala biaya justru melebihi perkiraan. (3) **Kesalahan tersembunyi sering ada pada 'distribusi'**. Prediksi mungkin benar secara agregat (misal, 'tidak ada gelombang pengangguran'), tetapi mengabaikan dampak buruk yang terkonsentrasi pada kelompok tertentu (misal, lulusan baru). (4) **Pernyataan yang disertai batasan atau ruang ketidakpastian lebih tahan uji waktu**.

QMenurut artikel, apa peran China dalam perkembangan AI global selama tiga tahun ini berdasarkan prediksi awal?

ABerdasarkan prediksi awal bahwa 'China pasti bisa membuat model besar yang dapat digunakan', perkembangan aktualnya menunjukkan bahwa prediksi arah ini akurat, bahkan melebihi perkiraan waktu. Laporan Stanford 2026 menunjukkan kesenjangan kemampuan antara model top China dan AS telah menyempit secara signifikan (dari 17.5–31.6 poin persentase menjadi hanya 2.7%). Pencapaian ini diraih dengan investasi yang jauh lebih kecil dibanding AS. Model-model seperti DeepSeek, Qwen, Kimi, dan GLM telah menjadi pemain global utama, dengan ekosistem sumber terbuka yang bahkan memimpin. Namun, penilaian bahwa 'pintu tidak akan tertutup' ternyata salah, karena OpenAI memutuskan akses API ke China pada Juli 2024.

Bacaan Terkait

Peringatan Gelembung AI: Investasi AI Merupakan Pengembalian Negatif bagi Kebanyakan Raksasa Teknologi

Peringatan Gelembung AI: Investasi AI Membawa Pengembalian Negatif bagi Sebagian Besar Raksasa Teknologi Demam AI kini memasuki tahap pemeriksaan keuangan. Raksasa cloud seperti Microsoft, Alphabet, Amazon, Meta, dan Oracle berencana menginvestasikan ratusan miliar dolar ke pusat data AI dalam lima tahun ke depan. Namun, analisis terhadap proyeksi pendapatan dan pengeluaran modal (capex) hingga 2030 mengungkap masalah: tingkat pengembalian investasi implisit diperkirakan sangat negatif bagi semua perusahaan kecuali Amazon, bahkan dalam skenario optimis ekstrem. Ini menunjukkan bahwa jika tren saat ini berlanjut, boom AI bisa menjadi salah satu peristiwa perusakan nilai pemegang saham terbesar. Ada dua jalan keluar: pendapatan yang jauh melebihi ekspektasi saat ini, atau pengurangan rencana investasi. Jalan pertama tampaknya mustahil, karena membutuhkan tambahan pendapatan triliunan dolar. Jalan kedua—pemotongan investasi—akan berdampak luas, meruntuhkan harga saham perusahaan-perusahaan teknologi global dan dapat mendorong ekonomi AS ke resesi, mengingat 93% pertumbuhan PDB AS belakangan ini didorong oleh investasi teknologi. IPO perusahaan AI seperti OpenAI dan Anthropic tahun ini bisa menjadi mekanisme transfer risiko, memindahkan ketidakpastian dari pemilik awal kepada investor ritail dan dana pensiun. Sementara euphoria pemasaran mungkin bertahan hingga setelah IPO tahun 2026, tekanan matematika yang tak terelakkan mungkin memaksa raksasa cloud mengumumkan pemotongan investasi pada 2027 atau 2028, mirip dengan jeda tiga tahun antara peringatan "irrational exuberance" Alan Greenspan pada 1996 dan pecahnya gelembung dotcom pada 2000.

marsbit1j yang lalu

Peringatan Gelembung AI: Investasi AI Merupakan Pengembalian Negatif bagi Kebanyakan Raksasa Teknologi

marsbit1j yang lalu

Dari Token ke Tenaga Kerja Mesin: AI Sedang Berubah dari Alat Menjadi 'Pekerja'

Dari Token ke Tenaga Kerja Mesin: AI Berubah dari Alat Menjadi "Pekerja" AI mulai menulis kode, menangani tiket dukungan pelanggan, dan meninjau dokumen hukum. Artikel ini mengusulkan kerangka baru: komersialisasi AI sedang bergerak menuju "pasar tenaga kerja mesin". Dalam pasar ini, token hanyalah unit pengukuran, GPU adalah bahan baku, dan model adalah alat produksi. Objek yang benar-benar ditetapkan harganya dan diperdagangkan adalah kerja ekonomi yang diselesaikan langsung oleh perangkat lunak. Mekanisme penetapan harga AI akan berkembang dari token mentah, kemampuan model yang terstandarisasi, tenaga kerja yang terspesialisasi industri, hingga pasar hasil yang dapat diprogram. Di masa depan, perusahaan mungkin tidak lagi peduli model atau GPU mana yang menyelesaikan suatu tugas, tetapi lebih pada apakah tugas itu diselesaikan dalam batas latensi, akurasi, keandalan, dan biaya yang ditentukan. Implikasinya, dampak AI pada pasar tenaga kerja manusia tidak hanya sekadar penggantian. Saat mesin mengambil alih lebih banyak pekerjaan yang dapat distandardisasi dan diverifikasi, peran manusia mungkin bergeser ke pengawasan, penanggung jawab, manajemen konteks, dan keputusan akhir. Dalam beberapa kasus, penilaian manusia untuk 1% akhir justru menjadi lebih berharga karena dapat membuka kunci 99% otomatisasi skala besar. Pasar AI adalah pasar ekspansif. Ketika biaya kerja turun, permintaan tidak tetap. Jika interaksi dukungan pelanggan menjadi lebih murah, perusahaan dapat menawarkan layanan 24/7, menciptakan pasar interaksi pelanggan yang lebih besar. Persaingan tahap berikutnya di pasar AI mungkin bukan lagi sekadar pertarungan kemampuan model atau perang harga daya komputasi, tetapi tentang siapa yang dapat pertama kali menstandarisasi, memverifikasi, dan menetapkan harga "pekerjaan", akhirnya menjadikan tenaga kerja mesin sebagai faktor produksi baru yang dapat dibeli, diselesaikan, dan diperdagangkan.

marsbit2j yang lalu

Dari Token ke Tenaga Kerja Mesin: AI Sedang Berubah dari Alat Menjadi 'Pekerja'

marsbit2j yang lalu

Diskon 99% untuk MiMo Bukan Hanya Pemasaran! Luo Fuli Membantah Para Pengecam di X

**Ringkasan:** Xiaomi MiMo memotong harga API MiMo-V2.5 hingga **99%**, memicu spekulasi tentang perang harga atau strategi merugi. Luo Fuli, kepala MiMo, merespons dengan mempublikasikan blog teknis 5000 kata yang merinci **enam pilar teknikal** di balik potongan harga besar ini. Intinya, diskon 99% terutama untuk **Input (Cache Hit)** – bagian dimana pengguna membaca ulang konteks historis dalam percakapan panjang. Ini menjadi mungkin karena serangkaian optimasi teknikal yang mengubah biaya komputasi untuk bagian tersebut mendekati nol. **Enam Pilar Teknikal:** 1. **Arsitektur Hybrid SWA:** Menggunakan Sliding Window Attention di sebagian besar lapisan model, mengurangi volume **KVCache** (memori jangka pendek model) hingga **1/7**. 2. **Manajemen KVCache Dua Kolam:** Mengalokasikan memori secara terpisah untuk lapisan SWA dan Full Attention, benar-benar mewujudkan penghematan teoretis 1/7 dan meningkatkan jumlah pengguna yang dapat dilayani secara bersamaan. 3. **Prefix Cache yang Dioptimalkan:** Meningkatkan aturan pencocokan cache untuk arsitektur SWA, menghasilkan **tingkat keberhasilan cache 93-95%** untuk pembacaan ulang. Artinya, sebagian besar permintaan "baca ulang" tidak memerlukan komputasi GPU baru. 4. **Sistem Cache Terdistribusi GCache:** Menyimpan data cache di **SSD bawaan mesin GPU**, menghilangkan biaya penyimpanan cluster khusus dan memperpanjang masa hidup cache. 5. **Sistem Penjadwalan LLM-Router:** Mengarahkan permintaan secara cerdas berdasarkan kesamaan prefix dan panjang konteks, memprioritaskan permintaan yang menggunakan cache, meningkatkan efisiensi dan mengurangi latensi. 6. **Multi-Token Prediction (MTP):** Mengoptimalkan proses generasi output model, mempercepat pembuatan respons dan melengkapi pengurangan biaya di sisi input. **Kesimpulan:** Penurunan harga 99% bukanlah gimmick pemasaran atau strategi merugi, tetapi hasil dari **efisiensi sistemik rekayasa AI** yang telah divalidasi di lingkungan produksi. Rantai optimasi ini secara kumulatif mengurangi biaya komputasi per permintaan hingga lebih dari 95%, memungkinkan penurunan harga ekstrem sambil mempertahankan profitabilitas. Luo Fuli menekankan bahwa ini adalah masalah teknikal yang terwujud, bukan sekadar perang harga.

marsbit4j yang lalu

Diskon 99% untuk MiMo Bukan Hanya Pemasaran! Luo Fuli Membantah Para Pengecam di X

marsbit4j yang lalu

Rp 426 Triliun, "Tim Murni Tionghoa" Menopang Perusahaan Pemrograman AI dengan Valuasi Tertinggi di Dunia

Pada Mei 2025, Cognition AI, startup pengembangan AI yang didirikan oleh tiga pendiri berkebangsaan China pemenang Olimpiade Informatika, mengumumkan pendanaan baru senilai lebih dari $10 miliar, yang menaikkan valuasinya menjadi $26 miliar. Lonjakan valuasi ini, hanya dalam 8 bulan sejak valuasi $10,2 miliar sebelumnya, didorong oleh kepercayaan investor bahwa agen AI seperti "Devin" perusahaan mereka akan menjadi infrastruktur rekayasa perangkat lunak generasi berikutnya. Awalnya, Cognition menciptakan sensasi dengan meluncurkan Devin, yang dipasarkan sebagai "insinyur perangkat lunak AI" pertama yang dapat menangani tugas pengkodean secara mandiri. Namun, produk awal ini menuai kritik karena kinerja yang tidak konsisten dan harga yang tinggi. Untuk mengatasi kekurangan ini, Cognition melakukan pivoting strategis dengan mengakuisisi Windsurf, sebuah platform IDE berbasis AI, pada tahun 2025. Akuisisi ini memberi Cognition dua jalur produk: Devin untuk menangani tugas-tugas rekayasa asinkron yang dapat didelegasikan, dan Windsurf IDE sebagai alat bantu kolaboratif bagi pengembang dalam editor kode. Kombinasi ini terbukti sukses. Cognition melaporkan pertumbuhan penggunaan perusahaan lebih dari 10 kali lipat tahun ini, dengan run-rate pendapatan mencapai $492 juta dan pertumbuhan penggunaan bulanan Devin sebesar 50% selama enam bulan terakhir. Kliennya termasuk nama-nama besar seperti Goldman Sachs, NASA, dan Angkatan Darat AS. Intinya, valuasi $26 miliar ini mencerminkan keyakinan pasar bahwa Cognition, dengan strategi "dua kaki"nya, berada di posisi yang tepat untuk menangkap peluang adopsi AI berskala besar di sektor rekayasa perangkat lunak perusahaan, yang bergerak menuju sistem hybrid di mana manusia dan AI berkolaborasi.

marsbit4j yang lalu

Rp 426 Triliun, "Tim Murni Tionghoa" Menopang Perusahaan Pemrograman AI dengan Valuasi Tertinggi di Dunia

marsbit4j yang lalu

Anak Muda Kelahiran 2000an yang Paling Booming di Wall Street

“Hanya karena aku lebih awal, bukan berarti aku salah.” Kalimat ini dari film “The Big Short” menggambarkan dengan tepat Leopold Aschenbrenner, seorang manajer dana lindung nilai termuda di Wall Street. Pada 2024, di usianya yang baru 23 tahun, Leopold dipecat oleh OpenAI karena tuduhan kebocoran informasi. Alih-alih patah semangat, ia justru mendirikan dana lindung nilai bernama Situational Awareness LP. Berbeda dengan tren pasar yang berfokus pada chip AI, ia justru memilih untuk berinvestasi besar-besaran pada infrastruktur pendukung AI yang ‘membosankan’ seperti pasokan listrik, pusat data, dan jaringan energi. Hasilnya spektakuler. Hingga kuartal pertama 2026, nilai portofolio dananya telah melonjak menjadi $13,7 miliar dari hanya $255 juta di akhir 2024. Ia berhasil karena melihat masa depan AI dibatasi oleh hambatan fisik, sehingga ia memilih untuk berinvestasi pada hambatan itu sendiri. Portofolionya unik: ia menggunakan opsi jual (put option) senilai miliaran dolar untuk meng-hedge saham-saham teknologi dan semikonduktor panas seperti NVIDIA dan AMD. Sementara itu, fokus investasi utamanya adalah pada perusahaan-perusahaan yang bergerak di bidang bahan bakar bersih seperti Bloom Energy, serta perusahaan pusat data dan penambangan kripto yang memiliki akses ke lahan dan listrik berlimpah. Satu pengecualian adalah saham SanDisk, yang justru dibeli dan diberi opsi beli (call option). Saham SanDisk kemudian meroket sekitar 160% pada kuartal kedua 2026. Kejelian Leopold terbukti benar. Era AI kini memicu ‘demam’ infrastruktur besar-besaran. Raksasa teknologi seperti Amazon, Alphabet, dan Meta meningkatkan belanja modal mereka secara drastis untuk membangun pusat data baru. Kebutuhan global akan listrik untuk pusat data AI diprediksi akan melampaui konsumsi listrik seluruh Jepang pada 2030. Demikian pula dengan permintaan akan komponen pendukung seperti modul optik dan serat optik yang melonjak. Kisah Leopold mengajarkan bahwa di balik masa depan AI yang canggih dan ‘ringan’, terdapat pondasi yang ‘berat’ dan ‘bisu’: listrik, tanah, chip, jaringan, dan sistem pendingin. Masa depan yang hebat selalu tumbuh dari aset-aset yang tampak diam ini.

marsbit6j yang lalu

Anak Muda Kelahiran 2000an yang Paling Booming di Wall Street

marsbit6j yang lalu

Trading

Spot
Futures
活动图片