Lima Bentuk Inti AI Agent Menurut Pandangan YC

marsbitDipublikasikan tanggal 2026-05-20Terakhir diperbarui pada 2026-05-20

Abstrak

Penyunting: AI Agent telah berkembang dari prompt sekali pakai ke dalam alur kerja yang lebih kompleks. Pertanyaan penting sekarang bukanlah "apakah model bisa menyelesaikan tugas?", tetapi "bisakah kemampuan AI dijadikan aset proses yang dapat digunakan ulang dan terakumulasi?". Berikut adalah lima bentuk inti yang muncul: 1. **Skills:** Bukan SOP kaku, melainkan lebih seperti "pemanggilan metode". Satu alur kerja (Skill) yang sama dapat digunakan untuk banyak kasus dengan mengganti parameternya (misal, target, pertanyaan, dataset). 2. **Thin Harness:** Kerangka kerja eksekusi ringan (~200 baris kode) yang menjadi "tangan dan kaki" bagi model. Fungsinya menjalankan loop, membaca/menulis file, dan mengelola konteks. 3. **Resolvers:** Tabel perutean yang memetakan jenis tugas ke Skill spesifik. Ini mencegah "korupsi konteks" saat jumlah Skill sangat banyak, sehingga memastikan panggilan yang tepat. 4. **Latent vs. Deterministic:** Pisahkan tugas. Serahkan penilaian, sintesis, dan pemahaman kontekstual ke LLM. Gunakan kode deterministik (yang dapat ditulis model) untuk hal-hal yang memerlukan kepastian dan konsistensi, seperti perhitungan. 5. **Memory:** Lapisan memori untuk akumulasi pengetahuan jangka panjang. Contoh: folder markdown dengan satu halaman per entitas (orang/perusahaan/konsep), berisi kesimpulan terkini dan garis waktu yang terus bertambah. Kombinasi ini membentuk **"kemampuan proses" (process power)** – keunggulan kompetitif yang berkelanjutan di era AI....

Catatan Editor: Ketika AI Agent bergerak dari Prompt sekali pakai dan vibe coding ke tahap alur kerja yang lebih kompleks, pertanyaan yang benar-benar penting bukan lagi "Apakah model dapat menyelesaikan tugas?", melainkan "Apakah kita dapat mengendapkan kemampuan AI menjadi aset proses yang dapat digunakan kembali dan terakumulasi?".

Artikel ini, berangkat dari GBrain milik Garry Tan, merangkum lima bentuk inti yang secara bertahap ditemukan oleh banyak orang saat menggunakan alat Agent seperti Codex, Claude Code, Hermes: Skills yang dapat diparameterisasi, kerangka eksekusi ringan Thin Harness, Resolvers yang bertanggung jawab untuk routing, lapisan eksekusi yang membedakan penilaian model dengan kode deterministik, serta Memory yang digunakan untuk mengakumulasi konteks jangka panjang.

Modul-modul ini digabungkan bersama mengarah pada suatu jenis "kemampuan proses" yang baru: mengubah pengalaman menjadi alur kerja, mengabstraksikan tugas menjadi parameter, menyerahkan aturan stabil kepada kode, menyerahkan penilaian dan sintesis kepada model, dan terus mengendapkan melalui lapisan memori. Dibandingkan dengan aplikasi atau prompt yang dihasilkan sekali pakai, sistem semacam ini lebih sulit untuk direplikasi, dan lebih mungkin menjadi dasar bagi individu, tim kecil, bahkan perusahaan untuk membentuk keunggulan kompetitif jangka panjang di era AI.

Berikut adalah teks aslinya:

Saya menghabiskan waktu untuk mempelajari GBrain milik Garry Tan. Sebagai seseorang yang berlatar belakang non-teknis dan tidak bekerja di industri modal ventura, saya ingin menyaring beberapa struktur bentuk universal yang saya lihat di dalamnya, serta hal-hal yang benar-benar menarik.

Saya percaya, banyak orang secara bertahap mulai menyatu pada sekumpulan struktur inti yang sama. Mereka kira-kira dapat diringkas menjadi 5 bentuk, yang juga mewakili arah evolusi alami dalam cara penggunaan alat AI berbentuk agen cerdas seperti Codex, Claude Code, Hermes, OpenClaw.

Bacaan terkait: "Thin Harness, Fat Skill: Sumber Sebenarnya Produktivitas AI 100x"

Skills: Dari SOP hingga "Pemanggilan Metode"

Skills hampir merupakan titik awal paling alami bagi semua orang. Bahkan tanpa ada yang mengingatkan, pengguna secara naluriah akan membangunnya, karena bentuknya sangat familiar. Awalnya saya memahaminya sebagai sejenis SOP, yaitu alur kerja standar untuk menyelesaikan sesuatu. Pengguna menyediakan "apa yang harus dilakukan", Skill menyediakan "bagaimana melakukannya".

Pemahaman Tan adalah, Skill lebih mirip dengan "pemanggilan metode". Dalam pemrograman, pemanggilan metode merujuk pada penggunaan parameter untuk memanggil suatu alur program. Kode yang sama akan berjalan setiap kali, yang berubah adalah parameternya: data apa, masalah apa, tujuan apa. Misalnya, fungsi process_invoice yang sama dapat memproses setiap faktur di sistem, bukan hanya yang awalnya ditulis untuk faktur tertentu itu.

Skill memiliki struktur serupa. Sebuah Skill bernama /investigate mungkin berisi tujuh langkah tetap, ketujuh langkah ini tidak akan berubah. Yang berubah adalah parameternya: TARGET (siapa atau apa objek investigasi), QUESTION (apa yang ingin Anda pahami), DATASET (di mana mencari informasi). Arahkan ke kasus whistleblower industri medis, ia berperan seperti analis penelitian; arahkan ke dokumen pengajuan SEC, ia berperan seperti penyelidik hukum. File yang sama, tujuh langkah yang sama, perbedaannya disediakan oleh dunia luar.

Ini berbeda dengan SOP tradisional. Kebanyakan SOP ditulis untuk posisi atau tugas tertentu, seperti "memproses hutang usaha". Setiap skenario penggunaan sesuai dengan satu set alur kerja. Sedangkan abstraksi Skill lebih tinggi, alur kerja yang sama dapat menangani satu jenis masalah. Sebuah Skill yang dirancang dengan baik dapat menyelesaikan pekerjaan puluhan SOP, karena informasi kasus konkret dipisahkan dari dokumen dan dialihkan ke parameter. Secara praktis, beberapa Skill lebih mirip SOP, sementara yang lain lebih mirip pemanggilan metode.

Thin Harness: Model adalah Kecerdasan, Harness adalah Tangan dan Kaki

Model, seperti Opus, GPT-5.5, adalah kecerdasan mentah; Harness, seperti Claude Code, Codex CLI, Hermes, OpenClaw, adalah kerangka eksekusi yang membuat model benar-benar "memiliki tangan dan kaki". Mereka bertanggung jawab untuk eksekusi berulang, membaca/menulis file, mengelola konteks, menegakkan batasan keamanan. Kode intinya hanya sekitar 200 baris.

Garry menyebutkan, kesalahan yang dilakukan kebanyakan orang adalah terus memasukkan lebih banyak hal ke dalam Harness, saya sendiri juga demikian. Saya akhirnya mengakumulasi 100 definisi alat, serta banyak server MCP. Hasilnya, jendela konteks dipenuhi dengan penjelasan alat yang tidak diperlukan oleh tugas saat ini. Model mulai bingung alat mana yang harus digunakan, latensi meningkat, akurasi turun, dan akhirnya terbentuk apa yang disebut "konteks korupsi".

Resolvers: Menggunakan Tabel Routing untuk Menyelesaikan Konteks Korupsi

Cara mengatasi konteks korupsi adalah dengan membuat tabel routing. Fungsi Resolver adalah memetakan dengan jelas "jenis tugas X yang baru masuk" ke "harus memanggil Skill Y". Ketika Anda hanya memiliki 5 Skill, Anda tidak memerlukan Resolver; tetapi ketika Anda memiliki 100 Skill, berbagai deskripsi menjadi kabur, dan model sangat mudah tidak dapat memanggil Skill yang benar pada waktu yang tepat. Resolver menggunakan aturan eksplisit sebagai pengganti pencocokan pola yang samar.

Tan juga menjalankan mekanisme serupa Resolver untuk file: tabel routing independen yang digunakan untuk menentukan di mana lokasi dalam sistem file yang seharusnya menjadi tujuan output suatu Skill. Ini adalah struktur "audit-routing" yang sama, diterapkan pada masalah lain. Dengan demikian, output akan stabil masuk ke folder yang benar, bukan ditempatkan di lokasi yang diduga sementara oleh model.

Skillify adalah pemikiran pendukung lainnya darinya: ini adalah set siklus kualitas untuk mengubah Skill sekali pakai menjadi infrastruktur yang dapat digunakan kembali jangka panjang. Alur 10 langkah yang dijelaskan Tan meliputi: definisi kontrak, penggunaan kode deterministik di tempat yang sesuai, pengujian unit, pengujian integrasi, evaluasi LLM-as-judge, entri Resolver, skrip audit, pemeriksaan Skill mana yang tidak memiliki jalur panggilan, serta pengujian asap ujung ke ujung. Standar ujinya sederhana: jika Anda harus menanyakan pertanyaan yang sama kepada model dua kali, itu adalah kegagalan.

Latent vs. Deterministic: Penilaian Diserahkan ke Model, Tugas Deterministik Diserahkan ke Kode

Perlu benar-benar membedakan pekerjaan mana yang harus diserahkan kepada LLM, dan mana yang harus diserahkan kepada sistem deterministik. LLM unggul dalam penilaian, sintesis, pengenalan pola, dan membaca makna tersirat; tetapi tidak unggul dalam aritmatika, optimasi kombinasi, juga tidak cocok untuk menangani tugas apa pun yang membutuhkan jawaban yang sama setiap kali diberikan. LLM pada dasarnya probabilistik, ketika solusi deterministik dapat menyelesaikan masalah, seharusnya tidak menggunakan LLM.

Kebanyakan orang dengan latar belakang non-teknis cenderung meremehkan nilai lapisan deterministik. Reaksi default kebanyakan orang adalah melemparkan semua hal ke model. Tetapi jika sesuatu dapat diselesaikan dengan cara deterministik, maka hampir pasti harus dilakukan seperti itu. Dan Anda tidak perlu menjadi programmer sendiri, karena model dapat menuliskan kode untuk Anda. Yang benar-benar perlu dilatih adalah disiplin: setiap kali bertanya pada diri sendiri, apakah hal ini dapat diselesaikan dengan stabil dan biaya rendah menggunakan kode? Jika jawabannya ya, suruh model menuliskan kode tersebut.

Memory: Membuat Sistem Benar-benar Dapat Diakumulasi

Agar sistem berguna, ia harus memiliki semacam bentuk memori. Saya belum yakin apa bentuk yang paling tepat, saat ini banyak orang juga membangun dengan cara berbeda: vektor embedding, kesamaan semantik, grafik pengetahuan, penyimpanan campuran, dll. Cara Tan sama dengan saya: hanya sebuah folder markdown.

Strukturnya adalah: satu halaman per orang, satu halaman per perusahaan, satu halaman per konsep. Di bagian atas setiap halaman adalah "Kesimpulan Terpercaya Saat Ini", yaitu penilaian sintesis yang terus ditulis ulang dan diperbarui seiring bukti baru; bagian bawah adalah garis waktu yang hanya ditambahkan, tidak ditimpa.

Memilih markdown membawa beberapa hasil. Pertama, file itu sendiri adalah catatan utama sistem, bukan semacam hasil ekspor. Anda dapat membukanya di VS Code, mengeditnya secara manual, dan Agent akan secara otomatis membaca perubahan ini. Kedua, hubungan bertipe, seperti works_at, invested_in, founded, attended, advises, akan secara otomatis diekstraksi melalui ekspresi reguler setiap kali ditulis, sehingga grafik pengetahuan dapat terhubung sendiri tanpa menghabiskan token. Skema spesifik ini sangat cocok untuk pekerjaannya, tetapi bagi orang lain, mungkin perlu disesuaikan kembali sesuai dengan profesi dan skenario bisnis mereka sendiri.

Selain itu, ada detektor sinyal yang berjalan di latar belakang. Seseorang disebutkan sekali, halaman stub akan dibuat; jika dia disebutkan di tiga sumber berbeda, pemicu pelengkapan informasi web akan diaktifkan; setelah satu pertemuan berakhir, alur lengkap akan dijalankan. "Siklus mimpi" malam hari akan memindai percakapan, melengkapi informasi entitas yang kedaluwarsa, dan memperbaiki referensi yang gagal. Lapisan dasarnya adalah teks, semua hal di atasnya murah dan dapat dikombinasikan.

Tentu saja ada lebih banyak detail di lapisan bawah, tetapi saya percaya, ini adalah garis besar yang paling penting, dan pada tingkat yang cukup besar, mereka bersifat universal.

Saya sendiri sebenarnya telah membangun sekitar setengah dari arsitektur semacam ini. Dulu belum mencapai skala yang mengharuskan pengenalan Resolver sungguhan, tetapi sekarang sudah sampai tahap itu, jadi saya baru saja melakukan sedikit refaktor, membuat sistem saya tidak bergantung pada model tertentu, dan membangun Resolver di dalamnya. Bagian kunci yang saat ini belum saya bangun adalah detektor sinyal yang berjalan otomatis di latar belakang dan siklus mimpi malam hari, yaitu mekanisme pelengkapan dan pengaturan informasi otomatis, ini adalah bagian yang ingin saya coba tambahkan selanjutnya.

Saya menduga, bahwa pembangun yang berbeda sedang menyatu ke struktur serupa, itu sendiri adalah sebuah sinyal: bentuk ini meskipun belum tentu cocok untuk semua orang, tetapi secara keseluruhan kemungkinan besar berguna. Meskipun detail implementasi spesifik akan memiliki perbedaan penting, struktur keseluruhan ini semakin banyak ditemukan secara independen oleh orang-orang.

Pertanyaan yang akhir-akhir ini selalu saya tanyakan pada diri sendiri adalah: Bagaimana menggunakan AI untuk membangun keunggulan kompetitif yang berkelanjutan?

Semua orang sangat antusias dengan aplikasi vibe-coded dan prompt sekali pakai, itu tentu sangat keren. Saya sendiri awalnya juga mulai bermain seperti itu, dan karena itu terjun ke dalamnya. Tetapi apa pun yang dapat dibangun melalui prompt sekali pakai, harga ekuilibriumnya pada akhirnya akan turun ke biaya token yang dibutuhkan untuk membangunnya, yaitu beberapa sen.

Misalnya, seseorang menyalin MyFitnessPal, menjualnya dengan setengah harga dan menghasilkan 1 juta dolar, itu tentu sangat hebat. Tetapi segera akan ada orang lain yang menyalinnya lagi, dan menjual dengan harga lebih rendah. Siklus ini akan terus berlanjut, hingga ruang keuntungan benar-benar terkompresi.

Hal yang benar-benar berkelanjutan adalah semacam "kemampuan proses". Menggunakan kerangka "7 Powers" dari Hamilton Helmer, arsitektur di atas sebenarnya menyiratkan kekuatan proses.

"7 Powers" mengusulkan bahwa perusahaan dapat mempertahankan tingkat profitabilitas di atas rata-rata pasar dalam jangka panjang karena memiliki salah satu dari tujuh kekuatan struktural ini. Setiap keunggulan yang tidak berakar pada kekuatan-kekuatan ini pada akhirnya akan terkikis oleh persaingan.

Bagi usaha kecil-menengah dan perusahaan rintisan, lima dari tujuh kekuatan Helmer pada dasarnya adalah pintu tertutup. Ekonomi skala membutuhkan skala; efek jaringan dan biaya peralihan dapat dibangun, tetapi memerlukan basis pengguna yang besar terlebih dahulu; sumber daya eksklusif biasanya berarti paten atau aset serupa, yang tidak dimiliki oleh kebanyakan perusahaan; membangun merek biasanya membutuhkan waktu sepuluh tahun, tidak bisa jalan pintas.

Dua yang tersisa adalah anti-posisi dan kemampuan proses.

Anti-posisi mengacu pada model bisnis yang tidak dapat ditiru oleh raksasa yang ada, karena begitu meniru, akan merugikan bisnis mereka sendiri yang sudah ada. Peluang semacam ini terkadang ada, tetapi tidak selalu tersedia.

Jadi, jalur paling realistis tersisa pada kemampuan proses. Dan sistem AI yang dirancang dengan baik, justru adalah alat yang dapat menghasilkan kemampuan proses.

Ini pada dasarnya adalah pekerjaan yang sama dengan membangun SOP berkualitas tinggi atau perangkat lunak berpemilik yang dikembangkan sendiri: proses dikodekan, kasus diparameterisasi, sistem deterministik dasar cepat dan andal, lapisan memori terus menerima hal-hal yang dipelajari di masa lalu. Ini memperbesar "layanan yang diproduktifkan": Anda dapat memberikan layanan atau produk tertentu dengan biaya lebih rendah atau kualitas lebih tinggi, karena seluruh pekerjaan telah terstruktur.

Bayangkan seorang akuntan membangun sistem seperti ini. Lapisan memori adalah sebuah folder, setiap klien memiliki file markdown, yang berisi kesimpulan terpercaya saat ini, seperti struktur entitas, posisi pajak tahunan, audit yang sedang berlangsung, serta garis waktu yang mencatat pertemuan, keputusan, dan perubahan yang terjadi.

Dia memiliki beberapa Skill, seperti /year-end-review, /quarterly-estimate, /audit-prep. Alur kerja yang sama dapat dieksekusi dengan parameter yang berbeda untuk klien yang berbeda.

Dia juga memiliki lapisan deterministik, termasuk formulir pajak, tabel depresiasi, dokumen IRS, riwayat formulir pajak klien, dll.

Ditambah dengan mekanisme mirip pengaturan log atau siklus mimpi. Misalnya, sistem secara otomatis menemukan di malam hari bahwa alokasi K-1 seorang mitra turun 40% tanpa perubahan strategi; atau memperhatikan bahwa struktur pengurangan kantor rumah tangga seorang klien dapat dimigrasikan ke klien lain, strukturnya dapat digunakan kembali, tetapi identitas dan privasi tetap di tempat asal.

Dengan demikian, dia dapat mengenakan sedikit premi, melayani lebih banyak klien per tahun, dan pesaing sulit meniru, karena struktur ini tidak muncul begitu saja setelah dia sukses, melainkan terakumulasi secara terus-menerus sejak awal.

Di permukaan, alat ini hanyalah folder markdown. Tetapi setiap baris dalam setiap file di dalamnya, di baliknya berasal dari banyak pengujian, pembangunan, dan iterasi yang disengaja. Yang benar-benar membentuk penghalang kompetitif bukanlah file itu sendiri, melainkan kemampuan proses yang dibawa oleh file-file tersebut.

Pertanyaan Terkait

QApa lima bentuk inti AI Agent yang diidentifikasi dalam artikel, dan mengapa kelimanya penting untuk mengubah kecakapan AI menjadi aset yang dapat digunakan kembali?

ALima bentuk inti tersebut adalah: 1) Skills (Keterampilan) yang dapat diparameterisasi seperti pemanggilan metode, 2) Thin Harness (Rangkaian Tipis) sebagai kerangka kerja eksekusi ringan, 3) Resolvers (Penyelesai) yang bertugas merutekan tugas ke Skill yang tepat, 4) Lapisan Eksekusi yang memisahkan penilaian model dengan kode deterministik, dan 5) Memory (Memori) untuk akumulasi konteks jangka panjang. Kombinasi ini penting karena mengubah pengalaman menjadi proses yang terstandarisasi, mendelegasikan tugas yang tepat ke komponen yang tepat (AI atau kode), dan memungkinkan akumulasi pengetahuan—sehingga menciptakan aset proses yang berkelanjutan dan sulit ditiru dibandingkan prompt sekali pakai.

QApa perbedaan utama antara Skill yang dijelaskan dalam artikel dengan SOP (Prosedur Operasi Standar) tradisional?

ASkill memiliki tingkat abstraksi yang lebih tinggi dibanding SOP tradisional. SOP biasanya dibuat untuk satu peran atau tugas spesifik (misalnya, 'memproses utang dagang'). Sebaliknya, Skill dirancang seperti 'pemanggilan metode' dalam pemrograman: alur kerjanya tetap (misalnya, 7 langkah investigasi), tetapi variabel seperti target, pertanyaan, dan dataset disediakan sebagai parameter dari luar. Satu Skill yang dirancang dengan baik dapat menangani puluhan kasus berbeda yang sebelumnya memerlukan banyak SOP terpisah, karena informasinya dipisahkan dari dokumen dan dimasukkan sebagai parameter.

QApa masalah 'konteks korupsi' (context corruption) yang disebutkan terkait dengan Harness, dan bagaimana Resolver mengatasinya?

A'Konteks korupsi' terjadi ketika terlalu banyak definisi alat atau penjelasan Skill yang tidak relevan dimasukkan ke dalam konteks model (Harness). Hal ini membuat model bingung menentukan alat mana yang harus digunakan untuk tugas saat ini, sehingga menurunkan akurasi dan meningkatkan latensi. Resolver mengatasi masalah ini dengan bertindak sebagai 'tabel perutean' yang eksplisit. Resolver memetakan jenis tugas yang masuk (misalnya, 'analisis laporan keuangan') langsung ke Skill tertentu yang harus dipanggil (misalnya, '/financial-review'), menggantikan tebakan model yang kabur dengan aturan yang jelas dan mengurangi beban konteks yang tidak perlu.

QMengapa artikel menekankan pentingnya memisahkan pekerjaan antara model LLM (latent) dan sistem deterministik (kode)? Berikan contoh.

APemisahan ini penting karena LLM dan kode deterministik memiliki keunggulan yang berbeda. LLM unggul dalam penilaian, sintesis, pengenalan pola, dan memahami maksud tersirat—tugas yang bersifat probabilistik. Sebaliknya, sistem deterministik (kode) unggul dalam tugas yang memerlukan ketepatan, keandalan, dan hasil yang konsisten setiap kali, seperti perhitungan aritmatika, pengoptimalan kombinatorial, atau pemrosesan data terstruktur. Contohnya: menilai sentimen dari teks ulasan pelanggan adalah tugas untuk LLM, tetapi menghitung total pajak berdasarkan tabel tarif dan data pendapatan yang tetap sebaiknya dilakukan oleh kode deterministik untuk menghindari kesalahan dan variasi jawaban.

QBerdasarkan artikel, bagaimana arsitektur AI Agent yang dijelaskan dapat menciptakan 'kekuatan proses' (process power) sebagai keunggulan kompetitif yang berkelanjutan bagi individu atau bisnis?

AArsitektur ini menciptakan 'kekuatan proses' dengan mengkodekan pengalaman menjadi alur kerja yang dapat digunakan kembali (Skills), mendelegasikan logika ke komponen yang paling efisien (LLM untuk penilaian, kode untuk kepastian), dan secara terus-menerus mengakumulasi pengetahuan dalam lapisan Memori. Seperti contoh akuntan dalam artikel, sistem semacam ini memungkinkan penyediaan layanan yang lebih berkualitas atau lebih murah dengan struktur kerja yang konsisten. Keunggulan kompetitifnya berkelanjutan karena sistem ini dibangun dan dioptimalkan dari waktu ke waktu melalui iterasi dan pengujian—bukan sesuatu yang dapat dengan mudah disalin pesaing hanya dengan prompt atau aplikasi sekali pakai, sehingga membentuk penghalang yang berbasis pada kemampuan proses organisasi itu sendiri.

Bacaan Terkait

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

Tiga tahun kemudian, pada Mei 2026, penulis meninjau kembali 20 prediksi tentang ChatGPT yang dibuatnya pada Maret 2023, menggunakan AI untuk mengevaluasi akurasinya berdasarkan data terbaru. Secara keseluruhan, arah dan mekanisme prediksi banyak yang tepat. Yang paling akurat adalah tentang RAG sebagai arsitektur standar, LUI (Antarmuka Pengguna Bahasa Alami) sebagai lapisan interaksi baru, munculnya "jaringan robot" (protokol untuk agen AI), dan kemampuan China mengejar ketertinggalan model AI besar. Prediksi bahwa ChatGPT bukan AGI namun langkah besar, tidak menyebabkan gelombang pengangguran massal, serta sifat uji Turing yang hanya mengukur persepsi juga pada dasarnya benar. Namun, prediksi dengan angka spesifik atau pernyataan mutlak sering meleset. Klaim bahwa GPT-4 memiliki 100 triliun parameter sepenuhnya salah. Pernyataan bahwa LLM "tidak mungkin" mengerjakan matematika murni terbantahkan dengan model penalaran yang memenangkan medali emas IMO. Estimasi biaya pelatihan model hanya $5-10 miliar juga jauh dari kenyataan, yang kini mencapai miliaran dolar untuk model terdepan. Beberapa prediksi keliru tentang distribusi dampak, seperti bahwa nilai akan berpindah ke lapisan aplikasi (nyatanya, penyedia chip seperti NVIDIA paling untung), atau bahwa AI akan "menghindari" masalah hak cipta (justru menimbulkan gugatan besar). Kesimpulan utama adalah: dalam memprediksi teknologi yang cepat berubah, mengidentifikasi arah dan mekanisme umumnya lebih bisa diandalkan daripada memberikan angka pasti atau pernyataan mutlak. Prediksi cenderung terlalu optimis tentang kecepatan perubahan jangka pendek, tetapi meremehkan besarnya perubahan jangka panjang. Penting juga untuk mempertimbangkan distribusi dampak, bukan hanya kesimpulan agregat. Pernyataan yang disertai batasan dan keraguan justru lebih tahan uji waktu. Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun. Tinjauan ini berfungsi sebagai pelajaran untuk membuat prediksi yang lebih baik di tiga tahun mendatang.

marsbit5j yang lalu

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

marsbit5j yang lalu

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

Tiga tahun kemudian: Meninjau Kembali 20 Prediksi ChatGPT Saya pada 2023 Pada Maret 2023, penulis Wang Jianshuo membuat 20 prediksi intuitif tentang ChatGPT dan AI masa depan. Kini, di Mei 2026, sebuah sistem AI yang terdiri dari 41 agen menganalisis prediksi-prediksi tersebut berdasarkan data terkini. Hasilnya menunjukkan pola menarik. **Yang Terbukti Benar (Secara Umum):** * **RAG dan Arsitektur Pencarian (✅):** Solusi utama untuk pengetahuan dan halusinasi adalah dengan menambahkan "contekan" (RAG), bukan mengubah model. Arsitektur pencarian + LLM kini menjadi standar. * **LUI sebagai Benua Baru (🟢):** Antarmuka Pengguna Bahasa Alami (LUI) adalah lapisan interaksi baru yang besar, melahirkan industri agen dan protokol seperti MCP. * **Jaringan Robot dan Sistem Pengalamatan Baru (🟢):** Agen akan berkomunikasi otomatis dengan bahasa alami. Protokol seperti MCP dan ANP sedang mewujudkannya. * **Model Besar Tiongkok (🟢):** Model-model seperti DeepSeek dan Qwen telah mengejar ketertinggalan performa, meski dengan investasi lebih kecil. * **Tidak Ada Kesadaran, Tes Turing Hanya Ukur Penampilan (🟢):** AI tidak memiliki kesadaran. Tes Turing hanya mengukur ilusi kesadaran. * **Prediksi Lain yang Benar:** ChatGPT bukan AGI, tapi lompatan besar; gelombang pengangguran besar tidak terjadi; tahun besar untuk startup; momen "browser 1994" telah tiba. **Yang Kurang Tepat atau Salah:** * **Parameter GPT-4 (❌):** Prediksi 100 triliun parameter salah. Estimasi terbaru sekitar 1,8 triliun. * **Matematika di LLM (🟡):** Diagnosis bahwa matematika adalah kelemahan intrinsik dan memerlukan alat bantu benar. Namun, pernyataan "tidak mungkin" ditingkatkan terbukti salah, karena model kini bisa memenangkan medali emas Olimpiade Matematika Internasional (IMO). * **Penangkapan Nilai (🟡):** Aplikasi memang berkembang pesat, tetapi nilai terbesar justru ditangkap oleh lapisan komputasi (seperti Nvidia), bukan oleh pembuat model. * **Hak Cipta (🟡):** Konten AI sulit didaftarkan hak cipta, tetapi tidak serta-mata "menghindari" pelanggaran. Gugatan dan penyelesaian besar (misalnya, Anthropic $1,5 miliar) membuktikan risikonya. * **Biaya Model (🟡):** Prediksi "perang lokal" dengan biaya $5-10 miliar untuk model canggih terbukti salah. Biaya pelatihan model terdepan (seperti GPT-5) jauh lebih tinggi, sementara biaya kloning model terbuka justru bisa lebih murah. **Pola dan Pelajaran:** 1. **Arah dan mekanisme lebih dapat diandalkan daripada angka pasti dan pernyataan mutlak.** 2. **Cenderung terlalu optimis untuk jangka pendek (kecepatan), tetapi terlalu konservatif untuk jangka panjang (skala/dampak).** 3. **Kesalahan sering terjadi pada distribusi, bukan pada total.** Contoh: Tidak ada gelombang pengangguran masif, tetapi dampak berat dirasakan oleh lulusan baru. 4. **Pernyataan yang disertai batasan dan ruang ketidakpastian justru lebih tahan uji waktu.** 5. **Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun.** Kesimpulannya, prediksi tentang arah besar dan mekanisme cenderung akurat, sementara prediksi spesifik tentang angka, kecepatan, dan distribusi dampak lebih sering meleset. Latihan ini lebih merupakan pelajaran dalam kerendahan hati dan penilaian yang bernuansa daripada sekadar penghitungan skor.

链捕手7j yang lalu

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

链捕手7j yang lalu

Peringatan Gelembung AI: Investasi AI Merupakan Pengembalian Negatif bagi Kebanyakan Raksasa Teknologi

Peringatan Gelembung AI: Investasi AI Membawa Pengembalian Negatif bagi Sebagian Besar Raksasa Teknologi Demam AI kini memasuki tahap pemeriksaan keuangan. Raksasa cloud seperti Microsoft, Alphabet, Amazon, Meta, dan Oracle berencana menginvestasikan ratusan miliar dolar ke pusat data AI dalam lima tahun ke depan. Namun, analisis terhadap proyeksi pendapatan dan pengeluaran modal (capex) hingga 2030 mengungkap masalah: tingkat pengembalian investasi implisit diperkirakan sangat negatif bagi semua perusahaan kecuali Amazon, bahkan dalam skenario optimis ekstrem. Ini menunjukkan bahwa jika tren saat ini berlanjut, boom AI bisa menjadi salah satu peristiwa perusakan nilai pemegang saham terbesar. Ada dua jalan keluar: pendapatan yang jauh melebihi ekspektasi saat ini, atau pengurangan rencana investasi. Jalan pertama tampaknya mustahil, karena membutuhkan tambahan pendapatan triliunan dolar. Jalan kedua—pemotongan investasi—akan berdampak luas, meruntuhkan harga saham perusahaan-perusahaan teknologi global dan dapat mendorong ekonomi AS ke resesi, mengingat 93% pertumbuhan PDB AS belakangan ini didorong oleh investasi teknologi. IPO perusahaan AI seperti OpenAI dan Anthropic tahun ini bisa menjadi mekanisme transfer risiko, memindahkan ketidakpastian dari pemilik awal kepada investor ritail dan dana pensiun. Sementara euphoria pemasaran mungkin bertahan hingga setelah IPO tahun 2026, tekanan matematika yang tak terelakkan mungkin memaksa raksasa cloud mengumumkan pemotongan investasi pada 2027 atau 2028, mirip dengan jeda tiga tahun antara peringatan "irrational exuberance" Alan Greenspan pada 1996 dan pecahnya gelembung dotcom pada 2000.

marsbit8j yang lalu

Peringatan Gelembung AI: Investasi AI Merupakan Pengembalian Negatif bagi Kebanyakan Raksasa Teknologi

marsbit8j yang lalu

Dari Token ke Tenaga Kerja Mesin: AI Sedang Berubah dari Alat Menjadi 'Pekerja'

Dari Token ke Tenaga Kerja Mesin: AI Berubah dari Alat Menjadi "Pekerja" AI mulai menulis kode, menangani tiket dukungan pelanggan, dan meninjau dokumen hukum. Artikel ini mengusulkan kerangka baru: komersialisasi AI sedang bergerak menuju "pasar tenaga kerja mesin". Dalam pasar ini, token hanyalah unit pengukuran, GPU adalah bahan baku, dan model adalah alat produksi. Objek yang benar-benar ditetapkan harganya dan diperdagangkan adalah kerja ekonomi yang diselesaikan langsung oleh perangkat lunak. Mekanisme penetapan harga AI akan berkembang dari token mentah, kemampuan model yang terstandarisasi, tenaga kerja yang terspesialisasi industri, hingga pasar hasil yang dapat diprogram. Di masa depan, perusahaan mungkin tidak lagi peduli model atau GPU mana yang menyelesaikan suatu tugas, tetapi lebih pada apakah tugas itu diselesaikan dalam batas latensi, akurasi, keandalan, dan biaya yang ditentukan. Implikasinya, dampak AI pada pasar tenaga kerja manusia tidak hanya sekadar penggantian. Saat mesin mengambil alih lebih banyak pekerjaan yang dapat distandardisasi dan diverifikasi, peran manusia mungkin bergeser ke pengawasan, penanggung jawab, manajemen konteks, dan keputusan akhir. Dalam beberapa kasus, penilaian manusia untuk 1% akhir justru menjadi lebih berharga karena dapat membuka kunci 99% otomatisasi skala besar. Pasar AI adalah pasar ekspansif. Ketika biaya kerja turun, permintaan tidak tetap. Jika interaksi dukungan pelanggan menjadi lebih murah, perusahaan dapat menawarkan layanan 24/7, menciptakan pasar interaksi pelanggan yang lebih besar. Persaingan tahap berikutnya di pasar AI mungkin bukan lagi sekadar pertarungan kemampuan model atau perang harga daya komputasi, tetapi tentang siapa yang dapat pertama kali menstandarisasi, memverifikasi, dan menetapkan harga "pekerjaan", akhirnya menjadikan tenaga kerja mesin sebagai faktor produksi baru yang dapat dibeli, diselesaikan, dan diperdagangkan.

marsbit8j yang lalu

Dari Token ke Tenaga Kerja Mesin: AI Sedang Berubah dari Alat Menjadi 'Pekerja'

marsbit8j yang lalu

Diskon 99% untuk MiMo Bukan Hanya Pemasaran! Luo Fuli Membantah Para Pengecam di X

**Ringkasan:** Xiaomi MiMo memotong harga API MiMo-V2.5 hingga **99%**, memicu spekulasi tentang perang harga atau strategi merugi. Luo Fuli, kepala MiMo, merespons dengan mempublikasikan blog teknis 5000 kata yang merinci **enam pilar teknikal** di balik potongan harga besar ini. Intinya, diskon 99% terutama untuk **Input (Cache Hit)** – bagian dimana pengguna membaca ulang konteks historis dalam percakapan panjang. Ini menjadi mungkin karena serangkaian optimasi teknikal yang mengubah biaya komputasi untuk bagian tersebut mendekati nol. **Enam Pilar Teknikal:** 1. **Arsitektur Hybrid SWA:** Menggunakan Sliding Window Attention di sebagian besar lapisan model, mengurangi volume **KVCache** (memori jangka pendek model) hingga **1/7**. 2. **Manajemen KVCache Dua Kolam:** Mengalokasikan memori secara terpisah untuk lapisan SWA dan Full Attention, benar-benar mewujudkan penghematan teoretis 1/7 dan meningkatkan jumlah pengguna yang dapat dilayani secara bersamaan. 3. **Prefix Cache yang Dioptimalkan:** Meningkatkan aturan pencocokan cache untuk arsitektur SWA, menghasilkan **tingkat keberhasilan cache 93-95%** untuk pembacaan ulang. Artinya, sebagian besar permintaan "baca ulang" tidak memerlukan komputasi GPU baru. 4. **Sistem Cache Terdistribusi GCache:** Menyimpan data cache di **SSD bawaan mesin GPU**, menghilangkan biaya penyimpanan cluster khusus dan memperpanjang masa hidup cache. 5. **Sistem Penjadwalan LLM-Router:** Mengarahkan permintaan secara cerdas berdasarkan kesamaan prefix dan panjang konteks, memprioritaskan permintaan yang menggunakan cache, meningkatkan efisiensi dan mengurangi latensi. 6. **Multi-Token Prediction (MTP):** Mengoptimalkan proses generasi output model, mempercepat pembuatan respons dan melengkapi pengurangan biaya di sisi input. **Kesimpulan:** Penurunan harga 99% bukanlah gimmick pemasaran atau strategi merugi, tetapi hasil dari **efisiensi sistemik rekayasa AI** yang telah divalidasi di lingkungan produksi. Rantai optimasi ini secara kumulatif mengurangi biaya komputasi per permintaan hingga lebih dari 95%, memungkinkan penurunan harga ekstrem sambil mempertahankan profitabilitas. Luo Fuli menekankan bahwa ini adalah masalah teknikal yang terwujud, bukan sekadar perang harga.

marsbit10j yang lalu

Diskon 99% untuk MiMo Bukan Hanya Pemasaran! Luo Fuli Membantah Para Pengecam di X

marsbit10j yang lalu

Trading

Spot
Futures

Artikel Populer

Cara Membeli CORE

Selamat datang di HTX.com! Kami telah membuat pembelian CORE (CORE) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli CORE (CORE) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan CORE (CORE) AndaSetelah melakukan pembelian, simpan CORE (CORE) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading CORE (CORE)Lakukan trading CORE (CORE) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

412 Total TayanganDipublikasikan pada 2024.12.13Diperbarui pada 2025.03.21

Cara Membeli CORE

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga CORE (CORE) disajikan di bawah ini.

活动图片