Agentic Design Patterns: Buku yang Membuat Saya Memahami Kembali "Apa Itu Agent Sebenarnya"

链捕手Dipublikasikan tanggal 2026-05-25Terakhir diperbarui pada 2026-05-25

Abstrak

Buku *Agentic Design Patterns* oleh Antonio Gulli (direktur teknik Google) menawarkan kerangka untuk memahami dan membangun AI Agent. Artikel ini menyoroti beberapa konsep kunci: **1. Level Agent (0-3):** Sebagian besar "AI" saat ini hanya Level 0 (LLM telanjang tanpa alat). Agent sejati dimulai dari Level 1 (pengguna alat yang memutuskan kapan dan bagaimana menggunakan alat), Level 2 (pemikir strategis dengan perencanaan dan *Context Engineering*), hingga Level 3 (kolaborasi multi-Agent seperti tim). **2. Context Engineering:** Lebih dari sekadar *prompt engineering*, ini adalah seni menyusun konteks yang tepat (termasuk *system prompt*, data eksternal, data implisit, dan umpan balik) untuk memberi Agent informasi yang terfokus dan relevan, meningkatkan akurasi. **3. Reflection (Produser-Kritikus):** Pola praktis di mana satu Agent (Produser) menghasilkan output, dan Agent lain (Kritikus) dengan peran/prompt berbeda meninjaunya. Mereka berinteraksi dalam loop hingga kualitas memadai. Pendekatan ini meningkatkan kualitas hasil untuk coding, penulisan, dll. **4. Kolaborasi Multi-Agent:** Tidak harus kompleks. Tiga topologi komunikasi umum: Agen Tunggal, Peer-to-Peer, dan Supervisor (agen pengatur yang mengoordinasikan pekerja). Pilihan tergantung pada kompleksitas tugas. **5. Memori Tiga Lapis:** *Session* (memori percakapan sementara), *State* (data sementara untuk satu tugas), dan *Memory* (penyimpanan jangka panjang untuk preferensi dan pembelajaran). Desain strategi p...

Penulis: Yanhua

Antonio Gullí adalah Direktur Teknik di Google. Dia menulis buku setebal 453 halaman, yang memecah pengembangan AI Agent menjadi 21 pola desain.

Namun ini bukan resensi buku. Motivasi saya membaca buku ini sangat spesifik: Saya pernah menulis tentang Harness Engineering, tentang pengalaman jatuh-bangun Clawdbot, tentang "AI Agent Bukan Sihir" yang membahas tujuh titik balik dari sekedar membakar token hingga benar-benar berguna, dan setiap kali selesai menulis, selalu ada satu pertanyaan yang belum sepenuhnya terjawab: Apakah ada logika dasar yang dapat digunakan kembali di balik semua ini?

Buku ini memberikan jawabannya, dan lebih dalam dari yang saya bayangkan.

Apa yang Anda Buat Mungkin Bukan Agent Sama Sekali

Penilaian paling tajam dalam buku ini tersembunyi di bagian prolog.

"AI" yang digunakan kebanyakan orang hanya Level 0: LLM polos, tanpa alat, tanpa memori, tidak bisa bertindak. Anda bertanya film apa yang memenangkan Oscar 2025, dia menebak. Buku ini menyebutkan dengan gamblang: Barang Level 0, bukan Agent.

Baru ke atas itulah Agent sebenarnya:

  • Level 1: Pengguna Alat

    Agent mulai menggunakan alat: pencarian, API, basis data. Tapi tidak sekedar "bisa panggil API", dia harus menilai sendiri kapan harus memanggil, memanggil apa, dan bagaimana menggunakan hasilnya. Buku ini memberikan contoh yang sangat spesifik: pengguna bertanya "Ada drama baru apa akhir-akhir ini?", Agent sendiri menyadari informasi ini tidak ada dalam data latihan, aktif memanggil alat pencarian untuk mencari, lalu menyintesis hasilnya. Langkah kuncinya adalah "menyadari sendiri". Bukan manusia yang menyuruhnya "coba kamu cari", tapi dia yang menilai perlu mencari. Kemampuan menilai ini adalah ambang batas Level 1.

  • Level 2: Pemikir Strategis

    Menambah dua hal: perencanaan dan Context Engineering. Buku ini mendefinisikan Context Engineering: bukan menumpuk informasi, tapi menyaring, memangkas, mengemas konteks dengan cermat. Contohnya sangat bagus: pengguna ingin mencari kedai kopi di antara dua lokasi. Agent pertama-tama memanggil alat peta untuk mendapatkan segudang data, lalu dia menilai sendiri "langkah selanjutnya hanya membutuhkan nama jalan", memangkas keluaran peta menjadi daftar pendek, lalu memberikannya ke alat pencarian lokal. Setiap langkah melakukan peredaman kebisingan informasi.

    Ada satu kalimat dalam buku ini yang saya baca berulang kali: "Agar AI mencapai akurasi tertinggi, berikan dia konteks yang pendek, fokus, dan kuat." Context Engineering lah yang melakukan hal ini.

    Sampai level ini, Agent juga bisa refleksi diri. Setelah selesai bekerja, meninjau sendiri, menemukan masalah, dan memperbaikinya sendiri. Akan saya bahas lebih detail nanti.

  • Level 3: Kolaborasi Multi-Agent

    Posisi buku ini sangat jelas: jangan selalu berpikir untuk membuat satu super agent serba bisa. Cara yang benar-benar andal adalah seperti membangun tim, Agent Manajer Proyek + Agent Peneliti + Agent Desainer + Agent Penulis Naskah. Contoh yang diberikan buku ini adalah peluncuran produk baru: satu "Agent Manajer Proyek" sebagai pengatur keseluruhan, menugaskan pekerjaan ke "Agent Penelitian Pasar", "Agent Desain Produk", "Agent Pemasaran". Kuncinya adalah komunikasi: bagaimana antar-Agent mentransfer data, bagaimana sinkronisasi status, bagaimana menangani konflik. Bab ini menggambarkan enam struktur topologi komunikasi, dari yang paling sederhana Single Agent hingga yang paling fleksibel Custom Hybrid, masing-masing disertai penjelasan situasi apa yang cocok.

Setelah melihat empat level ini, saya tiba-tiba mengerti mengapa banyak orang mengatakan "Agent saya tidak berguna". Model tidak bermasalah, masalahnya adalah Anda menggunakannya seperti chatbot, mungkin bahkan belum mencapai Level 1.

Context Engineering: Konsep yang Paling Diremehkan dalam Buku

Saya pernah menulis tentang Harness Engineering, yang membahas bahwa desain lintasan balap lebih penting daripada tenaga mesin. Setelah membaca buku ini, saya menemukan Context Engineering adalah pemetaan Harness Engineering di tingkat prompt.

Prompt Engineering tradisional hanya mengatur "bagaimana Anda bertanya". Context Engineering dalam buku ini mengatur "sebelum bertanya, apa yang ada di hadapan Agent". Ini mencakup empat lapisan informasi:

  1. Lapisan pertama, system prompt. Mendefinisikan siapa Agent, nada bicara apa, batasan apa. Kebanyakan orang hanya menulis lapisan ini.

  2. Lapisan kedua, data eksternal. Dokumen yang diambil dari RAG, nilai pengembalian dari pemanggilan alat, data API real-time. Ini adalah tempat kebanyakan orang terjebak: tahu harus memberikan data, tapi tidak tahu bagaimana caranya agar model tidak tenggelam.

  3. Lapisan ketiga, data implisit. Identitas pengguna, riwayat interaksi, status lingkungan. Hal-hal yang tidak Anda nyatakan tetapi harus diketahui Agent. Misalnya, Anda berkata kepada Agent "tolong kirim email kepada John untuk konfirmasi rapat besok", dia harus tahu rapat besok apa di kalender Anda, hubungan Anda dengan John seperti apa.

  4. Lapisan keempat, loop umpan balik. Setelah setiap keluaran Agent, menilai kualitas secara otomatis, menyesuaikan strategi konteks berikutnya. Buku menyebut ini "optimasi konteks otomatis", Prompt Optimizer Google Vertex AI adalah implementasi rekayasa dari pemikiran ini.

Saat membaca bagian ini, saya teringat tulisan sebelumnya "AI Agent Bukan Sihir", di dalamnya ada satu pengalaman bahwa "Agent Anda butuh aturan, dan itu banyak aturan". Sekarang melihat ke belakang, aturan-aturan itu pada dasarnya adalah versi manual dari Context Engineering, yang telah disistematisasi dalam buku ini.

Reflection: Dua Agent Benar-Benar Lebih Baik daripada Satu

Ini adalah Pattern yang paling bernilai praktis dalam buku ini bagi saya.

Inti Reflection sederhana: setelah Agent selesai bekerja, dia meninjau sendiri, menemukan masalah, dan memperbaikinya sendiri. Tapi cara implementasinya perlu dipertimbangkan. Buku ini mengatakan dengan jelas: Producer dan Critic harus menggunakan dua Agent berbeda, dengan system prompt yang berbeda. Persona yang sama meninjau karyanya sendiri pasti memiliki titik buta. Anda meminta LLM yang sama untuk menulis kode, lalu meninjau kode yang ditulisnya sendiri, kemungkinan besar dia akan berkata "lumayan bagus".

Buku ini memberikan contoh kode lengkap.

  • Prompt Producer adalah "Anda adalah pengembang Python, tulis fungsi untuk menghitung faktorial, tangani kondisi batas dan pengecualian."

  • Prompt Critic adalah "Anda adalah insinyur senior yang sangat teliti, tinjau kode baris per baris, periksa Bug, gaya, kondisi batas yang terlewat, bagian yang dapat ditingkatkan. Jika sempurna, keluarkan CODE_IS_PERFECT, jika tidak daftarkan semua masalah."

  • Kemudian ada loop for: Producer menulis kode → Critic meninjau → Producer memperbaiki berdasarkan saran → Critic meninjau lagi → sampai Critic berkata CODE_IS_PERFECT atau mencapai jumlah iterasi maksimum.

Sesederhana itu. Tapi buku ini mengingatkan masalah biaya yang sering diabaikan: setiap siklus refleksi adalah pemanggilan LLM baru, semakin banyak iterasi semakin mahal. Dan seiring membengkaknya riwayat percakapan, jendela konteks dipenuhi versi sebelumnya dan kritik, ruang penalaran yang tersedia sebenarnya menyusut. Jadi praktik terbaik Reflection adalah: tetapkan jumlah iterasi maksimum yang masuk akal (buku menggunakan 3), begitu Critic puas berhenti, jangan mengejar kesempurnaan.

Penggunaannya jauh lebih dari sekedar menulis kode. Menulis artikel, membuat rencana, merangkum dokumen, menyelesaikan soal logika, model Producer-Critic semua bisa diterapkan. Buku ini mendaftarkan tujuh skenario aplikasi, logika intinya sama: hasilkan dulu, tinjau kemudian, perbaiki lagi.

Multi-Agent Bukan Berarti Semakin Kompleks Semakin Baik

Yang paling saya sukai dari bab Multi-Agent Collaboration adalah enam diagram topologi komunikasi itu. Banyak orang langsung menggunakan yang kompleks, tapi sebenarnya sebagian besar skenario cukup tiga saja:

  1. Single Agent (Eksekusi Mandiri): Tugas dapat dipecah menjadi sub-masalah yang tidak bergantung, setiap Agent menyelesaikan sendiri. Sederhana, mudah dirawat.

  2. Jaringan Setara (Peer-to-Peer): Antar-Agent berkomunikasi langsung, tanpa node kontrol pusat. Terdesentralisasi, toleransi kesalahan baik, satu Agent mati tidak mempengaruhi keseluruhan. Tapi biaya koordinasi tinggi, mudah kacau.

  3. Pengawas (Supervisor / Penjadwal Pusat): Sebuah Supervisor Agent mengelola sekelompok Worker Agent. Membagikan tugas, mengumpulkan hasil, menyelesaikan konflik. Hirarki jelas, mudah dikelola. Tapi Supervisor adalah titik kegagalan tunggal, sekaligus hambatan kinerja.

Tiga lainnya (Supervisor-as-Tool, Hierarkis, Hybrid Kustom) adalah varian dan kombinasi dari tiga yang pertama. Buku ini mengatakan dengan sangat realistis: Topologi yang Anda butuhkan tergantung pada kompleksitas tugas Anda. Semakin terpecah-pecah tugasnya, semakin tinggi biaya komunikasi, pada tingkat tertentu mode Supervisor justru lebih efisien daripada model hierarkis.

Pelajaran saya adalah, banyak orang menghabiskan 80% waktu membangun Multi-Agent pada protokol komunikasi, lupa bertanya masalah yang lebih mendasar: apakah tugas ini benar-benar membutuhkan banyak Agent? Buku ini menulis dengan jelas, Single Agent Level 2 + Reflection seringkali sudah cukup. Level 3 disiapkan untuk skenario yang memang tidak bisa ditangani oleh Single Agent.

Model Memori Tiga Lapis, Saya Sebelumnya Hanya Merasa Ada tapi Tak Diberi Nama

Bab Memori ini paling saya resapi, karena saat menulis dua artikel tentang Obsidian + Claude, saya selalu merenungkan satu pertanyaan: bagaimana memori Agent harus dibagi lapisan?

Buku ini memberikan jawabannya:

  1. Sesi (Lapisan Percakapan): Jendela konteks percakapan saat ini, ini adalah memori terpendek, berakhir percakapan hilang. Model konteks panjang hanya memperbesar jendela ini, tapi pada dasarnya masih sementara, dan setiap penalaran harus memproses seluruh jendela, mahal dan lambat.

  2. Status (Lapisan Status): Data sementara yang sedang berjalan dalam tugas saat ini. Misalnya "tugas apa yang sedang dikerjakan", "sudah sampai tahap mana", "data apa yang dihasilkan di tengah". Lebih panjang dari Sesi, tapi berakhir tugas dibersihkan, buku ini menggunakan mekanisme State Google ADK untuk memberikan contoh lengkap.

  3. Memori (Lapisan Tahan Lama): Memori jangka panjang lintas sesi, lintas tugas. Preferensi pengguna, pengalaman yang dipelajari, keputusan historis penting, disimpan di basis data atau vector store, diambil secara semantik. Buku ini menekankan poin penting: Memori bukan hanya disimpan, tapi juga mendesain strategi lengkap "menyimpan apa, kapan menyimpan, bagaimana mengambil". Menyimpan terlalu banyak meningkatkan kebisingan, menyimpan terlalu sedikit tidak cukup.

Sebelumnya saat menulis artikel Clawdbot yang menyebutkan "file status" dan "dokumen workspace", pada dasarnya itu adalah versi manual dari lapisan State dan Memory, buku ini membingkai hal ini.

Lima Hipotesis, Yang Kelima Paling Tak Masuk Akal

Di akhir buku disebutkan lima hipotesis tentang masa depan Agent, empat pertama masih dalam jangkauan penalaran wajar: General-Purpose Agent dari menulis kode hingga mengelola proyek, personalisasi mendalam aktif menemukan kebutuhan Anda, embodied intelligence keluar layar ke dunia fisik, Agent menjadi entitas ekonomi mandiri.

Yang kelima membuat saya terkejut: Multi-Agent yang Berubah Bentuk.

Anda hanya mendeklarasikan tujuan, misalnya "buat bisnis e-commerce kopi spesialitas". Sistem secara otomatis memutuskan: pertama buat "Agent Penelitian Pasar" dan "Agent Merek". Setelah menjalankan satu putaran data, dia menilai sendiri Agent Merek tidak dibutuhkan lagi, memecah menjadi tiga baru: "Agent Desain Logo", "Agent Pembuatan Situs", "Agent Rantai Pasok". Jika Agent Pembuatan Situs menjadi hambatan, sistem akan secara otomatis menggandakan tiga Agent paralel yang bekerja bersamaan di halaman berbeda. Selama proses ini, sistem terus-menerus secara otomatis menyesuaikan prompt setiap Agent, terus-menerus menyusun ulang arsitektur tim.

Buku ini menyebutnya sebagai "sistem multi-Agent yang digerakkan tujuan, dapat mengubah bentuk sendiri". Dia tidak menjalankan rencana yang Anda tulis, dia sendiri yang menghasilkan rencana, menyesuaikan rencana sendiri, menyusun ulang tim pelaksana sendiri.

Ini mengingatkan saya pada AutoResearch Karpathy: menulis program.md, mendefinisikan tujuan, metrik, batasan, tekan "mulai". Manusia berada di luar loop. Tapi buku ini mendorong lebih jauh: bahkan bagaimana tim Agent dibentuk, bagaimana disusun ulang, semuanya diserahkan kepada sistem untuk memutuskan sendiri. Manusia hanya mendeklarasikan "menginginkan apa".

Tiga Hal yang Bisa Segera Dilakukan

Setelah membaca buku ini, saya memiliki tiga tindakan yang dapat segera diterapkan:

  • Pertama, tambahkan Critic pada Agent Anda saat ini. Baik Anda menggunakan Claude Code, CrewAI, atau kerangka kerja buatan sendiri, tambahkan satu langkah di akhir workflow Anda: biarkan Agent lain (dengan system prompt berbeda) meninjau keluaran langkah sebelumnya. Pembuatan kode ditambah tinjauan kode, penulisan artikel ditambah pemeriksaan fakta, pembuatan rencana ditambah peninjauan kelayakan. Satu pemanggilan LLM tambahan, tapi peningkatan kualitas seringkali berlipat ganda. Pola Producer-Critic dalam buku ini adalah plug and play.

  • Kedua, mulailah melakukan Context Engineering, bukan hanya Prompt Engineering. Tinjau kembali file instruksi yang Anda tulis untuk Agent. Jika semuanya adalah aturan "bagaimana Anda melakukannya", kurang konteks "lingkungan apa yang sedang Anda hadapi sekarang", tambahkan. Beritahu Agent proyek mana yang sedang dia tangani, keputusan apa yang pernah dibuat sebelumnya, preferensi pengguna seperti apa. Bab Context Engineering dalam buku ini dan AGENTS.md Anda adalah dua ungkapan dari hal yang sama.

  • Ketiga, jangan buru-buru menerapkan Multi-Agent. Sempurnakan Single Agent Anda sampai Level 2: memiliki alat, Reflection, Memori. Buku ini berulang kali menekankan, Single Agent Level 2 ditambah Producer-Critic dan Context Engineering dapat mencakup sebagian besar skenario nyata. Level 3 disiapkan untuk tugas yang benar-benar lintas domain, multi-tahap, membutuhkan pembagian kerja paralel. Masalah kebanyakan orang bukan Agentnya kurang banyak, tapi satu Agent pun belum diatur dengan baik.

Buku ini 453 halaman, diterbitkan Springer tahun 2025. Contoh kode mencakup LangChain/LangGraph, Google ADK, CrewAI, OpenAI API. Kata pengantar ditulis oleh VP AI Google Cloud, dan ada rekomendasi dari CIO Goldman Sachs, mengejutkan bagus.

Tapi alasan saya merekomendasikannya bukan karena "lengkap". Tapi karena Anda akan menyadari satu hal setelah membacanya: semua lubang yang Anda masuki selama setengah tahun terakhir di dunia Agent, sudah ada yang mengumpulkan menjadi pola. Anda tidak perlu lagi menemukan Reflection, tidak perlu lagi menebak bagaimana Memori harus dibagi lapisan, tidak perlu lagi mencoba topologi komunikasi Multi-Agent mana yang harus digunakan.

Ada orang yang sudah menggambar peta untuk Anda, sisanya tinggal melangkah.

Apakah Anda menggunakan AI Agent untuk pengembangan? Agent Anda sekarang sampai Level berapa?

Pertanyaan Terkait

QApakah perbedaan antara Level 0 dan Level 1 AI Agent menurut buku 'Agentic Design Patterns'?

ALevel 0 hanyalah LLM telanjang tanpa alat, ingatan, atau kemampuan bertindak. Itu hanya menebak berdasarkan data pelatihannya, seperti menebak pemenang Oscar 2025. Level 1 adalah Agent sejati yang mampu menggunakan alat seperti pencarian atau API. Yang membedakan adalah kemampuan Level 1 untuk menyadari sendiri kapan perlu menggunakan alat tersebut, tanpa disuruh manusia, lalu mensintesis hasilnya.

QApa itu 'Context Engineering' dan bagaimana perbedaannya dengan 'Prompt Engineering' tradisional?

AContext Engineering adalah konsep yang mengelola 'apa yang ada di depan mata Agent sebelum ia bertanya/bertindak'. Ini mencakup empat lapis informasi: system prompt, data eksternal (hasil RAG/API), data implisit (sejarah, preferensi), dan umpan balik (evaluasi otomatis). Prompt Engineering tradisional hanya fokus pada 'bagaimana cara Anda bertanya', sedangkan Context Engineering mengatur seluruh konteks yang tersedia untuk Agent agar keputusannya lebih tepat dan terfokus.

QBagaimana pola 'Reflection' dalam buku tersebut meningkatkan kualitas output sebuah AI Agent?

APola Reflection menggunakan dua Agent terpisah: 'Producer' untuk menghasilkan output (misalnya kode) dan 'Critic' untuk mengkritiknya. Mereka memiliki system prompt dan peran yang berbeda untuk menghindari bias. Mereka bekerja dalam loop: Producer membuat → Critic meninjau → Producer merevisi berdasarkan kritik → dan seterusnya hingga kritik puas atau mencapai batas iterasi. Pendekatan ini secara signifikan meningkatkan kualitas hasil seperti kode, artikel, atau rencana.

QApa saja tiga jenis topologi komunikasi dasar untuk Multi-Agent Collaboration yang disebutkan dalam artikel, dan kapan masing-masing cocok digunakan?

ATiga topologi dasar adalah: 1) **Single Agent (Eksekusi Independen)**: Cocok untuk tugas yang dapat dipecah menjadi submasalah yang tidak bergantung satu sama lain. 2) **Jaringan Peer-to-Peer**: Agent berkomunikasi langsung, cocok untuk sistem yang membutuhkan ketahanan tanpa titik pusat. 3) **Supervisor (Penjadwal Pusat)**: Sebuah Agent pengawas mengelola pekerja, cocok untuk koordinasi tugas yang kompleks dengan hierarki jelas. Pilihan tergantung pada kompleksitas tugas; tidak perlu selalu memilih yang paling rumit.

QApa tiga hal yang dapat segera dilakukan setelah membaca buku ini untuk meningkatkan AI Agent yang ada?

ATiga hal yang dapat segera dilakukan adalah: 1) **Tambahkan sebuah Critic** pada workflow Agent yang ada untuk meninjau output secara otomatis. 2) **Mulai terapkan Context Engineering**, bukan hanya Prompt Engineering, dengan memperkaya instruksi dengan informasi kontekstual tentang proyek, keputusan sebelumnya, dan preferensi pengguna. 3) **Jangan terburu-buru menggunakan Multi-Agent**; tingkatkan dulu satu Agent ke Level 2 dengan alat, Reflection, dan Memori yang baik, karena itu sudah cukup untuk banyak skenario.

Bacaan Terkait

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

Tiga tahun kemudian, pada Mei 2026, penulis meninjau kembali 20 prediksi tentang ChatGPT yang dibuatnya pada Maret 2023, menggunakan AI untuk mengevaluasi akurasinya berdasarkan data terbaru. Secara keseluruhan, arah dan mekanisme prediksi banyak yang tepat. Yang paling akurat adalah tentang RAG sebagai arsitektur standar, LUI (Antarmuka Pengguna Bahasa Alami) sebagai lapisan interaksi baru, munculnya "jaringan robot" (protokol untuk agen AI), dan kemampuan China mengejar ketertinggalan model AI besar. Prediksi bahwa ChatGPT bukan AGI namun langkah besar, tidak menyebabkan gelombang pengangguran massal, serta sifat uji Turing yang hanya mengukur persepsi juga pada dasarnya benar. Namun, prediksi dengan angka spesifik atau pernyataan mutlak sering meleset. Klaim bahwa GPT-4 memiliki 100 triliun parameter sepenuhnya salah. Pernyataan bahwa LLM "tidak mungkin" mengerjakan matematika murni terbantahkan dengan model penalaran yang memenangkan medali emas IMO. Estimasi biaya pelatihan model hanya $5-10 miliar juga jauh dari kenyataan, yang kini mencapai miliaran dolar untuk model terdepan. Beberapa prediksi keliru tentang distribusi dampak, seperti bahwa nilai akan berpindah ke lapisan aplikasi (nyatanya, penyedia chip seperti NVIDIA paling untung), atau bahwa AI akan "menghindari" masalah hak cipta (justru menimbulkan gugatan besar). Kesimpulan utama adalah: dalam memprediksi teknologi yang cepat berubah, mengidentifikasi arah dan mekanisme umumnya lebih bisa diandalkan daripada memberikan angka pasti atau pernyataan mutlak. Prediksi cenderung terlalu optimis tentang kecepatan perubahan jangka pendek, tetapi meremehkan besarnya perubahan jangka panjang. Penting juga untuk mempertimbangkan distribusi dampak, bukan hanya kesimpulan agregat. Pernyataan yang disertai batasan dan keraguan justru lebih tahan uji waktu. Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun. Tinjauan ini berfungsi sebagai pelajaran untuk membuat prediksi yang lebih baik di tiga tahun mendatang.

marsbit2j yang lalu

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

marsbit2j yang lalu

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

Tiga tahun kemudian: Meninjau Kembali 20 Prediksi ChatGPT Saya pada 2023 Pada Maret 2023, penulis Wang Jianshuo membuat 20 prediksi intuitif tentang ChatGPT dan AI masa depan. Kini, di Mei 2026, sebuah sistem AI yang terdiri dari 41 agen menganalisis prediksi-prediksi tersebut berdasarkan data terkini. Hasilnya menunjukkan pola menarik. **Yang Terbukti Benar (Secara Umum):** * **RAG dan Arsitektur Pencarian (✅):** Solusi utama untuk pengetahuan dan halusinasi adalah dengan menambahkan "contekan" (RAG), bukan mengubah model. Arsitektur pencarian + LLM kini menjadi standar. * **LUI sebagai Benua Baru (🟢):** Antarmuka Pengguna Bahasa Alami (LUI) adalah lapisan interaksi baru yang besar, melahirkan industri agen dan protokol seperti MCP. * **Jaringan Robot dan Sistem Pengalamatan Baru (🟢):** Agen akan berkomunikasi otomatis dengan bahasa alami. Protokol seperti MCP dan ANP sedang mewujudkannya. * **Model Besar Tiongkok (🟢):** Model-model seperti DeepSeek dan Qwen telah mengejar ketertinggalan performa, meski dengan investasi lebih kecil. * **Tidak Ada Kesadaran, Tes Turing Hanya Ukur Penampilan (🟢):** AI tidak memiliki kesadaran. Tes Turing hanya mengukur ilusi kesadaran. * **Prediksi Lain yang Benar:** ChatGPT bukan AGI, tapi lompatan besar; gelombang pengangguran besar tidak terjadi; tahun besar untuk startup; momen "browser 1994" telah tiba. **Yang Kurang Tepat atau Salah:** * **Parameter GPT-4 (❌):** Prediksi 100 triliun parameter salah. Estimasi terbaru sekitar 1,8 triliun. * **Matematika di LLM (🟡):** Diagnosis bahwa matematika adalah kelemahan intrinsik dan memerlukan alat bantu benar. Namun, pernyataan "tidak mungkin" ditingkatkan terbukti salah, karena model kini bisa memenangkan medali emas Olimpiade Matematika Internasional (IMO). * **Penangkapan Nilai (🟡):** Aplikasi memang berkembang pesat, tetapi nilai terbesar justru ditangkap oleh lapisan komputasi (seperti Nvidia), bukan oleh pembuat model. * **Hak Cipta (🟡):** Konten AI sulit didaftarkan hak cipta, tetapi tidak serta-mata "menghindari" pelanggaran. Gugatan dan penyelesaian besar (misalnya, Anthropic $1,5 miliar) membuktikan risikonya. * **Biaya Model (🟡):** Prediksi "perang lokal" dengan biaya $5-10 miliar untuk model canggih terbukti salah. Biaya pelatihan model terdepan (seperti GPT-5) jauh lebih tinggi, sementara biaya kloning model terbuka justru bisa lebih murah. **Pola dan Pelajaran:** 1. **Arah dan mekanisme lebih dapat diandalkan daripada angka pasti dan pernyataan mutlak.** 2. **Cenderung terlalu optimis untuk jangka pendek (kecepatan), tetapi terlalu konservatif untuk jangka panjang (skala/dampak).** 3. **Kesalahan sering terjadi pada distribusi, bukan pada total.** Contoh: Tidak ada gelombang pengangguran masif, tetapi dampak berat dirasakan oleh lulusan baru. 4. **Pernyataan yang disertai batasan dan ruang ketidakpastian justru lebih tahan uji waktu.** 5. **Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun.** Kesimpulannya, prediksi tentang arah besar dan mekanisme cenderung akurat, sementara prediksi spesifik tentang angka, kecepatan, dan distribusi dampak lebih sering meleset. Latihan ini lebih merupakan pelajaran dalam kerendahan hati dan penilaian yang bernuansa daripada sekadar penghitungan skor.

链捕手4j yang lalu

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

链捕手4j yang lalu

Peringatan Gelembung AI: Investasi AI Merupakan Pengembalian Negatif bagi Kebanyakan Raksasa Teknologi

Peringatan Gelembung AI: Investasi AI Membawa Pengembalian Negatif bagi Sebagian Besar Raksasa Teknologi Demam AI kini memasuki tahap pemeriksaan keuangan. Raksasa cloud seperti Microsoft, Alphabet, Amazon, Meta, dan Oracle berencana menginvestasikan ratusan miliar dolar ke pusat data AI dalam lima tahun ke depan. Namun, analisis terhadap proyeksi pendapatan dan pengeluaran modal (capex) hingga 2030 mengungkap masalah: tingkat pengembalian investasi implisit diperkirakan sangat negatif bagi semua perusahaan kecuali Amazon, bahkan dalam skenario optimis ekstrem. Ini menunjukkan bahwa jika tren saat ini berlanjut, boom AI bisa menjadi salah satu peristiwa perusakan nilai pemegang saham terbesar. Ada dua jalan keluar: pendapatan yang jauh melebihi ekspektasi saat ini, atau pengurangan rencana investasi. Jalan pertama tampaknya mustahil, karena membutuhkan tambahan pendapatan triliunan dolar. Jalan kedua—pemotongan investasi—akan berdampak luas, meruntuhkan harga saham perusahaan-perusahaan teknologi global dan dapat mendorong ekonomi AS ke resesi, mengingat 93% pertumbuhan PDB AS belakangan ini didorong oleh investasi teknologi. IPO perusahaan AI seperti OpenAI dan Anthropic tahun ini bisa menjadi mekanisme transfer risiko, memindahkan ketidakpastian dari pemilik awal kepada investor ritail dan dana pensiun. Sementara euphoria pemasaran mungkin bertahan hingga setelah IPO tahun 2026, tekanan matematika yang tak terelakkan mungkin memaksa raksasa cloud mengumumkan pemotongan investasi pada 2027 atau 2028, mirip dengan jeda tiga tahun antara peringatan "irrational exuberance" Alan Greenspan pada 1996 dan pecahnya gelembung dotcom pada 2000.

marsbit5j yang lalu

Peringatan Gelembung AI: Investasi AI Merupakan Pengembalian Negatif bagi Kebanyakan Raksasa Teknologi

marsbit5j yang lalu

Dari Token ke Tenaga Kerja Mesin: AI Sedang Berubah dari Alat Menjadi 'Pekerja'

Dari Token ke Tenaga Kerja Mesin: AI Berubah dari Alat Menjadi "Pekerja" AI mulai menulis kode, menangani tiket dukungan pelanggan, dan meninjau dokumen hukum. Artikel ini mengusulkan kerangka baru: komersialisasi AI sedang bergerak menuju "pasar tenaga kerja mesin". Dalam pasar ini, token hanyalah unit pengukuran, GPU adalah bahan baku, dan model adalah alat produksi. Objek yang benar-benar ditetapkan harganya dan diperdagangkan adalah kerja ekonomi yang diselesaikan langsung oleh perangkat lunak. Mekanisme penetapan harga AI akan berkembang dari token mentah, kemampuan model yang terstandarisasi, tenaga kerja yang terspesialisasi industri, hingga pasar hasil yang dapat diprogram. Di masa depan, perusahaan mungkin tidak lagi peduli model atau GPU mana yang menyelesaikan suatu tugas, tetapi lebih pada apakah tugas itu diselesaikan dalam batas latensi, akurasi, keandalan, dan biaya yang ditentukan. Implikasinya, dampak AI pada pasar tenaga kerja manusia tidak hanya sekadar penggantian. Saat mesin mengambil alih lebih banyak pekerjaan yang dapat distandardisasi dan diverifikasi, peran manusia mungkin bergeser ke pengawasan, penanggung jawab, manajemen konteks, dan keputusan akhir. Dalam beberapa kasus, penilaian manusia untuk 1% akhir justru menjadi lebih berharga karena dapat membuka kunci 99% otomatisasi skala besar. Pasar AI adalah pasar ekspansif. Ketika biaya kerja turun, permintaan tidak tetap. Jika interaksi dukungan pelanggan menjadi lebih murah, perusahaan dapat menawarkan layanan 24/7, menciptakan pasar interaksi pelanggan yang lebih besar. Persaingan tahap berikutnya di pasar AI mungkin bukan lagi sekadar pertarungan kemampuan model atau perang harga daya komputasi, tetapi tentang siapa yang dapat pertama kali menstandarisasi, memverifikasi, dan menetapkan harga "pekerjaan", akhirnya menjadikan tenaga kerja mesin sebagai faktor produksi baru yang dapat dibeli, diselesaikan, dan diperdagangkan.

marsbit5j yang lalu

Dari Token ke Tenaga Kerja Mesin: AI Sedang Berubah dari Alat Menjadi 'Pekerja'

marsbit5j yang lalu

Diskon 99% untuk MiMo Bukan Hanya Pemasaran! Luo Fuli Membantah Para Pengecam di X

**Ringkasan:** Xiaomi MiMo memotong harga API MiMo-V2.5 hingga **99%**, memicu spekulasi tentang perang harga atau strategi merugi. Luo Fuli, kepala MiMo, merespons dengan mempublikasikan blog teknis 5000 kata yang merinci **enam pilar teknikal** di balik potongan harga besar ini. Intinya, diskon 99% terutama untuk **Input (Cache Hit)** – bagian dimana pengguna membaca ulang konteks historis dalam percakapan panjang. Ini menjadi mungkin karena serangkaian optimasi teknikal yang mengubah biaya komputasi untuk bagian tersebut mendekati nol. **Enam Pilar Teknikal:** 1. **Arsitektur Hybrid SWA:** Menggunakan Sliding Window Attention di sebagian besar lapisan model, mengurangi volume **KVCache** (memori jangka pendek model) hingga **1/7**. 2. **Manajemen KVCache Dua Kolam:** Mengalokasikan memori secara terpisah untuk lapisan SWA dan Full Attention, benar-benar mewujudkan penghematan teoretis 1/7 dan meningkatkan jumlah pengguna yang dapat dilayani secara bersamaan. 3. **Prefix Cache yang Dioptimalkan:** Meningkatkan aturan pencocokan cache untuk arsitektur SWA, menghasilkan **tingkat keberhasilan cache 93-95%** untuk pembacaan ulang. Artinya, sebagian besar permintaan "baca ulang" tidak memerlukan komputasi GPU baru. 4. **Sistem Cache Terdistribusi GCache:** Menyimpan data cache di **SSD bawaan mesin GPU**, menghilangkan biaya penyimpanan cluster khusus dan memperpanjang masa hidup cache. 5. **Sistem Penjadwalan LLM-Router:** Mengarahkan permintaan secara cerdas berdasarkan kesamaan prefix dan panjang konteks, memprioritaskan permintaan yang menggunakan cache, meningkatkan efisiensi dan mengurangi latensi. 6. **Multi-Token Prediction (MTP):** Mengoptimalkan proses generasi output model, mempercepat pembuatan respons dan melengkapi pengurangan biaya di sisi input. **Kesimpulan:** Penurunan harga 99% bukanlah gimmick pemasaran atau strategi merugi, tetapi hasil dari **efisiensi sistemik rekayasa AI** yang telah divalidasi di lingkungan produksi. Rantai optimasi ini secara kumulatif mengurangi biaya komputasi per permintaan hingga lebih dari 95%, memungkinkan penurunan harga ekstrem sambil mempertahankan profitabilitas. Luo Fuli menekankan bahwa ini adalah masalah teknikal yang terwujud, bukan sekadar perang harga.

marsbit7j yang lalu

Diskon 99% untuk MiMo Bukan Hanya Pemasaran! Luo Fuli Membantah Para Pengecam di X

marsbit7j yang lalu

Trading

Spot
Futures
活动图片