Agentic Design Patterns: Buku yang Membuat Saya Memahami Kembali "Apa Itu Agent Sebenarnya"

链捕手Dipublikasikan tanggal 2026-05-25Terakhir diperbarui pada 2026-05-25

Abstrak

Buku *Agentic Design Patterns* oleh Antonio Gulli (direktur teknik Google) menawarkan kerangka untuk memahami dan membangun AI Agent. Artikel ini menyoroti beberapa konsep kunci: **1. Level Agent (0-3):** Sebagian besar "AI" saat ini hanya Level 0 (LLM telanjang tanpa alat). Agent sejati dimulai dari Level 1 (pengguna alat yang memutuskan kapan dan bagaimana menggunakan alat), Level 2 (pemikir strategis dengan perencanaan dan *Context Engineering*), hingga Level 3 (kolaborasi multi-Agent seperti tim). **2. Context Engineering:** Lebih dari sekadar *prompt engineering*, ini adalah seni menyusun konteks yang tepat (termasuk *system prompt*, data eksternal, data implisit, dan umpan balik) untuk memberi Agent informasi yang terfokus dan relevan, meningkatkan akurasi. **3. Reflection (Produser-Kritikus):** Pola praktis di mana satu Agent (Produser) menghasilkan output, dan Agent lain (Kritikus) dengan peran/prompt berbeda meninjaunya. Mereka berinteraksi dalam loop hingga kualitas memadai. Pendekatan ini meningkatkan kualitas hasil untuk coding, penulisan, dll. **4. Kolaborasi Multi-Agent:** Tidak harus kompleks. Tiga topologi komunikasi umum: Agen Tunggal, Peer-to-Peer, dan Supervisor (agen pengatur yang mengoordinasikan pekerja). Pilihan tergantung pada kompleksitas tugas. **5. Memori Tiga Lapis:** *Session* (memori percakapan sementara), *State* (data sementara untuk satu tugas), dan *Memory* (penyimpanan jangka panjang untuk preferensi dan pembelajaran). Desain strategi p...

Penulis: Yanhua

Antonio Gullí adalah Direktur Teknik di Google. Dia menulis buku setebal 453 halaman, yang memecah pengembangan AI Agent menjadi 21 pola desain.

Namun ini bukan resensi buku. Motivasi saya membaca buku ini sangat spesifik: Saya pernah menulis tentang Harness Engineering, tentang pengalaman jatuh-bangun Clawdbot, tentang "AI Agent Bukan Sihir" yang membahas tujuh titik balik dari sekedar membakar token hingga benar-benar berguna, dan setiap kali selesai menulis, selalu ada satu pertanyaan yang belum sepenuhnya terjawab: Apakah ada logika dasar yang dapat digunakan kembali di balik semua ini?

Buku ini memberikan jawabannya, dan lebih dalam dari yang saya bayangkan.

Apa yang Anda Buat Mungkin Bukan Agent Sama Sekali

Penilaian paling tajam dalam buku ini tersembunyi di bagian prolog.

"AI" yang digunakan kebanyakan orang hanya Level 0: LLM polos, tanpa alat, tanpa memori, tidak bisa bertindak. Anda bertanya film apa yang memenangkan Oscar 2025, dia menebak. Buku ini menyebutkan dengan gamblang: Barang Level 0, bukan Agent.

Baru ke atas itulah Agent sebenarnya:

  • Level 1: Pengguna Alat

    Agent mulai menggunakan alat: pencarian, API, basis data. Tapi tidak sekedar "bisa panggil API", dia harus menilai sendiri kapan harus memanggil, memanggil apa, dan bagaimana menggunakan hasilnya. Buku ini memberikan contoh yang sangat spesifik: pengguna bertanya "Ada drama baru apa akhir-akhir ini?", Agent sendiri menyadari informasi ini tidak ada dalam data latihan, aktif memanggil alat pencarian untuk mencari, lalu menyintesis hasilnya. Langkah kuncinya adalah "menyadari sendiri". Bukan manusia yang menyuruhnya "coba kamu cari", tapi dia yang menilai perlu mencari. Kemampuan menilai ini adalah ambang batas Level 1.

  • Level 2: Pemikir Strategis

    Menambah dua hal: perencanaan dan Context Engineering. Buku ini mendefinisikan Context Engineering: bukan menumpuk informasi, tapi menyaring, memangkas, mengemas konteks dengan cermat. Contohnya sangat bagus: pengguna ingin mencari kedai kopi di antara dua lokasi. Agent pertama-tama memanggil alat peta untuk mendapatkan segudang data, lalu dia menilai sendiri "langkah selanjutnya hanya membutuhkan nama jalan", memangkas keluaran peta menjadi daftar pendek, lalu memberikannya ke alat pencarian lokal. Setiap langkah melakukan peredaman kebisingan informasi.

    Ada satu kalimat dalam buku ini yang saya baca berulang kali: "Agar AI mencapai akurasi tertinggi, berikan dia konteks yang pendek, fokus, dan kuat." Context Engineering lah yang melakukan hal ini.

    Sampai level ini, Agent juga bisa refleksi diri. Setelah selesai bekerja, meninjau sendiri, menemukan masalah, dan memperbaikinya sendiri. Akan saya bahas lebih detail nanti.

  • Level 3: Kolaborasi Multi-Agent

    Posisi buku ini sangat jelas: jangan selalu berpikir untuk membuat satu super agent serba bisa. Cara yang benar-benar andal adalah seperti membangun tim, Agent Manajer Proyek + Agent Peneliti + Agent Desainer + Agent Penulis Naskah. Contoh yang diberikan buku ini adalah peluncuran produk baru: satu "Agent Manajer Proyek" sebagai pengatur keseluruhan, menugaskan pekerjaan ke "Agent Penelitian Pasar", "Agent Desain Produk", "Agent Pemasaran". Kuncinya adalah komunikasi: bagaimana antar-Agent mentransfer data, bagaimana sinkronisasi status, bagaimana menangani konflik. Bab ini menggambarkan enam struktur topologi komunikasi, dari yang paling sederhana Single Agent hingga yang paling fleksibel Custom Hybrid, masing-masing disertai penjelasan situasi apa yang cocok.

Setelah melihat empat level ini, saya tiba-tiba mengerti mengapa banyak orang mengatakan "Agent saya tidak berguna". Model tidak bermasalah, masalahnya adalah Anda menggunakannya seperti chatbot, mungkin bahkan belum mencapai Level 1.

Context Engineering: Konsep yang Paling Diremehkan dalam Buku

Saya pernah menulis tentang Harness Engineering, yang membahas bahwa desain lintasan balap lebih penting daripada tenaga mesin. Setelah membaca buku ini, saya menemukan Context Engineering adalah pemetaan Harness Engineering di tingkat prompt.

Prompt Engineering tradisional hanya mengatur "bagaimana Anda bertanya". Context Engineering dalam buku ini mengatur "sebelum bertanya, apa yang ada di hadapan Agent". Ini mencakup empat lapisan informasi:

  1. Lapisan pertama, system prompt. Mendefinisikan siapa Agent, nada bicara apa, batasan apa. Kebanyakan orang hanya menulis lapisan ini.

  2. Lapisan kedua, data eksternal. Dokumen yang diambil dari RAG, nilai pengembalian dari pemanggilan alat, data API real-time. Ini adalah tempat kebanyakan orang terjebak: tahu harus memberikan data, tapi tidak tahu bagaimana caranya agar model tidak tenggelam.

  3. Lapisan ketiga, data implisit. Identitas pengguna, riwayat interaksi, status lingkungan. Hal-hal yang tidak Anda nyatakan tetapi harus diketahui Agent. Misalnya, Anda berkata kepada Agent "tolong kirim email kepada John untuk konfirmasi rapat besok", dia harus tahu rapat besok apa di kalender Anda, hubungan Anda dengan John seperti apa.

  4. Lapisan keempat, loop umpan balik. Setelah setiap keluaran Agent, menilai kualitas secara otomatis, menyesuaikan strategi konteks berikutnya. Buku menyebut ini "optimasi konteks otomatis", Prompt Optimizer Google Vertex AI adalah implementasi rekayasa dari pemikiran ini.

Saat membaca bagian ini, saya teringat tulisan sebelumnya "AI Agent Bukan Sihir", di dalamnya ada satu pengalaman bahwa "Agent Anda butuh aturan, dan itu banyak aturan". Sekarang melihat ke belakang, aturan-aturan itu pada dasarnya adalah versi manual dari Context Engineering, yang telah disistematisasi dalam buku ini.

Reflection: Dua Agent Benar-Benar Lebih Baik daripada Satu

Ini adalah Pattern yang paling bernilai praktis dalam buku ini bagi saya.

Inti Reflection sederhana: setelah Agent selesai bekerja, dia meninjau sendiri, menemukan masalah, dan memperbaikinya sendiri. Tapi cara implementasinya perlu dipertimbangkan. Buku ini mengatakan dengan jelas: Producer dan Critic harus menggunakan dua Agent berbeda, dengan system prompt yang berbeda. Persona yang sama meninjau karyanya sendiri pasti memiliki titik buta. Anda meminta LLM yang sama untuk menulis kode, lalu meninjau kode yang ditulisnya sendiri, kemungkinan besar dia akan berkata "lumayan bagus".

Buku ini memberikan contoh kode lengkap.

  • Prompt Producer adalah "Anda adalah pengembang Python, tulis fungsi untuk menghitung faktorial, tangani kondisi batas dan pengecualian."

  • Prompt Critic adalah "Anda adalah insinyur senior yang sangat teliti, tinjau kode baris per baris, periksa Bug, gaya, kondisi batas yang terlewat, bagian yang dapat ditingkatkan. Jika sempurna, keluarkan CODE_IS_PERFECT, jika tidak daftarkan semua masalah."

  • Kemudian ada loop for: Producer menulis kode → Critic meninjau → Producer memperbaiki berdasarkan saran → Critic meninjau lagi → sampai Critic berkata CODE_IS_PERFECT atau mencapai jumlah iterasi maksimum.

Sesederhana itu. Tapi buku ini mengingatkan masalah biaya yang sering diabaikan: setiap siklus refleksi adalah pemanggilan LLM baru, semakin banyak iterasi semakin mahal. Dan seiring membengkaknya riwayat percakapan, jendela konteks dipenuhi versi sebelumnya dan kritik, ruang penalaran yang tersedia sebenarnya menyusut. Jadi praktik terbaik Reflection adalah: tetapkan jumlah iterasi maksimum yang masuk akal (buku menggunakan 3), begitu Critic puas berhenti, jangan mengejar kesempurnaan.

Penggunaannya jauh lebih dari sekedar menulis kode. Menulis artikel, membuat rencana, merangkum dokumen, menyelesaikan soal logika, model Producer-Critic semua bisa diterapkan. Buku ini mendaftarkan tujuh skenario aplikasi, logika intinya sama: hasilkan dulu, tinjau kemudian, perbaiki lagi.

Multi-Agent Bukan Berarti Semakin Kompleks Semakin Baik

Yang paling saya sukai dari bab Multi-Agent Collaboration adalah enam diagram topologi komunikasi itu. Banyak orang langsung menggunakan yang kompleks, tapi sebenarnya sebagian besar skenario cukup tiga saja:

  1. Single Agent (Eksekusi Mandiri): Tugas dapat dipecah menjadi sub-masalah yang tidak bergantung, setiap Agent menyelesaikan sendiri. Sederhana, mudah dirawat.

  2. Jaringan Setara (Peer-to-Peer): Antar-Agent berkomunikasi langsung, tanpa node kontrol pusat. Terdesentralisasi, toleransi kesalahan baik, satu Agent mati tidak mempengaruhi keseluruhan. Tapi biaya koordinasi tinggi, mudah kacau.

  3. Pengawas (Supervisor / Penjadwal Pusat): Sebuah Supervisor Agent mengelola sekelompok Worker Agent. Membagikan tugas, mengumpulkan hasil, menyelesaikan konflik. Hirarki jelas, mudah dikelola. Tapi Supervisor adalah titik kegagalan tunggal, sekaligus hambatan kinerja.

Tiga lainnya (Supervisor-as-Tool, Hierarkis, Hybrid Kustom) adalah varian dan kombinasi dari tiga yang pertama. Buku ini mengatakan dengan sangat realistis: Topologi yang Anda butuhkan tergantung pada kompleksitas tugas Anda. Semakin terpecah-pecah tugasnya, semakin tinggi biaya komunikasi, pada tingkat tertentu mode Supervisor justru lebih efisien daripada model hierarkis.

Pelajaran saya adalah, banyak orang menghabiskan 80% waktu membangun Multi-Agent pada protokol komunikasi, lupa bertanya masalah yang lebih mendasar: apakah tugas ini benar-benar membutuhkan banyak Agent? Buku ini menulis dengan jelas, Single Agent Level 2 + Reflection seringkali sudah cukup. Level 3 disiapkan untuk skenario yang memang tidak bisa ditangani oleh Single Agent.

Model Memori Tiga Lapis, Saya Sebelumnya Hanya Merasa Ada tapi Tak Diberi Nama

Bab Memori ini paling saya resapi, karena saat menulis dua artikel tentang Obsidian + Claude, saya selalu merenungkan satu pertanyaan: bagaimana memori Agent harus dibagi lapisan?

Buku ini memberikan jawabannya:

  1. Sesi (Lapisan Percakapan): Jendela konteks percakapan saat ini, ini adalah memori terpendek, berakhir percakapan hilang. Model konteks panjang hanya memperbesar jendela ini, tapi pada dasarnya masih sementara, dan setiap penalaran harus memproses seluruh jendela, mahal dan lambat.

  2. Status (Lapisan Status): Data sementara yang sedang berjalan dalam tugas saat ini. Misalnya "tugas apa yang sedang dikerjakan", "sudah sampai tahap mana", "data apa yang dihasilkan di tengah". Lebih panjang dari Sesi, tapi berakhir tugas dibersihkan, buku ini menggunakan mekanisme State Google ADK untuk memberikan contoh lengkap.

  3. Memori (Lapisan Tahan Lama): Memori jangka panjang lintas sesi, lintas tugas. Preferensi pengguna, pengalaman yang dipelajari, keputusan historis penting, disimpan di basis data atau vector store, diambil secara semantik. Buku ini menekankan poin penting: Memori bukan hanya disimpan, tapi juga mendesain strategi lengkap "menyimpan apa, kapan menyimpan, bagaimana mengambil". Menyimpan terlalu banyak meningkatkan kebisingan, menyimpan terlalu sedikit tidak cukup.

Sebelumnya saat menulis artikel Clawdbot yang menyebutkan "file status" dan "dokumen workspace", pada dasarnya itu adalah versi manual dari lapisan State dan Memory, buku ini membingkai hal ini.

Lima Hipotesis, Yang Kelima Paling Tak Masuk Akal

Di akhir buku disebutkan lima hipotesis tentang masa depan Agent, empat pertama masih dalam jangkauan penalaran wajar: General-Purpose Agent dari menulis kode hingga mengelola proyek, personalisasi mendalam aktif menemukan kebutuhan Anda, embodied intelligence keluar layar ke dunia fisik, Agent menjadi entitas ekonomi mandiri.

Yang kelima membuat saya terkejut: Multi-Agent yang Berubah Bentuk.

Anda hanya mendeklarasikan tujuan, misalnya "buat bisnis e-commerce kopi spesialitas". Sistem secara otomatis memutuskan: pertama buat "Agent Penelitian Pasar" dan "Agent Merek". Setelah menjalankan satu putaran data, dia menilai sendiri Agent Merek tidak dibutuhkan lagi, memecah menjadi tiga baru: "Agent Desain Logo", "Agent Pembuatan Situs", "Agent Rantai Pasok". Jika Agent Pembuatan Situs menjadi hambatan, sistem akan secara otomatis menggandakan tiga Agent paralel yang bekerja bersamaan di halaman berbeda. Selama proses ini, sistem terus-menerus secara otomatis menyesuaikan prompt setiap Agent, terus-menerus menyusun ulang arsitektur tim.

Buku ini menyebutnya sebagai "sistem multi-Agent yang digerakkan tujuan, dapat mengubah bentuk sendiri". Dia tidak menjalankan rencana yang Anda tulis, dia sendiri yang menghasilkan rencana, menyesuaikan rencana sendiri, menyusun ulang tim pelaksana sendiri.

Ini mengingatkan saya pada AutoResearch Karpathy: menulis program.md, mendefinisikan tujuan, metrik, batasan, tekan "mulai". Manusia berada di luar loop. Tapi buku ini mendorong lebih jauh: bahkan bagaimana tim Agent dibentuk, bagaimana disusun ulang, semuanya diserahkan kepada sistem untuk memutuskan sendiri. Manusia hanya mendeklarasikan "menginginkan apa".

Tiga Hal yang Bisa Segera Dilakukan

Setelah membaca buku ini, saya memiliki tiga tindakan yang dapat segera diterapkan:

  • Pertama, tambahkan Critic pada Agent Anda saat ini. Baik Anda menggunakan Claude Code, CrewAI, atau kerangka kerja buatan sendiri, tambahkan satu langkah di akhir workflow Anda: biarkan Agent lain (dengan system prompt berbeda) meninjau keluaran langkah sebelumnya. Pembuatan kode ditambah tinjauan kode, penulisan artikel ditambah pemeriksaan fakta, pembuatan rencana ditambah peninjauan kelayakan. Satu pemanggilan LLM tambahan, tapi peningkatan kualitas seringkali berlipat ganda. Pola Producer-Critic dalam buku ini adalah plug and play.

  • Kedua, mulailah melakukan Context Engineering, bukan hanya Prompt Engineering. Tinjau kembali file instruksi yang Anda tulis untuk Agent. Jika semuanya adalah aturan "bagaimana Anda melakukannya", kurang konteks "lingkungan apa yang sedang Anda hadapi sekarang", tambahkan. Beritahu Agent proyek mana yang sedang dia tangani, keputusan apa yang pernah dibuat sebelumnya, preferensi pengguna seperti apa. Bab Context Engineering dalam buku ini dan AGENTS.md Anda adalah dua ungkapan dari hal yang sama.

  • Ketiga, jangan buru-buru menerapkan Multi-Agent. Sempurnakan Single Agent Anda sampai Level 2: memiliki alat, Reflection, Memori. Buku ini berulang kali menekankan, Single Agent Level 2 ditambah Producer-Critic dan Context Engineering dapat mencakup sebagian besar skenario nyata. Level 3 disiapkan untuk tugas yang benar-benar lintas domain, multi-tahap, membutuhkan pembagian kerja paralel. Masalah kebanyakan orang bukan Agentnya kurang banyak, tapi satu Agent pun belum diatur dengan baik.

Buku ini 453 halaman, diterbitkan Springer tahun 2025. Contoh kode mencakup LangChain/LangGraph, Google ADK, CrewAI, OpenAI API. Kata pengantar ditulis oleh VP AI Google Cloud, dan ada rekomendasi dari CIO Goldman Sachs, mengejutkan bagus.

Tapi alasan saya merekomendasikannya bukan karena "lengkap". Tapi karena Anda akan menyadari satu hal setelah membacanya: semua lubang yang Anda masuki selama setengah tahun terakhir di dunia Agent, sudah ada yang mengumpulkan menjadi pola. Anda tidak perlu lagi menemukan Reflection, tidak perlu lagi menebak bagaimana Memori harus dibagi lapisan, tidak perlu lagi mencoba topologi komunikasi Multi-Agent mana yang harus digunakan.

Ada orang yang sudah menggambar peta untuk Anda, sisanya tinggal melangkah.

Apakah Anda menggunakan AI Agent untuk pengembangan? Agent Anda sekarang sampai Level berapa?

Pertanyaan Terkait

QApakah perbedaan antara Level 0 dan Level 1 AI Agent menurut buku 'Agentic Design Patterns'?

ALevel 0 hanyalah LLM telanjang tanpa alat, ingatan, atau kemampuan bertindak. Itu hanya menebak berdasarkan data pelatihannya, seperti menebak pemenang Oscar 2025. Level 1 adalah Agent sejati yang mampu menggunakan alat seperti pencarian atau API. Yang membedakan adalah kemampuan Level 1 untuk menyadari sendiri kapan perlu menggunakan alat tersebut, tanpa disuruh manusia, lalu mensintesis hasilnya.

QApa itu 'Context Engineering' dan bagaimana perbedaannya dengan 'Prompt Engineering' tradisional?

AContext Engineering adalah konsep yang mengelola 'apa yang ada di depan mata Agent sebelum ia bertanya/bertindak'. Ini mencakup empat lapis informasi: system prompt, data eksternal (hasil RAG/API), data implisit (sejarah, preferensi), dan umpan balik (evaluasi otomatis). Prompt Engineering tradisional hanya fokus pada 'bagaimana cara Anda bertanya', sedangkan Context Engineering mengatur seluruh konteks yang tersedia untuk Agent agar keputusannya lebih tepat dan terfokus.

QBagaimana pola 'Reflection' dalam buku tersebut meningkatkan kualitas output sebuah AI Agent?

APola Reflection menggunakan dua Agent terpisah: 'Producer' untuk menghasilkan output (misalnya kode) dan 'Critic' untuk mengkritiknya. Mereka memiliki system prompt dan peran yang berbeda untuk menghindari bias. Mereka bekerja dalam loop: Producer membuat → Critic meninjau → Producer merevisi berdasarkan kritik → dan seterusnya hingga kritik puas atau mencapai batas iterasi. Pendekatan ini secara signifikan meningkatkan kualitas hasil seperti kode, artikel, atau rencana.

QApa saja tiga jenis topologi komunikasi dasar untuk Multi-Agent Collaboration yang disebutkan dalam artikel, dan kapan masing-masing cocok digunakan?

ATiga topologi dasar adalah: 1) **Single Agent (Eksekusi Independen)**: Cocok untuk tugas yang dapat dipecah menjadi submasalah yang tidak bergantung satu sama lain. 2) **Jaringan Peer-to-Peer**: Agent berkomunikasi langsung, cocok untuk sistem yang membutuhkan ketahanan tanpa titik pusat. 3) **Supervisor (Penjadwal Pusat)**: Sebuah Agent pengawas mengelola pekerja, cocok untuk koordinasi tugas yang kompleks dengan hierarki jelas. Pilihan tergantung pada kompleksitas tugas; tidak perlu selalu memilih yang paling rumit.

QApa tiga hal yang dapat segera dilakukan setelah membaca buku ini untuk meningkatkan AI Agent yang ada?

ATiga hal yang dapat segera dilakukan adalah: 1) **Tambahkan sebuah Critic** pada workflow Agent yang ada untuk meninjau output secara otomatis. 2) **Mulai terapkan Context Engineering**, bukan hanya Prompt Engineering, dengan memperkaya instruksi dengan informasi kontekstual tentang proyek, keputusan sebelumnya, dan preferensi pengguna. 3) **Jangan terburu-buru menggunakan Multi-Agent**; tingkatkan dulu satu Agent ke Level 2 dengan alat, Reflection, dan Memori yang baik, karena itu sudah cukup untuk banyak skenario.

Bacaan Terkait

PA Visual | Satu Gambar Pahami Peristiwa Web3 Penting yang Patut Diperhatikan di Bulan Juni

"PA Pictorial: Peta untuk Memahami Peristiwa Web3 Penting yang Perlu Diperhatikan pada Juni" Jelajahi Kalender Kripto terbaru PANews dengan cakupan lebih lengkap, penyaringan fleksibel, dan ekspor yang mudah. Pada Juni, pasar kripto dipadati oleh keputusan suku bunga makro, data ekonomi penting, pelepasan token, dan acara teknologi tradisional. Poin-poin intinya meliputi: 📌 Amerika Serikat merilis data NFP dan CPI bulan Mei. The Fed menerbitkan Buku Beige dan menggelar konferensi pers kebijakan, dengan preferensi risiko pasar tetap dipengaruhi ekspektasi makro. 🏦 Bank Sentral Eropa dan Bank of Japan akan mengumumkan keputusan suku bunga, menjadikan likuiditas global dan jalur suku bunga sebagai salah satu tema utama pasar di Juni. 🪙 Beberapa token seperti SUI dan ENA akan mengalami pelepasan (unlock), perlu diperhatikan risikonya. 🚀 Perkembangan proyek: Coinbase akan meluncurkan futures indeks saham perpetual perdana, CME Group berencana meluncurkan futures indeks kripto Nasdaq; SharpLink akan dimasukkan ke dalam Indeks Russell 2000 dan 3000. ⚠️ Penyaringan proyek terus berlanjut: Layanan seperti browser Bitcoin Ordinals, Ord.io, secara bertahap berhenti beroperasi. Perhatikan pengaturan penarikan dan migrasi aset. 🌐 Acara penting lainnya: Pembukaan Piala Dunia, pembukaan Apple WWDC26, penawaran saham SpaceX, pertemuan IPO S&T UBTECH di pasar STAR, dll. Dengan makroekonomi, pelepasan token, regulasi, penyaringan proyek, dan acara teknologi yang berlangsung bersamaan, pasar pada Juni mungkin terus mencari arah baru di tengah ekspektasi likuiditas, perubahan kebijakan, dan rotasi ekosistem. Kunci inti peristiwa global dan alur utama Web3 Juni 2026 dalam satu peta!

marsbit47m yang lalu

PA Visual | Satu Gambar Pahami Peristiwa Web3 Penting yang Patut Diperhatikan di Bulan Juni

marsbit47m yang lalu

Ali "Menaruh Barang", Byte "Berlatih Ilmu"

Dalam satu minggu terakhir Mei, dua raksasa teknologi China, Alibaba dan ByteDance, memamerkan dua pendekatan berbeda dalam strategi AI mereka. Alibaba, sebagai perusahaan publik, fokus pada integrasi AI untuk monetisasi langsung. Mereka menghubungkan model Qwen dengan platform e-commerce seperti Taobao, menciptakan fitur seperti "pencocokan harga AI" dan "pakaian virtual AI". Melalui protokol ACT, mereka membangun infrastruktur untuk transaksi berbasis agen AI. Pendapatan eksternal Alibaba Cloud tumbuh 40%, menunjukkan model bisnis "MaaS" (Model-as-a-Service) mereka yang berhasil. Namun, pendekatan ini mungkin mengorbankan penelitian mendasar untuk keunggulan jangka pendek. Sebaliknya, ByteDance, yang masih swasta, berinvestasi besar dalam penelitian AI jangka panjang. Departemen Seed mereka, dengan anggaran belanja modal (capex) yang meningkat pesat, bertujuan "menjelajahi batas atas kecerdasan". Mereka merilis model pembuatan video Seedance 2.0 yang memimpin peringkat global dan mempublikasikan penelitian mendalam tentang "model dunia". Perusahaan ini memberikan kebebasan bagi tim risetnya tanpa tekanan kuartalan dari pasar modal. Perbedaan kunci ini lebih disebabkan oleh status kepemilikan daripada filosofi semata. Sebagai perusahaan publik, Alibaba terikat pada harapan ROI jangka pendek investor. ByteDance, yang belum IPO, memiliki kemewahan untuk berfokus pada terobosan teknologi jangka panjang. Analisis menyimpulkan bahwa jalan strategis AI sebuah perusahaan di China sangat ditentukan oleh apakah perusahaan tersebut terdaftar di bursa atau tidak, yang membentuk pilihan antara "menjual AI" dan "membuat AI".

marsbit55m yang lalu

Ali "Menaruh Barang", Byte "Berlatih Ilmu"

marsbit55m yang lalu

Mengapa Lebih Banyak AI Agent Belum Tentu Berarti Produktivitas yang Lebih Tinggi?

**Mengapa Lebih Banyak AI Agent Tidak Sama dengan Produktivitas Lebih Tinggi?** Meskipun teknologi memungkinkan kita meluncurkan banyak AI Agent dengan mudah dan murah, produktivitas nyata tidak serta-merta meningkat. Ini karena munculnya konsep "Pajak Orkestrasi"—biaya tersembunyi untuk mengelola, menilai, dan menggabungkan hasil kerja semua Agent tersebut. Pekerjaan ini harus kembali ke satu sumber daya serial yang tidak dapat diduplikasi: perhatian dan penilaian manusia. **Manusia adalah 'GIL' dalam Sistem.** Seperti Global Interpreter Lock (GIL) dalam Python, semua Agent dapat berjalan paralel, tetapi untuk keputusan penting (seperti tinjauan arsitektur, kode, atau penyelesaian konflik), mereka harus "mengambil kunci" dari Anda—sang pengembang. Hukum Amdahl berlaku: percepatan maksimum dari paralelisasi dibatasi oleh bagian kerja yang harus tetap serial, yaitu kapasitas penilaian manusia. Menambah Agent hanya membuat antrian tinjauan lebih panjang, memperbesar beban konteks, dan menyebabkan kelelahan kognitif. **Kelelahan dan Utang Tersembunyi.** Banyaknya Agent yang aktif memberi ilusi produktivitas tinggi, tetapi rasa sibuk itu tidak sama dengan hasil berkualitas. Jika Anda "menyerah secara kognitif" dan tidak meninjau hasil dengan benar, Anda menumpuk utang teknis dan utang kognitif—masalah yang akan muncul nanti. Pajak orkestrasi harus dibayar, baik secara sadar melalui proses yang terencana, atau diam-diam melalui penurunan kualitas. **Solusi: Kelola Perhatian Seperti Sistem Produksi.** Kuncinya adalah merancang alur kerja dengan menghormati batas perhatian manusia sebagai sumber daya langka: 1. **Kontrol Jumlah Agent:** Sesuaikan jumlah Agent dengan kemampuan *review* Anda, bukan dengan apa yang UI izinkan. Batasi ke angka rendah. 2. **Klasifikasi Tugas:** Pisahkan tugas independen (cocok untuk Agent paralel) dari tugas kompleks yang membutuhkan penilaian mendalam (kerjakan secara serial). 3. **Tinjau Secara Berkelompok (*Batch Review*):** Kurangi biaya alih konteks dengan meninjau hasil beberapa Agent sekaligus. 4. **Gunakan Waktu Serial untuk Penilaian:** Fokuskan perhatian hanya pada bagian yang memerlukan penilaian manusia. Biarkan Agent menangani bagian yang dapat diverifikasi otomatis (seperti tes). 5. **Lindungi Waktu Fokus Anda:** Kadang, tindakan paling produktif adalah berhenti mengoordinasi banyak Agent dan fokus pada satu masalah inti. Kemampuan sebenarnya di era AI bukanlah menjalankan banyak Agent, tetapi merancang sistem yang secara sadar mengelilingi dan melindungi kapasitas penilaian serial manusia—sumber daya paling berharga dalam proses pengembangan.

marsbit2j yang lalu

Mengapa Lebih Banyak AI Agent Belum Tentu Berarti Produktivitas yang Lebih Tinggi?

marsbit2j yang lalu

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

Tiga tahun kemudian, pada Mei 2026, penulis meninjau kembali 20 prediksi tentang ChatGPT yang dibuatnya pada Maret 2023, menggunakan AI untuk mengevaluasi akurasinya berdasarkan data terbaru. Secara keseluruhan, arah dan mekanisme prediksi banyak yang tepat. Yang paling akurat adalah tentang RAG sebagai arsitektur standar, LUI (Antarmuka Pengguna Bahasa Alami) sebagai lapisan interaksi baru, munculnya "jaringan robot" (protokol untuk agen AI), dan kemampuan China mengejar ketertinggalan model AI besar. Prediksi bahwa ChatGPT bukan AGI namun langkah besar, tidak menyebabkan gelombang pengangguran massal, serta sifat uji Turing yang hanya mengukur persepsi juga pada dasarnya benar. Namun, prediksi dengan angka spesifik atau pernyataan mutlak sering meleset. Klaim bahwa GPT-4 memiliki 100 triliun parameter sepenuhnya salah. Pernyataan bahwa LLM "tidak mungkin" mengerjakan matematika murni terbantahkan dengan model penalaran yang memenangkan medali emas IMO. Estimasi biaya pelatihan model hanya $5-10 miliar juga jauh dari kenyataan, yang kini mencapai miliaran dolar untuk model terdepan. Beberapa prediksi keliru tentang distribusi dampak, seperti bahwa nilai akan berpindah ke lapisan aplikasi (nyatanya, penyedia chip seperti NVIDIA paling untung), atau bahwa AI akan "menghindari" masalah hak cipta (justru menimbulkan gugatan besar). Kesimpulan utama adalah: dalam memprediksi teknologi yang cepat berubah, mengidentifikasi arah dan mekanisme umumnya lebih bisa diandalkan daripada memberikan angka pasti atau pernyataan mutlak. Prediksi cenderung terlalu optimis tentang kecepatan perubahan jangka pendek, tetapi meremehkan besarnya perubahan jangka panjang. Penting juga untuk mempertimbangkan distribusi dampak, bukan hanya kesimpulan agregat. Pernyataan yang disertai batasan dan keraguan justru lebih tahan uji waktu. Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun. Tinjauan ini berfungsi sebagai pelajaran untuk membuat prediksi yang lebih baik di tiga tahun mendatang.

marsbit8j yang lalu

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

marsbit8j yang lalu

Trading

Spot
Futures
活动图片