Pendiri a16z: Di Era Agent, Hal yang Benar-Benar Penting Telah Berubah

marsbitDipublikasikan tanggal 2026-04-20Terakhir diperbarui pada 2026-04-20

Abstrak

Wawancara Marc Andreessen, pendiri a16z, membahas evolusi AI dan dampak era agent. AI bukanlah fenomena baru, melainkan hasil akumulasi penelitian 80 tahun yang kini matang dengan kemampuan: LLM, reasoning, coding, dan agent yang mampu peningkatan diri. Arsitektur agent (LLM + shell + file system + markdown + cron/loop) memanfaatkan komponen perangkat lunak yang sudah ada, memungkinkan statusnya disimpan dan dipindahkan. Interaksi berbasis agent akan menggantikan GUI tradisional, di mana manusia memberikan tujuan dan agent menjalankannya. Siklus investasi AI saat ini didukung perusahaan besar dengan likuiditas kuat, berbeda dengan gelembung dot-com 2000. Kendala utama bukan hanya GPU, tetapi juga CPU, memori, dan jaringan. Sumber terbuka (open source) dan inferensi di perangkat lokal (edge) akan menjadi krusial untuk biaya, privasi, dan latensi. Tantangan nyata meliputi keamanan siber, identitas digital, infrastruktur pembayaran untuk agent, serta resistensi kelembagaan. AI tidak akan langsung diadopsi secara global, tetapi akan mengubah cara kerja dan organisasi secara fundamental.

Judul Asli: Marc Andreessen introspects on Death of the Browser, Pi + OpenClaw, and Why "This Time Is Different"

Disusun oleh: FuturePulse

Sumber Sinyal: Ini adalah wawancara terbaru pendiri a16z, Marc Andreessen dalam podcast Latent Space. Dia adalah pengusaha internet terkenal di AS dan salah satu tokoh kunci dalam perkembangan awal internet; setelah mendirikan a16z, dia menjadi perwakilan investor top Silicon Valley. Seluruh percakapan berfokus pada sejarah dan tren terbaru perkembangan AI, sangat layak dibaca.

I. AI Gelombang Ini Bukan Muncul Tiba-tiba, Melainkan "Mulai Bekerja" Secara Menyeluruh untuk Pertama Kalinya Setelah Lari Jarak Jauh Teknologi 80 Tahun

  • AI gelombang ini bukan muncul tiba-tiba, melainkan setelah lari jarak jauh teknologi 80 tahun

  • Marc Andreessen secara langsung menyebut saat ini sebagai "80-year overnight success", yang berarti ledakan tiba-tiba di mata publik, sebenarnya adalah pelepasan terkonsentrasi dari cadangan teknologi puluhan tahun.

  • Dia menelusuri kembali garis teknologi ini ke penelitian neural network awal, dan menekankan bahwa industri saat ini sebenarnya telah menerima penilaian "neural network adalah arsitektur yang benar".

  • Dalam narasinya, titik kunci bukanlah momen tunggal, melainkan serangkaian tumpukan: AlexNet, Transformer, ChatGPT, model reasoning, hingga agents dan self-improvement.

  • Dia sangat menekankan, kali ini tidak hanya pembuatan teks yang menjadi lebih kuat, tetapi empat jenis fungsi muncul bersamaan: LLMs, reasoning, coding, serta agents / recursive self-improvement.

  • Alasan dia认为 "this time is different", bukan karena narasi yang lebih menarik, tetapi karena kemampuan-kemampuan ini telah mulai bekerja dalam tugas-tugas dunia nyata.

II. Arsitektur Agent yang Diwakili oleh Pi dan OpenClaw adalah Perubahan Arsitektur Perangkat Lunak yang Lebih Dalam Dibandingkan Chatbot

  • Dia menggambarkan agent dengan sangat konkret: pada dasarnya adalah "LLM + shell + file system + markdown + cron/loop". Dalam struktur ini, LLM adalah inti penalaran dan generasi, shell menyediakan lingkungan eksekusi, file system menyimpan status, markdown membuat status dapat dibaca, cron/loop menyediakan pembangkitan periodik dan dorongan tugas.

  • Dia认为 kombinasi ini penting karena: selain model itu sendiri baru, komponen lainnya semuanya adalah bagian yang telah matang, dapat dipahami, dan dapat digunakan kembali di dunia perangkat lunak.

  • Status agent disimpan dalam file, sehingga dapat bermigrasi lintas model, lintas runtime; model底层 dapat diganti, tetapi memori dan status仍然保留.

  • Dia反复强调 introspeksi: agent mengetahui file-nya sendiri, dapat membaca statusnya sendiri, bahkan dapat menulis ulang file dan fungsinya sendiri, bergerak ke arah "extend yourself".

  • Menurutnya, terobosan sebenarnya bukan hanya "model dapat menjawab", tetapi agent dapat memanfaatkan toolchain Unix yang ada, menyambungkan seluruh kemampuan潜在 komputer.

III. Era Browser, GUI Tradisional dan "Perangkat Lunak Klik Manual" Akan Secara Bertahap Digantikan oleh Cara Interaksi Agent-First

  • Marc Andreessen dengan jelas pernah mengatakan, di masa depan "Anda mungkin tidak lagi memerlukan antarmuka pengguna (user interface)".

  • Dia进一步指出, pengguna utama perangkat lunak di masa depan mungkin bukan manusia, melainkan "bot lain (other bots)".

  • <极好的p style="text-align: justify; font-size: 16px; font-weight: inherit; word-break: break-all; line-height: 2; font-family: PingFang SC,Helvetica Neue,Helvetica,Arial,Hiragino Sans GB,Heiti SC,Microsoft YaHei,WenQuanYi Micro Hei,sans-serif;">Ini berarti banyak antarmuka yang dirancang untuk klik,浏览, mengisi formulir manusia saat ini, akan terdegradasi menjadi lapisan eksekusi yang dipanggil di belakang agent.

  • Di dunia ini, manusia lebih seperti orang yang mengajukan tujuan: memberi tahu sistem apa yang diinginkan, lalu agent memanggil layanan, mengoperasikan perangkat lunak, menyelesaikan proses.

  • Dia menghubungkan perubahan ini dengan masa depan perangkat lunak yang lebih besar: perangkat lunak berkualitas tinggi akan semakin "melimpah", bukan lagi barang langka yang dibuat secara manual oleh少数工程师.

  • Dia juga menilai, pentingnya bahasa pemrograman akan menurun; model akan menulis kode跨语言, menerjemahkan satu sama lain, bahkan di masa depan manusia lebih peduli menjelaskan mengapa AI mengorganisir kode seperti itu,而不是死守一种语言本身.

  • Dia bahkan menyebutkan arah yang lebih radikal: secara konseptual, AI tidak hanya mungkin mengeluarkan kode, tetapi juga langsung mengeluarkan kode biner (binary) yang lebih底层 atau bobot model (model weights 模型权重).

IV. Siklus Investasi AI Kali Ini Memiliki Kesamaan dengan Gelembung Internet 2000, tetapi Struktur Dasar Penawaran dan Permintaan Tidak Sama

  • Dia回顾 tahun 2000 menekankan,垮台很大程度上 bukan "internet tidak baik", melainkan infrastruktur telekomunikasi dan bandwidth yang berlebihan, serat optik dan pusat data dipasang terlalu dini, kemudian mengalami pencernaan waktu lama.

  • Dia认为 hari ini memang也能看到 kekhawatiran "overbuilding", tetapi subjek investasi saat ini terutama perusahaan-perusahaan besar dengan kas melimpah seperti Microsoft, Amazon, Google,而不是 pemain rapuh dengan leverage tinggi.

  • Dia特别指出, sekarang只要 investasi yang membentuk GPU yang dapat dijalankan,通常很快就能 diubah menjadi pendapatan,这一点与 tahun 2000大量 kapasitas menganggur不同.

  • Dia juga menekankan, teknologi yang kita gunakan saat ini sebenarnya是 versi "di-sandbag (sandbagged)": karena pasokan GPU, memori, pusat data, dll tidak mencukupi, potensi model belum sepenuhnya dilepaskan.

  • Dalam penilaiannya, kendala nyata di tahun-tahun mendatang tidak hanya GPU, tetapi juga CPU, memori, jaringan dan联动 bottleneck seluruh ekosistem chip.

  • Dia menempatkan AI scaling laws bersama Moore's Law masa lalu,认为它们不只是 menggambarkan hukum, juga terus merangsang modal, teknik, dan industri untuk maju bersama.

  • Dia menyebutkan fenomena yang sangat tidak normal tetapi penting: seiring optimisasi perangkat lunak semakin cepat, beberapa chip generasi lama bahkan mungkin lebih berharga secara ekonomi dibandingkan saat baru dibeli.

V. Sumber, Inferensi Tepi, dan Menjalankan Secara Lokal Bukan Sisa-sisa, Melainkan Bagian dari Landscape Persaingan AI

  • Marc Andreessen dengan jelas认为 open source sangat penting, alasannya bukan hanya gratis, melainkan "membuat seluruh dunia belajar bagaimana hal itu dibuat".

  • Dia menggambarkan rilis open source seperti DeepSeek sebagai "hadiah untuk dunia (gift to the world)", karena code + paper akan menyebarkan pengetahuan dengan cepat, meningkatkan底线 seluruh industri.

  • Dalam narasinya, open source bukan hanya pilihan teknis,也可能是一种 strategi geopolitik dan pasar: negara dan perusahaan yang berbeda akan mengadopsi strategi keterbukaan yang berbeda berdasarkan batasan bisnis dan tujuan pengaruh mereka.

  • Dia同时 menekankan pentingnya inferensi tepi ("Edge inference"): dalam beberapa tahun ke depan, biaya inferensi terpusat未必 cukup rendah, banyak aplikasi tingkat konsumen tidak dapat menanggung biaya inferensi cloud yang mahal dalam jangka panjang.

  • Dia menyebutkan pola yang反复出现: model yang hari ini terlihat "tidak mungkin dijalankan di PC",常常几个月后真的 dapat dijalankan di mesin lokal.

  • Selain biaya, yang mendorong operasi lokal termasuk kepercayaan, privasi, latency dan skenario penggunaan: perangkat wearable, kunci pintu, perangkat portabel, dll lebih cocok untuk inferensi rendah latency,就地.

  • Penilaiannya sangat langsung: hampir semua hal dengan chip di masa depan mungkin membawa model AI.

VI. Tantangan Sebenarnya AI, Tidak Hanya pada Kemampuan Model, Tetapi pada Keamanan, Identitas, Aliran Uang, Organisasi, dan Hambatan Institusional

  • Dalam hal keamanan, penilaiannya sangat tajam: hampir semua potential security bug akan lebih mudah ditemukan, dalam jangka pendek mungkin ada一段 "bencana besar keamanan komputer".

  • Tetapi dia同时也认为, kecerdasan pemrograman akan menskalakan kemampuan memperbaiki kerentanan; di masa depan cara "melindungi perangkat lunak" mungkin adalah让 bot memindai dan memperbaikinya.

  • Dalam masalah identitas, dia认为 "bukti bot (proof of bot)" tidak可行, karena bot akan semakin kuat; arah yang真正可行 adalah "bukti manusia (proof of human)", yaitu kombinasi pengenalan biometrik, verifikasi enkripsi, dan pengungkapan selektif (selective disclosure).

  • Dia juga membahas masalah yang sering diabaikan: jika agent benar-benar要办事 di dunia nyata, mereka akhirnya akan membutuhkan uang, kemampuan pembayaran, bahkan semacam rekening bank, kartu atau infrastruktur gaya stable coin. Pada tingkat organisasi, dia menggunakan kerangka kapitalisme manajerial (managerial capitalism),认为 AI mungkin memperkuat kembali founder-led company, karena bot sangat pandai dalam pelaporan, koordinasi, dokumen, dan大量 "pekerjaan manajerial".

  • Tetapi dia tidak认为 masyarakat会快速 menerima AI dengan mulus: dia mengutip contoh lisensi profesi, serikat pekerja, pemogokan buruh pelabuhan, departemen pemerintah, pendidikan K-12, perawatan kesehatan, dll., menjelaskan bahwa dunia nyata memiliki大量 institutional减速器.

  • Penilaiannya adalah, utopis AI dan peramal kiamat都容易 mengabaikan satu hal: teknologi一旦 mungkin, tidak berarti 8 miliar orang akan立刻 berubah mengikutinya.

Pertanyaan Terkait

QMenurut Marc Andreessen, mengapa AI saat ini berbeda dengan hype cycle sebelumnya?

AKarena kali ini bukan hanya tentang teks yang lebih baik, tetapi empat kemampuan muncul bersamaan: LLM, reasoning, coding, dan agents/self-improvement, yang sudah mulai bekerja dalam tugas dunia nyata, bukan hanya narasi.

QApa yang dimaksud dengan arsitektur agent menurut penjelasan Marc Andreessen?

AAgent adalah kombinasi dari 'LLM + shell + file system + markdown + cron/loop'. LLM sebagai inti, shell untuk eksekusi, file system menyimpan status, markdown untuk keterbacaan, dan cron/loop untuk penjadwalan tugas.

QBagaimana Marc Andreessen membandingkan siklus investasi AI saat ini dengan gelembung internet tahun 2000?

AIa melihat kesamaan dalam over-investment, tetapi kali ini didanai perusahaan besar beruang tunai (seperti Microsoft, Google), bukan pemain berlever tinggi. Investasi GPU juga cepat menghasilkan pendapatan, tidak seperti kapasitas menganggur tahun 2000.

QMengapa open source dan edge inference penting dalam persaingan AI menurut pandangannya?

AOpen source menyebarkan pengetahuan dan meningkatkan standar industri, sementara edge inference mengurangi biaya cloud, meningkatkan privasi, dan memungkinkan AI di perangkat lokal seperti wearable atau perangkat IoT dengan latency rendah.

QApa tantangan terbesar AI selain kemampuan model, berdasarkan analisis Marc Andreessen?

ATantangan termasuk keamanan (bug mudah ditemukan tapi bisa diperbaiki oleh bot), identitas (perlu 'proof of human'), infrastruktur keuangan untuk agent, serta hambatan organisasi dan regulasi seperti lisensi profesi atau birokrasi.

Bacaan Terkait

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

Tiga tahun kemudian, pada Mei 2026, penulis meninjau kembali 20 prediksi tentang ChatGPT yang dibuatnya pada Maret 2023, menggunakan AI untuk mengevaluasi akurasinya berdasarkan data terbaru. Secara keseluruhan, arah dan mekanisme prediksi banyak yang tepat. Yang paling akurat adalah tentang RAG sebagai arsitektur standar, LUI (Antarmuka Pengguna Bahasa Alami) sebagai lapisan interaksi baru, munculnya "jaringan robot" (protokol untuk agen AI), dan kemampuan China mengejar ketertinggalan model AI besar. Prediksi bahwa ChatGPT bukan AGI namun langkah besar, tidak menyebabkan gelombang pengangguran massal, serta sifat uji Turing yang hanya mengukur persepsi juga pada dasarnya benar. Namun, prediksi dengan angka spesifik atau pernyataan mutlak sering meleset. Klaim bahwa GPT-4 memiliki 100 triliun parameter sepenuhnya salah. Pernyataan bahwa LLM "tidak mungkin" mengerjakan matematika murni terbantahkan dengan model penalaran yang memenangkan medali emas IMO. Estimasi biaya pelatihan model hanya $5-10 miliar juga jauh dari kenyataan, yang kini mencapai miliaran dolar untuk model terdepan. Beberapa prediksi keliru tentang distribusi dampak, seperti bahwa nilai akan berpindah ke lapisan aplikasi (nyatanya, penyedia chip seperti NVIDIA paling untung), atau bahwa AI akan "menghindari" masalah hak cipta (justru menimbulkan gugatan besar). Kesimpulan utama adalah: dalam memprediksi teknologi yang cepat berubah, mengidentifikasi arah dan mekanisme umumnya lebih bisa diandalkan daripada memberikan angka pasti atau pernyataan mutlak. Prediksi cenderung terlalu optimis tentang kecepatan perubahan jangka pendek, tetapi meremehkan besarnya perubahan jangka panjang. Penting juga untuk mempertimbangkan distribusi dampak, bukan hanya kesimpulan agregat. Pernyataan yang disertai batasan dan keraguan justru lebih tahan uji waktu. Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun. Tinjauan ini berfungsi sebagai pelajaran untuk membuat prediksi yang lebih baik di tiga tahun mendatang.

marsbit4j yang lalu

Tiga Tahun Kemudian: Meninjau Kembali Penilaian Saya terhadap ChatGPT di Tahun 2023

marsbit4j yang lalu

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

Tiga tahun kemudian: Meninjau Kembali 20 Prediksi ChatGPT Saya pada 2023 Pada Maret 2023, penulis Wang Jianshuo membuat 20 prediksi intuitif tentang ChatGPT dan AI masa depan. Kini, di Mei 2026, sebuah sistem AI yang terdiri dari 41 agen menganalisis prediksi-prediksi tersebut berdasarkan data terkini. Hasilnya menunjukkan pola menarik. **Yang Terbukti Benar (Secara Umum):** * **RAG dan Arsitektur Pencarian (✅):** Solusi utama untuk pengetahuan dan halusinasi adalah dengan menambahkan "contekan" (RAG), bukan mengubah model. Arsitektur pencarian + LLM kini menjadi standar. * **LUI sebagai Benua Baru (🟢):** Antarmuka Pengguna Bahasa Alami (LUI) adalah lapisan interaksi baru yang besar, melahirkan industri agen dan protokol seperti MCP. * **Jaringan Robot dan Sistem Pengalamatan Baru (🟢):** Agen akan berkomunikasi otomatis dengan bahasa alami. Protokol seperti MCP dan ANP sedang mewujudkannya. * **Model Besar Tiongkok (🟢):** Model-model seperti DeepSeek dan Qwen telah mengejar ketertinggalan performa, meski dengan investasi lebih kecil. * **Tidak Ada Kesadaran, Tes Turing Hanya Ukur Penampilan (🟢):** AI tidak memiliki kesadaran. Tes Turing hanya mengukur ilusi kesadaran. * **Prediksi Lain yang Benar:** ChatGPT bukan AGI, tapi lompatan besar; gelombang pengangguran besar tidak terjadi; tahun besar untuk startup; momen "browser 1994" telah tiba. **Yang Kurang Tepat atau Salah:** * **Parameter GPT-4 (❌):** Prediksi 100 triliun parameter salah. Estimasi terbaru sekitar 1,8 triliun. * **Matematika di LLM (🟡):** Diagnosis bahwa matematika adalah kelemahan intrinsik dan memerlukan alat bantu benar. Namun, pernyataan "tidak mungkin" ditingkatkan terbukti salah, karena model kini bisa memenangkan medali emas Olimpiade Matematika Internasional (IMO). * **Penangkapan Nilai (🟡):** Aplikasi memang berkembang pesat, tetapi nilai terbesar justru ditangkap oleh lapisan komputasi (seperti Nvidia), bukan oleh pembuat model. * **Hak Cipta (🟡):** Konten AI sulit didaftarkan hak cipta, tetapi tidak serta-mata "menghindari" pelanggaran. Gugatan dan penyelesaian besar (misalnya, Anthropic $1,5 miliar) membuktikan risikonya. * **Biaya Model (🟡):** Prediksi "perang lokal" dengan biaya $5-10 miliar untuk model canggih terbukti salah. Biaya pelatihan model terdepan (seperti GPT-5) jauh lebih tinggi, sementara biaya kloning model terbuka justru bisa lebih murah. **Pola dan Pelajaran:** 1. **Arah dan mekanisme lebih dapat diandalkan daripada angka pasti dan pernyataan mutlak.** 2. **Cenderung terlalu optimis untuk jangka pendek (kecepatan), tetapi terlalu konservatif untuk jangka panjang (skala/dampak).** 3. **Kesalahan sering terjadi pada distribusi, bukan pada total.** Contoh: Tidak ada gelombang pengangguran masif, tetapi dampak berat dirasakan oleh lulusan baru. 4. **Pernyataan yang disertai batasan dan ruang ketidakpastian justru lebih tahan uji waktu.** 5. **Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun.** Kesimpulannya, prediksi tentang arah besar dan mekanisme cenderung akurat, sementara prediksi spesifik tentang angka, kecepatan, dan distribusi dampak lebih sering meleset. Latihan ini lebih merupakan pelajaran dalam kerendahan hati dan penilaian yang bernuansa daripada sekadar penghitungan skor.

链捕手6j yang lalu

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

链捕手6j yang lalu

Peringatan Gelembung AI: Investasi AI Merupakan Pengembalian Negatif bagi Kebanyakan Raksasa Teknologi

Peringatan Gelembung AI: Investasi AI Membawa Pengembalian Negatif bagi Sebagian Besar Raksasa Teknologi Demam AI kini memasuki tahap pemeriksaan keuangan. Raksasa cloud seperti Microsoft, Alphabet, Amazon, Meta, dan Oracle berencana menginvestasikan ratusan miliar dolar ke pusat data AI dalam lima tahun ke depan. Namun, analisis terhadap proyeksi pendapatan dan pengeluaran modal (capex) hingga 2030 mengungkap masalah: tingkat pengembalian investasi implisit diperkirakan sangat negatif bagi semua perusahaan kecuali Amazon, bahkan dalam skenario optimis ekstrem. Ini menunjukkan bahwa jika tren saat ini berlanjut, boom AI bisa menjadi salah satu peristiwa perusakan nilai pemegang saham terbesar. Ada dua jalan keluar: pendapatan yang jauh melebihi ekspektasi saat ini, atau pengurangan rencana investasi. Jalan pertama tampaknya mustahil, karena membutuhkan tambahan pendapatan triliunan dolar. Jalan kedua—pemotongan investasi—akan berdampak luas, meruntuhkan harga saham perusahaan-perusahaan teknologi global dan dapat mendorong ekonomi AS ke resesi, mengingat 93% pertumbuhan PDB AS belakangan ini didorong oleh investasi teknologi. IPO perusahaan AI seperti OpenAI dan Anthropic tahun ini bisa menjadi mekanisme transfer risiko, memindahkan ketidakpastian dari pemilik awal kepada investor ritail dan dana pensiun. Sementara euphoria pemasaran mungkin bertahan hingga setelah IPO tahun 2026, tekanan matematika yang tak terelakkan mungkin memaksa raksasa cloud mengumumkan pemotongan investasi pada 2027 atau 2028, mirip dengan jeda tiga tahun antara peringatan "irrational exuberance" Alan Greenspan pada 1996 dan pecahnya gelembung dotcom pada 2000.

marsbit7j yang lalu

Peringatan Gelembung AI: Investasi AI Merupakan Pengembalian Negatif bagi Kebanyakan Raksasa Teknologi

marsbit7j yang lalu

Dari Token ke Tenaga Kerja Mesin: AI Sedang Berubah dari Alat Menjadi 'Pekerja'

Dari Token ke Tenaga Kerja Mesin: AI Berubah dari Alat Menjadi "Pekerja" AI mulai menulis kode, menangani tiket dukungan pelanggan, dan meninjau dokumen hukum. Artikel ini mengusulkan kerangka baru: komersialisasi AI sedang bergerak menuju "pasar tenaga kerja mesin". Dalam pasar ini, token hanyalah unit pengukuran, GPU adalah bahan baku, dan model adalah alat produksi. Objek yang benar-benar ditetapkan harganya dan diperdagangkan adalah kerja ekonomi yang diselesaikan langsung oleh perangkat lunak. Mekanisme penetapan harga AI akan berkembang dari token mentah, kemampuan model yang terstandarisasi, tenaga kerja yang terspesialisasi industri, hingga pasar hasil yang dapat diprogram. Di masa depan, perusahaan mungkin tidak lagi peduli model atau GPU mana yang menyelesaikan suatu tugas, tetapi lebih pada apakah tugas itu diselesaikan dalam batas latensi, akurasi, keandalan, dan biaya yang ditentukan. Implikasinya, dampak AI pada pasar tenaga kerja manusia tidak hanya sekadar penggantian. Saat mesin mengambil alih lebih banyak pekerjaan yang dapat distandardisasi dan diverifikasi, peran manusia mungkin bergeser ke pengawasan, penanggung jawab, manajemen konteks, dan keputusan akhir. Dalam beberapa kasus, penilaian manusia untuk 1% akhir justru menjadi lebih berharga karena dapat membuka kunci 99% otomatisasi skala besar. Pasar AI adalah pasar ekspansif. Ketika biaya kerja turun, permintaan tidak tetap. Jika interaksi dukungan pelanggan menjadi lebih murah, perusahaan dapat menawarkan layanan 24/7, menciptakan pasar interaksi pelanggan yang lebih besar. Persaingan tahap berikutnya di pasar AI mungkin bukan lagi sekadar pertarungan kemampuan model atau perang harga daya komputasi, tetapi tentang siapa yang dapat pertama kali menstandarisasi, memverifikasi, dan menetapkan harga "pekerjaan", akhirnya menjadikan tenaga kerja mesin sebagai faktor produksi baru yang dapat dibeli, diselesaikan, dan diperdagangkan.

marsbit7j yang lalu

Dari Token ke Tenaga Kerja Mesin: AI Sedang Berubah dari Alat Menjadi 'Pekerja'

marsbit7j yang lalu

Diskon 99% untuk MiMo Bukan Hanya Pemasaran! Luo Fuli Membantah Para Pengecam di X

**Ringkasan:** Xiaomi MiMo memotong harga API MiMo-V2.5 hingga **99%**, memicu spekulasi tentang perang harga atau strategi merugi. Luo Fuli, kepala MiMo, merespons dengan mempublikasikan blog teknis 5000 kata yang merinci **enam pilar teknikal** di balik potongan harga besar ini. Intinya, diskon 99% terutama untuk **Input (Cache Hit)** – bagian dimana pengguna membaca ulang konteks historis dalam percakapan panjang. Ini menjadi mungkin karena serangkaian optimasi teknikal yang mengubah biaya komputasi untuk bagian tersebut mendekati nol. **Enam Pilar Teknikal:** 1. **Arsitektur Hybrid SWA:** Menggunakan Sliding Window Attention di sebagian besar lapisan model, mengurangi volume **KVCache** (memori jangka pendek model) hingga **1/7**. 2. **Manajemen KVCache Dua Kolam:** Mengalokasikan memori secara terpisah untuk lapisan SWA dan Full Attention, benar-benar mewujudkan penghematan teoretis 1/7 dan meningkatkan jumlah pengguna yang dapat dilayani secara bersamaan. 3. **Prefix Cache yang Dioptimalkan:** Meningkatkan aturan pencocokan cache untuk arsitektur SWA, menghasilkan **tingkat keberhasilan cache 93-95%** untuk pembacaan ulang. Artinya, sebagian besar permintaan "baca ulang" tidak memerlukan komputasi GPU baru. 4. **Sistem Cache Terdistribusi GCache:** Menyimpan data cache di **SSD bawaan mesin GPU**, menghilangkan biaya penyimpanan cluster khusus dan memperpanjang masa hidup cache. 5. **Sistem Penjadwalan LLM-Router:** Mengarahkan permintaan secara cerdas berdasarkan kesamaan prefix dan panjang konteks, memprioritaskan permintaan yang menggunakan cache, meningkatkan efisiensi dan mengurangi latensi. 6. **Multi-Token Prediction (MTP):** Mengoptimalkan proses generasi output model, mempercepat pembuatan respons dan melengkapi pengurangan biaya di sisi input. **Kesimpulan:** Penurunan harga 99% bukanlah gimmick pemasaran atau strategi merugi, tetapi hasil dari **efisiensi sistemik rekayasa AI** yang telah divalidasi di lingkungan produksi. Rantai optimasi ini secara kumulatif mengurangi biaya komputasi per permintaan hingga lebih dari 95%, memungkinkan penurunan harga ekstrem sambil mempertahankan profitabilitas. Luo Fuli menekankan bahwa ini adalah masalah teknikal yang terwujud, bukan sekadar perang harga.

marsbit9j yang lalu

Diskon 99% untuk MiMo Bukan Hanya Pemasaran! Luo Fuli Membantah Para Pengecam di X

marsbit9j yang lalu

Trading

Spot
Futures

Artikel Populer

Cara Membeli ERA

Selamat datang di HTX.com! Kami telah membuat pembelian Caldera (ERA) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli Caldera (ERA) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan Caldera (ERA) AndaSetelah melakukan pembelian, simpan Caldera (ERA) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading Caldera (ERA)Lakukan trading Caldera (ERA) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

730 Total TayanganDipublikasikan pada 2025.07.17Diperbarui pada 2025.07.17

Cara Membeli ERA

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga ERA (ERA) disajikan di bawah ini.

活动图片