Baru Saja, Claude Opus 4.8 Dirilis, Langsung Mengaku Dirinya Sebagai DeepSeek, Qwen

marsbitDipublikasikan tanggal 2026-05-29Terakhir diperbarui pada 2026-05-29

Abstrak

Anthropic meluncurkan model unggulan terbaru, Claude Opus 4.8, dan menyelesaikan pendanaan Seri H senilai $650 miliar, menilai perusahaan sebesar $965 miliar. Opus 4.8 menawarkan peningkatan dalam pengkodean, penalaran, tugas agen, dan pekerjaan berbasis pengetahuan, dengan harga yang sama. Model ini juga menunjukkan peningkatan kejujuran dan keselarasan. Anthropic memperkenalkan fitur baru seperti "effort control" (kontrol upaya) dan "dynamic workflows". Dynamic workflows memungkinkan Claude Code untuk mengelola tugas rekayasa yang kompleks dengan menjalankan banyak subagen secara paralel, seperti yang ditunjukkan dalam kasus migrasi Bun dari Zig ke Rust. Pendanaan besar-besaran ini akan digunakan untuk memperluas kapasitas komputasi melalui kemitraan dengan Amazon, Google, Broadcom, dan SpaceX. Strategi Anthropic berkembang dari sekadar menyediakan model AI menjadi menciptakan sistem kerja terintegrasi yang menggabungkan kecerdasan, alat, lingkungan pengembangan, dan infrastruktur cloud untuk perusahaan.

Seiring dengan naiknya ekspektasi IPO, ritme rilis model produk Anthropic juga semakin cepat.

Baru saja, Anthropic merilis dua berita penting berturut-turut: yang pertama adalah meningkatkan model andalannya menjadi Claude Opus 4.8, dan yang kedua adalah menyelesaikan pendanaan Seri H senilai 650 miliar dolar AS, dengan valuasi pasca-investasi mencapai 9.650 triliun dolar AS, telah mendekati ambang batas satu triliun dolar AS.

Bagi perusahaan AI yang valuasinya telah mendekati satu triliun dolar AS, pasar tidak lagi hanya melihat skor benchmark model, tetapi apakah perusahaan tersebut mampu mengubah kecerdasan, alat, lingkungan pengembangan, platform cloud, dan sumber daya komputasi menjadi seperangkat infrastruktur yang dapat disampaikan secara terukur.

Dengan kata lain, Anthropic harus berubah dari perusahaan yang menyampaikan model yang baik, menjadi perusahaan yang mencoba membentuk ulang cara kerja AI perusahaan.

Bertambah Kemampuan Tanpa Naik Harga, Claude Opus 4.8 Resmi Hadir

Claude Opus 4.8 yang dirilis kali ini merupakan peningkatan terhadap model andalan seri Opus oleh Anthropic. Dengan ritme rilis model saat ini, menurut kata-kata guyonan netizen, kemungkinan besar kita akan bisa melihat Claude Opus 6 lebih dulu sebelum GTA 6 dirilis (jika tidak tunda, bulan November).

Anthropic menyatakan, Opus 4.8 dibangun di atas dasar Opus 4.7, dengan peningkatan dalam pengkodean, tugas agen, penalaran, dan pekerjaan berbasis pengetahuan, serta sudah dibuka untuk pengguna, dengan harga penggunaan standar tetap tidak berubah, masih 5 dolar AS per juta token input, 25 dolar AS per juta token output.

Pengembang juga dapat menggunakan claude-opus-4-8 melalui Claude API.

Perbandingan Harga API https://platform.claude.com/docs/en/about-claude/models/overview

Dari informasi yang diungkapkan secara resmi, peningkatan Opus 4.8 mencakup kemampuan pengkodean, kemampuan agen, kemampuan penalaran, dan tugas-tugas pekerjaan berbasis pengetahuan praktis.

Anthropic menggunakan tabel perbandingan dalam materi perilisan untuk menunjukkan performa Opus 4.8 dibandingkan dengan pendahulunya Opus 4.7 dan model lainnya dalam berbagai pengujian. Tentu saja, selain kualitas jawaban tunggal, fokus peningkatan model tetap pada performa dalam tugas panjang dan kolaborasi kompleks.

Dalam alur kerja nyata, model sering kali perlu memproses tugas bertahap secara berurutan, memanggil alat, memeriksa hasil perantara, dan melanjutkan berdasarkan umpan balik. Anthropic menyatakan, penguji awal menganggap Opus 4.8 lebih andal dalam melaksanakan tugas agen, dan pertimbangannya juga lebih jelas.

Peningkatan kejujuran Opus 4.8 merupakan sorotan utama.

Masalah umum model AI adalah terlalu cepat mengambil keputusan ketika bukti belum cukup, dan dengan percaya diri mengklaim telah membuat kemajuan. Anthropic menyatakan, Opus 4.8 lebih bersedia untuk menjelaskan ketidakpastian dalam pekerjaannya, dan juga lebih jarang membuat penilaian yang tidak didukung bukti.

Tugas kode khususnya dapat mencerminkan perubahan ini.

Evaluasi internal menunjukkan, kemungkinan Opus 4.8 membiarkan bug dalam kode yang ditulisnya sendiri lolos tanpa penjelasan adalah sekitar seperempat dari generasi sebelumnya. Artinya, model baru ini lebih mungkin mengingatkan pengguna ketika menemukan risiko, daripada membiarkan masalah tersebut sampai tahap pengujian atau lingkungan produksi selanjutnya.

Dalam hal keselarasan dan keamanan, Anthropic melanjutkan narasi intinya. Tingkat kejadian perilaku tidak selaras seperti penipuan, kerja sama penyalahgunaan, pada Opus 4.8 jelas lebih rendah daripada Opus 4.7, dan mendekati salah satu model dengan performa keselarasan terbaik saat ini, Claude Mythos Preview.

Aman, andal, terkendali, tetap menjadi serangkaian kata kunci yang digunakan Anthropic untuk membedakan dirinya. Seiring Claude semakin masuk ke dalam proses perusahaan, kata kunci ini juga mulai memikul lebih banyak makna bisnis.

Namun yang menarik adalah, setelah Opus 4.8 dirilis, netizen menemukan ada yang tidak beres.

https://x.com/realNyarime/status/2060059543820963975

Banyak netizen yang menguji menemukan, ketika mereka menanyakan lebih lanjut tentang identitas model Opus 4.8, jawaban yang diberikan tidak selalu Claude.

Terkadang ia mengira dirinya adalah Qwen, terkadang menyebutkan nama DeepSeek, diduga terdapat perilaku distilasi.

Namun ketika netizen mengajukan pertanyaan yang sama di klien resmi Claude, jawaban semacam ini biasanya tidak mudah direproduksi. Alasannya kemungkinan besar adalah, prompt sistem dan batasan lapisan produk di dalam klien lebih lengkap.

Alur Kerja Dinamis Diluncurkan, Claude Code Menuju Kolaborasi Multi-Agents

Bersamaan dengan Claude Opus 4.8, beberapa fitur produk dan pengembang juga diluncurkan.

Di antaranya, yang paling langsung mempengaruhi pengalaman pengguna Claude adalah effort control, yaitu pengaturan intensitas pemikiran.

Kontrol ini terletak di samping pemilih model, sesuai namanya, pengguna dapat menentukan seberapa banyak daya komputasi penalaran yang akan diinvestasikan Claude dalam satu tugas. Pada intensitas lebih tinggi, Claude akan melakukan lebih banyak penalaran, untuk mendapatkan kualitas jawaban yang lebih baik; pada intensitas lebih rendah, respons Claude lebih cepat, dan penggunaan kuota juga lebih lambat.

Anthropic menyatakan, Opus 4.8 secara default menggunakan high effort, pengguna juga dapat memilih extra, yang di Claude Code sesuai dengan xhigh, atau memilih max, untuk membuat model menginvestasikan lebih banyak token. Anthropic menyarankan, tugas sulit dan alur kerja asinkron yang berjalan lama lebih cocok menggunakan extra.

Yang benar-benar mempengaruhi bentuk produk Claude Code adalah dynamic workflows.

Fitur ini saat ini berada dalam tahap research preview, tujuannya adalah agar Claude Code dapat menangani tugas skala besar yang sebelumnya memerlukan siklus teknikal lebih panjang. Pekerjaan yang sebelumnya direncanakan per kuartal, sekarang bahkan berpeluang diselesaikan dalam beberapa hari.

Mekanisme inti dynamic workflows adalah, Claude akan menulis skrip orkestrasi secara dinamis berdasarkan tugas pengguna, dan menjalankan puluhan hingga ratusan subagents paralel dalam satu sesi. Model akan merencanakan tugas terlebih dahulu, kemudian membagikannya ke beberapa subagents, memeriksa hasil yang dikembalikan, dan akhirnya melaporkan kepada pengguna. Setelah Opus 4.8 diluncurkan, agents ini juga dapat berjalan lebih lama.

Fitur ini terutama ditujukan untuk basis kode yang kompleks, besar, atau memiliki beban sejarah yang berat. Skenario khas meliputi pencarian bug di seluruh layanan, audit optimasi performa, audit keamanan, migrasi basis kode besar, penggantian kerangka kerja, migrasi API usang, porting bahasa, serta verifikasi multi-sudut pandang untuk solusi kritis.

Dalam hal cara penggunaan, Anthropic menyarankan untuk membuka auto mode dalam dynamic workflows. Pengguna dapat langsung meminta Claude untuk membuat workflow, atau membuka ultracode di Claude Code. ultracode akan mengatur intensitas pemikiran menjadi xhigh, dan membuat Claude secara otomatis menilai apakah tugas saat ini cocok menggunakan workflow.

dynamic workflows saat ini sudah dibuka di Claude Code CLI, Desktop, dan ekstensi VS Code, ditujukan untuk paket Max, Team, dan Enterprise. Di antaranya, Enterprise saat dirilis defaultnya tertutup, perlu diaktifkan oleh administrator di pengaturan Claude Code.

Fitur ini juga dapat digunakan untuk Claude API, Amazon Bedrock, Vertex AI, dan Microsoft Foundry. Untuk pengguna Max, Team, serta pengguna yang menggunakan Claude Code melalui API, dynamic workflows defaultnya terbuka.

Anthropic menggunakan studi kasus migrasi Bun untuk menunjukkan batas atas dynamic workflows. Jarred Sumner menggunakan fitur ini untuk memindahkan Bun dari Zig ke Rust, akhirnya menghasilkan sekitar 750 ribu baris kode Rust, tingkat kelulusan suite pengujian yang ada mencapai 99.8%, dari komit pertama hingga penggabungan memakan waktu sekitar 11 hari.

Seluruh proses migrasi diselesaikan oleh beberapa workflow: pertama memetakan Rust lifetime untuk field struct di basis kode Zig, kemudian menghasilkan file .rs yang konsisten perilakunya untuk setiap file .zig, ratusan agents bekerja secara paralel, setiap file memiliki dua reviewer. Setelah itu, fix loop terus menjalankan build dan test suite, hingga build dan test berhasil. Setelah migrasi selesai, overnight workflow menangani masalah penyalinan data yang tidak perlu, dan membuka PR untuk setiap jenis masalah, untuk tinjauan akhir.

Selain Claude Code, Anthropic juga memperbarui Messages API. Sekarang, Messages API dapat menerima system entries di dalam messages array.

Pengembang dapat memperbarui instruksi Claude selama pelaksanaan tugas, tanpa merusak prompt cache, dan juga tidak perlu menyampaikan pembaruan melalui user turn. Kemampuan ini dapat digunakan untuk memperbarui izin, anggaran token, atau konteks lingkungan saat runtime agen.

Selanjutnya, Anthropic juga berencana meluncurkan kategori model baru yang tingkat kecerdasannya lebih tinggi daripada Opus. Ya, itu dia Claude Mythos Preview yang sangat mengerikan, diperkirakan dalam beberapa minggu ke depan dapat membawa model kelas Mythos kepada semua pelanggan.

Saat itu, kami juga akan mencicipinya pertama kali.

Di Balik Valuasi Hampir Satu Triliun Dolar AS, Claude Membutuhkan Fondasi Komputasi yang Lebih Besar

Berita lain yang dirilis pada hari yang sama dengan Claude Opus 4.8, adalah Anthropic menyelesaikan pendanaan Seri H senilai 650 miliar dolar AS. Putaran ini dipimpin oleh Altimeter Capital, Dragoneer, Greenoaks, dan Sequoia Capital, valuasi pasca-investasi mencapai 9.650 triliun dolar AS.

Putaran pendanaan ini juga mencakup investasi komitmen yang ada sebesar 150 miliar dolar AS dari hyperscalers, termasuk 50 miliar dolar AS dari Amazon. Mitra infrastruktur strategis seperti Micron, Samsung, SK hynix juga bergabung. Anthropic menyatakan, perusahaan-perusahaan ini memiliki peran kunci dalam pasokan memory, storage, dan logic chips global, dapat membantu memperluas kapasitas komputasi seiring dengan pertumbuhan permintaan Claude.

Ekspansi daya komputasi merupakan latar belakang kunci di balik putaran pendanaan ini. Anthropic mengungkapkan beberapa perjanjian infrastruktur: menandatangani perjanjian dengan Amazon, memperoleh hingga 5 gigawatt kapasitas tambahan; menandatangani perjanjian dengan Google dan Broadcom, memperoleh 5 gigawatt kapasitas TPU generasi berikutnya; mencapai kesepakatan dengan SpaceX, dapat menggunakan kapasitas GPU di Colossus 1 dan Colossus 2.

Anthropic juga menekankan, Claude adalah model terdepan pertama yang masuk ke tiga platform cloud utama sekaligus: AWS, Google Cloud, dan Microsoft Azure. Namun, AWS tetap menjadi penyedia layanan cloud utama dan mitra pelatihan Anthropic.

Di balik pendanaan, sebenarnya adalah perubahan posisi bisnis Anthropic. Perusahaan model besar awal bersaing dalam kemampuan model dan pengalaman obrolan umum, sedangkan sekarang pelanggan perusahaan lebih peduli apakah AI dapat masuk ke proses inti, dapat menangani tugas kompleks, dapat diintegrasikan ke lingkungan pengembangan, platform cloud, dan sistem internal.

Claude Code, Cowork, effort control, dynamic workflows, dan pembaruan Messages API, semuanya dikembangkan mengarah ke arah ini.

Melihat peluncuran produk dan pendanaan secara bersamaan, Anthropic sedang memperluas tiga jenis kemampuan secara simultan.

Pertama adalah kemampuan model, Opus 4.8 meningkatkan performa pengkodean, penalaran, tugas agen, dan pekerjaan berbasis pengetahuan, serta memperkuat ekspresi ketidakpastian.

Kedua adalah kemampuan alur kerja, dynamic workflows membuat Claude Code beralih dari asisten kode tunggal ke eksekusi dan tinjauan teknikal yang lebih kompleks.

Ketiga adalah kemampuan infrastruktur, pendanaan 650 miliar dolar AS, investasi komitmen dari vendor cloud hyperscale, bergabungnya mitra memori dan chip, serta perjanjian daya komputasi dengan Amazon, Google, Broadcom, SpaceX, menyediakan sumber daya untuk kebutuhan pelatihan dan inferensi model selanjutnya.

Ini juga logika inti valuasi Anthropic yang mendekati satu triliun dolar AS. Claude tidak lagi hanya jendela obrolan AI, tetapi sedang menjadi sistem kerja yang menghubungkan model, kode, proses perusahaan, platform cloud, dan infrastruktur daya komputasi.

Opus 4.8 adalah fondasi model terbaru dalam sistem ini, dynamic workflows adalah bentuk produk yang ditujukan untuk tugas teknikal kompleks, pendanaan 650 miliar dolar AS dan ekspansi daya komputasi adalah prasyarat untuk terus mendorong sistem ini ke pelanggan skala lebih besar.

Gelombang AI mendorong Anthropic ke puncak ombak, berdiri di ketinggian ini, ke depan adalah mengikuti angin, ke belakang adalah tenggelam dan jatuh ke air, tidak ada postur ketiga.

Artikel ini berasal dari akun WeChat publik “APPSO”, penulis: APPSO yang menemukan produk masa depan

Pertanyaan Terkait

QApa yang menjadi sorotan utama dalam peluncuran Claude Opus 4.8?

APeluncuran Claude Opus 4.8 menonjolkan peningkatan kemampuan dalam pengkodean, tugas agen cerdas, penalaran, dan pekerjaan berbasis pengetahuan. Model ini juga diklaim lebih jujur dalam mengungkapkan ketidakpastian dan mengurangi kesimpulan prematur.

QApa keunikan yang ditemukan pengguna terkait identitas model Claude Opus 4.8?

ABeberapa pengguna menemukan bahwa ketika ditanya tentang identitasnya, Claude Opus 4.8 terkadang menyebut dirinya sebagai model lain seperti DeepSeek atau Qwen, bukan Claude. Hal ini diduga berkaitan dengan proses distilasi atau kendala pada sistem prompt.

QFitur baru apa yang diluncurkan bersama Claude Opus 4.8 untuk meningkatkan alur kerja?

AAnthropic meluncurkan fitur dynamic workflows yang memungkinkan Claude Code menangani tugas kompleks dengan membuat skrip orkestrasi dan menjalankan banyak subagen secara paralel dalam satu sesi, cocok untuk proyek migrasi kode atau audit skala besar.

QBerapa nilai valuasi Anthropic setelah putaran pendanaan H terbaru?

ASetelah menyelesaikan putaran pendanaan H senilai 650 miliar dolar AS, valuasi pascapendanaan Anthropic mencapai 9,65 triliun dolar AS, mendekati ambang satu triliun dolar.

QApa tujuan pendanaan besar-besaran dan kerja sama infrastruktur yang diumumkan Anthropic?

ATujuannya adalah untuk memperluas kapasitas komputasi guna mendukung pelatihan dan inferensi model Claude yang terus berkembang, melalui kerja sama dengan penyedia cloud seperti AWS, Google Cloud, Microsoft Azure, serta mitra chip dan memori seperti Micron dan Samsung.

Bacaan Terkait

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

Tiga tahun kemudian: Meninjau Kembali 20 Prediksi ChatGPT Saya pada 2023 Pada Maret 2023, penulis Wang Jianshuo membuat 20 prediksi intuitif tentang ChatGPT dan AI masa depan. Kini, di Mei 2026, sebuah sistem AI yang terdiri dari 41 agen menganalisis prediksi-prediksi tersebut berdasarkan data terkini. Hasilnya menunjukkan pola menarik. **Yang Terbukti Benar (Secara Umum):** * **RAG dan Arsitektur Pencarian (✅):** Solusi utama untuk pengetahuan dan halusinasi adalah dengan menambahkan "contekan" (RAG), bukan mengubah model. Arsitektur pencarian + LLM kini menjadi standar. * **LUI sebagai Benua Baru (🟢):** Antarmuka Pengguna Bahasa Alami (LUI) adalah lapisan interaksi baru yang besar, melahirkan industri agen dan protokol seperti MCP. * **Jaringan Robot dan Sistem Pengalamatan Baru (🟢):** Agen akan berkomunikasi otomatis dengan bahasa alami. Protokol seperti MCP dan ANP sedang mewujudkannya. * **Model Besar Tiongkok (🟢):** Model-model seperti DeepSeek dan Qwen telah mengejar ketertinggalan performa, meski dengan investasi lebih kecil. * **Tidak Ada Kesadaran, Tes Turing Hanya Ukur Penampilan (🟢):** AI tidak memiliki kesadaran. Tes Turing hanya mengukur ilusi kesadaran. * **Prediksi Lain yang Benar:** ChatGPT bukan AGI, tapi lompatan besar; gelombang pengangguran besar tidak terjadi; tahun besar untuk startup; momen "browser 1994" telah tiba. **Yang Kurang Tepat atau Salah:** * **Parameter GPT-4 (❌):** Prediksi 100 triliun parameter salah. Estimasi terbaru sekitar 1,8 triliun. * **Matematika di LLM (🟡):** Diagnosis bahwa matematika adalah kelemahan intrinsik dan memerlukan alat bantu benar. Namun, pernyataan "tidak mungkin" ditingkatkan terbukti salah, karena model kini bisa memenangkan medali emas Olimpiade Matematika Internasional (IMO). * **Penangkapan Nilai (🟡):** Aplikasi memang berkembang pesat, tetapi nilai terbesar justru ditangkap oleh lapisan komputasi (seperti Nvidia), bukan oleh pembuat model. * **Hak Cipta (🟡):** Konten AI sulit didaftarkan hak cipta, tetapi tidak serta-mata "menghindari" pelanggaran. Gugatan dan penyelesaian besar (misalnya, Anthropic $1,5 miliar) membuktikan risikonya. * **Biaya Model (🟡):** Prediksi "perang lokal" dengan biaya $5-10 miliar untuk model canggih terbukti salah. Biaya pelatihan model terdepan (seperti GPT-5) jauh lebih tinggi, sementara biaya kloning model terbuka justru bisa lebih murah. **Pola dan Pelajaran:** 1. **Arah dan mekanisme lebih dapat diandalkan daripada angka pasti dan pernyataan mutlak.** 2. **Cenderung terlalu optimis untuk jangka pendek (kecepatan), tetapi terlalu konservatif untuk jangka panjang (skala/dampak).** 3. **Kesalahan sering terjadi pada distribusi, bukan pada total.** Contoh: Tidak ada gelombang pengangguran masif, tetapi dampak berat dirasakan oleh lulusan baru. 4. **Pernyataan yang disertai batasan dan ruang ketidakpastian justru lebih tahan uji waktu.** 5. **Beberapa pertanyaan mendasar masih belum terjawab setelah tiga tahun.** Kesimpulannya, prediksi tentang arah besar dan mekanisme cenderung akurat, sementara prediksi spesifik tentang angka, kecepatan, dan distribusi dampak lebih sering meleset. Latihan ini lebih merupakan pelajaran dalam kerendahan hati dan penilaian yang bernuansa daripada sekadar penghitungan skor.

链捕手1j yang lalu

Tiga Tahun Kemudian: Menilik Kembali Penilaian Saya terhadap ChatGPT pada 2023

链捕手1j yang lalu

Peringatan Gelembung AI: Investasi AI Merupakan Pengembalian Negatif bagi Kebanyakan Raksasa Teknologi

Peringatan Gelembung AI: Investasi AI Membawa Pengembalian Negatif bagi Sebagian Besar Raksasa Teknologi Demam AI kini memasuki tahap pemeriksaan keuangan. Raksasa cloud seperti Microsoft, Alphabet, Amazon, Meta, dan Oracle berencana menginvestasikan ratusan miliar dolar ke pusat data AI dalam lima tahun ke depan. Namun, analisis terhadap proyeksi pendapatan dan pengeluaran modal (capex) hingga 2030 mengungkap masalah: tingkat pengembalian investasi implisit diperkirakan sangat negatif bagi semua perusahaan kecuali Amazon, bahkan dalam skenario optimis ekstrem. Ini menunjukkan bahwa jika tren saat ini berlanjut, boom AI bisa menjadi salah satu peristiwa perusakan nilai pemegang saham terbesar. Ada dua jalan keluar: pendapatan yang jauh melebihi ekspektasi saat ini, atau pengurangan rencana investasi. Jalan pertama tampaknya mustahil, karena membutuhkan tambahan pendapatan triliunan dolar. Jalan kedua—pemotongan investasi—akan berdampak luas, meruntuhkan harga saham perusahaan-perusahaan teknologi global dan dapat mendorong ekonomi AS ke resesi, mengingat 93% pertumbuhan PDB AS belakangan ini didorong oleh investasi teknologi. IPO perusahaan AI seperti OpenAI dan Anthropic tahun ini bisa menjadi mekanisme transfer risiko, memindahkan ketidakpastian dari pemilik awal kepada investor ritail dan dana pensiun. Sementara euphoria pemasaran mungkin bertahan hingga setelah IPO tahun 2026, tekanan matematika yang tak terelakkan mungkin memaksa raksasa cloud mengumumkan pemotongan investasi pada 2027 atau 2028, mirip dengan jeda tiga tahun antara peringatan "irrational exuberance" Alan Greenspan pada 1996 dan pecahnya gelembung dotcom pada 2000.

marsbit1j yang lalu

Peringatan Gelembung AI: Investasi AI Merupakan Pengembalian Negatif bagi Kebanyakan Raksasa Teknologi

marsbit1j yang lalu

Dari Token ke Tenaga Kerja Mesin: AI Sedang Berubah dari Alat Menjadi 'Pekerja'

Dari Token ke Tenaga Kerja Mesin: AI Berubah dari Alat Menjadi "Pekerja" AI mulai menulis kode, menangani tiket dukungan pelanggan, dan meninjau dokumen hukum. Artikel ini mengusulkan kerangka baru: komersialisasi AI sedang bergerak menuju "pasar tenaga kerja mesin". Dalam pasar ini, token hanyalah unit pengukuran, GPU adalah bahan baku, dan model adalah alat produksi. Objek yang benar-benar ditetapkan harganya dan diperdagangkan adalah kerja ekonomi yang diselesaikan langsung oleh perangkat lunak. Mekanisme penetapan harga AI akan berkembang dari token mentah, kemampuan model yang terstandarisasi, tenaga kerja yang terspesialisasi industri, hingga pasar hasil yang dapat diprogram. Di masa depan, perusahaan mungkin tidak lagi peduli model atau GPU mana yang menyelesaikan suatu tugas, tetapi lebih pada apakah tugas itu diselesaikan dalam batas latensi, akurasi, keandalan, dan biaya yang ditentukan. Implikasinya, dampak AI pada pasar tenaga kerja manusia tidak hanya sekadar penggantian. Saat mesin mengambil alih lebih banyak pekerjaan yang dapat distandardisasi dan diverifikasi, peran manusia mungkin bergeser ke pengawasan, penanggung jawab, manajemen konteks, dan keputusan akhir. Dalam beberapa kasus, penilaian manusia untuk 1% akhir justru menjadi lebih berharga karena dapat membuka kunci 99% otomatisasi skala besar. Pasar AI adalah pasar ekspansif. Ketika biaya kerja turun, permintaan tidak tetap. Jika interaksi dukungan pelanggan menjadi lebih murah, perusahaan dapat menawarkan layanan 24/7, menciptakan pasar interaksi pelanggan yang lebih besar. Persaingan tahap berikutnya di pasar AI mungkin bukan lagi sekadar pertarungan kemampuan model atau perang harga daya komputasi, tetapi tentang siapa yang dapat pertama kali menstandarisasi, memverifikasi, dan menetapkan harga "pekerjaan", akhirnya menjadikan tenaga kerja mesin sebagai faktor produksi baru yang dapat dibeli, diselesaikan, dan diperdagangkan.

marsbit2j yang lalu

Dari Token ke Tenaga Kerja Mesin: AI Sedang Berubah dari Alat Menjadi 'Pekerja'

marsbit2j yang lalu

Diskon 99% untuk MiMo Bukan Hanya Pemasaran! Luo Fuli Membantah Para Pengecam di X

**Ringkasan:** Xiaomi MiMo memotong harga API MiMo-V2.5 hingga **99%**, memicu spekulasi tentang perang harga atau strategi merugi. Luo Fuli, kepala MiMo, merespons dengan mempublikasikan blog teknis 5000 kata yang merinci **enam pilar teknikal** di balik potongan harga besar ini. Intinya, diskon 99% terutama untuk **Input (Cache Hit)** – bagian dimana pengguna membaca ulang konteks historis dalam percakapan panjang. Ini menjadi mungkin karena serangkaian optimasi teknikal yang mengubah biaya komputasi untuk bagian tersebut mendekati nol. **Enam Pilar Teknikal:** 1. **Arsitektur Hybrid SWA:** Menggunakan Sliding Window Attention di sebagian besar lapisan model, mengurangi volume **KVCache** (memori jangka pendek model) hingga **1/7**. 2. **Manajemen KVCache Dua Kolam:** Mengalokasikan memori secara terpisah untuk lapisan SWA dan Full Attention, benar-benar mewujudkan penghematan teoretis 1/7 dan meningkatkan jumlah pengguna yang dapat dilayani secara bersamaan. 3. **Prefix Cache yang Dioptimalkan:** Meningkatkan aturan pencocokan cache untuk arsitektur SWA, menghasilkan **tingkat keberhasilan cache 93-95%** untuk pembacaan ulang. Artinya, sebagian besar permintaan "baca ulang" tidak memerlukan komputasi GPU baru. 4. **Sistem Cache Terdistribusi GCache:** Menyimpan data cache di **SSD bawaan mesin GPU**, menghilangkan biaya penyimpanan cluster khusus dan memperpanjang masa hidup cache. 5. **Sistem Penjadwalan LLM-Router:** Mengarahkan permintaan secara cerdas berdasarkan kesamaan prefix dan panjang konteks, memprioritaskan permintaan yang menggunakan cache, meningkatkan efisiensi dan mengurangi latensi. 6. **Multi-Token Prediction (MTP):** Mengoptimalkan proses generasi output model, mempercepat pembuatan respons dan melengkapi pengurangan biaya di sisi input. **Kesimpulan:** Penurunan harga 99% bukanlah gimmick pemasaran atau strategi merugi, tetapi hasil dari **efisiensi sistemik rekayasa AI** yang telah divalidasi di lingkungan produksi. Rantai optimasi ini secara kumulatif mengurangi biaya komputasi per permintaan hingga lebih dari 95%, memungkinkan penurunan harga ekstrem sambil mempertahankan profitabilitas. Luo Fuli menekankan bahwa ini adalah masalah teknikal yang terwujud, bukan sekadar perang harga.

marsbit4j yang lalu

Diskon 99% untuk MiMo Bukan Hanya Pemasaran! Luo Fuli Membantah Para Pengecam di X

marsbit4j yang lalu

Rp 426 Triliun, "Tim Murni Tionghoa" Menopang Perusahaan Pemrograman AI dengan Valuasi Tertinggi di Dunia

Pada Mei 2025, Cognition AI, startup pengembangan AI yang didirikan oleh tiga pendiri berkebangsaan China pemenang Olimpiade Informatika, mengumumkan pendanaan baru senilai lebih dari $10 miliar, yang menaikkan valuasinya menjadi $26 miliar. Lonjakan valuasi ini, hanya dalam 8 bulan sejak valuasi $10,2 miliar sebelumnya, didorong oleh kepercayaan investor bahwa agen AI seperti "Devin" perusahaan mereka akan menjadi infrastruktur rekayasa perangkat lunak generasi berikutnya. Awalnya, Cognition menciptakan sensasi dengan meluncurkan Devin, yang dipasarkan sebagai "insinyur perangkat lunak AI" pertama yang dapat menangani tugas pengkodean secara mandiri. Namun, produk awal ini menuai kritik karena kinerja yang tidak konsisten dan harga yang tinggi. Untuk mengatasi kekurangan ini, Cognition melakukan pivoting strategis dengan mengakuisisi Windsurf, sebuah platform IDE berbasis AI, pada tahun 2025. Akuisisi ini memberi Cognition dua jalur produk: Devin untuk menangani tugas-tugas rekayasa asinkron yang dapat didelegasikan, dan Windsurf IDE sebagai alat bantu kolaboratif bagi pengembang dalam editor kode. Kombinasi ini terbukti sukses. Cognition melaporkan pertumbuhan penggunaan perusahaan lebih dari 10 kali lipat tahun ini, dengan run-rate pendapatan mencapai $492 juta dan pertumbuhan penggunaan bulanan Devin sebesar 50% selama enam bulan terakhir. Kliennya termasuk nama-nama besar seperti Goldman Sachs, NASA, dan Angkatan Darat AS. Intinya, valuasi $26 miliar ini mencerminkan keyakinan pasar bahwa Cognition, dengan strategi "dua kaki"nya, berada di posisi yang tepat untuk menangkap peluang adopsi AI berskala besar di sektor rekayasa perangkat lunak perusahaan, yang bergerak menuju sistem hybrid di mana manusia dan AI berkolaborasi.

marsbit4j yang lalu

Rp 426 Triliun, "Tim Murni Tionghoa" Menopang Perusahaan Pemrograman AI dengan Valuasi Tertinggi di Dunia

marsbit4j yang lalu

Trading

Spot
Futures
活动图片