Maret 2026, AMI Labs yang didirikan oleh pemenang Turing Award dan mantan Chief AI Scientist Meta, Yann LeCun, mengumumkan penyelesaian pendanaan seed round senilai 1,03 miliar dolar AS.
Hampir pada waktu yang sama:
- World Labs yang didirikan Fei-Fei Li menyelesaikan pendanaan baru sekitar 1 miliar dolar AS
- Google DeepMind merilis model dunia Genie 3
- Tesla terus mendorong penerapan robot humanoid Optimus di pabrik
Peristiwa-peristiwa ini tidak terjadi secara terisolasi, tetapi bersama-sama menunjuk pada tren yang lebih jelas: AI sedang beralih dari 'memahami dunia digital' menjadi 'memahami dan bertindak dalam dunia fisik'.
Jika tahun 2024 adalah periode ekspansi model bahasa besar (LLM), tahun 2025 adalah periode eksplorasi penerapan Agent, maka tahun 2026, narasi inti Silicon Valley sedang beralih ke masalah yang lebih mendasar: Dapatkah AI benar-benar memahami 'bagaimana dunia berjalan', dan menyelesaikan tugas dalam kenyataan?
Ini bukan hanya perubahan arah teknologi, tetapi lebih berarti bahwa rantai nilai industri sedang ditulis ulang. Dua tahun terakhir, medan pertempuran utama kompetisi AI terutama terkonsentrasi pada beberapa segmen berambang tinggi seperti model, daya komputasi, dan pusat data; ketika AI mulai benar-benar memasuki dunia fisik, kompetisi tidak hanya terjadi di lapisan model, tetapi juga meluas secara bersamaan ke badan perangkat keras, integrasi sistem, pengumpulan data, lingkungan simulasi, kolaborasi rantai pasokan, dan penerapan skenario nyata. Dengan kata lain, Physical AI membawa bukan terobosan titik tunggal, tetapi rekonstruksi seluruh sistem infrastruktur.
Justru karena itu, perubahan gelombang ini bagi dunia berbahasa Mandarin, terutama bagi wirausahawan, insinyur, dan investor Tionghoa, mungkin bukan hanya merupakan gelombang panas teknologi baru, tetapi juga merupakan jendela peluang struktural yang langka. Berbeda dengan kompetisi putaran sebelumnya yang terutama dipimpin oleh sumber daya pelatihan model besar dan modal super, Physical AI secara alami lebih bergantung pada kemampuan gabungan: harus memahami algoritma, juga harus mengerti teknik; harus mampu melakukan kolaborasi sistem, juga harus mampu masuk ke dalam manufaktur, rantai pasokan, dan kedalaman skenario industri. Tim-tim yang memiliki kedalaman teknik, kemampuan kolaborasi perangkat keras, dan visi industri AS-Tiongkok justru lebih berpeluang menempati posisi kunci dalam siklus baru ini.
Dengan kata lain, Physical AI bukan hanya cerita baru yang diceritakan Silicon Valley, itu juga mungkin merupakan tiket masuk yang paling layak diperhatikan bagi orang Tionghoa dalam perubahan infrastruktur teknologi global putaran berikutnya.
01 Pertarungan Abad Dua Jalur: Kubu LLM vs. Kubu Model Dunia
Tiga tahun terakhir, model bahasa besar (LLM) hampir mendominasi jalur pengembangan AI, dengan paradigma intinya adalah prediksi token berikutnya (next-token prediction) berdasarkan data teks dalam jumlah besar. Namun, batas paradigma ini juga perlahan muncul: ia dapat 'menggambarkan' dunia fisik, tetapi tidak memiliki pemahaman yang dapat dieksekusi; kurangnya kemampuan pemodelan hubungan sebab-akibat dan batasan fisik; performanya juga terbatas dalam pengambilan keputusan berkelanjutan dan tugas jangka panjang.
Oleh karena itu, sekelompok pihak yang diwakili oleh Yann LeCun mulai mendorong jalur lain: Model Dunia (World Model) — memprediksi 'status', bukan 'teks'. Perbedaan inti keduanya adalah, LLM menggunakan teks sebagai objek pembelajaran, bahasa sebagai bentuk keluaran, pada dasarnya berhenti pada 'kognisi dan ekspresi'; sedangkan model dunia menggunakan status dunia fisik sebagai objek pemodelan, langsung menunjuk pada lingkaran tertutup kemampuan 'persepsi—keputusan—eksekusi'.
Ini bukan penilaian LeCun sendirian. Q1 2026, arah model dunia hampir pada waktu yang sama menyambut beberapa kemajuan kunci: AMI Labs dengan arsitektur inti JEPA, jelas memasang taruhan pada jalur jangka panjang 'riset dulu, produk kemudian'; World Labs menyelip dari 'kecerdasan spasial', berusaha membuat AI benar-benar memahami hubungan, halangan, dan batasan fisik dalam dunia tiga dimensi; Google DeepMind melalui Genie 3 mendorong pembuatan lingkungan dinamis yang dapat berinteraksi secara real-time, dan menggunakannya untuk pelatihan agen cerdas.
Tiga perusahaan dengan jalur berbeda, tetapi menunjuk pada tren yang sama: Lompatan berikutnya AI, bukan hanya menghasilkan teks yang lebih baik, tetapi memodelkan dunia dengan lebih akurat, dan menyelesaikan tindakan di dalamnya.
02 Perang Perangkat Keras: Siapa yang Membuat 'Tubuh'?
Model dunia menyelesaikan masalah 'otak' — bagaimana AI memahami dunia fisik. Tetapi separuh medan pertempuran Physical AI lainnya sama sengit: Siapa yang membuat 'tubuh'?
Jalur robot humanoid tahun 2026, telah sepenuhnya memasuki tahap 'produksi massal pabrik' dari 'demo laboratorium'. Beberapa angka kunci:
Tesla Optimus Gen 3: Lebih dari 1000 unit telah ditempatkan di Gigafactory Texas dan pabrik Fremont, melakukan tugas penanganan dan perakitan suku cadang. Ini adalah penempatan pabrik robot humanoid terbesar dalam sejarah manusia. Tesla sedang membangun pabrik khusus dengan kapasitas produksi tahunan 10 juta unit di Giga Texas, menargetkan biaya per unit ditekan hingga 20 ribu dolar AS — dua tahun lalu harga rata-rata industri masih 5-25 ribu dolar AS.
Boston Dynamics Atlas: Atlas versi produk di CES 2026, tinggi 6,2 kaki, 56 derajat kebebasan, dapat mengangkat beban 110 pon. Yang lebih layak diperhatikan adalah 'jiwanya' — Boston Dynamics mengumumkan kerja sama dengan Google DeepMind, mengintegrasikan model dasar terdepan ke dalam Atlas. Kapasitas produksi tahun 2026 telah dipesan oleh Hyundai dan Google DeepMind, pabrik 30000 unit/tahun sedang dalam perencanaan.
Figure 03: Figure AI dengan valuasi 39 miliar dolar AS mengumpulkan 1 miliar dolar AS, Figure 02-nya dalam uji coba operasi 11 bulan di pabrik BMW Spartanburg, berpartisipasi dalam produksi lebih dari 30000 BMW X3, memindahkan lebih dari 90 ribu suku cadang, akumulasi beroperasi 1250 jam. Figure 03 melakukan peningkatan menyeluruh berdasarkan ini, dilengkapi 48+ derajat kebebasan dan platform Helix AI proprietary.
Mind Robotics: Baru mengumumkan pendanaan 500 juta dolar AS pada Maret, fokus pada penempatan robot AI skala industri.
Tetapi dalam kompetisi perangkat keras ini, sebuah segmen yang diremehkan sedang muncul: Tangan Cekatan (Dexterous Hand).
Kaki robot humanoid menyelesaikan masalah pergerakan, badan menyelesaikan masalah menahan beban, tetapi yang benar-benar menentukan apakah robot dapat bekerja di lingkungan kompleks adalah tangan. Mengambil contoh Tesla Optimus, biaya tangan menyumbang 17% dari keseluruhan mesin, sekitar 9500 dolar AS — komponen tunggal paling mahal.
Alasan tangan cekatan sulit, terletak pada kontradiksi fundamental: ruang jari terlalu kecil, tidak dapat menampung motor besar; motor kecil torsi tidak cukup, maka perlu gearbox rasio reduksi tinggi untuk memperbesar kekuatan; dan gearbox rasio reduksi tinggi akan membawa distorsi inersia, kehilangan umpan balik gaya, dan keausan mekanis — tiga masalah ini akan 'meracuni' proses pembelajaran AI dari tingkat fisik.
Sebagian perusahaan baru sedang mencoba menembus kemacetan ini. Ada yang menggunakan arsitektur motor fluks aksial untuk mengompres rasio reduksi dari 288:1 menjadi 15:1, mewujudkan tangan cekatan yang sepenuhnya dapat digerakkan balik; ada yang melalui desain sarung tangan pengumpulan data sinkron, membuat data operasi manusia dapat bermigrasi ke perangkat keras robot tanpa kehilangan. Inovasi perangkat keras yang tampak kecil ini, mungkin merupakan salah satu infrastruktur paling kunci dalam seluruh ekosistem Physical AI.
03 NVIDIA: 'Penjual Sekop' Era Physical AI
Setiap gelombang teknologi, akan muncul seorang 'penjual sekop'.
Di era model besar, NVIDIA dengan GPU dan ekosistem CUDA menjadi penerima manfaat terbesar; di era Physical AI, perannya sedang ditingkatkan lebih lanjut — tidak hanya menyediakan daya komputasi, tetapi mencoba membangun seluruh infrastruktur era robotika.
Dalam konferensi GTC Maret 2026, NVIDIA merilis serangkaian kemampuan platform seputar Physical AI: termasuk model visi-bahasa-gerakan Isaac GR00T untuk robot humanoid, seri Cosmos untuk menghasilkan data sintetis skala besar, serta rantai alat yang mencakup pelatihan, evaluasi, dan penerapan (seperti Isaac Lab dan OSMO). Kemampuan-kemampuan ini bukan alat titik tunggal, tetapi perlahan membentuk satu set sistem pengembangan dan operasi lengkap.
Termasuk beberapa perusahaan robotika seperti Boston Dynamics, Caterpillar, Franka Robotics, LG, NEURA Robotics, telah membangun sistem generasi berikutnya di platform NVIDIA.
Strateginya juga sangat jelas:
Tidak langsung berpartisipasi dalam produk akhir, tetapi menjadi standar dasar seluruh industri.
Jika Physical AI adalah kota yang sedang dibangun, maka NVIDIA sedang menyediakan semen, baja, dan jaringan listrik secara bersamaan.
04 Data: 'Minyak' Paling Langka Physical AI
Di dunia model bahasa besar, internet menyediakan data teks yang hampir tak terbatas. Tetapi dalam Physical AI, masalah yang lebih mendasar muncul:
Data manipulasi dunia nyata sangat langka.
Ini membuat data, menjadi salah satu sumber daya paling kunci, dan juga paling langka, dalam seluruh rantai industri.
Saat ini, industri terutama mengeksplorasi tiga jalur.
Jalur data nyata. Diwakili oleh Physical Intelligence, model π0-nya dilatih berdasarkan data operasi robot nyata lebih dari 10 ribu jam, mencakup berbagai bentuk robot dan jenis tugas, dapat menyelesaikan operasi kompleks (seperti melipat pakaian, merakit kotak kardus, dll.). Tindakan open source-nya, pada dasarnya menyediakan satu set 'dasar pelatihan pra-manipulasi' untuk industri.
Jalur data sintetis. Genie 3 Google DeepMind dan Cosmos NVIDIA, mencoba menghasilkan sejumlah besar lingkungan simulasi melalui model dunia, menyelesaikan pelatihan di dunia virtual, kemudian bermigrasi ke dunia nyata. Tantangan inti jalur ini adalah kesenjangan simulasi-ke-nyata (sim-to-real gap), tetapi seiring peningkatan akurasi simulasi, kesenjangan ini perlahan mengecil.
Jalur operasi jarak jauh manusia. Melalui perangkat seperti sarung tangan pengumpulan data, memetakan operasi manusia langsung ke sistem robot. Cara ini kualitas data tertinggi, tetapi masih memiliki batasan dalam biaya dan kemampuan skalabilitas.
Tesla sedang mencoba jalur campuran: melalui video pabrik terus mengumpulkan perilaku operasi manusia, dan digunakan untuk melatih kemampuan gerakan Optimus.
Dalam jangka panjang, pola persaingan Physical AI, kemungkinan besar tidak tergantung pada model siapa yang paling optimal, tetapi pada siapa yang memiliki data interaksi dunia fisik paling banyak dan berkualitas tinggi. Begitu roda data mulai berputar, hambatannya akan meningkat secara eksponensial.
05┃ Apa Kata Uang: Gambaran Lengkap Pendanaan Physical AI Q1 2026
Angka tidak berbohong. Berikut adalah peristiwa pendanaan kunci di bidang Physical AI pada kuartal pertama tahun 2026:
【Lapisan Model Dunia】
· AMI Labs(LeCun)— $1,03 M Seed Round, valuasi $3,5 M
· World Labs(Fei-Fei Li)— $1 M putaran baru, Autodesk invest $200 juta
【Lapisan Model Dasar】
· Physical Intelligence — Sedang negosiasi $1 M putaran baru, valuasi akan melebihi $11 M
· RLWRLD — $41 Juta ekstensi seed round
【Robot Humanoid Utuh】
· Figure AI — Sebelumnya valuasi $39 M kumpulkan $1 M (2025)
· Mind Robotics — $500 Juta, penempatan skala industri
· Galaxea — $434 Juta, Series B unicorn
· Humanoid — $290 Juta seed round, langsung unicorn
· Generative Bionics — €70 Juta seed round
【Infrastruktur & Alat】
· NVIDIA — Terus berinvestasi dalam platform Isaac GR00T / Cosmos
· RoboForce — $52 Juta, platform tenaga kerja Physical AI
Hanya data publik di atas, Q1 telah melebihi 6,4 miliar dolar AS. Dan ini belum termasuk investasi internal pabrik besar seperti Tesla, Hyundai/Boston Dynamics, Google DeepMind, dll.
Aliran modal menjelaskan satu hal: Physical AI telah melewati tahap 'validasi konsep', memasuki tahap 'pembangunan infrastruktur'. Investor tidak lagi bertanya 'apakah robot dapat digunakan', tetapi bertanya 'infrastruktur siapa yang dapat membuat robot paling cepat berskala'.
06 Pikiran Dingin: Gelembung atau Titik Balik?
Tentu, Silicon Valley tidak pernah kekurangan gelembung. Menghadapi kegembiraan Physical AI, beberapa pertanyaan tenang layak dipertimbangkan:
Demo ≠ Penempatan. Seperti konsensus para pelaku industri di Davos 2026: jurang antara demo yang brilian dan sistem yang dapat berjalan terus menerus 10000 kali tanpa kesalahan, jauh lebih besar dari yang disiratkan oleh publisitas. Figure 02 memang berpartisipasi dalam produksi 30000 mobil di pabrik BMW, tetapi ia melakukan pemindahan suku cadang yang relatif standar, bukan perakitan cekatan.
Sim-to-real masih merupakan tulang keras. Ketelitian model dunia sedang meningkat, tetapi kompleksitas ekor panjang dunia fisik — perubahan pencahayaan, perbedaan material, tabrakan tak terduga — tetap merupakan tantangan terbesar jalur data sintetis.
Model bisnis belum terbukti. LeCun sendiri mengatakan AMI Labs tahun pertama hanya melakukan penelitian. World Labs mencoba mode gratis+berbayar. Physical Intelligence open source model inti. Saat ini pendapatan perusahaan-perusahaan ini hampir nol, modal bertaruh pada monopoli paradigma 3-5 tahun kemudian.
Badak abu-abu keamanan dan regulasi. Ketika ribuan robot dengan kemampuan pengambilan keputusan otonom memasuki pabrik bahkan rumah, siapa yang bertanggung jawab atas kecelakaan? Saat ini kerangka regulasi global untuk Physical AI hampir kosong.
Justru masalah-masalah ini menunjukkan bahwa kita berada di tahap awal titik balik teknologi, bukan di puncak gelembung. Setiap transformasi paradigma yang benar — internet, ponsel pintar, komputasi awan — pada tahap awal disertai dengan tahap 'Demo jauh lebih baik daripada produk'. Perbedaan kuncinya adalah: apakah teknologi dasar benar-benar mengalami kemajuan, bukan hanya PPT yang maju.
Dari arsitektur JEPA LeCun, ke pembuatan dunia real-time Genie 3, ke kemampuan generalisasi 68 tugas π0, ke penempatan pabrik tingkat 1000 unit Optimus — kemajuan Q1 2026 adalah terobosan teknik yang nyata, bukan istana di udara.
07 Physical AI Bukan Jalur Independen, Itu adalah Bentuk Akhir AI.
Physical AI bukan jalur baru, itu lebih seperti salah satu bentuk akhir AI.
Ketika AI beralih dari 'memahami dunia' menjadi 'memasuki dunia', yang benar-benar ditulis ulang bukan hanya batas kemampuan model, tetapi juga cara pembagian kerja industri dan distribusi nilai. Kompetisi masa depan, tidak hanya akan terjadi dalam parameter model dan kluster daya komputasi, tetapi juga akan terjadi dalam badan robot, tangan cekatan, pengumpulan data, sistem simulasi, skenario industri, dan kemampuan organisasi rantai pasokan.
Ini juga alasan mengapa, putaran ini sangat penting bagi orang Tionghoa.
Karena akumulasi terdalam orang Tionghoa dalam dua puluh tahun terakhir, salah satunya, bukanlah label teknologi dimensi tunggal, tetapi kemampuan untuk benar-benar menghubungkan teknologi terdepan, eksekusi teknik, manufaktur perangkat keras, dan kolaborasi industri lintas wilayah. Baik wirausahawan, insinyur, maupun investor dan pengorganisir sumber daya industri, asalkan dapat menangkap migrasi dari kecerdasan digital ke kecerdasan fisik putaran ini, memiliki peluang tidak hanya berpartisipasi dalam tren, tetapi dalam beberapa lapisan kunci, menjadi bagian dari tren itu sendiri.
Tahun 2026, Physical AI mungkin masih jauh dari matang; tetapi justru karena masih awal, jendela baru saja terbuka. Bagi orang Tionghoa, ini mungkin bukan siklus 'partisipasi mengikuti' putaran lain, tetapi titik awal baru yang lebih berpeluang masuk mendalam ke lapisan infrastruktur, platform, dan komponen kunci.
Artikel ini dari akun WeChat publik "硅兔君" (ID:gh_1faae33d0655), penulis: 硅兔君
















