Adegan yang familiar terulang kembali.
Investment Community mendapat informasi bahwa VisionExtreme mengumumkan telah menyelesaikan putaran pendanaan B2 sebesar 10 miliar yuan, yang diinvestasikan bersama oleh lembaga investasi lintas batas terkemuka Singapura Lion City Capital (melanjutkan investasi di beberapa putaran), China-Belgium Fund (CBF), Jian Tou Investment, Wanxiang Qianchao, Fosun RuiZheng, Huagai Chuangying, Jin Chuang Tou, Deyi Capital, Huacang Capital, Yuanshi Fund, dan lembaga keuangan negara, modal industri, dan platform modal negara global lainnya. Sejumlah pemegang saham lama seperti Guozhong Capital, Fortune Capital, dan Turing Asset Management terus memberikan tambahan investasi ekstra.
Menurut sumber yang mengetahui, niat investasi pasar pada putaran ini jauh melebihi target pendanaan asli. Patut dicatat, ini adalah putaran pendanaan ketiga VisionExtreme dalam tiga bulan, dengan jumlah kumulatif mencapai 35 miliar yuan.
Dengan demikian, VisionExtreme dan pemimpinnya, doktor kelahiran tahun 90-an Huang Guan, menciptakan momen panas di lingkaran venture capital tahun ini. Di balik taruhan kolektif investor ini, mungkin momen "GPT-3" untuk AGI fisik akan segera tiba.
Investor Antri Datang,Tiga Bulan, Berturut-turut Mendapat Pendanaan 35 Miliar
Seperti yang Anda lihat, hampir semua jenis lembaga investasi top di pasar muncul di belakang VisionExtreme.
Sejak awal pendiriannya, VisionExtreme telah memperoleh pendanaan seed round senilai puluhan juta yuan dari Chengtai Capital. Setelah itu, investor mulai berdatangan antri—pada September 2024 menyelesaikan dua putaran berturut-turut Angel dan Angel+ senilai hampir 50 juta yuan, diinvestasikan oleh BAIC Capital, MiraclePlus, Huamin Investment, Longding Investment, Qingzhi Capital, PKSHA Algorithm Fund, dan lembaga lainnya.
Setahun kemudian, pada Agustus 2025, VisionExtreme kembali memperoleh pendanaan Pre-A & Pre-A+ berturut-turut senilai ratusan juta yuan. Pendanaan Pre-A dipimpin oleh Guozhong Capital, dengan partisipasi dari Zifeng Capital dan pemegang saham lama PKSHA Algorithm Fund; Pendanaan Pre-A+ diinvestasikan oleh CICC Capital, Guangzhou Industrial Investment, Yicun Songling, dan Huaqiang Capital.
Selanjutnya, ritme pendanaan VisionExtreme menjadi semakin padat. Pada November tahun yang sama, VisionExtreme menyelesaikan putaran A1 baru senilai ratusan juta yuan, diinvestasikan bersama oleh Huawei Hubble dan Huakong Fund. Sebulan kemudian, perusahaan menyelesaikan putaran A2 senilai 200 juta yuan, dipimpin oleh Fortune Capital, dengan pemegang saham lama Huakong Fund sebagai co-leader, diikuti oleh institusi terkenal seperti Shoufazhan Chuangtou, Puyao Xinye, Caixin Capital, Huajin Capital, Zhangke Yaokun, Fuzhuo Chuangtou, dan pemegang saham lama Hedin Capital memberikan tambahan investasi ekstra.
Memasuki tahun 2026, ritme pendanaan VisionExtreme memberikan kesan mendalam di lingkaran venture capital.
Pertama, pada awal Maret tahun ini, menyelesaikan pendanaan Pre-B senilai hampir 10 miliar yuan, dengan investor termasuk Zhongxin Juyuan, Shanghai Semiconductor Industry Investment Fund, Linxin Capital, Xingyuan Capital, Wanlin International, dan modal industri chip serta otomotif top lainnya; platform modal negara dan lembaga keuangan terkenal seperti CICC Capital, Su Chuangtou, Huaqiang Capital, Changjiang Capital, Guanggu Chantou, Xishan Guotou, Jinyu Maowu, Xinding Capital, Lingyang Investment, Caixin Capital, Zhangke Yaokun, Chengzhu Investment. Di antaranya, CICC Capital, Huaqiang Capital, Caixin Capital, Zhangke Yaokun, dan lainnya sebagai pemegang saham lama terus memberikan dukungan ekstra yang signifikan.
Kemudian pada April, pendanaan B1 VisionExtreme muncul—diinvestasikan bersama oleh raksasa teknologi terkenal tertentu, beberapa dana negara top, perusahaan CVC grup Yili Jianling Capital, Puhua Capital, Huafu Investment, Yida Capital, New Industrialization Fund, Shengjing Jiacheng, Turing Asset Management, Kaiyang Capital, Wuhan High-tech, Guiyang Jintou, Shandong Chantou, dan platform modal negara, modal industri, serta lembaga keuangan dual-currency top lainnya, dengan pemegang saham lama seperti Huakong Fund, Huamin Investment, Yicun Capital, Lingyang Investment, dan lainnya terus memberikan tambahan investasi ekstra.
Dengan demikian, valuasi VisionExtreme telah melampaui 10 miliar yuan, menjadi unicorn bernilai 10 miliar pertama di dunia untuk model dunia di dalam negeri.
Sampai kali ini, pendanaan B2 secara resmi terungkap, berarti dalam waktu singkat tiga bulan, VisionExtreme secara kumulatif menyelesaikan pendanaan 35 miliar yuan, para investor memberikan suara dengan uang sungguhan.
Jika dirinci, perjalanan pendanaan VisionExtreme sejak berdiri hingga kini, merupakan gambaran kecil dari kepercayaan pasar primer terhadap jalur AGI fisik yang terus memanas, dan juga pandangan tegas investor terhadap kemampuan VisionExtreme dalam "jalur teknologi AGI fisik yang digerakkan model dunia + kemampuan implementasi tingkat produktivitas".
Sinyal yang tersirat di dalamnya juga memiliki makna yang dalam. Lebih lanjut, ini merupakan saksi dari akumulasi teknologi VisionExtreme di masa lalu, sekaligus dukungan paling berharga dalam memimpin jalur AGI fisik dan membuka lanskap industri baru. Dapat diprediksi, di masa depan akan ada lebih banyak investor yang berkumpul di belakang VisionExtreme.
Sistem "Piramida Ganda", Modal Menuju AGI Fisik
Seperti yang penasaran publik, mengapa VisionExtreme?
Investasi adalah investasi pada orang. Di belakang VisionExtreme ada seorang nahkoda, doktor lulusan Tsinghua kelahiran tahun 90-an—Huang Guan. Ia lulus S1 dari Huazhong University of Science and Technology, kemudian melanjutkan S2 di Institute of Automation, Chinese Academy of Sciences, dan selanjutnya menjadi doktor di Department of Automation, Tsinghua University. Selain itu, ia pernah bekerja di Horizon Robotics, Jianzhi Robotics, dan memiliki pengalaman kerja di Microsoft Research Asia, Samsung China R&D Center, dan institusi lainnya.
Yang lebih langka, Huang Guan dalam karier profesionalnya sebelumnya, secara kumulatif memimpin atau berpartisipasi dalam pendanaan lebih dari 2 miliar yuan. Dengan demikian, Huang Guan adalah pemimpin komposit langka di industri yang sekaligus memiliki pengalaman penelitian top di bidang AI fisik, pengalaman rekayasa produksi massal, pengalaman implementasi komersial, dan pengalaman kewirausahaan berkelanjutan.
Tim inti yang dipimpin oleh Huang Guan ini juga secara lengkap mengalami perjalanan perkembangan AI fisik selama sepuluh tahun terakhir, dan terus memberikan prestasi bagus dalam inovasi teknologi dan implementasi industri di setiap tahap seperti CV, autonomous driving, embodied intelligence, model dunia, dan lainnya. Ini adalah tim langka di industri yang memiliki pengalaman dan kemampuan top di semua aspek seperti algoritma, data, body, produksi massal, bisnis, organisasi, dll., untuk AGI fisik, yang dapat disebut sebagai "Tim Impian" AGI fisik.
Jika talenta adalah pendorong kebangkitan VisionExtreme, maka inovasi teknologi adalah fondasi intinya untuk berdiri di jalur AGI fisik global.
Seperti diketahui, pengembangan AGI fisik menghadapi dua hambatan inti: pertama, fragmentasi data, kurangnya data berkualitas tinggi dan multidimensi yang sesuai dengan skenario interaksi fisik; kedua, model dasar yang didominasi bahasa bukanlah arsitektur yang efektif untuk mengkodekan informasi 3D, sebab-akibat fisik, dan tindakan, menyebabkan model sulit memahami hukum fisika yang kompleks.
Bagaimana menyelesaikan dua masalah ini? Jawaban VisionExtreme adalah, dengan model dunia sebagai inti, sekaligus membangun sistem "piramida ganda" untuk algoritma dan data.
Di antara mereka, piramida data dibagi menjadi lima lapisan, dari bawah ke atas secara berurutan: data video internet, data manusia nyata, simulator model dunia, data sintesis simulasi, data mesin nyata. Arsitektur data lima lapisan ini dapat menyelesaikan titik sakit dalam pengembangan AGI fisik seperti data tidak cukup, kualitas tidak tinggi, dan skenario tunggal, menyediakan "bahan bakar" yang cukup dan berkualitas untuk pelatihan model algoritma.
Piramida algoritma dibagi menjadi tiga lapisan, terutama berkisar pada tiga kemampuan inti: simulasi dunia, penyelarasan tindakan, dan penguatan pengalaman. Dengan demikian, dapat mewujudkan lompatan dari kognisi fisik ke eksekusi entitas, dari eksekusi pasif ke evolusi aktif, memberikan AGI fisik kemampuan belajar dan adaptasi mirip manusia.
Nilai inti sistem "piramida ganda" terletak pada pembangunan mekanisme evolusi tertutup yang digerakkan data oleh algoritma, dan algoritma memberi makan balik data. Piramida data menyediakan data interaksi fisik dalam jumlah besar dan berkualitas tinggi untuk piramida algoritma, mendukung pelatihan dan optimasi model algoritma; iterasi dan peningkatan piramida algoritma dapat meningkatkan akurasi pengumpulan data dan keaslian data simulasi, yang pada gilirannya memperkaya konten piramida data.
Yang lebih penting, VisionExtreme melalui endapan waktu tiga tahun, menciptakan sistem model ganda "pembangkitan dunia-tindakan". Di dalamnya, model tindakan dunia adalah mengubah pemahaman dan prediksi model dunia menjadi strategi tindakan robot—GigaBrain-0: model VLA embodied bertenaga model dunia yang dikembangkan sendiri, dalam evaluasi mesin nyata terbesar di dunia RoboChallenge, meraih juara global dengan tingkat keberhasilan tugas 51,67%;
GigaBrain-0.5M*: paradigma asli agen fisik pertama di dunia yang berpusat pada "pembelajaran pengalaman yang dipimpin model dunia", mencapai evolusi diri melalui "model dunia + pembelajaran penguatan", tingkat keberhasilan tugas jangka panjang dengan tingkat kesulitan tinggi mendekati 100%;
GigaWorld-Policy: model tindakan dunia yang meruntuhkan segitiga mustahil "kecepatan-kinerja-efisiensi", mencapai peningkatan kecepatan inferensi 10 kali, efisiensi pelatihan 10 kali, tingkat keberhasilan tugas meningkat sekitar 30 persen. Di platform evaluasi otoritatif global RoboCasa365 yang berorientasi pada tugas operasi bergerak rumah tangga, mengalahkan Nvidia GR00T N1.5, PI0.5, dll., dan meraih posisi pertama global, serta menjadi model tindakan dunia pertama yang menduduki puncak dalam daftar.
Model pembangkitan dunia adalah memahami, mensimulasikan, dan membangkitkan dunia fisik, menyediakan data dan dasar simulasi serta parameter pra-pelatihan untuk model tindakan—GigaWorld-0: pekerjaan tonggak sejarah pertama di dunia yang memverifikasi "data yang dibangkitkan model dunia dapat secara efektif meningkatkan kinerja robot nyata", dirilis dan open source pada Desember 2025, kode sumber terbuka GitHub meraih lebih dari 1,5k Star;
GigaWorld-1: model dunia kondisi tindakan (AC-WM), di evaluasi otoritatif WorldArena dengan skor komprehensif 62,34 mengalahkan model dari institusi top internasional seperti Google, NVIDIA, Alibaba, dll., dan meraih juara global, adalah model pertama dalam daftar yang melampaui 60 poin;
DriveDreamer: model dunia untuk mengemudi otonom pertama di dunia yang berorientasi pada dunia fisik nyata, menerima undangan NVIDIA Oral Presentation, salah satu makalah paling berpengaruh di ECCV 2024, memimpin dalam implementasi industri skala besar untuk model dunia.
Tidak diragukan lagi, model tindakan dunia dan model pembangkitan dunia saling melengkapi dan tidak dapat dipisahkan, berada dalam keadaan saling mendukung dan spiral naik, bersama-sama membentuk model dasar AGI fisik, sehingga mempercepat AGI fisik menuju "momen GPT-3". Dalam beberapa hal, VisionExtreme telah membuka jalur baru yang semakin terbukti.
Dunia Fisik, Perhentian Berikutnya AGI
Momen pembagian air baru era AI telah tiba.
Beberapa tahun terakhir, AGI digital berfokus pada pemrosesan informasi dan interaksi virtual, mengandalkan model bahasa besar, model generasi multimodal, mewujudkan fungsi seperti penulisan teks, desain gambar, penulisan kode, yang pada dasarnya adalah optimasi dan peningkatan "produktivitas informasi".
Batasan juga jelas terlihat. Meskipun AGI digital sangat meningkatkan efisiensi penyebaran informasi, penciptaan konten, dan pemrosesan data, ia tetap tidak dapat menembus batas antara virtual dan realitas. Seperti kata "Ibu Baptis AI" Li Fei-Fei, model bahasa besar tetap adalah "tukang kata-kata dalam kegelapan", fasih bicara tetapi kurang pengalaman, berpengetahuan luas tetapi tidak cukup mendasar.
Oleh karena itu, dalam pandangan tim VisionExtreme, AGI seharusnya tidak hanya berhenti di layar. Nilai inti AGI fisik terletak pada eksekusi entitas dan transformasi fisik, memahami hukum fisika melalui model dunia, merasakan lingkungan fisik melalui persepsi multimodal, dan melakukan tindakan fisik melalui tubuh mekanis.
Tidak diragukan lagi, GPT-3 secara luas diakui sebagai titik kunci dalam proses realisasi AGI digital, di mana Scaling Law pertama kali menunjukkan kemampuan muncul. Hingga hari ini, VisionExtreme dengan waktu tiga tahun, setelah menyelesaikan terobosan terus-menerus pada sistem algoritma dan data, telah melihat tren konvergensi jalur AGI fisik, yang berarti "momen GPT-3" untuk AGI fisik mungkin akan segera tiba.
Menurut penjelasan, VisionExtreme GigaBrain-1 akan dirilis pada kuartal ketiga tahun ini. Sebagai model dasar AGI fisik pertama di dunia yang dibangun berdasarkan sistem "piramida ganda", GigaBrain-1 akan membawa tiga terobosan kunci: pemahaman asli visual (dengan visual sebagai saluran utama untuk memahami keadaan), perencanaan tingkat tinggi bahasa (bahasa bertanggung jawab atas dekomposisi tugas tingkat tinggi), penyelarasan hukum fisika (secara sistematis memperluas data pelatihan skala besar dan semua jenis).
Setelah itu, GigaBrain-2 dan GigaBrain-3 juga akan diluncurkan berturut-turut. Di antaranya, GigaBrain-3 akan dilatih berdasarkan data video 10 juta jam + data dunia-tindakan 1 juta jam, mengarah pada "momen GPT-3" untuk AGI fisik.
Tentu saja, teknologi pada akhirnya harus kembali ke realisasi nilai industri.
VisionExtreme memilih jalan unik: jalur C memasuki rumah tangga, jalur B memasuki pabrik, kedua jalur berjalan bersama. Melihat ke industri, saat ini perusahaan embodied intelligence yang bisa mendapatkan pesanan rumah tangga dapat dihitung dengan jari, alasannya adalah karena kebutuhan skenario rumah tangga nyata lebih kompleks dan beragam, jauh dari standarisasi skenario industri.
Tapi VisionExtreme tetap menghadapi tantangan, tidak lama yang lalu merilis sub-merek untuk skenario rumah tangga "SeeLight", dan meluncurkan robot humanoid umum pertama yang masuk ke rumah tangga nyata "SeeLight S1", telah mendapatkan pesanan ratusan unit untuk skenario rumah tangga nyata, akan segera diterapkan di komunitas Wuhan Guanggu Zhiyu, mulai kuartal ketiga memulai operasi skala besar; robot umum rumah tangga generasi berikutnya "SeeLight S2" juga akan dirilis pada kuartal ketiga.
Dengan demikian, VisionExtreme dalam aspek data mesin nyata rumah tangga yang paling langka di industri, sekali lagi berhasil memecahkan kebuntuan. Dan mengikuti ritme produk SeeLight S2/S3, yang sesuai adalah momen ChatGPT untuk AGI fisik—membuat keterampilan umum digunakan secara luas dalam skenario rumah tangga nyata.
Di sisi B, di satu sisi, menghadapi skenario manufaktur industri, VisionExtreme sedang bergerak dari verifikasi titik tunggal menuju produksi massal skala besar. Pada April tahun ini, VisionExtreme telah meluncurkan robot umum asli AGI fisik yang sepenuhnya dikembangkan sendiri Maker H01, dan bekerja sama dengan FAW Mould, Alibaba Cloud, menyelesaikan implementasi solusi lengkap untuk robot embodied intelligence dalam skenario manufaktur industri nyata, memampatkan siklus adaptasi skenario yang biasanya berbulan-bulan dari solusi otomatisasi tradisional menjadi beberapa minggu.
Pada saat yang sama, VisionExtreme mengumumkan bulan ini, merencanakan dalam tiga tahun bekerja sama dengan Longsheng Technology untuk menerapkan 1.000 robot umum yang dilengkapi dengan otak embodied model dunia VisionExtreme dan seri Maker di Wuxi—ini adalah pertama kalinya di dunia robot umum yang digerakkan oleh model dasar kecerdasan fisik memulai implementasi skala besar ribuan unit dalam skenario industri, menandai embodied intelligence dalam negeri benar-benar meninggalkan uji coba skala kecil, sepenuhnya memasuki siklus produksi massal skala besar dalam skenario industri.
Di sisi lain, VisionExtreme sudah lama menjadikan model dunia untuk mengemudi otonom seri DriveDreamer sebagai karya representatif industri—simulator mengemudi generasi baru berinti model dunia, telah mencapai penandatanganan titik dan kerja sama produksi massal dengan beberapa OEM terkemuka dalam negeri, OEM luar negeri dan joint venture, serta raksasa chip AI dan Tier 1, melayani lebih dari 30 OEM terkemuka dan perusahaan autonomous driving dalam dan luar negeri.
Kesimpulannya, tata letak sisi B yang diwakili oleh produk seri industri, tepat sesuai dengan momen Claude Code untuk AGI fisik—terobosan keterampilan tingkat tinggi dalam skenario produktivitas.
Yang lebih penting, VisionExtreme menerapkan skenario implementasi dengan dua jalur paralel, dapat terus mengakumulasi data nyata dan arus kas untuk selanjutnya memberi makan basis data "piramida ganda", menggerakkan roda terbang "skenario—data—model—produk—ekosistem".
Dalam pandangan Huang Guan, momen GPT-3, mewujudkan munculnya kecerdasan kemampuan model; momen ChatGPT, produktivitas menguntungkan setiap orang biasa; momen Claude Code, kemampuan model kecerdasan digital mencapai tingkat ahli di bidang profesional.
"Sebagai perusahaan pionir AGI fisik yang paling awal menyusun model dunia di dalam negeri, VisionExtreme percaya bahwa AGI fisik di masa depan juga akan mengalami tahapan serupa, perbedaannya terletak pada—AGI fisik akan bekerja langsung pada dunia fisik nyata. Yang dibawanya bukan hanya peningkatan efisiensi informasi, tetapi juga transformasi cara produksi dan kehidupan, sehingga dampaknya terhadap ekonomi dan masyarakat juga akan lebih mendalam."
Melihat sejarah perkembangan peradaban manusia, setiap lompatan besar produktivitas tidak lepas dari terobosan disruptif teknologi inti. Oleh karena itu, ketika AI benar-benar menembus batasan digital dan memasuki dunia luas fisik, pasti juga akan membangkitkan revolusi produktivitas baru, produktivitas fisik tak terbatas akan dilepaskan.
Inilah visi akhir yang digambarkan VisionExtreme—era AGI fisik melayani setiap orang, akan terjadi secara bertahap di setiap rumah tangga nyata.
Mungkin, adegan ini akan segera tiba.
Artikel ini berasal dari akun resmi WeChat "Investment Community" (ID:pedaily2012), penulis: Liu Bo







