QxSmart sekali lagi memadatkan ritme pendanaannya.
Pada 7 April 2026, QxSmart mengumumkan penyelesaian pendanaan baru senilai 1 miliar yuan. Pendanaan ini dipimpin bersama oleh Shunwei Capital dan Yunfeng Fund, dengan dukungan berat dari Dana RMB terkemuka, Galaxy Source Convergence, Turing Fund, New Ding Capital, Gengxin Capital, dan lainnya.
Ini sudah menjadi pendanaan besar kedua dalam 30 hari. Tidak lama sebelumnya pada bulan Februari, perusahaan baru saja menyelesaikan pendanaan hampir 2 miliar yuan. Digabungkan, total pendanaan kumulatif langsung mencapai 3 miliar yuan.
Yang lebih menarik, dalam putaran ini muncul kombinasi yang sangat menarik: Lei Jun (Shunwei) + Jack Ma (Yunfeld), untuk pertama kalinya bersama-sama memimpin investasi di bidang embodied intelligence.
Di masa lalu, mereka masing-masing telah mendukung siklus kunci seperti mobile internet, e-commerce, perangkat keras pintar, komputasi awan. Kali ini, dengan investasi bersama di bidang robotika, khususnya embodied intelligence yang masih awal, menunjukkan bahwa arah ini sedang bergerak dari imajinasi teknis menuju konsensus modal, mulai memasuki babak eliminasi yang didukung oleh raksasa dan sangat terkonsentrasi modal.
QxSmart didirikan pada Januari 2024, oleh pendiri serial di bidang robotika Han Fengtao, ilmuwan AI top Gao Yang, dan pelopor ekspor robotika Zheng Lingyin.
Pendiri dan CEO Han Fengtao sebelumnya adalah Pendiri Bersama dan CTO Luoshi Robotics, memimpin pengiriman hampir seratus model robot, memiliki kemampuan rekayasa dan produksi massal yang mendalam. Pendiri Bersama Gao Yang lulus dari University of California, Berkeley, belajar di bawah ahli visi komputer Trevor Darrell, sekarang sebagai Asisten Profesor di Institute for Interdisciplinary Information Sciences Tsinghua University, timnya yang memimpin open source model Spirit v1.5 dalam daftar RoboChallenge melampaui model AS teratas Pi0.5, menjadi model embodied open source China pertama yang mencapai puncak. Pendiri Bersama Zheng Lingyin adalah pelopor ekspor robotika industri, sebelumnya membangun divisi luar negeri dari 0 hingga 1, memimpin tim untuk mendalami beberapa pasar luar negeri dan dengan cepat mencapai transformasi hasil komersialisasi.
Tiga pendiri masing-masing mencakup tiga kemampuan inti AI, robotika, komersialisasi, bersama-sama membentuk tim 'pejuang segi enam' yang langka di industri, ini juga merupakan keyakinan dasar mengapa mereka mendapatkan pendanaan 3 miliar yuan dalam 30 hari, Shunwei Capital dan Yunfeng Fund bersama-sama berinvestasi besar. Kombinasi seperti ini membuat QxSmart sejak pendiriannya memiliki visi teknis tingkat dunia dan gen pelaksanaan komersialisasi.
Han Fengtao pernah menunjuk, tahun 2026, bersaing adalah skala data dan kinerja model. Hal terpenting tahun ini, bukan memperluas skenario, tetapi membuat model embodied menjadi Top 3 global. Untuk mencapai ini, harus ada cukup uang di rekening.
Oleh karena itu, pendanaan berkelanjutan seperti perang kilat pada dasarnya adalah menggunakan kepadatan modal untuk keuntungan waktu, cepat menumpuk sumber daya, memperlebar jarak kinerja, mengunci kursi terlebih dahulu. Pada saat yang sama, pemegang saham lama dalam putaran ini terus menambah investasi, berarti investor sudah beralih dari menunggu verifikasi ke mempercepat investasi.
Lalu, QxSmart, dengan apa mendapatkan tiket akselerasi ini? Seberapa dalam parit pertahanannya sudah digali?
Logika dasar investasi modal, jalur yang lebih mirip model besar telah diverifikasi
Mengapa modal bersedia terus menambah investasi? Jawaban: model, sudah memberikan jawaban tahapan.
Pada bulan Januari tahun ini, QxSmart open source model embodied Spirit v1.5. Dalam evaluasi publik, model ini langsung melampaui model open source terkuat saat itu Pi0.5.
Tapi yang paling menarik modal, adalah titik balik kurva kemampuan.
Spirit v1.5 sudah menunjukkan kemampuan generalisasi zero-shot yang cukup stabil – tidak perlu pelatihan tambahan, dapat menyelesaikan serangkaian operasi kompleks seperti menyeka, membuka dan menutup engsel, menangani objek fleksibel.
Dengan kata lain, robot mulai tidak hanya belajar satu tugas, tetapi memiliki kemampuan transfer lintas tugas, membuat orang melihat kemungkinan embodied intelligence membebaskan produktivitas manusia.
Di balik ini, sesuai dengan jalur teknis yang sangat mirip dengan model bahasa besar (LLM): memperbesar model, memberi makan data yang cukup, beriterasi terus, lalu percaya pada 'kemunculan' kemampuan.
Secara spesifik, Spirit v1.5 adalah model terpadu VLA (Vision-Language-Action) ujung ke ujung. Itu tidak berpegang pada mengembalikan semua detail dunia, juga tidak menekankan simulasi dunia eksplisit di tengah, tetapi langsung belajar pemetaan dari persepsi ke tindakan.
Cara pelatihan juga sangat LLM. Hanya saja, data teks diganti dengan data robot. Pertama melakukan pra-pelatihan dengan sejumlah besar video internet, membangun pemahaman dunia dasar, lalu menggunakan data interaksi nyata untuk penyelarasan – pertama mendapatkan kemampuan generalisasi, lalu mendekati tugas spesifik.
Hasilnya, dengan skala komputasi dan parameter yang lebih rendah, justru menghasilkan kinerja generalisasi yang lebih kuat.
Baru beberapa hari yang lalu, jalur ini juga mendapatkan 'resonansi frekuensi yang sama' dari rekan Silicon Valley.
Pada 3 April, perusahaan embodied intelligence Silicon Valley Generallist AI merilis model dasar GEN-1, dengan 500.000 jam data interaksi fisik nyata, memverifikasi Scaling Law di bidang embodied intelligence. Seberapa dahsyat efeknya?
Robot-robot ini meningkatkan tingkat keberhasilan rata-rata beberapa tugas fisik, dari 64% secara signifikan menjadi 99%; kecepatan eksekusi hampir sama cepatnya dengan manusia, mencapai sekitar 3 kali sistem paling maju yang ada, bahkan bisa berimprovisasi di tempat. Lebih夸张的是, setiap kemampuan yang diperoleh, hanya membutuhkan sekitar 1 jam data robot.
CEO Pete Florence menunjuk, hal yang terjadi sekarang di bidang robotika, sangat mirip dengan ketika orang membuka GPT-3 dan memintanya menulis limerick baru.
Pengamatan serupa, juga pernah diverifikasi oleh tim Qx. "Tim kami juga menemukan Scaling Law di bidang embodied intelligence, setiap data bertambah 10 kali, hasilnya akan lebih satu 9." Gao Yang pernah menggambarkan kecuraman kurva ini. Kita sedang berada di momen Scaling Law embodied intelligence, karena data robot lebih sulit didapat, jadi saya rasa GPT-4 untuk robot butuh lebih lama, mungkin 4-5 tahun.
Bisa dikatakan, modal menambah investasi, adalah jalur teknis yang sudah diverifikasi awal, sekaligus memiliki potensi skalabilitas dan rasio harga-kinerja yang lebih tinggi.
Mesin data, kunci berdirinya jalur
Di bidang embodied intelligence, hampir semua orang memiliki konsensus: pengumpulan data adalah hambatan mendasar.
Model besar bisa menghabiskan sejumlah besar korpus internet, tetapi robot tidak bisa – di dunia kerja fisik, tidak ada Wikipedia. Secara permukaan, semua orang bersaing model, tetapi persaingan yang lebih mendasar sebenarnya adalah mesin data. "Untuk mencapai skalabilitas, kami akan melakukan segalanya." Pete Florence blak-blakan.
Karena percaya Scaling Law, maka sistem data seperti apa, yang bisa diperoleh dengan biaya rendah,又能持续扩张,还具备足够多样性?
Sebelumnya model umum robot dengan tingkat keberhasilan超过 90% bergantung pada kumpulan data operasi jarak jauh skala besar yang sangat mahal dan sulit diperluas (seperti Physical Intelligence). Tetapi Generallist AI mengembangkan 'tangan data' (data hands) – perangkat yang dikenakan di pergelangan tangan dengan dua jari, mengubah tangan manusia menjadi seperti夹具 robot, sehingga mengumpulkan data visual dan sensorik.
Hasilnya, kemajuan GEN-0, GEN-1 memverifikasi mesin data ini juga bisa mencapai penguasaan tingkat tinggi – mereka tidak menggunakan data robot, hanya menggunakan data yang dihasilkan dari jutaan aktivitas manusia dengan perangkat yang dapat dikenakan biaya rendah.
QxSmart, juga mempromosikan rute Scaling yang berpusat pada keberagaman.
Dalam solusi perangkat keras, Qx juga memilih solusi yang dapat dikenakan, tetapi melangkah lebih jauh. Agar model belajar operasi halus tingkat manusia, mereka mengadopsi desain struktur tiga jari – mesin cerdas dilengkapi dengan 26 derajat kebebasan, setiap sendi mengintegrasikan sensor gaya, dilengkapi dengan tangan lincah tiga jari. Tetapi tantangan teknis juga meningkat signifikan. Struktur tiga jari dalam pengumpulan data yang dapat dikenakan menghadapi derajat kebebasan yang lebih tinggi, persyaratan kontrol gaya yang lebih halus, dan pemetaan tindakan yang lebih kompleks.
Saat ini, perangkat yang dapat dikenakan Qx sudah beriterasi ke generasi kelima, kegunaan data meningkat dari 30% menjadi 95%, sementara biaya ditekan menjadi sekitar sepersepuluh dari teleoperasi.
Perlu diperhatikan, berbeda dengan Generallist AI yang sepenuhnya mengandalkan data yang dapat dikenakan, Qx membangun mesin data fusi multi-sumber.
Pada tahap pra-pelatihan, selain sejumlah besar data yang dapat dikenakan, QxSmart juga aktif menggabungkan video internet untuk pra-pelatihan, untuk mendapatkan pengetahuan umum dan kemampuan dasar. Kemudian, memperkenalkan data teleoperasi mesin nyata, untuk SFT (supervised fine-tuning) halus, meningkatkan kinerja model dalam tugas nyata. Akhirnya, mengoptimalkan lebih lanjut melalui pembelajaran penguatan: membiarkan model terus roll-out di lingkungan nyata, terus menghasilkan data baru, memberi makan balik model.
Sampai saat ini, Qx sudah mendapatkan lebih dari 200.000 jam data interaksi nyata, sumbernya mencakup video internet, teleoperasi, pengumpulan yang dapat dikenakan, dan lainnya, dan angka ini masih tumbuh cepat, diperkirakan tahun 2026 akan突破 1 juta jam. Per April 2026, tim pengumpulan data QxSmart juga akan mencapai skala seribu orang.
Patut disebutkan, pemahaman Qx tentang data, juga mengalami perubahan mendasar.
Mereka tidak lagi berpegang pada data skrip yang diukir halus yang主流 industri, tetapi beralih ke paradigma pengumpulan beragam yang lebih terbuka: tidak lagi secara ketat menentukan jalur tindakan, tetapi berpusat pada tujuan tugas, membiarkan proses eksekusi terbuka secara alami: mengizinkan kegagalan, mengizinkan menumpahkan, mengizinkan interupsi, lalu melanjutkan penyelesaian.
Ini membawa perubahan mendasar, model belajar bukan lagi bagaimana melakukan hal ini, tetapi bagaimana menangani ketika menghadapi situasi serupa. Dalam skala data yang sama, distribusi data ini secara signifikan meningkatkan efisiensi transfer model, sekaligus mengurangi ketergantungan pada komputasi.
"Bertelur di sepanjang jalan", data skenario nyata, memberi makan balik model
Dalam mesin data Qx, yang benar-benar menentukan apakah roda terbang bisa berputar, bukan hanya sumber data, tetapi kemampuan roll-out berkelanjutan di lingkungan nyata.
Han Fengtao pernah menyimpulkan, menuju skenario nyata, adalah untuk mendapatkan bahan bakar evolusi model (data). Komersialisasi, adalah membuat proses perolehan ini berkelanjutan, dapat diskalakan.
Di balik ini, sebenarnya juga sesuai dengan diferensiasi jalur China-AS yang jelas. Di AS, beberapa perusahaan bisa lama berinvestasi di sekitar model dasar本身, menggunakan waktu untuk menukar batas kemampuan; tetapi di China, tanpa demo, tanpa sinyal落地, sulit mendapatkan pendanaan berkelanjutan. Sebagian besar perusahaan yang bisa bertahan, bahkan cukup baik, banyak memilih jalur yang lebih折中.
Menuju AI umum, adalah jalan yang panjang dan penuh salju, tidak mungkin menunggu model matang baru mencari aplikasi. Hanya dengan membiarkan robot masuk ke lingkungan produksi nyata, berpartisipasi dalam operasi bisnis nyata,才能利用海量数据 yang dihasilkan operasi bisnis nyata, memberi makan balik model, terus berevolusi.
Sebagai perusahaan embodied intelligence pertama di China yang mendorong rute pengumpulan data beragam dari teori ke rekayasa, skalabilitas, dan menyelesaikan verifikasi ganda dalam skenario komersial nyata, robot Qx berpegang pada "bertelur di sepanjang jalan". Mereka masuk dari skenario yang dapat dikendalikan, memprioritaskan masuk ke industri dan layanan这两类 yang strukturnya relatif stabil, batas tugas jelas, profit tinggi juga bersedia membayar, memverifikasi kemampuan model sekaligus mendukung operasi perusahaan.
Misalnya, dalam skenario ritel, kerja sama Qx dengan JD.com (juga investor) sedang mendalam. "Xiao Mo"已进入京东 MALL, bertugas sebagai barista. Dalam menyelesaikan tugas layanan, robot juga akan secara sinkron mengumpulkan data persepsi multimodal,轨迹运动 sendi, serta informasi umpan balik gaya halus.
Data 'tingkat ahli' dari lingkungan ritel nyata ini, akan langsung digunakan untuk pelatihan dan penyesuaian halus model embodied, membentuk闭环 positif "pengumpulan data – iterasi model – peningkatan kemampuan".
Robot QxSmart telah resmi bertugas di京东MALL, menjadi barista.
Kedua pihak juga berencana memperluas embodied intelligence lebih lanjut ke lebih banyak bidang ritel, termasuk pemanduan produk digital dan peralatan rumah tangga, pembersihan otomatis inspeksi dan panduan. Pada saat yang sama, apotek JD juga被视为 inti突破口, robot akan berpartisipasi dalam tugas presisi tinggi seperti penyortiran otomatis, pencampuran obat yang tepat, mengeksplorasi solusi apotek pintar tanpa orang.
Sebelum masuk京东 Mall, Qx sudah menyelesaikan一轮 verifikasi di lingkungan industri. "Xiao Mo"已走上 jalur produksi paket baterai宁德时代,承担 pengujian fungsi akhir sebelum turun jalur. Sampai saat ini,已 menyelesaikan lebih dari 1000 penyisipan baterai, tingkat keberhasilan stabil di atas 99%,节拍作业也 mendekati tingkat pekerja terampil.
"Xiao Mo" sudah berjalan di jalur produksi paket baterai
Embodied intelligence, dalam jangka pendek还不会迎来落地即分胜负的时刻. Tetapi tren yang lebih jelas sudah muncul – persaingan, tidak lagi hanya siapa yang datanya lebih banyak, tetapi beralih ke siapa yang bisa mendapatkan data skenario nyata lebih efisien, serta siapa yang bisa membangun闭环飞轮 data-model yang berputar lebih frekuensi tinggi.
Setelah menyelesaikan lompatan valuasi tahapan, QxSmart di satu sisi akan menginvestasikan kemampuan generalisasi model, di sisi lain terus memperbesar keunggulan skala data, menggunakan umpan balik frekuensi tinggi dunia nyata, mempercepat iterasi model.
Melihat kembali GPT-2 tahun 2019, mungkin tidak layak disebut, tetapi dengan skalabilitas yang terus diperluas, imbalan dari kemampuan generalisasi dengan cepat放大. Sekarang, titik balik yang sama, sedang terulang di bidang robotika.
Artikel ini来自微信公众号“机器之心”(ID:almosthuman2014), penulis: Sia











