Tahun 2026, perangkat keras AI yang berada pada periode kunci lompatan industri, telah mengucapkan selamat tinggal pada fase penumpukan konsep yang tersebar.
Seri Standar Nasional Klasifikasi Kecerdasan Terminal Kecerdasan Buatan yang dirilis bersama oleh Kementerian Perindustrian dan Teknologi Informasi, Kementerian Perdagangan, dan Administrasi Pengawasan Pasar, telah menetapkan skala yang jelas untuk jalur yang bergairah ini, membagi kecerdasan terminal menjadi empat tingkatan dari L1 hingga L4, meningkat bertahap dari tingkat respons hingga tingkat kolaboratif.
Sistem standar ini memperjelas lima elemen kemampuan: persepsi, kognisi, eksekusi, memori, dan pembelajaran, mencakup tujuh kategori produk: ponsel, komputer, TV, kacamata, kabin mobil, speaker, dan headphone. Ini pada dasarnya menguraikan bentuk perangkat keras AI pertama yang diharapkan dapat diadopsi secara luas, dan memberikan metode pengujian spesifik.
Bagi konsumen, mulai sekarang, seberapa pintar sebuah perangkat tidak perlu lagi dipahami dengan susah payah melalui logika teknis, atau mendengarkan klaim sepihak dari produsen.
Hampir bersamaan dengan rilis standar tersebut, pada Konferensi Puncak Alibaba Cloud yang diadakan pada 20 Mei, Alibaba Cloud menunjukkan berbagai hasil implementasi perangkat keras AI, sekaligus mengumumkan peluncuran bersama dengan Tmall "Rencana Kerjasama Perangkat Keras Cerdas Qianwen X Tmall". Rencana ini mencakup hak eksklusif model Qianwen, dukungan traffic miliaran level dari Tmall, serta sumber daya eksposur merek di seluruh domain. Kedua belah pihak akan berinvestasi bersama lebih dari 1 miliar sumber daya untuk membantu produsen perangkat keras menyelesaikan lompatan nilai dari tiga dimensi: teknologi, merek, dan saluran penjualan, mempercepat ledakan spesies baru perangkat keras AI.
Promosi besar Tmall 618 akan segera dimulai, berbagai perangkat keras AI yang dilengkapi kemampuan Qianwen akan tampil di Tmall. Kedua platform akan menyediakan sumber daya traffic dan eksposur merek secara bersama-sama, mendorong percepatan komersialisasi perangkat keras AI. Negara telah membangun piramida untuk perangkat keras AI, sementara penyedia cloud menyediakan fondasi kemampuan yang dibutuhkan untuk menaikinya.
Perubahan yang terjadi dengan cepat ini menunjuk pada tren yang sama:
Perangkat keras AI sedang bergerak dari proof-of-concept sisi perangkat, menuju adopsi luas dengan kolaborasi perangkat-cloud, dan pelepasan kemampuan layanan cloud AI tepat menginjak pada titik balik ini.
01. Siapa yang Berhenti di L1, Siapa yang Melaju ke L4?
Dari L1 ke L4, setiap peningkatan level sesuai dengan peningkatan ambang batas kemampuan.
Perangkat L1 hanya dapat menjalankan instruksi yang telah ditetapkan, pada dasarnya merupakan versi pintar dari peralatan listrik tradisional; L2 mulai memiliki atribut alat, pengguna dapat secara aktif memanggil fungsi tertentu.
Wakil Presiden Institut Standardisasi Teknologi Elektronik Tiongkok, Yu Xiuming, dalam penjelasan standar, menunjukkan bahwa berdasarkan penelitian dan analisis pengujian, produk dengan tingkat kepemilikan pengguna yang tinggi saat ini umumnya berada di level L1 dan L2, beberapa produk baru dapat mencapai level L3.
Secara keseluruhan, terminal AI sedang berkembang sejalan dengan tiga jalur: peningkatan terminal tradisional, perluasan kuantitas terminal baru, dan eksplorasi terminal masa depan.
Batas pemisah yang sebenarnya ada di L3 Tingkat Bantuan. Inti dari L3 adalah terminal dapat sepenuhnya memahami instruksi dan maksud pengguna, serta memiliki kemampuan untuk secara aktif mengidentifikasi dan menyediakan layanan.
Mengambil AC pintar sebagai contoh, perangkat level L3 dapat secara otomatis mengenali apakah keringat muncul di dahi pengguna, lalu secara aktif menurunkan suhu; setelah pengguna menekan mode 'keluar rumah', kamera akan menilai terlebih dahulu apakah masih ada orang di rumah, baru kemudian mematikan lampu setelah orang tersebut memakai sepatu dan pergi. Tindakan ini memerlukan input audio, video, sensor yang beragam, serta pengenalan dan penilaian maksud yang kompleks. Standar mengharuskan perangkat memiliki kemampuan pemahaman maksud kompleks, penalaran berantai, dan memori jangka panjang, yang berarti perangkat tidak hanya menjawab 'apa', tetapi juga memahami 'mengapa', bahkan memprediksi 'apa yang harus dilakukan selanjutnya'.
Beberapa produsen perangkat keras dalam beberapa tahun terakhir tertinggal di level L1, menunjukkan beberapa karakteristik khas.
Satu adalah definisi produk yang terlalu tertutup, hanya menyelesaikan fungsi tunggal, tidak menyisakan sensor atau redundansi komputasi untuk peningkatan selanjutnya; yang lain adalah ketergantungan berlebihan pada model ringan di sisi perangkat, menyebabkan kemampuan terputus dalam skenario kompleks.
Ada juga jenis yang lebih tersembunyi: mengemas fungsi L1 sebagai gimmick L2 atau L3. Produk semacam ini akan cepat terungkap dalam pengujian standar, dan konsumen akan 'memilih dengan kaki mereka'.
Mengenai hal ini, penilaian Chen Liwei, Wakil Manajer Umum Departemen Arsitektur Solusi dari Grup Bisnis Alibaba Cloud Intelligent, adalah bahwa seluruh industri perangkat keras sedang berada pada tahap transisi dari L2 ke L3. Siapa yang dapat membangun infrastruktur dasar L3 terlebih dahulu, mewujudkan pengalaman produk level L3, dialah yang akan merebut ruang pasar yang lebih besar.
Berhenti di L1, bahkan L2, bukan lagi zona aman. Dan untuk memasuki tahap L3 dengan mulus, yang dibutuhkan adalah kerja sama antara persepsi multimodal dan penalaran generalisasi.
Konferensi Puncak Alibaba Cloud kali ini juga secara penting merilis model unggulan Qianwen Qwen3.7-Max. Dalam peringkat global blind test model besar oleh lembaga pihak ketiga Arena, Qwen3.7-Max menempati posisi pertama di antara model domestik Tiongkok, setara dengan model terkuat global.
Tujuan desain Qwen3.7-Max sebenarnya adalah membuat model menjadi inti dari Agen, memiliki kemampuan perencanaan mandiri, iterasi berkelanjutan, dan kolaborasi lintas perangkat. Peningkatan teknologi ini tepat sesuai dengan persyaratan elemen persepsi dan kognisi untuk level L3. Saat ini, kit pengembangan interaksi multimodal yang disediakan Alibaba Cloud untuk industri perangkat keras cerdas telah sepenuhnya mendukung koneksi ke Qwen3.7-Max.
Semakin kuat kemampuan generalisasi di cloud, semakin rendah biaya adaptasi L3 untuk perangkat keras. Chen Liwei juga menekankan: "Hari ini, tidak ada satu pun produk perangkat keras yang dapat mencapai pengalaman pengguna closed-loop dari ujung ke ujung melalui model tunggal. Solusinya pasti adalah kombinasi multi-model."
02. Kolaborasi Perangkat-Cloud, Menjadi Pilihan Wajib
Setelah L3 Tingkat Bantuan, L4 Tingkat Kolaboratif akan menjadi lompatan yang lebih besar.
Dari definisi yang ada, fitur inti L4 tidak berfokus pada apakah satu perangkat lebih pintar, tetapi pada beberapa perangkat membentuk sistem cerdas. Ketika pengguna memasuki rumah, kacamata, speaker, robot, dan kabin akan secara otomatis berbagi memori, lalu melayani pengguna di dunia fisik.
Oleh karena itu, tantangan terbesar yang dihadapi produsen perangkat keras di masa depan untuk menerapkan teknologi dan produk dengan mulus di L4 adalah integrasi sistem dan kolaborasi perangkat.
Dalam tabel klasifikasi standar, dari terminal bergerak hingga kacamata dan headphone, sebagian besar produk diberi label kolaborasi perangkat-cloud. Logika di baliknya langsung: respons real-time bergantung pada sisi perangkat, penalaran kompleks bergantung pada cloud, ini adalah solusi optimal kecerdasan saat ini.
Robot rumah tangga "Bajie" dari Ecovacs adalah contoh tipikal. Berdasarkan pertimbangan kemampuan iterasi berkelanjutan terhadap model open-source, Ecovacs memilih untuk terhubung dengan model besar Qianwen sejak dini.
Tantangan inti robot rumah tangga berasal dari lingkungan rumah yang tidak standar, dengan tingkat keamanan yang tinggi, kepadatan informasi yang besar, dan kebutuhan yang sangat panjang. Salah satu solusi robot "Bajie" Ecovacs adalah mengemas kemampuan atomik robot (mengambil, meletakkan, persepsi, perencanaan) menjadi antarmuka API yang mudah dipahami model, sementara cloud menangani tugas kompleks seperti persepsi lingkungan dan pemecahan tindakan berdasarkan Qwen3.6-Plus.
Saat pengguna memberikan instruksi kabur seperti "rapikan ruang tamu", pertama-tama dapat dipahami di cloud apa yang termasuk dalam ruang tamu, apa standar perapian, kemudian dipecah menjadi serangkaian instruksi tindakan dan dikirim ke lengan robot. Di balik serangkaian pemahaman ini, pemrograman awal tidak diperlukan, agen cerdas di "Bajie" secara aktif merangkai tugas.
Saat ini, Ecovacs juga telah membuka sistem "Bajie", kemampuan atomik, dan platform simulasi, memungkinkan lebih banyak mitra ekosistem untuk dengan mudah berpartisipasi dalam pengembangan algoritma dan implementasi aplikasi robot rumah melalui "Bajie".
Produk seri Shen Mou dari perusahaan Hangzhou Yanjiwei juga membuktikan perlunya kolaborasi perangkat-cloud. Sebagai perusahaan yang berfokus pada pencitraan cerdas berdaya rendah, inti produk Yanjiwei adalah mengoptimalkan masalah daya dan komunikasi jaringan kamera, sehingga dapat beroperasi tanpa jaringan dan listrik. Tantangan dari daya rendah adalah bahwa daya komputasi chip di sisi perangkat terbatas, tidak dapat menanggung beban inferensi model skala besar.
Solusi mereka adalah: pelabelan real-time dan pemrosesan awal dilakukan di sisi perangkat, mengidentifikasi melalui chip AI di sisi perangkat bahwa ada orang, mobil, kendaraan non-motor dalam gambar, kemudian mengunggah informasi gambar teks ke cloud melalui beacon 4G berdaya rendah; cloud kemudian melakukan pemahaman mendalam dan penyimpanan memori terstruktur berdasarkan model besar Qianwen, memungkinkan pengguna bertanya kepada kamera seperti mencari album foto, misalnya "kucing warna apa yang muncul di depan pintu kemarin sore". Pengalaman seperti ini hampir tidak mungkin diwujudkan dengan solusi murni di sisi perangkat.
Berdasarkan arsitektur ini, tingkat konversi berbayar perusahaan ini meningkat 25%, rata-rata harga per pelanggan meningkat 30%, dan tingkat retensi berkelanjutan pengguna berbayar mencapai lebih dari 75%. Kemampuan AI langsung dikonversi menjadi daya saing komersial.
Model pembagian kerja kolaborasi perangkat-cloud sedang menjadi konsensus industri, dan peran penyedia cloud juga mengalami perubahan besar.
Dulu, penyedia cloud hanya menyediakan sumber daya cloud seperti daya komputasi dan penyimpanan, sekarang berubah menjadi penyedia infrastruktur dasar kolaborasi perangkat-cloud yang berpusat pada Agen, mengemas kemampuan seperti pemahaman visual, perencanaan tugas, bahkan kemampuan pembuatan kode front-end menjadi layanan yang dapat dipanggil. Dari menyediakan platform, menyediakan model, hingga menyediakan Agentic Coding, mengurangi hambatan bagi produsen perangkat keras untuk menyematkan kemampuan AI ke dalam sistem yang ada dari lapisan pengembangan.
Chen Liwei juga merangkum empat tantangan inti Alibaba Cloud saat ini: kombinasi model, kompleksitas rekayasa, kemampuan operasi berkelanjutan, dan loop data.
Berbicara tentang kombinasi model dan rekayasa, perlu disebutkan model multimodal lengkap generasi baru Qwen3.5-Omni yang dirilis sebelumnya.
Qwen3.5-Omni mencapai SOTA dalam 215 tugas seperti pemahaman, pengenalan, dan interaksi audio-video, secara signifikan meningkatkan pengalaman interaksi real-time, memiliki "kecerdasan emosional tinggi". Yang lebih mengejutkan, Qwen3.5-Omni menunjukkan kemampuan Vibe Coding audio-video, pengguna dapat menguraikan kebutuhan di depan kamera, dan model secara mandiri dapat menghasilkan kode untuk produk kompleks seperti APP, halaman web, game. Kemampuan multimodal lengkap real-time ini menyediakan dasar teknis kunci bagi perangkat keras AI untuk bergerak dari L1, L2 menuju L3, L4.
Sementara model multimodal lengkap terus matang, produsen perangkat keras juga mengeksplorasi jalur implementasi yang berbeda.
Misalnya, Robosen, sebagai perusahaan yang berfokus pada robot humanoid untuk konsumen, sedang mencoba kolaborasi perangkat-cloud yang menarik. Pengguna dapat, melalui jaringan area lokal rumah, menggunakan komputer atau agen cerdas lokal mereka sendiri untuk sepenuhnya mengambil alih sistem AI robot, sehingga robot memiliki kemampuan kustomisasi seperti kontrol perangkat rumah pintar, percakapan dalam dialek, topik personalisasi.
Guangfan Technology, yang baru saja meluncurkan headphone AI pertama di dunia dengan kemampuan persepsi visual, mengamati bahwa perubahan terbesar dalam industri perangkat keras AI selama setahun terakhir adalah "cepat", kecepatan iterasi perangkat lunak dan keras menakjubkan, AI berkembang dari sekadar obrolan menjadi agen cerdas dan kemampuan belajar mandiri, hal-hal yang dapat dilakukan meningkat drastis setiap hari. Praktik Guangfan adalah membangun sistem operasi asli AI dengan cakupan lebih luas dari OpenClaw, mencakup interaksi multimodal, penjadwalan perangkat keras, penjadwalan perangkat lunak, dan penjadwalan daya komputasi.
Eksplorasi para "pemain unggulan" membuktikan bahwa kolaborasi perangkat-cloud adalah tema jangka panjang yang "sulit namun benar". Kecerdasan cloud berkembang dengan cepat, sementara kemampuan eksekusi dan penjadwalan perangkat keras di sisi perangkat tetap menjadi variabel kunci yang menentukan tahap kecerdasan perangkat keras AI.
03. Di Mana Batas Kolaborasi, Di Sanalah Pasar Berada
Selain panduan teknis, makna standar klasifikasi juga adalah pelepasan sinyal di tingkat komersialisasi.
Konsumen dapat menilai produk berdasarkan L1 hingga L4, dan sebagai dorongan, produsen perangkat keras juga akan memiliki peta jalan peningkatan yang jelas.
Terutama bagi perusahaan rintisan, mengembangkan model multimodal dan kerangka kerja inferensi sendiri tidak realistis. Lebih banyak produsen membutuhkan fondasi AI yang terstandarisasi dan jalur imbal hasil komersial yang jelas.
Imajinasi komersial layanan perangkat keras AI dapat dilacak dari tingginya retensi pengguna pada Dr. Luka AI Learning Camera. Data publik Dr. Luka menunjukkan, durasi penggunaan harian pengguna awal hanya 30 menit lebih; setelah terhubung ke Qwen3.6-Plus, durasi harian meningkat 50%, setiap bulan sekitar 50 juta foto yang diambil pengguna berinteraksi dengan AI. Kemampuan pengenalan objek dan OCR yang lebih akurat membawa pengenalan gambar yang lebih sering, peningkatan penalaran generalisasi membawa peningkatan putaran tanya jawab. Kemajuan yang dapat diukur pada fondasi AI langsung tercermin sebagai perubahan kualitatif pada retensi pengguna.
Setelah pengguna menghasilkan ratusan interaksi sehari pada perangkat keras dan mengakumulasi banyak data minat pribadi, kebutuhan alami pun muncul: bagaimana memori dan preferensi ini dapat ditautkan ke perangkat lain? Misalnya, melanjutkan pembuatan tugas belajar berdasarkan data di perangkat sekolah.
Setelah tingkat kecerdasan perangkat tunggal mencapai ketinggian tertentu, imajinasi pasar yang sebenarnya akan datang pada kecerdasan sistem di bawah simbiosis skenario penuh.
Tingkat L4 Kolaboratif yang disebutkan dalam standar, fitur intinya adalah kolaborasi lintas perangkat dan memori preferensi pengguna. Satu ponsel, sepasang kacamata, satu kabin, satu speaker, membentuk jaringan cerdas di sekitar pengguna.
Anda mengenakan kacamata dan masuk ke dalam mobil, kabin secara otomatis beralih ke preferensi mengemudi Anda; Anda berbicara satu kalimat ke speaker, robot mulai merapikan ruang tamu. Pengalaman yang konsisten membutuhkan semua perangkat berbagi fondasi kecerdasan cloud yang sama, juga membutuhkan penyedia cloud menyediakan sistem identitas, memori, dan penjadwalan eksekusi yang terpadu.
Simbiosis skenario penuh akan langsung mengubah logika komersialisasi perangkat keras AI.
Dulu membuat perangkat keras, sebagian besar menghasilkan uang dari rantai pasokan, setiap kali satu unit terjual, satu transaksi selesai. Sekarang, penambahan AI membuka imajinasi baru, di masa depan juga dapat menghasilkan layanan premium berkelanjutan melalui cara berlangganan.
Dalam skenario kolaboratif, pengguna lebih bersedia membayar untuk pengalaman berkelanjutan lintas perangkat, seperti berlangganan layanan asisten pribadi, membeli paket keterampilan yang bersifat skenario. Dengan demikian, distribusi nilai seluruh jalur juga akan diacak ulang.
Mengambil contoh yang sudah ada, kacamata Rokid setelah terhubung ke produk OpenClaw versi Alibaba, JVS Claw, di sisi perangkat, para profesional dapat menyelesaikan operasi seperti membuat kalender, membalas WeChat, pembayaran dengan efisien. Jika perilaku frekuensi tinggi ini dapat lebih jauh diintegrasikan dan diendapkan menjadi skenario yang meningkatkan efisiensi kerja, maka dapat diperluas menjadi layanan berlangganan asisten kehidupan.
Selama promosi besar 618, Tmall juga meluncurkan puluhan merek host yang dilengkapi JVS Claw, sepenuhnya terintegrasi dengan asisten cerdas, menyambut era PC Agen.
Perangkat keras menjadi pintu masuk layanan, bukan titik akhir.
Gelombang rekonstruksi pasar akan mengalir ke produk yang dapat memasuki jaringan cerdas ini, secara bertahap meninggalkan perangkat level L1 yang terisolasi seperti pulau.
Standar klasifikasi memberikan panduan akhir industri, kolaborasi perangkat-cloud menyediakan jalur yang pasti, dan kemampuan terstandarisasi penyedia cloud juga sedang membuat jalan ini menjadi lebih lebar dan lebih rata.








