Старый соперник Unitree, компания Zhi Yuan, снова выделила дочернюю компанию.
После того как компания Miffeng Technology объявила о завершении стратегического раунда финансирования серии «Angel+» на сумму в несколько сотен миллионов юаней, эта компания, основанная по инициативе Zhi Yuan и занимающаяся данными, снова вышла на передний план. После компании по производству ловких рук Línjiè Diǎn, Zhi Yuan снова выделила отдельное направление, превратив ещё одну ключевую компетенцию в независимую компанию и встав на путь независимого финансирования и операционной деятельности.
Упомянув Zhi Yuan, многие автоматически считают её главным конкурентом Unitree.
Ведь только в 2025 году фактический объём поставок гуманоидных роботов Unitree превысил 5500 единиц, что позволило компании заявить о первом месте в мире по объёмам поставок; в марте этого года Zhi Yuan объявила о выпуске своего 10-тысячного универсального воплощённого интеллектуального робота.
От масштабов производства до коммерческого внедрения их постоянно сравнивают друг с другом.
И на этот раз, как один из самых прямых конкурентов Unitree, Zhi Yuan снова расширила свои конкурентные возможности за пределы самого робота.
Потому что выделенная Zhi Yuan компания Miffeng Technology занимается именно одним из самых горячих направлений в сфере воплощённого интеллекта: сбор, обработка и оборот данных. Заявленная ею цель также весьма амбициозна: к 2026 году достичь производственных мощностей по данным в объёме десятков миллионов часов.
Базовые модели, вычислительные мощности, оборудование — эти термины, тесно связанные с воплощённым интеллектом, мы слышим часто. Но многие, возможно, не осознают, что важность «данных» в индустрии воплощённого интеллекта стремительно растёт.
Даже соучредитель Zhi Yuan, президент и технический директор Пэн Чжихуэй ранее прямо заявил, что Zhi Yuan испытывает недостаток не в деньгах, а скорее в данных.
За недостатком данных у Zhi Yuan стоит целая индустрия воплощённого интеллекта, переживающая «голод на данные», который большинство ещё не видит, но который является чрезвычайно острым.
Нечто более важное, чем вычислительные мощности, начинает проявляться
В эпоху воплощённого интеллекта важность данных приближается к важности вычислительных мощностей в эпоху больших моделей.
Большие модели в основном обучаются на интернет-мире, тогда как роботы должны обучаться на физическом мире. Первые могут получать обучающий материал из веб-страниц, книг и научных статей, вторые должны поднимать чашки, открывать двери, складывать одежду, чтобы понимать действия и обратную связь в реальной среде.
Помимо визуальной информации, роботам необходима также мультимодальная информация, включая тактильные ощущения, силовые ощущения, траектории движения и т.д. Для высококачественных данных от реального оборудования каждая запись данных часто соответствует реальному физическому взаимодействию.
По оценкам Miffeng, представленным на презентации, для обучения системы уровня GPT-5 требуется материал объёмом в десятки миллиардов часов, в то время как во всём мире доступно лишь около 500 000 часов высококачественных эффективных данных, пригодных для обучения воплощённого интеллекта.
С другой стороны, в «Отчёте об индексе ИИ на 2026 год», опубликованном Институтом человеко-ориентированного ИИ (HAI) Стэнфордского университета, приводятся два контрастных результата: максимальный уровень успеха роботов в симуляции операций на бенчмарке RLBench достиг 89,4%; в симуляции на бенчмарке BEHAVIOR-1K, который ориентирован на реальные домашние потребности и имеет более сложные цепочки задач, максимальный уровень успешного выполнения полных задач составил лишь 12,4%.
Хотя эти результаты получены на разных бенчмарках, они, по крайней мере, показывают, что роботы быстро прогрессируют в коротких, контролируемых задачах, но их возможности всё ещё явно недостаточны для выполнения сложных домашних задач.
Недостаток высококачественных, разнообразных обучающих данных является одной из важных причин этого.
Другими словами, у нынешних роботов слабые места в возможностях во многом связаны с тем, что они видели слишком мало реального мира.
Поэтому быстро набирает обороты новая индустрия сбора данных для воплощённого интеллекта.
В настоящее время наиболее распространённым методом является телеоперация на реальном оборудовании, когда человек дистанционно управляет роботом для выполнения задач, а затем записывает визуальную информацию, действия и состояние во время выполнения. Качество данных относительно высокое, но и стоимость тоже немалая.
Как ранее пояснил генеральный директор Miffeng Яо Маоцин, в Китае цена одного часа данных с реального оборудования обычно составляет от 500 до 1000 юаней, при этом требуются совместные усилия самого робота, оператора и сценария, что ограничивает скорость расширения.
Другой путь — синтетические (симулированные) данные. Компании используют цифровых двойников и физические движки, чтобы заставить роботов выполнять множество обучающих задач в виртуальной среде, что может снизить затраты на сбор. Однако навыки, полученные роботами в виртуальном мире, всё ещё могут не полностью переноситься в реальный мир, что является давней проблемой, известной как «пропасть Sim-to-Real».
После сбора данных возникают ещё более фундаментальные проблемы.
Разные компании используют разные роботизированные платформы, сенсоры и форматы данных; одно и то же действие захвата может быть записано в совершенно разных структурах данных. Большое количество сырых данных также должно пройти процесс очистки, разметки и структурирования, прежде чем они смогут быть использованы для обучения моделей.
Поэтому многие компании всё ещё находятся на этапе «самосбора, самостоятельного использования и самообучения», а данные разбросаны по разным компаниям и платформам.
По мере роста важности данных конкуренция начинает смещаться от самих роботов к инфраструктуре, такой как сбор, обработка и оборот данных.
Но сколько именно данных не хватает отрасли, пока нет единого мнения. Можно с уверенностью сказать, что если полагаться только на самостоятельный сбор и использование данных одной компанией, трудно охватить сложные сценарии, с которыми сталкиваются универсальные роботы.
Тот, кто первым создаст стандартизированную и масштабируемую сеть поставок данных, получит больше шансов стать «продавцом лопат» в этом раунде расширения индустрии.
Именно на эту возможность нацелилась компания Miffeng Technology.
Создание платформы из данных
Конечно, сбор данных очень важен, но Miffeng Technology хочет большего.
В настоящее время сбор высококачественных данных в отрасли по-прежнему в значительной степени зависит от самого роботизированного оборудования. Компании должны покупать роботов, развёртывать сценарии, организовывать операторов, а затем выполнять сбор через телеоперацию, причём сам робот является одним из самых дорогих компонентов.
Miffeng сохранила решение на основе реального оборудования и одновременно представила продукты для сбора данных без оборудования серии MEgo, включая головное устройство сбора данных MEgo View и сборный захват MEgo Gripper.
После того как оператор надевает или берёт в руки устройство, он может записывать процесс работы в реальных сценариях, таких как супермаркеты, фабрики или дома, без необходимости участия робота на протяжении всего процесса сбора.
По сравнению с телеоперацией на реальном оборудовании, сбор данных без оборудования легче снижает затраты и расширяет масштабы. Согласно планам, раскрытым Miffeng, 60–70% её производственных мощностей по данным к 2026 году будут приходиться на сбор данных без оборудования.
Однако сбор данных — это только первый шаг, способность данных после обработки попасть на этап обучения во многом определяет их конечную ценность.
Сырые данные часто содержат шум и неэффективный контент, они должны пройти процессы синхронизации времени, восстановления траекторий, разметки, проверки качества и т.д. Даже если компания владеет большим объёмом сырых данных, она не обязательно сможет напрямую преобразовать их в эффективный обучающий набор.
Поэтому Miffeng уделяет много внимания обработке данных.
Её собственный движок обработки данных MEgo Engine охватывает такие процессы, как очистка данных, 6D-восстановление траекторий, восстановление пространственного восприятия, проверка качества, интеллектуальная оценка и автоматическая разметка. По словам представителей Miffeng, эффективность её автоматической разметки может быть более чем в 10 раз выше по сравнению с традиционными методами, цель — ускорить попадание собранных данных на этап обучения.
Помимо продажи данных, Miffeng также надеется предоставить возможность обработки сырых данных в обучающие наборы.
На более высоком уровне Miffeng также создала торговую площадку данных, надеясь стандартизировать и инкапсулировать разрозненные ресурсы данных и открыть их поставку для всей отрасли.
Такая концепция отчасти похожа на ранние облачные вычисления: облачные провайдеры превратили вычислительные мощности в услугу по требованию, а Miffeng надеется превратить данные в базовый ресурс, который можно продавать и использовать повторно.
Согласно планам компании, Miffeng достигнет производственных мощностей по данным в десятки миллионов часов к 2026 году и, объединившись с облачными провайдерами, владельцами сценариев и отраслевыми организациями через «Инициативу совместного создания данных "Пчелиный улей"», к 2030 году будет стремиться к объёму данных в десятки миллиардов часов.
На данный момент это всё ещё планы по производственным мощностям, смогут ли они быть реализованы в срок, зависит от серийного производства оборудования, сети сбора и реальных заказов.
Но даже в этом случае капитал уже готов платить за эту концепцию.
В феврале этого года Miffeng Technology завершила раунды финансирования Seed и Angel на сумму в несколько сотен миллионов юаней, которые возглавила Sequoia Capital China;
В июне она завершила стратегический раунд финансирования серии «Angel+» на сумму в несколько сотен миллионов юаней, который возглавила Guofang Venture Capital, при участии нескольких индустриальных и государственных институтов;
Такие компании, как Alibaba Cloud, Baidu Cloud и JD Cloud, также достигли стратегического сотрудничества с Miffeng в области экосистемы данных, синергии сценариев и поддержки вычислительных мощностей.
Таким образом, две компании, выделенные из Zhi Yuan — Línjiè Diǎn и Miffeng — также определились со своими направлениями деятельности:
Línjiè Diǎn нацелена на аппаратный компонент — ловкие руки, а Miffeng нацелена на направление данных в сфере воплощённого интеллекта.
Однако независимое финансирование и операционная деятельность предоставили Miffeng пространство для внешнего обслуживания, но автоматически не решили проблему доверия со стороны конкурентов.
Осмелятся ли конкуренты Zhi Yuan использовать Miffeng?
Первое, что нужно решить Miffeng — это вопрос нейтральности.
Предложенная ею «Инициатива совместного создания данных "Пчелиный улей"» — это попытка создать отраслевую сеть данных. Но чтобы привлечь больше робототехнических компаний, Miffeng должна доказать, что данные клиентов не попадут к Zhi Yuan и не будут несанкционированно использованы другими конкурентами.
Яо Маоцин публично отвечал на этот вопрос. Он заявил, что сделки с данными Miffeng делятся на две модели: «право использования» и «право собственности»; для клиентов, приобретающих право собственности, компания завершает передачу активов и локально уничтожает соответствующие данные.
Более того, единственный способ для Zhi Yuan получить данные от Miffeng — это разместить рыночный заказ, бесплатного доступа не существует. Эти меры, по крайней мере, определяют принципы изоляции данных.
Однако, чтобы конкуренты Zhi Yuan согласились на долгосрочные закупки, Miffeng должна с помощью соглашений, изоляции прав доступа, процессов поставки и сторонних аудитов постоянно доказывать свою нейтральность.
В конце концов, для конкурентов Zhi Yuan Miffeng не является «единственным вариантом», и она не единственная компания, обратила внимание на бизнес, связанный с данными.
JD.com уже представила терминал сбора данных JoyEgoCam, инфраструктуру данных для воплощённого интеллекта и торговую площадку данных, поставив цель накопить за следующие два года более 10 миллионов часов видеоданных из реальных сценариев.
Luming Robots также планирует сбор данных без оборудования, Lingchu Intelligence специализируется на данных о реальных человеческих операциях, а Guanglun Intelligence фокусируется на синтетических данных и инфраструктуре для симуляций.
Они конкурируют за одно и то же: превращение разрозненных сценариев и сырых данных в наборы данных, которые можно постоянно использовать для обучения.
Miffeng одновременно сталкивается с двумя проблемами: масштаба и качества.
Десятки миллионов часов — это на данный момент лишь планы по производственным мощностям, а не уже выполненные поставки данных; независимо от того, идёт ли речь о сборе на реальном оборудовании или без него, расширение масштабов означает постоянные вложения в оборудование, персонал и сценарии. Если не решить проблемы качества данных и их обобщения, даже самый большой набор данных может оказаться лишь нагромождением повторений.
В конечном итоге, доверие коллег по отрасли определит, сможет ли Miffeng сформировать сетевой эффект.
Однако решение Zhi Yuan позволить Miffeng функционировать независимо, по крайней мере, предоставило этому направлению бизнеса пространство для внешнего обслуживания.
Если данные всегда остаются внутри Zhi Yuan, они могут улучшить возможности модели только одной компании; будучи стандартизированными, коммерциализированными и получив признание других производителей роботов, они могут получить шанс стать отраслевой инфраструктурой.
В конечном счёте, для Miffeng производственные мощности в десятки миллионов часов — это всего лишь порог входа.
Только когда конкуренты Zhi Yuan также захотят делать у неё долгосрочные закупки и даже доверят обработку своих ключевых данных, этот бизнес можно будет считать по-настоящему устоявшимся.
Эта статья взята из WeChat Official Account: 蓝字计划 , автор: Chester








