Первая в стране сертификация по взрывозащите и первое в мире решение «мозга для заправки»: как им удалось достичь двух «первых»

marsbitОпубликовано 2026-06-26Обновлено 2026-06-26

Введение

По данным, в этом году общий объем финансирования в области воплощенного искусственного интеллекта в Китае превысил 37 миллиардов юаней, и отрасль находится на ключевом этапе коммерциализации. Основным направлением считается применение в опасных, тяжелых и повторяющихся задачах, таких как заправочные станции, нефтегазовые объекты и химические заводы. Однако первым серьезным препятствием является получение взрывозащищенной сертификации, требующей особых конструктивных решений аппаратного обеспечения. На заправочных станциях робот должен выполнять длинные последовательности точных операций (открытие крышки, заправка, закрытие) с миллиметровыми допусками, адаптируясь к разным моделям автомобилей. На объектах требуется способность к длительному автономному патрулированию, распознаванию аномалий и немедленному реагированию. В статье рассматривается новая архитектура H-GAR (Hierarchical Goal-Aware Reasoning), призванная решить проблему накопления ошибок в длинных задачах. В отличие от традиционных линейных подходов, H-GAR сначала прогнозирует целевое состояние мира после выполнения задачи, затем синтезирует промежуточные визуальные кадры и, наконец, детализирует действия. Этот метод, аналогичный планированию опытного водителя, позволяет системе «думать на несколько шагов вперед» и корректировать действия для достижения конечной цели, что значительно повышает устойчивость. Внедрение воплощенного ИИ в специальные сценарии требует долгосрочных усилий, глубокой интеграции «мозга» (а...

По статистике, общий объем финансирования в области воплощенного интеллекта в Китае в этом году превысил 37 миллиардов юаней.

Министерство промышленности и информатизации совместно с Государственным комитетом по делам государственных предприятий запустили «Специальную акцию по практическому обучению в реалистичных условиях человекоподобных роботов и воплощенного интеллекта». Центральное телевидение Китая прямо назвало этот год «ключевым годом для коммерциализации». Деньги первичного рынка и истории вторичного рынка кричат об одном направлении: внедрение, внедрение, внедрение.

Но возникает вопрос: как именно должен внедряться воплощенный интеллект?

Широко распространено мнение, что воплощенный интеллект должен решать задачи, которые не под силу человеку, должен заменять людей на опасных, тяжелых, повторяющихся работах, которые люди не хотят и не должны выполнять.

22 июня в Пекине открылась 4-я Китайская международная ярмарка содействия развитию цепочек поставок, впервые организована специализированная зона искусственного интеллекта.

Однако намерения — это одно, а чтобы роботы действительно смогли «войти» в такие сценарии, первое препятствие уже отпугивает большинство компаний: сертификация по взрывозащите.

На заправках, нефтегазовых станциях, химических заводах и в других взрывоопасных средах сам робот ни в коем случае не должен становиться потенциальным источником возгорания. Это предъявляет чрезвычайно строгие требования к аппаратному обеспечению продукта еще на этапе проектирования. Например: на уровне схемотехники необходимо реализовать искробезопасную конструкцию, ограничивающую энергию контура, чтобы гарантировать, что даже при возникновении неисправности ее будет недостаточно для воспламенения атмосферы; механическая конструкция должна соответствовать требованиям взрывонепроницаемости, выдерживать внутренний взрыв без повреждения корпуса; все точки соединения должны быть выполнены с повышенной безопасностью для предотвращения возникновения искр при нормальной работе; ключевые компоненты также должны быть герметизированы, чтобы изолировать опасные контакты и т.д.

Куда может пойти воплощенный интеллект

Сложность этого сценария для робота заключается в «последовательности точных операций». После оформления заказа клиентом робот должен выполнить более десяти действий подряд: открыть внешнюю крышку, открутить внутреннюю, снять пистолет с держателя, нацелиться на горловину и вставить, дождаться окончания заправки, вынуть пистолет, вернуть его на держатель, закрыть внутреннюю крышку, закрыть внешнюю. Допуск для каждого действия составляет всего несколько миллиметров, заминка на любом этапе означает срыв всей цепочки. Более того, расположение топливного бака, конструкция крышки, способ открывания различаются у разных моделей автомобилей, и робот не может работать по фиксированной программе для всех случаев.

Проблемы при патрулировании объектов совершенно иные. Если на заправке проверяется точность операций, то на объектах проверяется комплексная способность к «длительному автономному патрулированию + распознаванию множества аномалий + немедленному реагированию на месте». Инспекторы ежедневно ходят по фиксированным маршрутам — работа монотонная, опасная и требующая чрезвычайной концентрации внимания, после нескольких часов непрерывного обхода у человека значительно возрастает процент пропущенных нарушений.

Сценарий порта: исследование взаимодействия нескольких роботов

Особенность этого сценария в том, что он по своей природе требует совместной работы нескольких роботов.

В настоящее время архитектура большинства систем воплощенного интеллекта является «конвейерной»: модуль зрения отвечает за восприятие, языковой модуль — за понимание, модуль действий — за выполнение.

Такая архитектура еще может справиться с простыми задачами, имеющими короткую последовательность и низкий уровень помех. Однако как только встречается сценарий с длинной последовательностью из десятков шагов, высокой динамичностью окружения и чрезвычайно низкой допустимой погрешностью, любое малейшее отклонение на промежуточном этапе начинает распространяться по цепочке, как костяшки домино. Традиционная конвейерная архитектура практически не может гарантировать сквозную стабильность при задачах такого уровня сложности.

Прогностическая способность, основанная на модели мира

В сценарии заправки задачи, стоящие перед воплощенным интеллектом, представляют собой очень длинные цепочки: наведение на место парковки, распознавание расположения топливного бака, открытие внешней крышки, открытие внутренней крышки, взятие пистолета, наведение на горловину, вставка, заправка, извлечение, возврат пистолета, закрытие внутренней крышки, закрытие внешней крышки. Малейшее отклонение на любом шаге будет передаваться дальше по цепочке.

Эта способность особенно важна для задач с длинными последовательностями. Заправка — это не простая операция «захват-размещение», это целая цепочка действий с причинно-следственными связями. Модель мира наделяет воплощенный интеллект проактивной способностью «видеть на три шага вперед, делая один».

Для понимания можно привести аналогию: опытный заправщик, независимо от того, насколько легко открывается крышка бака, всегда держит в голове конечное состояние, которого нужно достичь, и каждый промежуточный шаг корректируется в соответствии с этим конечным состоянием. Это позволяет воплощенному интеллекту перейти от «линейного выполнения» к «выравниванию по конечному состоянию».

Первое — генерация целевого наблюдения. Получив инструкцию задачи и текущее изображение с камеры, система сначала предсказывает, «каким должен стать мир после выполнения задачи». Например, после завершения заправки пистолет должен быть возвращен на место, крышка бака — закрыта. Это предсказанное «изображение конечного состояния» и есть целевое наблюдение, которое служит четкой смысловой точкой привязки для всех последующих процессов рассуждения.

Второе — синтез промежуточных кадров перехода. Имея цель, система затем реконструирует, через какие визуальные состояния должен пройти переход. Если начальная точка — «крышка бака закрыта», а конечная — «пистолет на месте, крышка бака закрыта», то в промежутке должны последовательно появиться такие переходные изображения, как «крышка бака открыта», «пистолет взят», «пистолет вставлен в горловину» и т.д. Эти синтезированные промежуточные кадры наблюдения предоставляют визуальные ориентиры для пошагового выравнивания при генерации действий.

Этот механизм позволяет роботу еще до начала действий иметь полное визуальное представление о всем процессе задачи. Последующее планирование действий разворачивается вокруг этой «воображаемой траектории», что значительно снижает накопленное отклонение при выполнении длинных последовательностей.

(a) Существующие методы обычно используют не зависящую от цели, целостную парадигму прогнозирования. (b) H-GAR вводит синтезатор наблюдений с условием цели и оптимизатор действий с восприятием взаимодействия, реализуя тем самым прогнозирование, привязанное к цели, и явно моделируя взаимодействие между наблюдением и действием.

Конкретно рабочий процесс H-GAR делится на три этапа:

Схема архитектуры H-GAR

Первый этап: черновой набросок действий на грубом уровне. На основе истории кадров и инструкции задачи система сначала генерирует набор грубых последовательностей действий. Эти действия описывают «приблизительный путь» от текущего состояния к цели, подобно примерному плану, который возникает в голове у человека при заправке — примерно известно, какие шаги нужно сделать, это подготовка перед выполнением.
Второй этап: синтез наблюдений с условием цели (модуль GOS). Получив черновые действия, система под руководством целевого наблюдения синтезирует промежуточные визуальные кадры. Ключевой момент этого этапа: синтезированные изображения генерируются не произвольно, а с двойным ограничением — как конечным целевым состоянием, так и черновыми действиями. Это гарантирует, что промежуточные переходные кадры соответствуют логике действий и одновременно выровнены по конечной цели.
Третий этап: уточнение действий с учетом взаимодействия (модуль IAAR). На последнем этапе черновые действия преобразуются в точные исполняемые команды. IAAR получает обратную связь из двух направлений для уточнения действий: во-первых, из визуального контекста, предоставляемого промежуточными кадрами наблюдения, что позволяет выровнять действия с реальной сценой; во-вторых, из библиотеки памяти исторических действий, которая записывает ранее выполненные точные действия, гарантируя, что генерируемые в данный момент действия сохраняют временную согласованность с исторической траекторией. Когда объем библиотеки памяти превышает пороговое значение, система использует стратегию вытеснения по схожести, объединяя наиболее похожие соседние действия для сохранения разнообразия памяти.

Адрес статьи: https://arxiv.org/pdf/2511.17079

В реальных сценариях неожиданности — это почти норма. Крышка топливного бака может открываться под неправильным углом, клиент может припарковаться не там, где ожидалось, или даже вокруг горловины могут быть посторонние предметы. Действия, которые в лаборатории успешны в 99 случаях из 100, в реальных уличных условиях могут давать успех лишь в 70%.

Эпилог: Единство знания и действия

Внедрение воплощенного интеллекта в специальные сценарии — это дело, требующее долгосрочного подхода.

Чтобы войти в специальные отрасли, механическая конструкция должна с самого начала учитывать требования безопасности, необходимо иметь возможность разрабатывать само воплощенное «тело». А для выполнения задач в специальных условиях «мозг» воплощенного интеллекта совершенно незаменим. Глубокая интеграция мозга и тела уже вышла за рамки дополнительного преимущества — это условие допуска.

Когда отрасль воплощенного интеллекта в целом стоит на перекрестке коммерческого внедрения, те игроки, которые первыми наладят замкнутый цикл «мозг-тело-данные», с большой вероятностью получат преимущество в предстоящей конкуренции.

Эта статья взята из официального аккаунта WeChat: Machine Heart (机器之心) , редактор: Лэн Мао, автор: интересующийся воплощенным интеллектом, оригинальное название: «Первая в стране сертификация по взрывозащите и первое в мире решение «мозга для заправки»: как им удалось достичь двух «первых»»

Трендовые криптовалюты

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

BrevisBREV

ZRX（0X）ZRX

PancakeSwapCAKE

Связанные с этим вопросы

QПочему проблема взрывозащиты является таким важным препятствием для развертывания воплощенного интеллекта в таких местах, как автозаправочные станции?

AВ легковоспламеняющихся и взрывоопасных средах, таких как автозаправочные станции или нефтехимические заводы, любая искра может привести к катастрофе. Робот сам по себе не должен становиться источником возгорания. Это требует экстремально строгих требований к проектированию оборудования: схемотехника должна быть искробезопасной, механическая конструкция — взрывозащищенной, все соединения — усиленными, а ключевые компоненты — герметизированными. Получение взрывозащищенного сертификата — это первое и высокое входное требование, которое отсеивает большинство компаний, прежде чем они смогут войти в подобные сценарии.

QКаковы основные различия в задачах для воплощенного интеллекта при заправке автомобиля и патрулировании производственных площадок?

AОсновное различие заключается в характере задач. Заправка автомобиля фокусируется на «последовательности тонких операций». Робот должен выполнить длинную цепочку точно скоординированных действий (открыть крышку, взять пистолет, вставить его в горловину и т.д.) с допуском в несколько миллиметров. Работа на производственной площадке требует «комплексной способности к длительному автономному патрулированию, распознаванию различных аномалий и немедленному реагированию на месте». Первое — это точность в коротком промежутке времени, второе — выносливость, внимательность и способность к анализу в течение длительного времени.

QЧто такое «модель мира» (world model) и как она улучшает выполнение длинных последовательностей задач, таких как заправка топлива?

A«Модель мира» — это внутренняя способность системы предсказывать будущие состояния окружающей среды. В контексте заправки топлива она позволяет воплощенному интеллекту не просто механически выполнять следующий шаг, а «заглядывать на три шага вперед, делая один». Система сначала генерирует целевое наблюдение — мысленный образ того, как должен выглядеть мир после успешного выполнения задачи (пистолет на месте, крышка закрыта). Затем она синтезирует промежуточные визуальные кадры, которые должны возникнуть на пути к этой цели. Этот механизм обеспечивает семантическую привязку, позволяя всем действиям согласовываться с конечным состоянием, что значительно снижает накопление ошибок в длинных последовательностях.

QОпишите трехэтапный рабочий процесс архитектуры H-GAR.

AАрхитектура H-GAR работает в три этапа: 1) Черновой план действий: на основе истории наблюдений и команды задачи система генерирует примерную последовательность действий — общий план. 2) Синтез наблюдений с учетом цели (модуль GOS): используя черновой план и целевое состояние, система синтезирует ключевые визуальные кадры — промежуточные наблюдения, которые должны возникнуть на пути к цели. 3) Уточнение действий с учетом взаимодействия (модуль IAAR): черновые действия уточняются до исполняемых команд, используя обратную связь от синтезированных визуальных кадров и библиотеки памяти исторических действий, чтобы обеспечить согласованность и соответствие контексту.

QКакой, согласно статье, является ключевое условие для успешного внедрения воплощенного интеллекта в специальные (специфические) отрасли?

AКлючевым условием является глубокое объединение («глубинная связь») «мозга» (искусственного интеллекта и программного обеспечения) и «тела» (роботизированного аппаратного обеспечения). Недостаточно просто установить мощный ИИ на готовое роботизированное шасси. Для работы в особых условиях конструкция механизмов должна с самого начала проектироваться с учетом безопасности, что требует способности самостоятельно разрабатывать роботизированное «тело». В то же время, для выполнения сложных задач в этих сценариях необходим продвинутый «мозг». Эта интеграция выходит за рамки простого преимущества и становится обязательным условием для входа в отрасль. Компании, которые первыми замкнут цикл «мозг — тело — данные», получат стратегическое преимущество.

Похожее

Стейблкоины становятся следующей политической проблемой ФРС в версии Уорша

Стабильные монеты становятся новой политической задачей для ФРС США, как отметил член Совета управляющих ФРС Кристофер Уоллер на конференции 22 июня. Ранее считавшиеся инструментом крипторынка, такие стейблкоины, как USDT и USDC, теперь изучаются с точки зрения их влияния на международную роль доллара. Их растущий масштаб (рыночная капитализация USDT приближается к $186 млрд, USDC — около $73,8 млрд) означает, что они превращаются в канал трансмиссии долларовой ликвидности, воздействующий на спрос на краткосрочные казначейские облигации, банковское финансирование и глобальный доступ к доллару. ФРС рассматривает стейблкоины как частный технологический слой в долларовой системе, который может либо расширять охват доллара за рубежом, либо создавать новые риски. Их резервы, размещенные в банках, фондах денежного рынка и гособлигациях, связывают их с традиционной финансовой системой. Рост стейблкоинов может оказывать давление на банковские депозиты, влиять на доходность краткосрочных гособлигаций и усложнять проведение денежно-кредитной политики. Ключевые вопросы для регуляторов: определяет ли рост стейблкоинов новый спрос на доллар или замещает банковские депозиты, и могут ли их механизмы резервирования и выкупа выдержать стресс. Таким образом, стейблкоины перешли из периферийной темы крипторегулирования в основную исследовательскую повестку ФРС о будущем доллара.

marsbit4 мин. назад

Стейблкоины становятся следующей политической проблемой ФРС в версии Уорша

marsbit4 мин. назад

Выбросив $90 млрд, Цукерберг решил открыть казино, где нельзя играть на деньги

После того как Meta потеряла 90 миллиардов долларов на метавселенной, Марк Цукерберг решил запустить прогнозную платформу Arena. Однако в отличие от таких платформ, как Polymarket или Kalshi, в Arena нельзя ставить реальные деньги — только игровые очки. Эксперты считают, что без финансовых рисков прогнозы теряют свою точность, так как участники не мотивированы серьезно анализировать события. Возможно, Arena — это просто попытка Meta создать социальную игру вокруг текущих событий, избегая регуляторных проблем. Или же Цукерберг, обжегшись на метавселенной, теперь копирует чужие идеи, но без ключевого элемента — настоящих ставок. Интересно, станет ли Arena просто развлечением для миллиардов пользователей Meta или всё же сможет составить конкуренцию настоящим прогнозным рынкам.

marsbit12 мин. назад

Выбросив $90 млрд, Цукерберг решил открыть казино, где нельзя играть на деньги

marsbit12 мин. назад

Взлет на 380%, IPO стоимостью в сотни миллиардов в Шэньчжэне уже состоялось

Акции HKC (HKC Corporation) успешно вышли на основную площадку Шэньчжэньской фондовой биржи 26 июня. После размещения по цене 10,12 юаня за акцию их стоимость на открытии резко выросла на 400%, а рыночная капитализация компании в какой-то момент превысила 500 миллиардов юаней. Компания HKC, основанная в Шэньчжэне, прошла путь от сборки дисплеев на рынке Хуацянбэй до глобального игрока в производстве панелей для дисплеев, заняв третье место в мире по поставкам телевизионных и смартфонных панелей. Выход на IPO стал результатом почти 30-летнего развития. Компания, занимающаяся разработкой, производством и продажей полупроводниковых дисплейных панелей и интеллектуальных дисплейных терминалов, демонстрирует стабильный рост. С 2023 по 2025 год ее выручка составила около 358,24, 402,82 и 408,97 миллиардов юаней соответственно, а чистая прибыль достигла 25,82, 33,20 и 38,01 миллиардов юаней. Основными клиентами являются такие известные бренды, как Samsung, TCL, Hisense, LG, Xiaomi и Skyworth. Развитие HKC тесно связано с поддержкой государственного капитала. Начиная с 2015 года, компания сотрудничала с государственными платформами Чунцина, Чучжоу, Мьянъяна и Чанши для совместных инвестиций в строительство производственных линий. Перед IPO такие инвесторы, как Miantou Group, Liuyang Urban Construction, Jingdongfang Capital, Chuzhou City Investment и Gui'an Industrial Development Company, внесли значительные средства в капитал компании. Основатель Ван Чжиюн через холдинговые компании контролирует 52,31% голосующих акций. Успешное размещение акций HKC отражает новые тенденции в инновационной экосистеме Шэньчжэня. Помимо гигантов вроде Tencent и BYD, в городе появляется все больше чемпионов в специализированных отраслях, таких как робототехника (рободолина Шэньчжэня) и производство чипов памяти («пять тигров памяти»: Jiangbolong, Dapu Micro, Biwin Storage, Demingli и Shannon Core Creation), совокупная рыночная капитализация которых достигает триллионов юаней. Эти компании, наряду с перспективными направлениями, такими как искусственный интеллект, низкоорбитальная экономика и коммерческая космонавтика, формируют новую промышленную глубину Шэньчжэня и потенциально готовят почву для появления следующей компании с триллионной капитализацией.

marsbit15 мин. назад

Взлет на 380%, IPO стоимостью в сотни миллиардов в Шэньчжэне уже состоялось

marsbit15 мин. назад

Продолжался 233 дня, падение превысило 50%. Является ли текущий медвежий рынок самым мягким за всю историю?

Анализ текущего медвежьего рынка биткоина, который длится 233 дня (на 24 июня), показывает, что это четвертый по продолжительности период с 2014 года. Текущий цикл характеризуется снижением на 51,2% от исторического максимума в $124 773, что делает его самым мягким за всю историю наблюдений. Для сравнения, предыдущие крупные медвежьи рынки (2018-2019, 2014-2015, 2022-2023 гг.) демонстрировали падение от 76,7% до 83,6%. Текущий спад связывают с макроэкономическими факторами: неопределенность в отношении процентных ставок, иссякающий импульс после халвинга и рост интереса к ИИ как к классу активов. Цена биткоина ($62 651) в настоящее время находится на 22% ниже своего 200-дневного скользящего среднего ($76 450), которое выступает ключевым уровнем сопротивления. Если дно цикла было достигнуто 7 июня ($60 861), то для возврата выше 200-дневной средней, согласно историческим данным, может потребоваться от 65 дней и более. Таким образом, потенциальное восстановление может начаться не раньше августа 2026 года. Относительно умеренный характер текущего спада может указывать на более зрелую структуру рынка и более высокое участие институциональных инвесторов.

marsbit1 ч. назад

Продолжался 233 дня, падение превысило 50%. Является ли текущий медвежий рынок самым мягким за всю историю?

marsbit1 ч. назад

Медвежий рынок Bitcoin заставляет криптокомпании сокращать персонал, но порождает самую агрессивную волну слияний и поглощений в истории индустрии

Автор: Oluwapelumi Adejumo. Компиляция: TechFlow. Медвежий рынок биткоина приводит к массовым сокращениям в криптоиндустрии, но одновременно с этим вызывает самую агрессивную волну слияний и поглощений (M&A) в её истории. Общая стоимость сделок в первой половине 2026 года достигла 94 миллиардов долларов США, что в 26 раз больше, чем за аналогичный период прошлого года. Традиционные финансовые институты, вместо того чтобы создавать собственную инфраструктуру, активно скупают компании с готовыми лицензиями, решениями для хранения цифровых активов и платёжными системами. Эта динамика показывает реальное направление движения капитала в условиях медвежьего рынка. Волну поглощений в основном двигают традиционные финансовые организации, такие как Mastercard (купившая компанию BVNK за 1,8 млрд долларов), банки и управляющие активами (например, Franklin Templeton), стремящиеся быстро получить доступ к регулируемым технологиям и платёжным рейлам. При этом рынок труда в криптосекторе сокращается: количество открытых вакансий упало, а крупные компании, включая Coinbase и Kraken, объявляют об увольнениях, частично связывая их с переходом на модели, основанные на искусственном интеллекте. Наём сфокусирован на технических и комплаенс-специалистах. Финансово слабые криптокомпании с истощённым финансированием становятся целями для поглощений по сниженной стоимости, как это произошло с аналитическим провайдером Messari. Венчурный капитал стал более разборчивым, концентрируясь на проектах, которые служат мостом между традиционными финансами и цифровыми активами, обладают лицензиями и чёткими бизнес-моделями. Таким образом, медвежий рынок очищает отрасль, поощряя консолидацию и рост компаний, построивших устойчивую, ориентированную на институции инфраструктуру.

marsbit1 ч. назад

Медвежий рынок Bitcoin заставляет криптокомпании сокращать персонал, но порождает самую агрессивную волну слияний и поглощений в истории индустрии

marsbit1 ч. назад

Торговля

Спот

Фьючерсы

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на S (S) представлены ниже.

Первая в стране сертификация по взрывозащите и первое в мире решение «мозга для заправки»: как им удалось достичь двух «первых»

Введение

Трендовые криптовалюты

Связанные с этим вопросы

Похожее

Стейблкоины становятся следующей политической проблемой ФРС в версии Уорша

Выбросив $90 млрд, Цукерберг решил открыть казино, где нельзя играть на деньги

Взлет на 380%, IPO стоимостью в сотни миллиардов в Шэньчжэне уже состоялось

Продолжался 233 дня, падение превысило 50%. Является ли текущий медвежий рынок самым мягким за всю историю?

Медвежий рынок Bitcoin заставляет криптокомпании сокращать персонал, но порождает самую агрессивную волну слияний и поглощений в истории индустрии

Торговля

Популярные статьи

Как купить S

Sonic: Обновления под руководством Андре Кронье – новая звезда Layer-1 на фоне спада рынка

HTX Learn: Пройдите обучение по "Sonic" и разделите 1000 USDT

Обсуждения

Топ вопросы

Популярные категории

Популярные теги