В современном венчурном рынке "мировые модели" без сомнения являются одним из самых модных терминов. Мы почти каждый день видим, как новые компании в области "мировых моделей" завершают привлечение инвестиций, их капитализация стремительно растет, а списки акционеров впечатляют. И в пресс-релизах этих новостей о финансировании люди постоянно подчеркивают один факт: квалифицированный сверхинтеллектуальный агент не должен полагаться только на данные для получения способностей, а должен активно понимать физический мир, как человек.
Но Питер Флоренс после основания своей компании написал длинное открытое письмо, которое начинается так: "Не навешивайте на мою компанию ярлык 'мировой модели'."
Это поистине переворачивает все с ног на голову. Потому что Питер Флоренс — не просто "предприниматель". До своего стартапа Питер Флоренс работал в команде Google DeepMind, поднявшись от обычного исследователя до старшего научного сотрудника. Модель управления роботами Gemini Robotics, выпущенная DeepMind в 2025 году, была одним из ключевых разработчиков, над которой работал Питер Флоренс. Однако его самое влиятельное достижение в этот период — это представление миру в 2023 году вместе с коллегами новой архитектуры роботизированной модели "Vision-Language-Action Models".
(Питер Флоренс, источник: социальные сети)
Да, верно, если современные "мировые модели" или "VLA" являются наиболее передовым и консенсусным направлением, то Питер Флоренс — бесспорный пионер на этом пути. Такой человек, возглавляя движение, отказывается от ярлыка "мировая модель", что слишком шокирует.
И теперь шок удваивается. Недавно компания по воплощенному искусственному интеллекту Generalist AI, основанная Питером Флоренсом, завершила новый раунд финансирования общим объемом 4 миллиарда долларов (примерно 27 миллиардов юаней), с оценкой в 20 миллиардов долларов (примерно 135,5 миллиардов юаней). Среди инвесторов этого раунда — NVentures, принадлежащая NVIDIA, совместно управляемый известными бизнес-ангелами Натом Фридманом (Nat Friedman) и Дэниелом Гроссом (Daniel Gross) фонд NFDG, семейный офис Безоса Bezos Expeditions, а также соучредитель Xiaomi Линь Бинь, основатель Zoom Юань Чжэн и самый представительный ученый в области мировых моделей Ли Фэйфэй.
"Цель" важнее "ярлыка"
Почему Питер Флоренс, будучи одним из основных основоположников мировых моделей, так решительно отказывается от ярлыка "мировая модель"? Почему Ли Фэйфэй, как самый представительный ученый в области мировых моделей, реальными деньгами поддержала такого публичного "еретика", отклонившегося от общепринятых норм? Возможно, история начинается в 2019 году.
В то время Питер Флоренс получал докторскую степень по компьютерным наукам в Массачусетском технологическом институте, основными направлениями его исследований были управление роботами, компьютерное зрение и обработка естественного языка — с этой точки зрения Питер Флоренс был "правильным и чистым", его исследовательские направления традиционны, академический фон также очень традиционен, он не был "странником", нуждающимся в "особом пути" для привлечения ресурсов. Но проблема в том, что МТИ назначил ему научным руководителем человека по имени Расс Тедрейк (Russ Tedrake).
Кто такой Расс Тедрейк? Во-первых, он определенно крупный ученый. В 2019 году он был профессором электротехники и компьютерных наук МТИ и директором Центра робототехники лаборатории компьютерных наук и искусственного интеллекта. Каждый год во время известного конкурса роботов DARPA он также отвечал за руководство командой МТИ. Вне университета он также занимал должность вице-президента Исследовательского центра робототехники Toyota Research Institute. Можно сказать, что Расс Тедрейк — один из ведущих ученых в области робототехники, обладающий достаточными ресурсами, чтобы помочь молодому Питеру Флоренсу реализовать свои академические амбиции.
Однако в самооценке Расса Тедрейка его увлекала не программирование, а "физика". В одном из самоописаний Расс Тедрейк вспоминал, что его путь в компьютерные науки начался, когда он изучал "двуногих вертикальных роботов" и увидел "богатые динамические характеристики", которые пробудили в нем сильный интерес к "управлению сложной гидродинамикой". Поэтому, в отличие от других исследователей, которые начинали с изучения того, как заставить робота собирать яблоки или складывать одеяла, он сначала исследовал, как управлять "самолетом или летательным аппаратом с машущими крыльями при сваливании" и как "преодолевать плотные препятствия на высокой скорости".
Такой фон неизбежно заставил Расса Тедрейка очень серьезно относиться к "пониманию физического мира". На официальном сайте МТИ академические особенности Расса Тедрейка описаны так: "Исследования этого профессора сосредоточены на поиске элегантных решений управления для интересных (недостаточно управляемых, стохастических и/или трудно моделируемых) динамических систем, а также на возможности построения этих систем для экспериментальной проверки. Он уделяет особое внимание связи между механикой (особенно негладкой механикой) и теорией машинного обучения/оптимизации, чтобы реализовать надежное управление сложными механическими системами."
Питер Флоренс, находясь под влиянием такого окружения, естественно, также стал "физиком" в компьютерных науках. Например, его наиболее репрезентативная научная работа во время докторантуры — это статья под названием "Самообучение соответствию в обучении зрительно-моторным стратегиям". В этой статье утверждается, что они нашли метод обучения с подражанием, позволяющий роботу выполнять сложные задачи манипулирования всего за 50 демонстраций, а также обобщать на объекты разных категорий и адаптироваться к конфигурациям деформируемых объектов. Эта статья также получила премию IEEE (Институт инженеров по электротехнике и электронике) за лучшую статью в области робототехники и автоматизации 2020 года.
Конечно, принадлежность к какой-либо "школе" не важна, важно то, что Питер Флоренс под влиянием такой среды приобрел совершенно иной образ мышления. Многие исследователи привыкают к существующим технологиям, затем через эксперименты определяют возможности технологий и, наконец, определяют сценарии их применения. А Питер Флоренс верит, что правильный порядок должен быть "сначала установить конкретную цель", а затем разработать технологический путь.
Присоединившись к команде Google DeepMind, Питер Флоренс именно по этому пути развивал свою работу, и его первым значимым достижением стала архитектура роботизированной модели первого поколения Transporter Network, представленная Google в 2021 году. В статье о выпуске модели Питер Флоренс сказал, что организация предметов должна быть очень базовым навыком, но для робота выполнение этого действия означает "высокоуровневые и низкоуровневые рассуждения восприятия", требующие последовательного рассмотрения того, где должна лежать книга и в каком порядке их складывать, а также обеспечения того, чтобы края книг были выровнены друг с другом, образуя аккуратную стопку.
Transporter Network была создана именно для того, чтобы "сделать простые действия простыми", позволяя роботам на основе зрения универсально выполнять различные операции, с более высокой скоростью обучения и меньшей зависимостью от среды обучения.
Совместный выпуск архитектуры VLA с командой DeepMind в 2023 году также был "естественным продолжением" этой идеи. В той статье, которая открыла эру расцвета мировых моделей, авторы заявили, что надеются, что архитектура VLA сможет "значительно повысить способность к обобщению для новых объектов, интерпретировать инструкции, не встречавшиеся в обучающих данных робота (например, размещать объекты на определенных цифрах или значках), а также выполнять базовые логические выводы на основе инструкций пользователя (например, подбирать самый маленький или самый большой объект или объект, ближайший к другим объектам)".
Возвращаясь к начальному вопросу: почему Питер Флоренс, как один из основоположников мировых моделей, так сопротивляется навешиванию ярлыка "мировая модель"? Ответ таков: Питер Флоренс считает, что "цель" важнее "ярлыка".
По его мнению, нынешний энтузиазм вокруг мировых моделей на самом деле является "идеологически движимым", например, значительную часть энтузиазма можно отнести к возбуждению рынка капитала от обнаружения несогласия в горячем направлении. Более того, если действительно хочется продвигать роботов в нашу работу и жизнь, создавая производительность, то построение "мировой модели" явно не является целью. Настоящая цель на самом деле должна заключаться в том, чтобы робот мог выполнять с чрезвычайно высокой частотой успеха и скоростью различные виды ранее не встречавшихся задач, полностью без каких-либо данных, специфичных для задачи.
И это также является причиной, по которой Питер Флоренс решил покинуть Google DeepMind и начать собственный бизнес. На конференции NVIDIA GTC 2025 года Питер Флоренс впервые появился перед людьми как соучредитель и генеральный директор Generalist AI. Он сказал: "Мы полны решимости создать роботов, способных делать что угодно... Представьте, каково было бы, если бы предельные издержки физического труда упали до нуля."
99% успешности
Помимо "еретического" технического мировоззрения, путь предпринимательства Питера Флоренса также кажется нестандартным.
Теоретически, предприниматель с таким послужным списком в нынешних условиях неизбежно пользовался бы огромным спросом у венчурных инвесторов. Ян Лекун, Илья Суцкевер, Мира Мурати — все они примеры того, как компании завершили посевные раунды на сумму более 1 миллиарда долларов сразу после регистрации (или даже до регистрации). Но Generalist AI Питера Флоренса на начальном этапе приняла инвестиции только от нескольких организаций, таких как NVIDIA, семейный офис Безоса, NFDG. Если бы венчурное подразделение NVIDIA, NVentures, не организовало "круглый стол портфельных компаний" на конференции GTC 2025 года, никто бы не знал, что он уже уволился и начал бизнес.
Почему так? Наиболее вероятный ответ — активный выбор самого Питера Флоренса. Как упоминалось выше, Питер Флоренс сразу после окончания учебы попал в команду Google DeepMind и проработал там с 2019 по 2025 год без других записей в трудовой книжке. То есть Generalist AI — это его первый предпринимательский опыт в жизни, и к нему действительно нужно относиться крайне осторожно.
Фактически, впервые публично выступив в качестве предпринимателя на конференции NVIDIA GTC 2025 года, Питер Флоренс очень наглядно продемонстрировал свою "осторожность". Помимо того, что сообщил, что создает "роботов", он не раскрыл никаких конкретных бизнес-направлений, прямо заявив: "В настоящее время мы все еще находимся в скрытом режиме".
Только в ноябре 2025 года люди впервые увидели конкретный бизнес Generalist AI. В ноябре 2025 года Generalist AI выпустила свою первую модель воплощенного интеллекта GEN-0. В официальном представлении Generalist AI заявила, что GEN-0 объединяет преимущества визуальных и языковых моделей, одновременно совершив прорыв — Gen-0 способна улавливать человеческие рефлексы и понимание физики.
Проще говоря, она может постоянно повышать свои способности с увеличением масштаба модели и объема обучающих данных, преодолевая узкие места предыдущих небольших моделей; она может думать и действовать одновременно, как человек, быстро и естественно реагируя в реальной физической среде; она изначально адаптирована к разным типам роботов и не требует дополнительной доработки; что еще важнее, она опирается на огромные объемы реальных данных о манипуляциях, больше не ограничиваясь нехваткой данных, и позволяет гибко настраивать состав обучающих данных. Многие технологические СМИ отмечают, что GEN-0 доказала, что математические "законы масштабирования", лежащие в основе больших языковых моделей, таких как ChatGPT, также применимы к физическому движению.
Однако GEN-0 не идеальна. Например, она также не решила проблему наборов данных, мучающую область воплощенного интеллекта. Поэтому к апрелю 2026 года Generalist AI быстро выпустила новую версию GEN-1.
(«Рука-манипулятор», источник: соцсети Generalist AI)
Для решения проблемы наборов данных Generalist AI разработала носимые устройства для захвата мельчайших движений и визуальной информации человека при выполнении ручных задач. Generalist AI заявила, что в процессе разработки GEN-1 они собрали с помощью этих механических рук более 500 000 часов "петабайтных данных физического взаимодействия" для обучения своей физической модели. После достаточного обучения Generalist AI заявила, что GEN-1 достигла 99% успешности в таких повторяющихся, но точных механических задачах, как складывание картонных коробок, упаковка телефонов и обслуживание роботов-пылесосов, со скоростью примерно в три раза выше, чем у предыдущей модели GEN-0, и для достижения этой цели потребовалось всего около часа.
Таким образом, Generalist AI с гордостью объявила, что физическая модель GEN-1 приблизилась к переломному моменту, подобному GPT-3, производительность некоторых задач начала "достигать уровня, необходимого для развертывания в коммерчески полезной среде", и "мы можем ожидать, что каждое новое поколение моделей будет приносить все более сложные новые задачи, которые можно будет освоить".
В официальном блоге Питер Флоренс указал, что процесс разработки GEN-1 — лучшее воплощение его личной технической философии: во-первых, он поставил рациональную цель — чтобы робот мог выполнять с чрезвычайно высокой частотой успеха и скоростью различные виды ранее не встречавшихся задач, полностью без каких-либо данных, специфичных для задачи. Затем, основываясь на этой цели, он наметил путь решения, позволяющий использовать небольшое количество данных робота для конкретной задачи (назовем это X) и достичь высокого уровня выполнения этой задачи, а затем постоянно уменьшать X, одновременно повышая производительность.
Подойдя к этому моменту, мы также получили ответ на ранее заданный вопрос. Неважно, называется ли продукт, разработанный Generalist AI, "мировой моделью", если вы видите индустрию воплощенного интеллекта и верите, что роботы могут массово внедряться в реальное производство, то Generalist AI действительно стоит того, чтобы делать на нее ставку. И этот раунд финансирования Generalist AI действительно был быстро согласован в течение двух месяцев после выпуска GEN-1.
Согласно отчетам, старые акционеры NVIDIA, семейный офис Безоса Bezos Expeditions, NDFG все выбрали повторное инвестирование, и с удвоенной силой. Кроме того, среди новых инвесторов оказались соучредитель Xiaomi Линь Бинь, основатель Zoom Юань Чжэн, ученый-китаец Ли Фэйфэй, а также институциональные инвесторы Radical Ventures, 8VC, Union Square Ventures, Hanabi Capital, Norwest.
Другими словами, в июне 2026 года Питеру Флоренсу уже не нужно было доказывать себя. По крайней мере, те громкие заявления, которые он делал в те годы — например, только что начавший бизнес Питер Флоренс в 2025 году сказал в подкасте: "Универсальный робот — не тот, кто слегка пробует все, а тот, кто достаточно профессионален в реальных задачах, чтобы быть полезным" — уже находятся на пути к "постепенному осуществлению".
Эта статья взята с официального аккаунта WeChat "投中网", автор: Пу Фань







