В середине мая 2026 года Deepseek сформировал совершенно новую команду Harness, ориентированную на продукт для интеллектуальных агентов в области кода, с внутренней целью соответствия Claude Code от Anthropic. Звездный инженер по квантовым финансам Цуй Тяньи из Jane Street присоединился к команде в марте, а старший исследователь Чэнь Дэли публично подтвердил это и отвечает за подбор персонала. В описании вакансии Deepseek четко указана формула: "Model + Harness = Agent". По мере того как возможности базовых больших моделей постепенно выравниваются, эпоха простой гонки за параметрами подходит к концу. Личное участие Deepseek в формировании команды для создания цепочки инструментов (toolchain) знаменует переход основного поля конкурентной борьбы в сфере ИИ в Китае от "создания больших моделей" к "разработке инструментария и внедрению в рабочие процессы".
Почему Deepseek лично включился в создание Harness?
В течение длительного времени ожидания разработчиков от Deepseek ограничивались открытием исходного кода более мощных базовых моделей. Однако способность генерировать код не означает, что разработчики будут использовать её как инструмент производительности. То, что действительно меняет способ работы, — это не ответы с кодом в окне чата, а инженерные агенты, которые могут зайти в терминал, понять проект, читать и записывать файлы, запускать команды, исправлять ошибки. Ещё до официальных шагов, сообщество разработчиков на базе моделей Deepseek уже создало различные агенты с открытым исходным кодом для терминала. Создание команды Harness в Deepseek в этот момент направлено на получение контроля над дизайном интерфейсов и созданием замкнутого цикла обучающих данных, превращая тропы, протоптанные сообществом, в основной официальный продукт.
Чтобы понять эту стратегическую цель, необходимо сначала разобраться, что такое Harness. Для читателей без технического бэкграунда слово "Harness" может быть незнакомым. В формуле Deepseek модель отвечает за рассуждение, а Harness — за всё остальное. Изначально в инженерии "harness" означает "упряжь" или "ремень безопасности", в контексте ИИ это относится к "инфраструктуре времени выполнения" агента.
Для более понятного объяснения можно сравнить большую модель с "мозгом" и "интеллектом" высокоинтеллектуального работника, а Harness — с "должностной инструкцией, стандартами оценки KPI, защитными барьерами на рабочем месте и набором инструментов" этого работника. Это не "строительные леса", собираемые перед запуском, и не "фреймворк", предоставляющий строительные блоки, а постоянно работающая система. Она отвечает за оркестрацию цикла выполнения, распределение вызовов инструментов, управление контекстом, выполнение проверок безопасности, а также за восстановление после ошибок и сохранение состояния. Сама по себе большая модель не имеет состояния и способности взаимодействовать со средой, она может только получать текстовый ввод и выдавать текстовый вывод. А Harness компенсирует эти недостатки, позволяя модели действительно взаимодействовать с внешним миром и выполнять конкретные задачи.
Почему компания, разрабатывающая базовые модели, должна лично контролировать эту среду выполнения? Ключевая причина в том, что продукты-агенты являются не только точкой выхода для возможностей модели, но и полигоном для их тренировки. В описании вакансии Deepseek подчеркивается "достижение совместной эволюции модели и Harness". В реальных сложных задачах модель сталкивается с различными неудачами из-за ограничений среды или аномальных возвратов инструментов. Запись этих траекторий неудач Harness'ом может способствовать обучению модели, создавая эффект маховика. Если позволить сообществу строить эту инфраструктуру, производители моделей потеряют самую ценную обратную связь на уровне приложений, превратившись в простых поставщиков вычислительных мощностей и весов моделей.
С инженерной точки зрения, оптимизация Harness играет более решающую роль в успехе агента, чем просто оптимизация промптов. Согласно анализу технических экспертов, во время выполнения агента выводы инструментов составляют 67,6% от фактического содержания, которое агент видит в контексте, тогда как системные промпты — всего 3,4%. Это означает, что большая часть "поля зрения" модели занята результатами вызовов инструментов. Если Harness неправильно обрабатывает формат вывода инструментов или не может эффективно сжимать избыточную информацию, модель попадает в "гниение контекста", что приводит к резкому падению качества последующих рассуждений.
Ещё более критичной является проблема накопления ошибок. Процесс агента, состоящий из 10 шагов, каждый с надежностью 99%, имеет общую вероятность успеха около 90%; когда сложность задачи возрастает до 50 шагов, вероятность успеха резко падает до 60%. В реальных сценариях, таких как поддержка репозиториев кода или автоматизация бизнес-процессов, последовательные операции в десятки шагов являются нормой. В этом случае, как бы ни были сильны способности модели к рассуждению, они не могут компенсировать кумулятивные потери вероятности. Только механизмы обработки ошибок и восстановления внутри Harness могут выполнить повторную попытку или корректировку пути при сбое шага. Именно в этом заключается инженерная ценность Harness и причина, по которой Deepseek должен лично включиться в эту работу.
Tencent делает коннекторы, Alibaba внедряется через фронтенд: дифференцированные пути инструментария крупных компаний
Поворот Deepseek не является единичным случаем. Согласно отраслевым СМИ, усиление возможностей агентов стало важным направлением развития базовых больших моделей в Китае в 2026 году. Базовые модели постепенно превращаются в "коммунальные услуги", а основное поле конкуренции смещается на уровень приложений. Другие крупные китайские компании также ищут свою нишу через инструментарий, но пути различаются, что отражает различия в их экосистемах и целевых пользователях.
Tencent в июне 2026 года сделал новую ставку на корпоративных агентов, представив корпоративную версию WorkBuddy. Её основная позиция — это десктопная платформа для интеллектуальных агентов на рабочем месте, охватывающая все сценарии, с акцентом на переход от личной эффективности к организационной синергии. Корпоративная версия WorkBuddy поддерживает параллельную работу нескольких агентов и подключение коннекторов к бизнес-системам, пытаясь захватить единую точку входа для ИИ-офиса. Логика позиционирования Tencent опирается на его обширную экосистему WeChat Work и Tencent Cloud. Для крупных предприятий боль ИИ-офиса заключается не в идеальном опыте использования единичных инструментов, а в возможности объединения изолированных внутренних офисных систем. Tencent, создавая коннекторы, позволяет агентам напрямую обращаться к корпоративным данным и процессам, делая акцент на организационной координации и выполнении сложных задач. Преимущество этого пути в высоких барьерах для входа: как только происходит интеграция в ключевые бизнес-процессы, затраты на замену чрезвычайно велики; вызов же заключается в необходимости иметь исключительно сильные возможности по корпоративному обслуживанию и кастомизированной поддержке.
Alibaba выбрала другой путь, решив снизить порог автоматизации на стороне веб-браузера. Alibaba открыла исходный код фреймворка PageAgent для GUI-агентов, работающих полностью на фронтенде внутри браузера. Этот фреймворк не требует бэкенд-развертывания, одной строкой кода позволяет сайту интегрировать возможности ИИ-оператора. Логика позиционирования Alibaba заключается в расширении возможностей веб-разработчиков, позволяя любой веб-странице мгновенно стать нативным ИИ-приложением. В условиях, когда множество традиционных корпоративных систем не предоставляют API-интерфейсы, автоматизация через манипуляции с DOM на фронтенде представляет собой прагматичный путь атаки с понижением планки. Преимущество этого пути в легкости и простоте интеграции, что позволяет быстро охватить большое количество нишевых сайтов; однако частые изменения структуры DOM на фронтенде также могут создавать проблемы стабильности, предъявляя более высокие требования к способности Harness восстанавливаться после ошибок.
В сравнении видно, что компании больше не просто соревнуются в тестовых оценках моделей, а строят инструментарий в соответствии со своими экосистемными преимуществами. Tencent делает коннекторы, Alibaba внедряется через фронтенд, а Deepseek начинает с наиболее востребованной разработчиками сцены работы с кодом. Эта дифференциация показывает, что индустрия ИИ в Китае осознала: не существует идеального универсального агента, есть только вертикальные решения, отточенные за счет серьезной инженерной работы над Harness в конкретных сценариях. Для корпоративных закупок выбор того или иного инструментария, по сути, является выбором пути автоматизации: глубокая интеграция с офисной экосистемой, гибкое внедрение в существующие веб-системы или расширение возможностей рабочих процессов разработчиков.
ARR в 20 миллионов долларов от Viktor доказывает: компании готовы платить за автономное выполнение
Созревание инструментария меняет парадигму участия ИИ в офисной сфере. Логика нативных Copilot — "создать черновик и ждать завершения человеком". ИИ генерирует текст или код, но последний шаг по-прежнему требует человеческого вмешательства для модификации и выполнения. В этой модели ИИ является всего лишь инструментом повышения эффективности, неспособным по-настоящему заменить рабочую силу. Сотрудникам компаний необходимо постоянно следить за выводом ИИ, проверять и внедрять его, что фактически увеличивает когнитивную нагрузку.
На зарубежных рынках уже появились четкие сигналы смены парадигмы. В качестве ориентира зарубежных трендов, польская компания по офисной автоматизации Viktor позиционируется как ИИ-сотрудник внутри Slack и, не имея команды продаж, достигла годового дохода (ARR) в 20 миллионов долларов, обслуживая 30 тысяч предприятий, а в мае 2026 года получила финансирование серии A в размере 75 миллионов долларов. Модель Viktor представляет собой конечную форму новых ИИ-сотрудников: облачный компьютер, способность к длительной непрерывной работе, надежное удержание огромного контекста, прямая поставка результата.
Viktor позиционируется как ИИ-коллега 3-го уровня (Tier 3), что означает, что он обрабатывает уже не простые вопросы и ответы, а сложные задачи, требующие множества шагов и длительного выполнения, такие как аудит маркетинга, управление рекламой, исследование потенциальных клиентов. На стороне предприятий существует огромная готовность платить за такой ИИ, который не требует окончательного подтверждения человеком и может работать длительное время. Взрывной рост этих коммерческих данных доказывает, что точка ценности офисной автоматизации сместилась с "вспомогательной генерации" на "автономное выполнение".
Развертывание Harness и инструментария для агентов китайскими производителями как раз и направлено на то, чтобы уловить этот тренд. Когда Harness способен обеспечить достаточные защитные барьеры, сохранение состояния и восстановление после ошибок, ИИ может превратиться из "стажера", за которым нужно постоянно следить, в "подрядчика", способного независимо предоставлять рабочие результаты. Фокус корпоративных закупок также сместится с размера параметров модели на способность агента стабильно работать 8 часов без сбоев, автоматически обрабатывать ограничения API и изменения структуры веб-страниц. Для разработчиков это означает, что фокус при создании ИИ-приложений сместится с вопроса "как написать хороший промпт" на вопрос "как спроектировать надежную среду выполнения".
Взрыв токенов и инженерные барьеры "толстых" фреймворков
После перехода к конкуренции на уровне инструментария вызовы, с которыми сталкиваются предприятия и разработчики при внедрении, не уменьшились, а, наоборот, стали более сфокусированными на инженерных аспектах.
На первом плане стоит проблема взрыва токенов. Агенты, работающие длительное время, в цикле "мышление — действие — обратная связь" легко приводят к быстрому разбуханию контекста из-за избыточного вывода инструментов. Сообщество разработчиков активно обсуждает эту проблему, отмечая, что это не только увеличивает стоимость вычислений, но и приводит к рассеиванию внимания модели и резкому росту вероятности сбоя задачи. Например, при выполнении задачи по извлечению данных с веб-страницы, если Harness засовывает в контекст весь исходный HTML-код страницы без изменений, модель быстро теряется в избыточной информации, забывая первоначальную цель задачи. Поэтому способность Harness сжимать контекст и управлять памятью становится ключевым критерием при корпоративных закупках. Отличный Harness должен знать, какую историческую информацию можно отбросить, какие результаты инструментов требуют суммирования — это требует глубоких инженерно-архитектурных способностей, а не самого интеллекта модели.
Это также вызвало настороженность разработчиков по отношению к "тонким" фреймворкам-оболочкам. Если Harness, выпускаемый производителем больших моделей, представляет собой просто обертку API с базовым интерфейсом диалогового окна и вызова инструментов, он будет иметь небольшую ценность для отладки. Хрупкость в производственной среде требует, чтобы Harness обладал характеристиками "толстого" фреймворка: изоляцией в песочнице, детальным контролем прав, возобновлением с точки прерывания и т.д. Только среда выполнения с серьезными инженерными барьерами может действительно решить потребности в стабильности для корпоративных приложений. Например, в сценариях выполнения кода Harness должен предоставлять безопасную песочницу, чтобы предотвратить повреждение хост-системы вредоносным кодом, сгенерированным моделью; при длительных задачах он должен поддерживать возобновление с точки прерывания, чтобы избежать необходимости перезапуска всей задачи из-за сетевых сбоев.
Кроме того, геополитические факторы оставили огромный рыночный вакуум для отечественных решений Harness. Продукты высшего класса для инженерных агентов, такие как Claude Code, ограничивают доступ для материкового Китая и китайских предприятий. В условиях, когда отечественные разработчики не могут напрямую использовать эти передовые инструменты, они вынуждены искать отечественные аналоги. Создание команд Harness в Deepseek — это не только реакция на технологические тренды, но и ответ на этот огромный спрос на замену.
Для корпоративных закупщиков и разработчиков понимание ценности Harness означает, что при выборе ИИ-продуктов их больше не будут ослеплять впечатляющие демонстрации диалогов, а заставят задавать вопросы о том, каковы механизмы восстановления после ошибок, какова стратегия управления контекстом и может ли он действительно интегрироваться в существующие рабочие процессы. На этапе конкуренции инструментария предприятия должны в первую очередь оценивать способности компании к инженерной реализации и совместимость с экосистемой, а не просто сравнивать тестовые оценки моделей; разработчикам же следует обращать внимание на степень открытости фреймворка Harness и полноту инструментария для отладки, выбирая платформы, способные предоставить глубоко контролируемую среду выполнения.








