# Сопутствующие статьи по теме Агентный ИИ

Новостной центр HTX предлагает последние статьи и углубленный анализ по "Агентный ИИ", охватывающие рыночные тренды, новости проектов, развитие технологий и политику регулирования в криптоиндустрии.

CPU возвращается за игровой стол: начинается «игра на повышение» стоимостью 170 миллиардов долларов

6 июня 2026 года на выставке Computex NVIDIA анонсировала свой первый процессор Vera CPU, что знаменует серьезный вход компании на рынок серверных процессоров. Это событие подчеркивает растущую ключевую роль CPU в эпоху ИИ-агентов, когда задачи, связанные с выводом (инференсом) и управлением, требуют все большей вычислительной мощности и эффективности процессоров. Рынок серверных процессоров переживает бум. Прогнозы, такие как отчет UBS, предполагают, что его объем может вырасти с примерно 300 млрд долларов в 2025 году до 1700 млрд долларов к 2030 году. Основной драйвер роста — ИИ-агенты, которые выполняют сложные многошаговые задачи, требующие интенсивной работы CPU для управления потоками данных, вызова инструментов и обработки контекста. В таких сценариях нагрузка на CPU может достигать 70-90%, а соотношение CPU к GPU в системах стремится к 1:1, в отличие от 1:8 в эпоху обучения моделей. Это привело к изменению спроса и даже к росту цен на серверные CPU впервые за более чем десятилетие. AMD и Intel столкнулись с дефицитом мощностей. Спрос разделился на высокопроизводительные CPU для работы внутри стоек с GPU и более умеренные, но массовые CPU для развертывания независимых узлов агентов. Новая конкурентная динамика привлекла новых игроков, таких как NVIDIA с ее ARM-архитектурой, и открыла возможности для китайских производителей CPU, таких как Hygon (HaiGuang). Их рост поддерживается как общим рыночным бумом, так и политикой импортозамещения (программа «синьчуан»), требующей замены иностранного оборудования в государственном секторе к 2027 году. Таким образом, в центре следующего этапа развития ИИ находится не только GPU, но и эффективное взаимодействие CPU и GPU, что переопределяет ландшафт полупроводниковой индустрии.

marsbit06/19 13:45

CPU возвращается за игровой стол: начинается «игра на повышение» стоимостью 170 миллиардов долларов

marsbit06/19 13:45

Отчёт Bernstein: Agentic AI превратит CPU из второстепенного игрока в главного, оптимистичный прогноз по Hygon

Аналитики Bernstein в отчете «Global Semiconductors: CPU Renaissance?» утверждают, что переход от чат-ботов к агентному ИИ (Agentic AI) кардинально меняет роль центральных процессоров в дата-центрах. Если раньше CPU играли вспомогательную роль для GPU, то теперь в сценариях агентного ИИ, где требуется сложная координация рабочих процессов, планирование и вызов инструментов, нагрузка на процессоры резко возрастает. По прогнозам, к 2029 году соотношение GPU к CPU в кластерах для инференса снизится с 8:1 до 1:1, а доля CPU в вычислительной нагрузке достигнет 50%. Это увеличит общий объём рынка серверных CPU до 2230 млрд долларов к 2030 году (по сравнению с 370 млрд в 2025). Главным бенефициаром названа компания Arm благодаря энергоэффективности своей архитектуры и стратегическому переходу к самостоятельному производству чипов. Среди других компаний, которые могут выиграть, — AMD, Intel и китайская Hygon (Haiguang Information). В отчете отмечается, что ключевыми рисками для реализации такого сценария являются ограничения производственных мощностей полупроводниковых фабрик и зависимость прогноза от очень оптимистичных оценок будущих расходов на ИИ-инфраструктуру.

marsbit06/17 09:47

Отчёт Bernstein: Agentic AI превратит CPU из второстепенного игрока в главного, оптимистичный прогноз по Hygon

marsbit06/17 09:47

Правильный подход к использованию Skill: 5 размышлений после публикации методологии Anthropic

Автор делится размышлениями о методологии создания эффективных «навыков» (Skills) для языковых моделей, таких как Claude Code, основываясь на внутренней документации компании Anthropic. Ключевые выводы: 1. **Избегайте лишнего:** Навык должен содержать не общеизвестные факты, а специфические знания и «подводные камни» (Gotchas) из опыта команды — например, особенности работы с конкретными API или базами данных. 2. **Инженерия контекста:** Навык — это не просто файл, а структурированная папка (с инструкциями, справочниками, скриптами, примерами и активами). Такой подход позволяет дозированно загружать в контекст модели только необходимую информацию, экономя ресурсы и повышая качество выполнения. 3. **Используйте скрипты:** Повторяющиеся действия (запросы данных, преобразования) следует выносить в скрипты. Это освобождает модель от рутины, повышает точность и экономит токены, оставляя её способности для анализа и принятия решений на основе инструкций (опыта). 4. **Описание — это правило маршрутизации:** Описание навыка должно формулировать, *в какой ситуации* его следует активировать (например, «когда CI-пайплайн не проходит»), а не просто перечислять его функции. Это помогает модели точнее выбирать нужный инструмент. 5. **Управление и распространение:** При росте числа навыков эффективна модель «рынка» (Marketplace). Новые навыки сначала тестируются и распространяются внутри малых групп. Те, что доказали свою полезность и популярность, попадают в официальный каталог. Это создаёт естественный фильтр качества. Главная мысль: навыки эффективны, когда они представляют собой хорошо структурированную инженерию контекста для кодификации и повторного использования коллективного опыта, а не просто длинные инструкции.

marsbit06/08 09:07

Правильный подход к использованию Skill: 5 размышлений после публикации методологии Anthropic

marsbit06/08 09:07

Посттренировочный инженер OpenAI Вэн Цзяи предложил новую парадигмальную гипотезу для Agentic AI

OpenAI-инженер Вэн Цзяи выдвинул новую концепцию «Эвристического обучения» (HL), предполагая, что AI может совершенствоваться не только за счет увеличения параметров нейронных сетей, но и посредством автономного редактирования кода. В своем эксперименте он использовал Codex (на базе GPT-5.4) для создания и итеративного улучшения программных стратегий на основе правил для игр Atari (например, Breakout) и сред робототехники MuJoCo. Система анализировала логи, видео-повторы и ошибки, самостоятельно внося изменения в код, тесты и конфигурации, что позволило достичь максимального счета в Breakout и результатов, сопоставимых с алгоритмами глубокого обучения с подкреплением. Ключевая идея заключается в том, что «опыт» фиксируется в виде интерпретируемого программного обеспечения (эвристической системы — HS), а не только в неявных весах нейросети. Это может открыть новые возможности в областях, где важны прозрачность, безопасность и инженерная поддерживаемость, например, в робототехнике и критически важных системах. HL предлагает альтернативный путь, где обучение происходит через цикл обратной связи с агентом, способным писать и изменять код, хотя его применимость ограничена задачами, которые можно выразить программно. Эксперимент указывает на потенциальный симбиоз нейронных сетей (System 1) для восприятия и HL для логики, управляемой кодом, с LLM (System 2) в роли координатора.

marsbit05/11 00:20

Посттренировочный инженер OpenAI Вэн Цзяи предложил новую парадигмальную гипотезу для Agentic AI

marsbit05/11 00:20

Запись «безумия» больших моделей: вторжение кибер-монстров, гоблины и еноты создают самый абсурдный сезон в индустрии ИИ

Искусственный интеллект демонстрирует странное поведение: модели, такие как ChatGPT и Codex от OpenAI, начали неконтролируемо вставлять в ответы упоминания мифических существ, таких как гоблины, гремлины и еноты, даже в серьёзных деловых или технических контекстах. Как выяснило OpenAI, причиной стал сбой в системе подкрепляющего обучения с обратной связью от человека (RLHF) во время настройки определённой «ботанической» личности, что привело к ассоциации этих слов с более высокими оценками. Для исправления ситуации инженерам пришлось встроить в системные инструкции явный запрет на упоминание этих существ. Эта, казалось бы, безобидная аномалия подняла серьёзные вопросы о надёжности и предсказуемости передовых моделей ИИ, особенно в корпоративной среде, где подобные сбои могут подорвать доверие. Проблема не ограничивается OpenAI: другие крупные модели, такие как Claude от Anthropic и Gemini от Google, также демонстрируют неожиданное и неконтролируемое поведение на фундаментальном уровне. На этом фоне меняется и ландшафт сотрудничества: Microsoft пересмотрела эксклюзивное соглашение с OpenAI, а последняя, столкнувшись с ограничениями вычислительных мощностей, начала размещать свои модели на платформах конкурентов, таких как AWS. Инцидент с «гоблинами» обнажил хрупкость сложнейших ИИ-систем и стал предупреждением для бизнеса о необходимости продумывать запасные планы, прежде чем доверять таким моделям критически важные операции.

marsbit05/09 02:23

Запись «безумия» больших моделей: вторжение кибер-монстров, гоблины и еноты создают самый абсурдный сезон в индустрии ИИ

marsbit05/09 02:23

Выступление Дженсена Хуана на CES 2026: три ключевые темы и «чиповый монстр»

Короткий пересказ выступления Дженсена Хуана на CES 2026: На CES 2026 генеральный директор NVIDIA Дженсен Хуан представил новое поколение технологий, сфокусированных на инфраструктуре для эры «рассуждающего ИИ» (Reasoning AI) и «физического ИИ» (Physical AI). Ключевые анонсы включали: 1. **Платформа Rubin:** Впервые раскрыты полные данные о новой архитектуре Rubin, включая GPU Rubin, CPU Vera и NVLink 6. Платформа предназначена для радикального снижения стоимости вычислений при выводе (инференсе) ИИ, позволяя ИИ «думать дольше» экономически эффективно. Заявлено 10-кратное снижение стоимости обработки токенов. 2. **Платформа хранения контекстной памяти (Inference Context Memory Storage):** Решение для хранения больших объемов данных контекста (KV Cache) для долгосрочных задач ИИ, устраняющее «узкое место» между быстрой, но малой памятью GPU и медленной традиционной памятью. 3. **Новый DGX SuperPOD:** Масштабируемая система, объединяющая 576 GPU Rubin для работы в качестве единого кластера, предназначенная для обучения огромных моделей и работы тысяч ИИ-агентов. 4. **Расширение экосистемы открытых моделей (Open Model Universe):** NVIDIA открыла доступ к множеству моделей, наборов данных и инструментов across various domains, включая Nemotron (для рассуждающего ИИ), Cosmos (для физического ИИ и генерации синтетических данных), Alpamayo (первая открытая модель Vision-Language-Action для автономного вождения) и Isaac GR00T (для робототехники). 5. **Прогресс в физическом ИИ:** Анонсировано партнерство с Mercedes-Benz для внедрения системы DRIVE (уровень L2++) в новые автомобили с 2026 года. Продемонстрированы многочисленные роботы от партнеров (Boston Dynamics, LG и др.), использующие платформу NVIDIA. В целом, NVIDIA представила комплексное видение и готовую инфраструктуру для перехода от генеративного ИИ к рассуждающему и физическому ИИ, способному работать долговременно в реальном мире.

marsbit01/06 02:12

Выступление Дженсена Хуана на CES 2026: три ключевые темы и «чиповый монстр»

marsbit01/06 02:12

活动图片