# Сопутствующие статьи по теме Код

Новостной центр HTX предлагает последние статьи и углубленный анализ по "Код", охватывающие рыночные тренды, новости проектов, развитие технологий и политику регулирования в криптоиндустрии.

Команда NVIDIA создала агента-программиста, который берет на себя эксперименты с реальными роботами, достигая успеха в 99% случаев

Проект ENPIRE от NVIDIA GEAR Labs впервые реализовал полностью автоматизированные исследования на реальном роботизированном оборудовании. Система, состоящая из восьми автономных кодирующих агентов Codex, управляет флотом роботов для решения сложных задач ловкости, таких как завязывание стяжек, сортировка булавок и установка GPU, с успешностью до 99%. Агенты работают автономно в замкнутом цикле: сброс среды, поиск в литературе, реализация идей, обучение стратегий, развертывание, валидация и итеративное улучшение кода, практически без вмешательства человека. Ключевые инсайты: создание автоматизированной среды сброса часто проще, чем сама задача. Система демонстрирует «физический закон масштабирования» — увеличение числа параллельных роботов (например, до 8) значительно ускоряет решение. Введены новые метрики: MRU (средняя загрузка роботов) и MTU (эффективность использования токенов агентами). Текущая загрузка роботов ниже 50%, что указывает на потенциал роста через оптимизацию скорости работы агентов. Цель — достичь полностью автономной работы лаборатории. Проект будет открыт, что позволит разработчикам создавать подобные системы.

marsbitВчера 00:36

Команда NVIDIA создала агента-программиста, который берет на себя эксперименты с реальными роботами, достигая успеха в 99% случаев

marsbitВчера 00:36

Внезапно! Anthropic призывает всех приостановить исследования в области ИИ

Важное заявление от Anthropic: ИИ начал саморазвитие. По данным компании, более 80% кода Anthropic сейчас пишет их ИИ Claude, что привело к восьмикратному росту объема кода, сливаемого инженерами. Качество кода Claude также резко возросло: успешность выполнения сложных задач выросла с 26% до 76% за полгода. Claude теперь также выполняет ревью кода и участвует в исследованиях, демонстрируя ускорение в десятки раз по сравнению с человеком в некоторых задачах. Anthropic ввела метрику "длительность задачи, которую ИИ может выполнить самостоятельно": от 4 минут в марте 2024 года до 16+ часов для самой новой модели. Эта скорость удвоения ускорилась с 7 до 4 месяцев. Компания прогнозирует, что к 2027 году ИИ сможет работать над задачами неделями. В блоге описаны три возможных сценария: стагнация роста, ускорение с сохранением человеческого контроля или полная рекурсивная самоитерация (RSI), когда ИИ начнет создавать следующее поколение ИИ самостоятельно. Anthropic выражает озабоченность по поводу выравнивания (alignment) и заявляет о готовности замедлить или приостановить работу при наличии проверяемого механизма, гарантирующего, что все лаборатории последуют их примеру. Открытие последовало за похожим заявлением OpenAI, что указывает на растущую актуальность темы саморазвития ИИ в отрасли.

marsbit06/05 00:28

Внезапно! Anthropic призывает всех приостановить исследования в области ИИ

marsbit06/05 00:28

Только что выпущен Claude Opus 4.8, который с порога заявляет, что он — DeepSeek, Qwen

Только что Anthropic представила новую модель Claude Opus 4.8, обновив свой флагманский продукт. Модель показывает улучшения в программировании, рассуждениях, работе в качестве агента и обработке знаний, сохраняя прежнюю стоимость. Главный акцент сделан на надёжности в длительных и сложных задачах, а также на повышенной честности — модель чаще указывает на неопределённости и риски в коде. Одновременно Anthropic объявила о завершении раунда финансирования H на 650 миллиардов долларов, оценив компанию в 9650 миллиардов. Эти средства, а также партнёрства с Amazon, Google, Broadcom и SpaceX, направлены на расширение вычислительных мощностей для поддержки растущих потребностей Claude. Ключевым нововведением стал запуск dynamic workflows в Claude Code, позволяющий автоматически координировать множество подпроцессов (subagents) для масштабных задач, таких как миграция кода или аудит безопасности, что значительно ускоряет выполнение сложных инженерных проектов. Anthropic трансформируется из компании, предлагающей модели ИИ, в платформу, интегрирующую интеллект, инструменты, среду разработки и облачные ресурсы в единую инфраструктуру для корпоративного использования.

marsbit05/28 23:58

Только что выпущен Claude Opus 4.8, который с порога заявляет, что он — DeepSeek, Qwen

marsbit05/28 23:58

Информированные источники: DeepSeek формирует команду Harness для конкуренции с Claude Code

По информации из источников, близких к DeepSeek, компания формирует новую команду **Harness** для разработки продукта в области интеллектуальных агентов для программирования, который будет напрямую конкурировать с **Claude Code** от Anthropic. Это подтвердил старший научный сотрудник DeepSeek Чэнь Дэли. DeepSeek открывает ключевые вакансии: менеджер продукта и инженер-разработчик для Harness. В описании позиций представлена ключевая формула: **Model + Harness = Agent**. Это отражает видение компании: сама модель является лишь основой агента, а реальную ценность и возможность интеграции в рабочий процесс обеспечивает Harness — система, отвечающая за управление контекстом, вызов инструментов, планирование задач, чтение/запись файлов, выполнение кода в терминале и сбор обратной связи. Цель DeepSeek — не просто создать плагин-помощник для IDE, а построить критически важный промежуточный слой, который свяжет мощную модель с реальными инженерными рабочими процессами разработчиков. Ключевая задача Harness-команды — не только создать продукт, но и обеспечить совместную эволюцию модели и её "узды", превращая реальные задачи в источник данных для улучшения модели. Ранее в сообществе разработчиков набрал популярность сторонний opensource-проект **DeepSeek-TUI**, который по сути стал неофициальной версией "DeepSeek-Code". Его успех показал, что существует спрос на такой продукт, а модель DeepSeek имеет необходимый потенциал. Теперь компания намерена официально выйти на этот рынок, используя свои преимущества: прямой доступ к команде разработки моделей, возможность создания замкнутого цикла данных для обучения и долгосрочное развитие экосистемы. Война моделей сменяется войной агентов, и DeepSeek намерена дать своей модели "руки" для работы в реальном мире.

链捕手05/22 02:16

Информированные источники: DeepSeek формирует команду Harness для конкуренции с Claude Code

链捕手05/22 02:16

Тестирование Hunyuan Hy3 preview: ИИ от Tencent наконец-то стал конкурентоспособным?

Анонсирована новая языковая модель Tencent Hunyuan Hy3 preview с архитектурой смешанных экспертов, поддерживающая контекст до 256K токенов. Модель демонстрирует улучшенные возможности в сложных рассуждениях, генерации кода и работе с контекстом, при этом стоимость использования снижена до 1,2 юаня за миллион токенов. Тестирование выявило сильные стороны в логическом анализе и обработке сложных инструкций, но отметило недостатки в распознавании ловушек в задачах и устойчивости ответов. В генерации кода и работе агента модель показала себя компетентной в стандартных задачах, но испытывала трудности с глубоким анализом в открытых вопросах. В естественных диалогах и творческом письме Hy3 preview проявила способность создавать связные и стилистически адаптированные тексты, уменьшив характерный "ИИ-привкус". Модель позиционируется как практичный инструмент с сбалансированной производительностью, знаменующий прогресс Tencent в развитии ИИ после ранее признанного отставания. Текущая версия является превью, ожидаются более масштабные релизы в будущем.

marsbit04/26 07:19

Тестирование Hunyuan Hy3 preview: ИИ от Tencent наконец-то стал конкурентоспособным?

marsbit04/26 07:19

Интегрирует ли SWIFT XRP для платежей? Ответ может скрываться в коде

Криптоэксперт SMQKE высказал предположение, что SWIFT может интегрировать XRP для платежей. Он сослался на код в базе R3 Corda, который связывает XRP со стандартом ISO 20022 и SWIFT. Поскольку XRP совместим с ISO 20022, а SWIFT работает по этим стандартам, Ripple технически может установить прямое соединение между учреждениями SWIFT и реестром XRP Ledger. В коде обнаружены модули с названиями XrpPayment и SWIFTPaymentStatusType, что указывает на возможную интеграцию. Однако официального подтверждения от SWIFT пока не было. Ранее SWIFT заявлял о планах запустить собственный распределенный реестр, а не использовать XRP. Параллельно X (ранее Twitter) запустил функцию cashtags для XRP и других криптоактивов, что упрощает отслеживание их цен и обсуждений на платформе. На момент написания статьи цена XRP составляла около $1,40, показав рост более 3% за сутки.

bitcoinist04/16 22:04

Интегрирует ли SWIFT XRP для платежей? Ответ может скрываться в коде

bitcoinist04/16 22:04

Anthropic тестирует «лобстера» Conway: поддержка независимого UI, вебхуков для активации и стандарта пользовательских расширений

Anthropic разрабатывает постоянный агент Conway для Claude, обеспечивающий автономную работу в виде независимого интерфейса. Агент способен управлять браузером, подключаться к внешним сервисам и интегрировать возможности Claude Code для выполнения сложных операций. Conway поддерживает вызов через Webhook, что позволяет автоматизировать реакции на внешние события. Также вводится стандарт CNW ZIP, позволяющий разработчикам создавать расширения — пользовательские инструменты, вкладки и обработчики контекста, формируя экосистему по типу магазина приложений. Это превращает Claude из чат-инструмента в постоянно активного помощника, способного выполнять многошаговые задачи, что усиливает конкуренцию в области ИИ-агентов.

marsbit04/02 06:31

Anthropic тестирует «лобстера» Conway: поддержка независимого UI, вебхуков для активации и стандарта пользовательских расширений

marsbit04/02 06:31

AI Agent выдает мусор? Проблема в том, что вы жалеете токены

Основной тезис статьи: качество вывода AI Agent напрямую зависит от количества использованных токенов. Автор утверждает, что увеличение объёма вычислений (токенов) снижает количество ошибок, аналогично тому, как дополнительные временные затраты улучшают результаты человеческой работы. Ключевые идеи: 1. Сложные задачи (напр., написание кода с множеством компонентов) решаемы при достаточном бюджете токенов 2. Исключение — принципиально новые проблемы, отсутствующие в обучающих данных: здесь токены бессильны 3. Практические методы улучшения: - Многократный автономный анализ кода (WAIT) - Ранняя и частая верификация работы через тесты и инструменты (VERIFY) Вывод: инвестиции в токены повышают качество решений, но требуют экспертного руководства в инновационных задачах.

marsbit03/23 06:15

AI Agent выдает мусор? Проблема в том, что вы жалеете токены

marsbit03/23 06:15

活动图片