# Сопутствующие статьи по теме Генерация кода

Новостной центр HTX предлагает последние статьи и углубленный анализ по "Генерация кода", охватывающие рыночные тренды, новости проектов, развитие технологий и политику регулирования в криптоиндустрии.

Первый набор данных для обучения Doc2Repo на длинных последовательностях: Code Agent не только исправляет ошибки, но и начинает создавать репозитории

С развитием LLM Code Agent исследователи начинают переходить к более сложным задачам, приближенным к реальным сценариям, таким как генерация целого репозитория кода с нуля. Команда из Института искусственного интеллекта Гаолинь Китайского народного университета представила новый набор данных DeNovoSWE, предназначенный для длительных задач в области программной инженерии, особенно для создания репозиториев на уровне кода. DeNovoSWE использует методологию «Разделяй и властвуй» (Divide & Conquer) и механизм «Критика и исправление» (Critic & Repair) для создания высококачественных данных. Набор содержит 4 818 реальных примеров задач, что предоставляет масштабные данные для обучения Code Agent выполнению длительных операций. Эксперименты показали, что модель Qwen3-30B-A3B-Instruct, обученная на DeNovoSWE, значительно улучшила свои показатели: с 5,8% до 47,2% на BeyondSWE-Doc2Repo и с 4,3% до 23,0% на NL2RepoBench. Ключевая сложность задачи заключается в том, что агент должен воссоздать весь репозиторий, начиная только с документации, в очищенной среде без исходного кода, тестов и потенциальных утечек. Это требует навыков планирования архитектуры, создания модулей, определения API и обработки зависимостей. DeNovoSWE структурирует документацию по ключевым возможностям (capabilities) репозитория, обеспечивая ясность, полноту и соответствие критериям оценки. Результаты подтверждают, что данные, ориентированные на длительные задачи генерации репозиториев, более эффективны для развития соответствующих способностей Code Agent по сравнению с данными, сфокусированными только на исправлении ошибок. DeNovoSWE закладывает основу для следующего этапа развития код-агентов, способных понимать требования, планировать и создавать целые рабочие программные проекты.

marsbit2 дня назад 08:52

Первый набор данных для обучения Doc2Repo на длинных последовательностях: Code Agent не только исправляет ошибки, но и начинает создавать репозитории

marsbit2 дня назад 08:52

Или фуллстек, или провал: Истинные цели покупки Cursor xAI за 600 миллиардов долларов

**Аннотация:** Статья анализирует стратегическую сделку на сумму 600 млрд долларов, в рамках которой xAI (дочерняя компания SpaceX) приобрела Anysphere, создателя инструмента для ИИ-программирования Cursor. Автор, партнер венчурного фонда Tara Tan, утверждает, что истинная цель приобретения — не доля рынка Cursor (которая снижается), а доступ к высококачественным данным для обучения, которые генерируют 7 миллионов разработчиков, ежедневно использующих платформу. Эти данные, особенно из области программирования, считаются чрезвычайно ценными для улучшения модели xAI Grok. На примере стремительного роста Anthropic (выручка выросла в 540 раз за 28 месяцев во многом благодаря продукту Claude Code) автор обосновывает ключевую тезу: чтобы стать крупным игроком в сфере ИИ, компания должна строить **полноценный стек (full-stack)**, объединяющий вычислительные мощности (инфраструктуру), базовую модель и конечные приложения. Такой подход создает замкнутый цикл: лучшие приложения приносят больше уникальных данных для обучения, что улучшает модель и инфраструктуру, что, в свою очередь, улучшает пользовательский опыт и экономику модели. Это также создает конкурентный барьер за счет уникальных данных и блокировки рабочих процессов пользователей. Автор прогнозирует, что в ближайшие годы компании-разработчики моделей будут либо активно развивать собственные приложения, либо агрессивно скупать компании на уровне приложений, чтобы завершить свой стек и обеспечить устойчивое конкурентное преимущество.

marsbit06/18 09:42

Или фуллстек, или провал: Истинные цели покупки Cursor xAI за 600 миллиардов долларов

marsbit06/18 09:42

До AGI остался последний шаг

В июне 2026 года Anthropic представила мощную модель Fable 5, доступную широкой публике, и ее еще более продвинутую версию Mythos 5, доступную только избранным организациям. Fable 5 демонстрирует исключительные возможности в области автоматизированного программирования, самостоятельно выполняя сложные многоэтапные задачи, такие как миграция огромных кодовых баз, что указывает на достижение уровня AGI в цифровой экономике. Модель классифицируется как "Уровень 3" (интеллектуальный агент) по шкале OpenAI и быстро движется к "Уровню 4" (новатор). Однако внутренняя версия Mythos 5 показала опасные возможности, включая потенциальное содействие в создании биологического или химического оружия и генерацию эксплойтов для кибератак. Для предотвращения злоупотреблений Anthropic внедрила в Fable 5 систему классификации для фильтрации опасных запросов и обязательное 30-дневное хранение данных. Несмотря на высокую стоимость использования, ожидается, что спрос со стороны корпоративных клиентов, особенно в сфере кибербезопасности, останется высоким. Это знаменует переход рынка ИИ в зрелую фазу, где передовые технологии становятся стратегическим активом для бизнеса и обороны, потенциально приводя к росту "компаний одного человека" и трансформации рынка труда.

marsbit06/11 05:12

marsbit06/11 05:12

Посттренировочный инженер OpenAI Вэн Цзяи предложил новую парадигмальную гипотезу для Agentic AI

OpenAI-инженер Вэн Цзяи выдвинул новую концепцию «Эвристического обучения» (HL), предполагая, что AI может совершенствоваться не только за счет увеличения параметров нейронных сетей, но и посредством автономного редактирования кода. В своем эксперименте он использовал Codex (на базе GPT-5.4) для создания и итеративного улучшения программных стратегий на основе правил для игр Atari (например, Breakout) и сред робототехники MuJoCo. Система анализировала логи, видео-повторы и ошибки, самостоятельно внося изменения в код, тесты и конфигурации, что позволило достичь максимального счета в Breakout и результатов, сопоставимых с алгоритмами глубокого обучения с подкреплением. Ключевая идея заключается в том, что «опыт» фиксируется в виде интерпретируемого программного обеспечения (эвристической системы — HS), а не только в неявных весах нейросети. Это может открыть новые возможности в областях, где важны прозрачность, безопасность и инженерная поддерживаемость, например, в робототехнике и критически важных системах. HL предлагает альтернативный путь, где обучение происходит через цикл обратной связи с агентом, способным писать и изменять код, хотя его применимость ограничена задачами, которые можно выразить программно. Эксперимент указывает на потенциальный симбиоз нейронных сетей (System 1) для восприятия и HL для логики, управляемой кодом, с LLM (System 2) в роли координатора.

marsbit05/11 00:20

Посттренировочный инженер OpenAI Вэн Цзяи предложил новую парадигмальную гипотезу для Agentic AI

marsbit05/11 00:20

Восьмилетние заметки предпринимателя, партнера a16z по направлению ИИ

Сооснователь Rosebud AI, который сейчас стал партнером a16z по инвестициям в ИИ, делится восьмилетним опытом работы в области генеративного ИИ. В 2018 году, до появления GPT, он начал разрабатывать инструменты для творчества на основе ИИ, такие как TokkingHeads, с целью сделать процесс создания контента таким же простым, как игра. Несмотря на несовершенство ранних моделей, таких как CycleGAN и StyleGAN, его команда смогла создать продукты, которые привлекли миллионы пользователей за счет удобного дизайна и интерактивности. С развитием технологий, особенно после выхода GPT-4, возможности генерации кода и контента значительно улучшились, что открыло новые горизонты для творческих инструментов. Автор подчеркивает, что ключевым моментом сейчас является не только технология, но и то, как ее продуктивно использовать, коммерциализировать и интегрировать в реальные продукты. Переходя в a16z, он планирует сосредоточиться на инвестициях в передовые модели ИИ и инфраструктуру, поддерживая основателей, которые строят будущее в этой области. Он уверен, что генеративный ИИ входит в новую фазу, где главное — не что может сделать технология, а как ее применять.

marsbit04/26 12:04