Первый набор данных для обучения Doc2Repo на длинных последовательностях: Code Agent не только исправляет ошибки, но и начинает создавать репозитории

marsbitОпубликовано 2026-06-25Обновлено 2026-06-25

Введение

С развитием LLM Code Agent исследователи начинают переходить к более сложным задачам, приближенным к реальным сценариям, таким как генерация целого репозитория кода с нуля. Команда из Института искусственного интеллекта Гаолинь Китайского народного университета представила новый набор данных DeNovoSWE, предназначенный для длительных задач в области программной инженерии, особенно для создания репозиториев на уровне кода. DeNovoSWE использует методологию «Разделяй и властвуй» (Divide & Conquer) и механизм «Критика и исправление» (Critic & Repair) для создания высококачественных данных. Набор содержит 4 818 реальных примеров задач, что предоставляет масштабные данные для обучения Code Agent выполнению длительных операций. Эксперименты показали, что модель Qwen3-30B-A3B-Instruct, обученная на DeNovoSWE, значительно улучшила свои показатели: с 5,8% до 47,2% на BeyondSWE-Doc2Repo и с 4,3% до 23,0% на NL2RepoBench. Ключевая сложность задачи заключается в том, что агент должен воссоздать весь репозиторий, начиная только с документации, в очищенной среде без исходного кода, тестов и потенциальных утечек. Это требует навыков планирования архитектуры, создания модулей, определения API и обработки зависимостей. DeNovoSWE структурирует документацию по ключевым возможностям (capabilities) репозитория, обеспечивая ясность, полноту и соответствие критериям оценки. Результаты подтверждают, что данные, ориентированные на длительные задачи генерации репозиториев, более эффективны для развит...

С постоянным улучшением возможностей LLM Code Agent всё больше исследователей осознают, что настало время перейти к следующему этапу — более длинным задачам, приближенным к реальным сценариям. В результате появились некоторые бенчмарки для оценки длинных задач, такие как NL2RepoBench и BeyondSWE. Ожидаемая роль Code Agent постепенно меняется от сопроводителя репозитория к архитектору, способному планировать и выполнять длинные задачи по генерации всего кода в репозитории.

Недавно Высшая школа искусственного интеллекта имени Гаолиня при Народном университете Китая завершила соответствующее исследование и с большим размахом выпустила набор данных DeNovoSWE, специализирующийся на длинных задачах программной инженерии, особенно на задачах генерации кода уровня репозитория с нуля.

Ссылка на статью: https://arxiv.org/pdf/2606.10728

Ссылка на репозиторий: https://github.com/AweAI-Team/DeNovoSWE

Ссылка на данные: https://huggingface.co/collections/AweAI-Team/denovoswe

Используя механизмы Divide & Conquer и Critic & Repair для создания высококачественного набора данных, а также успешно реализовав масштабирование длинных задач SWE, был построен открытый набор данных высокого качества для длинных задач SWE, содержащий 4,818 реальных записей. Этот результат предоставляет Code Agent масштабные данные для обучения длинным задачам, значительно повышая его способности в выполнении длинных задач.

В статье также предоставлены методы фильтрации на основе оценки сложности задач, что эффективно смягчает проблему компромисса между долей сложных задач и качеством траекторий.

Эксперименты показывают, что Qwen3-30B-A3B-Instruct, обученная на DeNovoSWE, повысила свои результаты на BeyondSWE-Doc2Repo с 5,8% до 47,2%, а на NL2RepoBench — с 4,3% до 23,0%, демонстрируя значительное улучшение способностей к генерации кода уровня репозитория благодаря длинным данным.

Восстановление всего репозитория, начиная с одного документа

За прошедший год, с масштабированием крупномасштабных данных SWE в работах, подобных Scale-SWE, код-агенты быстро прогрессировали в решении реальных задач программной инженерии, таких как SWE-bench. Но по мере того, как модели становятся всё лучше в «исправлении одного issue» или «изменении нескольких строк кода для устранения бага», возникает более ключевой вопрос: Действительно ли агенты обладают способностями к длинной программной инженерии? Судя по результатам передовых моделей на BeyondSWE-Doc2Repo и NL2RepoBench, эффект не идеален.

Разработка программного обеспечения в реальном мире часто не сводится к изменению одной функции или добавлению одного условного оператора. Она включает понимание требований, планирование архитектуры, создание файлов, проектирование API, обработку зависимостей, интеграцию модулей и, в конечном итоге, обеспечение работы всего репозитория при тестировании.

Другими словами, сложность заключается в long-horizon repository-level generation: начав с одного документа с заданием, сгенерировать целый, исполняемый, проверяемый программный репозиторий. Именно эту проблему и решает DeNovoSWE.

Высококачественные документы-задания для «создания репозитория с нуля»

В задачах document-to-repository generation документ — это не просто README и не простой список API. По сути, он является единственной точкой входа для агента, восстанавливающего весь репозиторий.

Высококачественный документ-задание должен удовлетворять по крайней мере двум ключевым критериям.

Во-первых, он должен быть хорошо структурирован.

Задачи уровня репозитория по своей природе сложны, включая множество модулей, интерфейсов, конфигураций, структур данных и рабочих процессов взаимодействия. Если документ просто перечисляет описания функций, агенту легко запутаться в фрагментарной информации. Поэтому документ должен сначала давать чёткий обзор репозитория, затем разделяться на главы по функциональным возможностям или рабочим процессам, чтобы каждая часть соответствовала чёткой функциональной границе.

Во-вторых, он должен исходить из надёжной оценки (evaluation).

Документ не может быть слишком кратким, иначе задача становится недоопределённой, что может заставить модель гадать наугад, чтобы пройти evaluation; но и не может быть слишком подробным, иначе напрямую раскроются детали реализации, лишив задачу сложности.

По-настоящему высококачественный документ должен описывать ключевое поведение, на которое опирается evaluation: включая пути импорта (import path), публичные API, входы и выходы, параметры по умолчанию, поведение при исключениях, параметры конфигурации, шаблоны строк, возвращаемые поля, а также описывать в общих чертах функции, которые необходимо реализовать. Другими словами, документа должно быть достаточно, чтобы агент смог воспроизвести проверяемое поведение, но не настолько, чтобы она превратилась в копию реализующего кода.

Это и есть основная идея DeNovoSWE: сделать документ читаемым, реализуемым и проверяемым.

Метод DeNovoSWE

DeNovoSWE формулирует задачу «генерации полного репозитория из документа» как крупномасштабную, проверяемую длинную задачу программной инженерии. Это не ручное написание документа, а автоматическое построение высококачественных экземпляров с помощью sandboxed multi-agent workflow. Весь метод можно обобщить в два шага: Разделяй (Divide) и Властвуй (Conquer).

На этапе Divide система сначала анализирует целевой репозиторий, разбивая его на несколько repository capabilities (возможностей репозитория).

Каждая capability соответствует основной возможности или рабочему процессу в репозитории, например, аутентификация и подключение, чтение-запись данных, пакетная обработка, процесс экспорта и т.д. Таким образом, изначально большая проблема генерации репозитория разбивается на несколько структурно ясных глав документа.

Одновременно DeNovoSWE запускает оригинальные модульные тесты и собирает трассировку выполнения, определяя, какие функции, классы и интерфейсы действительно влияют на evaluation, далее различая direct components (прямые компоненты), core indirect components (основные косвенные компоненты) и non-core indirect components (неосновные косвенные компоненты): интерфейсы, вызываемые напрямую из тестов, должны быть подробно задокументированы; основные косвенные компоненты, влияющие на наблюдаемое поведение, также должны быть охвачены; а неосновные внутренние реализации могут быть оставлены на усмотрение агента.

На этапе Conquer DeNovoSWE использует механизм Draft-Critic-Repair для генерации документа по каждой возможности. Agent Draft сначала пишет черновик; Agent Critic проверяет, не упущены ли в документе ключевые API, контракты поведения или структурная информация; Agent Repair затем исправляет документ на основе обратной связи. Этот цикл повторяется до тех пор, пока каждая глава о возможности не станет достаточно ясной, полной и соответствующей evaluation.

В итоге документы по разным возможностям объединяются в один полный документ-задание, который служит единственной основой для генерации репозитория агентом с нуля.

Сложность: почему это длинная задача?

Сложность задач DeNovoSWE проистекает из фундаментального изменения: это уже не исправление на уровне issue (issue-level fixing), а генерация всего репозитория (whole-repository generation).

В традиционных задачах SWE агент обычно имеет дело с существующим репозиторием, ему нужно лишь локализовать ошибку, изменить локальный код и пройти тесты.

В DeNovoSWE агент сталкивается с очищенной средой: исходный код и тесты удалены, история git сброшена, потенциальные каналы утечки, такие как кеш, остатки в site-packages, pip wheel, временные компиляционные артефакты и т.д., также очищаются. Это означает, что агент должен действительно полагаться на документ для восстановления всего репозитория. Ему необходимо планировать структуру проекта, создавать модульные файлы, определять публичные интерфейсы, реализовывать межфайловое взаимодействие, обрабатывать зависимости и конфигурации, а также постоянно исправлять ошибки в процессе многократных редактирований и обратной связи от тестов.

Любое отклонение в сигнатуре API, возвращаемых полях, типах исключений или поведении по умолчанию может привести к провалу тестов. Ошибки также накапливаются в течение длительного процесса: непродуманный модуль на раннем этапе может повлиять на несколько последующих файлов и цепочек вызовов.

Для дальнейшей обработки различий в сложности репозиториев DeNovoSWE также предлагает difficulty-aware trajectory filtering (фильтрацию траекторий с учётом сложности). Проще говоря, для лёгких задач следует требовать более высокого процента прохождения, в то время как сложные задачи не должны отбрасываться полностью только из-за неидеального результата. DeNovoSWE устанавливает разные пороги фильтрации для разных интервалов сложности на основе структурной сложности и оценки сложности LLM, достигая баланса между качеством и разнообразием.

Это особенно важно для длинных задач: чем сложнее репозиторий, тем труднее пройти все тесты с первого раза, но трудные репозитории, траектории с низкими баллами или частично успешные траектории всё равно содержат ценную информацию о способностях к длинному планированию и реализации.

Результаты эксперимента

В конечном итоге DeNovoSWE построил 4818 высококачественных экземпляров задач document-to-repository. Это исполняемая, оцениваемая, обучаемая среда для длинных задач программной инженерии.

Результаты эксперимента показывают, что DeNovoSWE приносит значительное улучшение способностей моделей к генерации длинных репозиториев. На модели Qwen3-30B-A3B-Instruct исходная модель показывала результат только 5,8% на BeyondSWE-Doc2Repo и 4,3% на NL2RepoBench. Scale-SWE-Agent, обученный на обычных данных SWE уровня issue, может улучшить результаты до 29,2% и 18,3%, что демонстрирует некоторый перенос обычных данных SWE. Но когда модель обучалась на DeNovoSWE, производительность дополнительно повысилась до 47,2% и 23,0% соответственно.

Это указывает на то, что данные, ориентированные на «исправление багов», не могут полностью заменить длинные данные, ориентированные на «генерацию полного репозитория». Чтобы агент действительно научился repository-level engineering, необходимо строить среду обучения, специально предназначенную для длинных задач.

На более мощной базовой модели Qwen3.5-35B-A3B DeNovoSWE также приносит стабильный прирост: BeyondSWE-Doc2Repo повысился с 43,8% до 50,0%, а NL2RepoBench — с 23,5% до 27,1%. Это дополнительно подтверждает, что прирост от DeNovoSWE не является случайной адаптацией к одной конкретной модели, а обусловлен самим высококачественным длинным набором данных.

Заключение

Следующий этап для код-агентов — не только быстрее исправлять отдельные issues, но и уметь понимать документацию, планировать архитектуру, организовывать модули, реализовывать интерфейсы и в конечном итоге генерировать целый, работающий программный репозиторий.

DeNovoSWE систематически превращает эту цель в обучаемый, проверяемый, масштабируемый набор данных. Он даёт ответ на ключевой вопрос: какие данные действительно могут обучить агента, обладающего способностями к длинной программной инженерии?

Ответ — не в большем количестве фрагментированного кода или более простых заданиях, а в высококачественных, структурированных, соответствующих оценке (evaluation-aligned), защищённых от утечек (anti-leakage) задачах генерации полного репозитория.

Начать с одного документа и восстановить весь репозиторий. Это порог, который необходимо преодолеть длинным код-агентам.

Источники: https://arxiv.org/pdf/2606.10728

Данная статья из WeChat официального аккаунта «新智元», редактор: LRST

Трендовые криптовалюты

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

BrevisBREV

ZRX（0X）ZRX

Связанные с этим вопросы

QЧто такое DeNovoSWE и какую основную проблему в области разработки программного обеспечения с помощью ИИ он решает?

ADeNovoSWE - это набор данных (датасет), сфокусированный на задачах долгосрочной программной инженерии, особенно на создании целых репозиториев кода с нуля. Он решает ключевую проблему перехода Code Agent (код-агентов) от простого исправления багов к выполнению долгосрочных, сложных задач уровня всего репозитория - генерации работающего программного обеспечения на основе технического задания (документации).

QКакие два основных принципа использовались при создании высококачественных данных в DeNovoSWE?

AПри создании DeNovoSWE использовались два ключевых механизма: 1) **Divide & Conquer (Разделяй и властвуй)**: сложная задача генерации репозитория разбивается на более мелкие, структурированные подзадачи (возможности репозитория). 2) **Critic & Repair (Критика и исправление)**: используется многоагентный рабочий процесс, где один агент создает черновик документации, второй (критик) проверяет его полноту и соответствие оценке, а третий вносит исправления. Этот цикл повторяется до достижения высокого качества.

QКакие два основных критерия определяют высококачественное техническое задание (документ) для задачи генерации репозитория согласно исследованию?

AВысококачественный документ-задание должен удовлетворять двум критериям: 1) **Быть хорошо структурированным (Well-organized)**: иметь четкий обзор и разделение на главы по функциональным возможностям, чтобы агент не терялся в碎片рной информации. 2) **Ориентироваться на надежную оценку (Evaluation-aligned)**: документ должен описывать ключевое поведение, необходимое для прохождения тестов (API, входы/выходы, исключения), но не раскрывать детали реализации, оставляя простор для творчества агента.

QКакой значительный прогресс показала модель Qwen3-30B-A3B-Instruct после обучения на DeNovoSWE по сравнению с исходной версией?

AПосле обучения на наборе данных DeNovoSWE производительность модели Qwen3-30B-A3B-Instruct значительно возросла на двух бенчмарках долгосрочных задач: на **BeyondSWE-Doc2Repo** результат улучшился с 5.8% до 47.2%, а на **NL2RepoBench** - с 4.3% до 23.0%. Это демонстрирует, что специализированные данные для генерации целых репозиториев гораздо эффективнее развивают соответствующие способности у Code Agent, чем данные только для исправления ошибок.

QПочему задачи в DeNovoSWE считаются "долгосрочными" (long-horizon) и в чем их основная сложность?

AЗадачи считаются долгосрочными, потому что это не исправление одного бага (issue-level fixing), а **генерация целого репозитория с нуля (whole-repository generation)**. Сложность заключается в том, что агент должен: планировать архитектуру, создавать множество взаимосвязанных файлов, определять публичные интерфейсы, обрабатывать зависимости и конфигурации, а также последовательно исправлять ошибки в длинной цепочке действий. Окружение "очищается" от исходного кода, истории и артефактов, поэтому агент полагается исключительно на документ-задание. Ошибки могут накапливаться, а любое отклонение в API или поведении приводит к провалу тестов.

Похожее

Tide Investment: Мы по-прежнему оптимистично оцениваем цепочку создания стоимости ИИ, но причины изменились

Авторы из Tide Investment по-прежнему оптимистично смотрят на цепочку поставок ИИ, но их аргументация изменилась. По состоянию на середину 2026 года крупные технологические компании, такие как Alphabet, Amazon, Meta, Microsoft и Oracle, значительно увеличили свои капитальные затраты (Capex) на инфраструктуру ИИ, причем их планы на 2026 год только растут. Это указывает на продолжение инвестиционного цикла, а не на его пик. Ключевое отличие текущего этапа — смещение узких мест от чипов к более фундаментальным физическим ограничениям: электроснабжению, трансформаторам, сетевым мощностям и системам охлаждения. Расширение этих мощностей требует много времени и сложной координации, что делает цикл инвестиций более продолжительным и устойчивым по сравнению с прошлыми циклами в области аппаратного обеспечения. Рынок беспокоится о двух вещах: во-первых, что рост Capex опережает рост доходов, ставя под вопрос окупаемость инвестиций (ROI); во-вторых, о возможности повторения пузыря доткомов 2000 года. Авторы считают, что эти опасения преувеличены. Исторически облачные платформы проходили через фазы высоких Capex перед масштабированием и монетизацией. Более того, в отличие от легко избыточных мощностей, созданных во время бума телекоммуникаций, текущие физические ограничения в энергетике и сетях предотвратят стремительный коллапс из-за перепроизводства. Таким образом, несмотря на волатильность рынка и крупные раунды финансирования, текущая фаза представляет собой не конец, а переход к следующему, более сложному этапу развития инфраструктуры ИИ, который будет характеризоваться длительными инвестициями в преодоление физических ограничений.

marsbit1 ч. назад

Tide Investment: Мы по-прежнему оптимистично оцениваем цепочку создания стоимости ИИ, но причины изменились

marsbit1 ч. назад

Инвестиции Tidal: Мы по-прежнему оптимистично смотрим на цепочку создания стоимости ИИ, но причины изменились

**Приливные инвестиции: Мы по-прежнему оптимистично оцениваем цепочку поставок ИИ, но причины изменились** Рынок ИИ вступает в новую фазу. Если раньше главными были воображение и взрывной спрос, то сейчас ключевой вопрос — как долго продлится эта невероятная интенсивность капиталовложений. Несмотря на опасения инвесторов, вызванные масштабными IPO (SpaceX, OpenAI, Anthropic) и крупными планами финансирования гигантов (Alphabet, Meta), данные указывают, что цикл инвестиций далек от завершения. Пять основных облачных провайдеров (Alphabet, Amazon, Meta, Microsoft, Oracle) не просто продолжают инвестировать, а агрессивно наращивают капитальные затраты (Capex) на 2026 год, доводя их до сотен миллиардов долларов каждый. Эта «гонка вооружений» уже заставляет даже самых платежеспособных игроков пересматривать структуру капитала. Почему этот цикл может быть более устойчивым, чем предыдущие аппаратные циклы? Инвестиции теперь уходят гораздо глубже, в физическую инфраструктуру: энергоснабжение, трансформаторы, охлаждение, сети. Узкие места смещаются от чипов к элементам, расширение которых требует многих лет (например, подключение к электросетям). Заказы компаниям, таким как Eaton (энергораспределение), взлетели на сотни процентов, что подтверждает реальные темпы строительства. Рынок справедливо беспокоится о двух вещах: 1. **ROI (окупаемость инвестиций):** Рост Capex опережает рост выручки, что давит на свободный денежный поток. Однако история облачных вычислений показывает, что фаза масштабных инвестиций с последующей монетизацией — это стандартная модель. 2. **Пузырь, как в 2000-х:** Ключевое отличие — в природе предложения. В отличие от оптоволокна, которое можно было проложить с запасом, электроснабжение и тяжелое энергооборудование невозможно «предварительно установить» на десятилетия вперед. Их создание — долгий и регулируемый процесс, что предотвращает лавинообразное перепроизводство. Вывод: Текущая волна финансирования — не признак пика, а необходимое условие для следующего акта. Игра продолжается, но сменился сценарий: теперь это история о преодолении физических ограничений и долгосрочной монетизации колоссальных инфраструктурных вложений. Пока не появятся сигналы о снижении Capex или провале монетизации ИИ-сервисов, основания для пессимизма преждевременны.

链捕手1 ч. назад

Инвестиции Tidal: Мы по-прежнему оптимистично смотрим на цепочку создания стоимости ИИ, но причины изменились

链捕手1 ч. назад

Grayscale: эти 15 прибыльных криптопротоколов сильно недооценены

**Grayscale Research:** 15 высокодоходных криптопротоколов, стоимость которых серьезно недооценена Согласно отчету Grayscale Research, многие криптопротоколы с реальными доходами, пережив медвежий рынок, сейчас выглядят фундаментально дешевыми. Из 15 ведущих протоколов по доходности (включая Hyperliquid) большинство торгуется с низкой доходной мультипликацией (Price-to-Sales) в пределах однозначных цифр, а некоторые — всего в 1x. В «клуб 1x», где рыночная капитализация примерно равна годовому доходу, входят: Pump.fun (PUMP, $459 млн дохода), PancakeSwap (CAKE, $322 млн), Meteora (MET, $62 млн) и Collector Crypt (CARDS, $49 млн). Другие протоколы, такие как Raydium (RAY, 3x), Lido Finance (LDO, 3x), Aerodrome (AERO, 4x), Aave (AAVE, 9x) и Jupiter (JUP, 6x), также торгуются с низкими мультипликаторами. В то же время Uniswap (UNI) имеет высокую мультипликацию 37x, что отражает ценность его прав управления и потенциального включения механизма распределения комиссий, а не текущие денежные потоки. Ключевым потенциальным катализатором для переоценки, по мнению Grayscale, может стать принятие закона CLARITY Act, который установит четкие правила для цифровых активов и, вероятно, откроет путь институциональному капиталу в DeFi-сектор. Большинство протоколов в списке относятся именно к финансовому сектору (DEX, кредитование, стейкинг). Важное замечание: Grayscale, как управляющая активами компания, заинтересована в притоке инвестиций в криптосектор. Хотя данные об оценке проверяемы, выводы следует рассматривать с учетом этой позиции. Реализация сценария зависит от фактического принятия закона и последующего притока институциональных средств.

marsbit1 ч. назад

Grayscale: эти 15 прибыльных криптопротоколов сильно недооценены

marsbit1 ч. назад

Ripple запускает RLUSD в Японии на фоне растущей динамики расширения регулируемых стейблкоинов

Ripple официально выводит стабильную монету RLUSD на японский рынок после получения одобрения от Агентства финансовых услуг Японии. RLUSD теперь доступен институциональным и розничным инвесторам на платформе SBI VC Trade (VCTRADE). Запуск осуществляется в рамках регулирования типа «Электронное платежное средство 4», что позволяет лицензированным финансовым институтам распространять стабильную монету, обеспеченную долларовыми депозитами, казначейскими обязательствами и аналогичными активами. Япония, как рынок с четкими правилами для цифровых активов, становится ключевым для Ripple. Партнерство с SBI Group, длящееся с 2016 года, направлено на развитие кросс-платежей, токенизации и управления залогами. SBI VC Trade обеспечит бесплатное пополнение и вывод RLUSD, повышая его доступность. Запущенная в конце 2024 года RLUSD быстро выросла до рыночной капитализации около $1,7 млрд, став второй долларовой стабильной монетой на SBI VC Trade после USD Coin. Этот шаг расширяет глобальную платежную инфраструктуру Ripple и демонстрирует его приверженность работе с регулируемыми стабильными монетами.

TheNewsCrypto1 ч. назад

Ripple запускает RLUSD в Японии на фоне растущей динамики расширения регулируемых стейблкоинов

TheNewsCrypto1 ч. назад

Личная алхимия богатства Сэма Олтмана: инвестиции в 400 компаний, более 10 из которых тесно связаны с OpenAI

**Сэм Олтман: как личное инвестирование связано с OpenAI** Сэм Олтман, генеральный директор OpenAI, создал значительное личное состояние, инвестировав примерно в 400 стартапов, в то время как он не владеет прямыми акциями самой OpenAI. По крайней мере, 10 из его портфельных компаний установили деловые связи с OpenAI, что вызывает вопросы о потенциальных конфликтах интересов, расследуемых американскими властями. Ключевые инвестиции включают: * **Retro Biosciences (биотех):** Доля Олтмана оценивалась в $258 млн. * **Cerebras (чипы для ИИ):** Стоимость его акций выросла более чем в 6 раз после IPO компании, чему способствовал контракт с OpenAI. * **Helion Energy (термоядерный синтез):** Самый крупный личный проект Олтмана. Он инвестировал сотни миллионов долларов, лоббировал инвестиции от партнёров OpenAI (SoftBank, Thrive Capital) и продвигал соглашение о закупке энергии между Helion и OpenAI, что вызывало споры внутри компании. После нового раунда финансирования в 2026 году его доля в Helion оценивается минимум в $4,1 млрд. Несмотря на отсутствие акций OpenAI, его личный инвестиционный портфель тесно переплетается с деловыми интересами компании. Руководство OpenAI заявляет о прозрачности и управлении потенциальными конфликтами. По данным Forbes, состояние Олтмана составляет около $3,4 млрд.

Odaily星球日报2 ч. назад

Личная алхимия богатства Сэма Олтмана: инвестиции в 400 компаний, более 10 из которых тесно связаны с OpenAI

Odaily星球日报2 ч. назад

Торговля

Спот

Фьючерсы

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на RE (RE) представлены ниже.

Первый набор данных для обучения Doc2Repo на длинных последовательностях: Code Agent не только исправляет ошибки, но и начинает создавать репозитории

Введение

Восстановление всего репозитория, начиная с одного документа

Высококачественные документы-задания для «создания репозитория с нуля»

Метод DeNovoSWE

Сложность: почему это длинная задача?

Результаты эксперимента

Заключение

Трендовые криптовалюты

Связанные с этим вопросы

Похожее

Tide Investment: Мы по-прежнему оптимистично оцениваем цепочку создания стоимости ИИ, но причины изменились

Инвестиции Tidal: Мы по-прежнему оптимистично смотрим на цепочку создания стоимости ИИ, но причины изменились

Grayscale: эти 15 прибыльных криптопротоколов сильно недооценены

Ripple запускает RLUSD в Японии на фоне растущей динамики расширения регулируемых стейблкоинов

Личная алхимия богатства Сэма Олтмана: инвестиции в 400 компаний, более 10 из которых тесно связаны с OpenAI

Торговля

Популярные статьи

Как купить RE

Обсуждения

Топ вопросы

Популярные категории

Популярные теги