Таинственная модель HappyHorse взлетела в рейтинге, принеся свежее дыхание в гонку генерации?

marsbitОпубликовано 2026-04-08Обновлено 2026-04-08

Введение

Загадочная модель HappyHorse-1.0 неожиданно возглавила рейтинг AI Video Arena платформы Artificial Analysis, обойдя таких гигантов, как Seedance 2.0 и другие коммерческие решения. Рейтинг основан на слепых пользовательских тестах (Elo), что делает его более объективным. Анализ языка интерфейса (китайский и кантонский выше английского) и названия, отсылающего к году Лошади, указал на китайское происхождение команды. Технический анализ показал, что HappyHorse, вероятно, является оптимизированной версией недавно открытой модели daVinci-MagiHuman (разработана совместно Shanghai Insitute of Intelligence и Sand.ai). Её архитектура — 15-миллиардный трансформер, объединяющий текст, видео и аудио в единый поток. Быстрый успех объясняется фокусом на генерации портретов и говорящих голов, которые доминируют в тестовых выборках. Однако модель требует мощного железа (H100), ограничена короткими клипами и сценами с одним персонажем. Несмотря на это, её успех сигнализирует о важном сдвиге: открытые модели впервые достигли качества, сопоставимого с коммерческими в слепых тестах. Это может ускорить развитие сообщества и предложить альтернативу для создателей, ценящих контроль и кастомизацию.

Без презентаций, без технических блогов, без поддержки какой-либо компании — модель под названием HappyHorse-1.0 для преобразования текста в видео незаметно возглавила рейтинг AI Video Arena авторитетной платформы для оценки ИИ Artificial Analysis, набрав более высокий рейтинг Elo, чем Seedance 2.0, и оставив позади таких основных игроков, как Keling и Tiangong, что мгновенно вызвало «соревнование по разгадыванию» в техническом сообществе.

Рейтинг Artificial Analysis — это не оценка технических параметров, а совокупность результатов слепого тестирования реальными пользователями, выраженная в рейтинге Elo, что отражает реальное восприятие обычных людей после просмотра. Это делает данный рейтинг менее подверженным сомнениям по сравнению с обычными тестами производительности, а также превращает вопрос «кто же это сделал?» в нечто, что невозможно игнорировать.

«Счастливая лошадь» незаметно возглавляет рейтинг, вызывая соревнование по разгадкам в технологическом сообществе

Догадки в X появились быстро. Первое, что заметили, — это порядок языков на официальном сайте: путунхуа и кантонский стоят перед английским. Для продукта, ориентированного на глобальных пользователей, такой порядок несколько необычен — если бы за ним стояла американская команда, английский почти наверняка был бы на первом месте. То, что команда базируется в Китае, можно считать практически установленным фактом.

Само название также является подсказкой. 2026 год — это год Лошади по лунному календарю, и название «HappyHorse» содержит не слишком скрытую отсылку к году Лошади, подобный прием ранее в этом году уже использовала «Pony Alpha». Таким образом, список подозреваемых быстро расширился: основатели Tencent и Alibaba носят фамилию Ма (Лошадь), что естественно включает их в список; некоторые делали ставку на Xiaomi, полагая, что Лэй Цзюнь всегда低调ен и любит неожиданно раскрывать карты; другие считали, что стиль больше похож на DeepSeek, поскольку DS ранее уже незаметно запускала визуальную модель, а затем так же незаметно свернула ее. Предположения были оживленными, но ни одно не подкреплялось железными доказательствами.

Истинную цель помогло определить детальное техническое сравнение. Пользователь X Vigo Zhao сопоставил открытые эталонные данные HappyHorse-1.0 с данными известных моделей и нашел高度 соответствие с daVinci-MagiHuman — открытой моделью «Да Винчи: Магический человек», размещенной на Github в марте.

Качество изображения 4.80, соответствие тексту 4.18, физическая согласованность 4.52, коэффициент ошибок по словам в речи 14.60% — все пункты двух наборов данных совпадают. Структура официальных сайтов также почти идентична: описание архитектуры, таблицы производительности, стиль представления демонстрационных видео — все выглядит так, как будто сделано по одному шаблону. Обе используют архитектуру однорангового Transformer, обе генерируют аудио и видео совместно, поддерживаемые языки полностью совпадают. Степень такого совпадения трудно объяснить простым совпадением.

Наиболее широко признанный в техническом сообществе вывод на данный момент заключается в том, что HappyHorse — это итерационная версия, оптимизированная одной из сторон-разработчиков daVinci-MagiHuman, Sand.ai, на основе открытой модели, с основной целью проверки пределов производительности модели в условиях реальных пользовательских предпочтений для подготовки к коммерческому внедрению.

daVinci-MagiHuman был официально открыт 23 марта 2026 года и является результатом сотрудничества двух молодых команд. Одна — из Лаборатории исследований генеративного искусственного интеллекта (GAIR) Шанхайского инновационного и интеллектуального института (SII), во главе с ученым Лю Пэнфэем; другая — пекинская Sand.ai (Саньдай кэцзи), основатель Цао Юэ также имеет академический background, а компания ориентирована авторегрессионные мировые модели.

Модель использует чисто трансформерный одноранговый Transformer с 15 миллиардами параметров, помещая токены текста, видео и аудио в одну последовательность для совместного моделирования — в открытом сообществе ранее никто не делал с нуля настоящего совместного претренинга для аудио и видео, большинство ограничивалось склейкой на основе одномодальных моделей.

Как открытая модель для генерации видео смогла совершить прорыв за две недели?

После выяснения происхождения другой вопрос стал звучать еще сложнее: daVinci-MagiHuman был открыт только в конце марта, как HappyHorse-1.0 смог всего за две недели набрать более высокий рейтинг Elo, чем Seedance 2.0?

Судя по информации, раскрытой на официальном сайте, HappyHorse не вносил фундаментальных изменений в базовую архитектуру. Более разумное предположение заключается в том, что он внес целевые корректировки в стратегию генерации по умолчанию, ориентированные на сценарии оценки.

Система Elo по своей сути является накоплением пользовательских предпочтений. Если немного улучшить такие восприимчивые аспекты, как стабильность выражения лиц персонажей, синхронизация звука и изображения, визуальная привлекательность кадра, то в слепом тесте это с большей вероятностью будет выбрано. Верхний предел возможностей модели не изменился, но «производительность в тестах» можно было отточить.

Фактически, в слепых тестах Artificial Analysis доля контента с генерацией портретов и озвучкой превышает 60%, а daVinci-MagiHuman с этапа обучения был сфокусирован на портретных исполнениях, что дает ему естественное преимущество в таких сценариях и является основной причиной его лидерства в слепых тестах; если слепой тест в основном состоит из крупных планов людей, модели, специализирующиеся на портретах, будут систематически получать преимущество, что не имеет прямого отношения к их фактической производительности в сложных сценариях с множеством персонажей, сложной операторской работой, длительным повествованием и т.д.

В результате между цифрами в рейтинге и реальным опытом тестирования возник заметный разрыв, и участники дискуссий в X разделились на два лагеря. Скептики, протестировав, считают, что HappyHorse-1.0 все еще имеет видимый разрыв с Seedance 2.0 в деталях персонажей и плавности динамики, и на этом основании подвергают сомнению репрезентативность самого рейтинга Elo.

Сторонники же возлагают большие надежды на потенциал HappyHorse, надеясь, что он сможет решить отраслевую проблему «согласованности качества изображения в последовательностях с несколькими кадрами», поскольку это проблема, которую текущие mainstream модели для видео еще не решили. Если daVinci-MagiHuman действительно достигнет здесь прорыва, это может быть гораздо важнее места в рейтинге.

Ограничения самой модели также не должны быть скрыты цифрами. Блогер Xiaohongshu @JACK's AI World第一时间 развернул и протестировал daVinci-MagiHuman. Обнаружилось, что для его работы требуется H100, потребительские видеокарты基本 не справляются, и хотя сообщество изучает варианты квантования, в краткосрочной перспективе развертывание на машинах индивидуальных пользователей остается затруднительным.

Что касается сцен, в настоящее время он в основном擅长 одиночных персонажей, как только появляется несколько человек или сцена усложняется, качество падает — это не проблема, решаемая настройкой параметров, это напрямую связано с его ориентацией на портреты. Длительность генерации обычно составляет около 10 секунд, при большей длине может начаться путаница, а для вывода в высоком разрешении仍需 полагаться на плагины повышения разрешения.

@JACK's AI World пришел к выводу: общая удобство использования daVinci-MagiHuman уступает LTX 2.3, и для повседневного использования придется подождать, пока сообщество не завершит работу по квантованию.

Гонка генерации видео дождалась настоящей «рывковой силы»?

Конечно, одно лидерство в рейтинге не может сказать многого. Далее HappyHorse предстоит пройти более тщательную проверку на стабильность, скорость доступа при высокой concurrent нагрузке, согласованность между сценами, точность управления персонажами, а также способность к обобщению за пределами тестового набора. Именно эти показатели являются ключевыми для определения того, сможет ли модель真正 войти в рабочий процесс создателей контента.

Но если взглянуть на более широкую отраслевую картину, сигнал, передаваемый этим событием, уже достаточно ясен.

Открытые модели для генерации видео сами по себе не являются новостью. Но между открытыми и закрытыми моделями всегда существовал видимый разрыв в эффективности — в сценариях, требующих поставки клиентам, качество генерации открытых моделей长期 не могло перешагнуть порог от «пригодного к использованию» до «пригодного к поставке». Ценовая политика закрытых продуктов, таких как Keling и Seedance, в значительной степени строилась именно на этом разрыве.

Значение нынешнего события заключается в том, что продукт на основе открытой модели впервые в слепом тест-рейтинге, основанном на восприятии реальных пользователей, напрямую сравнялся с основными закрытыми конкурентами. Независимо от того, сколько в этом было成分 оптимизации под сценарии тестирования, для закрытых производителей, полагающихся на этот разрыв для построения ценовой политики, это, по крайней мере, сигнал, к которому стоит серьезно отнестись.

Для разработчиков значение этой转折点更为 конкретно. В вертикальных сценариях, таких как портреты, цифровые люди, виртуальные ведущие, как только качество генерации открытой базовой модели достигнет порога «пригодности к поставке», структура затрат на самостоятельное развертывание претерпит существенные изменения — это не только сокращение затрат на вызовы API, но, что более важно, включение данных, модели и цепочки логического вывода под полный собственный контроль, получение глубины кастомизации и соответствия требованиям конфиденциальности, гибкость которых закрытые решения提供 с трудом.

HappyHorse-1.0 в краткосрочной перспективе не поколеблет позиции Seedance 2.0 или Keling на рынке, но как только утвердится认知, что открытые модели могут сравниться по эффективности с закрытыми, последующая量化 оптимизация, вертикальная тонкая настройка и ускорение логического вывода будут продвигаться сообществом со скоростью итерации, значительно превышающей таковую у закрытых продуктов.

В этот год Лошади perhaps стоит обращать внимание не на то, какая лошадь бежит быстрее, а на то, что сама гоночная трасса становится шире.

Эта статья из WeChat Official Account «AI价值官», автор: Синъе, редактор: Мэйци

Связанные с этим вопросы

QЧто такое HappyHorse-1.0 и почему он вызвал ажиотаж в технологическом сообществе?

AHappyHorse-1.0 — это модель преобразования текста в видео, которая без предварительных анонсов и технических блогов возглавила рейтинг AI Video Arena платформы Artificial Analysis, опередив такие модели, как Seedance 2.0. Она вызвала интерес, поскольку её создатели неизвестны, а высокий рейтинг основан на слепом тестировании реальными пользователями, что делает результаты более объективными.

QКакие доказательства указывают на то, что HappyHorse-1.0 связан с daVinci-MagiHuman?

AПользователь Vigo Zhao провёл сравнение технических характеристик HappyHorse-1.0 и daVinci-MagiHuman, обнаружил полное совпадение параметров: визуальное качество 4.80, соответствие тексту 4.18, физическая согласованность 4.52 и уровень ошибок в речи 14.60%. Архитектура, стиль презентации и список поддерживаемых языков также идентичны, что свидетельствует о тесной связи между этими моделями.

QПочему HappyHorse-1.0 смог быстро обойти Seedance 2.0 в рейтинге, несмотря на недавний релиз?

AHappyHorse-1.0, основанный на daVinci-MagiHuman, оптимизирован для сценариев с человеческими образами, которые составляют более 60% тестовых данных Artificial Analysis. Модель не меняла базовую архитектуру, но была настроена для улучшения восприятия пользователями в ключевых областях, таких как стабильность выражений лица и синхронизация аудио и видео, что повысило её рейтинг в слепых тестах.

QКаковы основные ограничения модели daVinci-MagiHuman, согласно тестам?

AМодель требует мощного оборудования, такого как H100, и не подходит для потребительских видеокарт. Она эффективна только в сценах с одним человеком, а при наличии нескольких людей или сложных сцен её качество снижается. Длительность генерации ограничена 10 секундами, а для высокого разрешения необходимы дополнительные плагины. Эти ограничения связаны с её ориентацией на человеческие образы.

QКакое влияние может оказать успех HappyHorse на индустрию генерации видео?

AУспех HappyHorse показывает, что модели с открытым исходным кодом могут достигать качества, сопоставимого с коммерческими аналогами. Это может изменить cost-структуру развёртывания, предоставив разработчикам больше контроля над данными и моделями, а также гибкость в настройке и соблюдении конфиденциальности. Хотя он не сразу изменит рынок, это сигнал для коммерческих компаний и стимул для сообщества ускорить развитие открытых решений.

Похожее

Когда Кубок мира встречается с Agent: от Web2 к Web3, как кошельки идут к Agentic Wallet?

Чемпионат мира по футболу — это подходящий контекст для наблюдения за эволюцией кошельков Web3. Такие события, как выход команд в плей-офф или изменение коэффициентов, на платформах прогнозных рынков, подобных Polymarket, превращаются в торгуемые активы. Интеграция подобных активностей в основные кошельки Web3 может служить облегчённым входом для пользователей в ончейн-взаимодействие. Более значимым и ранним изменением становится внедрение AI Agent в сценарии использования кошельков, что меняет способ взаимодействия пользователей с блокчейном. Например, imToken в рамках активности, связанной с ЧМ, начал экспериментировать с AI Agent, позволяя пользователям через веб-интерфейс или Discord в естественной форме выражать намерение (например, «какие ставки на матч Португалии?»), после чего Agent помогает выстроить путь выполнения и незаметно вернуть пользователя в цепочку для завершения транзакции. Это можно рассматривать как раннюю форму «Agentic Wallet» — будущий Web3-кошелёк может не ограничиваться приложением, а становиться повсеместной «AI-формой кошелька». Ключевое изменение заключается в переходе от кошелька как «меню функций» к «интерпретатору намерений». Пользователь выражает цель на естественном языке, а Agent разбивает её на последовательность шагов, которую кошелёк затем превращает в ончейн-действия. Это отличается от простого добавления чат-бота. Тенденция выходит за рамки Web3. Такие игроки, как Mastercard с их решением Agent Pay for Machines, работают над инфраструктурой для авторизованных и контролируемых платежей через AI Agent, что подчёркивает растущую коммерческую значимость этого направления. В Web3-контексте вопросы доверия, разрешений и безопасности становятся ещё более критичными, поскольку транзакции необратимы. Таким образом, главный вызов для Agentic Wallet — не автоматизация как таковая, а определение границ и сохранение контроля пользователя. Кошелёк должен обеспечивать прозрачность: какой Agent что может делать, какие разрешения выданы, на какой срок, и позволять пользователю легко приостанавливать или отменять действия. Чем мощнее Agent, упрощающий сложные процессы, тем важнее роль кошелька как последнего защитного барьера, переводящего технические детали в понятные для пользователя условия и предупреждения. Эксперименты на таких событиях, как Чемпионат мира, являются отправной точкой для этой эволюции.

marsbit1 ч. назад

Когда Кубок мира встречается с Agent: от Web2 к Web3, как кошельки идут к Agentic Wallet?

marsbit1 ч. назад

Не работает ли опцион в DeFi? Виталик, возможно, так не думает

На протяжении долгого времени опционы в DeFi не были популярным инструментом из-за сложности, низкой ликвидности и недостатка естественного спроса. Однако Виталик Бутерин в своем последнем предложении по алгоритмическим стейблкоинам открыл новую возможность: использовать опционы не как самостоятельный продукт для торговли, а как базовый финансовый модуль для стейблкоинов, доходных продуктов и структурированных активов. В его дизайне стейбл-актив по сути представляет собой синтетический покрытый колл-опцион: 1 ETH делится на две части — одна обеспечивает «стабильную стоимость» ниже определенного страйка, а другая получает прибыль от роста выше страйка. Поскольку сумма двух частей всегда равна 1 ETH, система не требует долга, маржи или ликвидации, избегая ключевого риска традиционных CDP-стейблкоинов. Однако основная сложность заключается в том, что для поддержания стабильности стейбл-активу необходимо постоянно пролонгировать глубокие ITM-колл опционы, что создает проблемы с проскальзыванием, фронт-раннингом и ликвидностью. Кроме того, для каждого стейбл-актива должен существовать держатель соответствующего апсайд-актива — leveraged long позиции по ETH без финансирования и риска ликвидации. Устойчивый спрос на такую позицию определяет возможность масштабирования системы. Опыт Rysk показывает, что опционы в DeFi сложно масштабировать как прямой торговый инструмент, но они могут стать эффективной инфраструктурой для более сложных продуктов, таких как стейблкоины или структурированная доходность. Возможность опционов заключается не в том, чтобы стать следующим перпетуал-контрактом, а в том, чтобы стать движком ценообразования и распределения рисков для следующего поколения ончейн-финансовых продуктов.

marsbit1 ч. назад

Не работает ли опцион в DeFi? Виталик, возможно, так не думает

marsbit1 ч. назад

Диалог с инвестором Чжэн Ди: эксперимент MicroStrategy по продаже монет, экономика ИИ и возможности на фондовом рынке США

**Диалог с инвестором Дидье: Эксперимент MicroStrategy с продажей криптовалюты, экономика ИИ и возможности на рынке акций США** Инвестор в передовые технологии Дидье (Didier) обсудил в подкасте недавнее падение биткоина, изменения финансовой стратегии MicroStrategy (ныне Strategy), рост акций США, движимый ИИ, подключение криптобирж к рынку акций США и макроэкономические перспективы. **Ключевые тезисы:** 1. **MicroStrategy и давление на биткоин:** Согласно Дидье, основное давление на биткоин оказывает не разовый факт продажи криптовалюты MicroStrategy, а формирующиеся у рынка ожидания ее регулярных, пусть и небольших, продаж для покрытия дивидендов по привилегированным акциям (серии STR). Это связано с необходимостью компании поддерживать «нейтральность количества биткоинов на акцию» в условиях роста обязательств. Рынок сейчас определяет, сможет ли он поглотить такой постоянный отток, или же MicroStrategy придется скорректировать стратегию. 2. **Токены как новая рабочая сила в эпоху ИИ:** Дидье считает, что токены становятся новым ключевым фактором производства, заменяя человеческий труд во многих исполнительских функциях. ИИ и токены формируют новую структуру рабочей силы, где ценность создают креативные люди и автоматизированные агенты. Это повышает маржинальность компаний и является фундаментальным драйвером роста акций в секторах, связанных с ИИ (чипы, оборудование для ЦОД и т.д.), на рынке США. Эра «машинной экономики» только начинается. 3. **Криптобиржи и рынок акций США:** Подключение криптобирж к торговле акциями США — естественный шаг, вызванный поиском ликвидности и реальных активов с устойчивой стоимостью, которых не хватает среди нативных криптоактивов (кроме биткоина и нескольких инфраструктурных проектов). Это не обязательно «отток» из криптосферы, а скорее ее эволюция в сторону работы с оцифрованными реальными активами. При этом блокчейн-инфраструктура может стать основой для будущей «машинной экономики», где взаимодействуют автономные агенты. 4. **Конец эры «альткойнов»:** Инцидент 11 октября («1011») нанес серьезный удар по ликвидности крипторынка, фактически положив конец спекулятивной «альткойн»-лихорадке. Напротив, ликвидность и нарративы о «изменении мира» сместились на фондовый рынок США, где теперь торгуются мем-акции и компании с футуристическими концепциями. Дидье отмечает, что многие торговые стили из криптомира находят аналоги на рынке акций. 5. **Макроперспективы и распределение благ от ИИ:** В краткосрочной перспективе (вторая половина 2024 года) Дидье видит растущие риски на рынке из-за возможного выхода на IPO гигантов вроде SpaceX и политической неопределенности. В долгосрочной перспективе он сохраняет оптимизм в отношении ИИ и его конвергенции с блокчейном. Ключевой вызов будущего — справедливое распределение благ от роста производительности за счет ИИ, чтобы избежать резкого социального расслоения. Возможное введение «налога на ИИ» в следующие 3-5 лет выглядит вероятным для финансирования социальных нужд в новой экономической реальности.

marsbit2 ч. назад

Диалог с инвестором Чжэн Ди: эксперимент MicroStrategy по продаже монет, экономика ИИ и возможности на фондовом рынке США

marsbit2 ч. назад

Токен $GCOIN от Playnance выходит на биржу KoinBX на фоне стремительного роста проекта в Индии

Playnance, блокчейн-экосистема Web3 iGaming, объявила 18 июня о листинге своего нативного токена $GCOIN на бирже KoinBX. Это событие призвано расширить доступ к быстрорастущему сообществу проекта, особенно в Индии, где уже более 130 партнеров присоединились к программе «Be the Boss», создав сообщества с тысячами активных игроков. Генеральный директор Playnance Пини Питер отметил, что Индия стала одним из самых вовлеченных рынков экосистемы. Партнеры, такие как доктор Николас, который заработал более 57 000 долларов за несколько месяцев, видят в платформе возможность строить собственное дело и развивать активное сообщество. Токен $GCOIN служит основной утилитарной монетой экосистемы, поощряя участие, согласовывая стимулы между игроками и «Боссами» и стимулируя активность во всей сети Playnance. Листинг на KoinBX является частью стратегии глобального роста компании, целью которой является повышение полезности и доступности $GCOIN по всему миру за счет объединения коллективного владения, геймифицированного участия и блокчейн-вознаграждений. Основанная в 2020 году, Playnance фокусируется на создании некастодиальных ончейн-продуктов, обрабатывая около миллиона транзакций в день и стремясь устранить барьеры между пользовательским опытом и блокчейн-инфраструктурой.

TheNewsCrypto2 ч. назад

Токен $GCOIN от Playnance выходит на биржу KoinBX на фоне стремительного роста проекта в Индии

TheNewsCrypto2 ч. назад

STRC достиг исторического минимума, вечный двигатель Сэйлора заглох

В июле 2023 года Майкл Сэйлор представил Wall Street привилегированные акции STRC как «цифровую кредитную машину». Инвесторы получали высокие дивиденды в 11.5%, а компания Strategy использовала вырученные средства для покупки биткоина, создавая, по задумке, самоподдерживающийся цикл. 19 июня STRC упала до исторического минимума в $85.32, что на 17% ниже номинала в $100, демонстрируя сбой в этой модели. Падение обусловлено тремя факторами: 1. Цена биткоина снизилась более чем на 50% с исторических максимумов. 2. Денежный резерв Strategy сократился после погашения облигаций, сократив срок покрытия дивидендов STRC. Впервые с 2022 года компания продала 32 BTC для выплаты этих дивидендов, подорвав доверие инвесторов. 3. Конкурирующая ценная бумага SATA от Strive предлагает более высокую доходность и лучшие условия, переманивая инвесторов. Падение STRC ниже номинала остановило программу дополнительной эмиссии акций, ключевой механизм покупки биткоина Strategy. Вместо планируемого «вечного двигателя» капитала запустился обратный процесс: падение биткоина ведет к падению STRC, остановке финансирования, вынужденной продаже биткоина и дальнейшей потере доверия. Хотя математически модель Сэйлора может работать при росте биткоина всего на 2.3% в год, текущая рыночная ситуация, включая жесткую риторику ФРС, подвергает сомнению устойчивость всей стратегии компаний-казначеев биткоина в условиях медвежьего рынка. Падение STRC стало проверкой веры в эту финансовую конструкцию.

marsbit3 ч. назад

STRC достиг исторического минимума, вечный двигатель Сэйлора заглох

marsbit3 ч. назад

Торговля

Спот
Фьючерсы
活动图片