神秘模型HappyHorse空降屠榜,视频生成赛道迎来“鲶鱼”?
一款名为HappyHorse-1.0的文本生成视频模型在AI视频平台Artificial Analysis的盲测排行榜中登顶,以更高Elo评分超越Seedance 2.0和可灵、天工等主流产品。该排名基于真实用户偏好投票,具备较强公信力。
经技术社区推测,HappyHorse极有可能是基于3月开源的daVinci-MagiHuman模型优化而来,由上海SII GAIR实验室与北京Sand.ai联合开发。该模型采用150亿参数的单流Transformer架构,实现音视频联合生成,尤其擅长人像类内容。
其登顶原因可能源于对评测场景的针对性优化。由于盲测样本中人像和口播类内容占比超60%,而该模型训练阶段就侧重人像生成,因此在用户观感上占据优势。不过实测反馈显示,它在多人场景、长时序生成等方面仍有局限,需依赖高端算力,暂未达到广泛可用水平。
尽管如此,HappyHorse的意义在于首次有开源背景的生成模型在用户盲测中比肩闭源商业产品。这不仅对依赖技术差距维持定价权的闭源厂商构成挑战,也为开发者在数字人、虚拟主播等垂直场景提供了更低成本、更高自主性的技术选择。开源与闭源之间的效果鸿沟,正在逐渐收窄。
marsbit04/08 07:57