在AI视频生成这块,“遥遥领先”成真了

marsbit发布于2026-05-21更新于2026-05-21

文章摘要

近日海外一篇分析文章引发关注,认为中国在AI视频生成领域已实现对美国公司的领先,且优势可能长期保持。字节跳动的Seedance 2.0和快手的可灵3.0等工具,在全球评测中表现突出,获得用户认可。 领先的关键被认为在于数据和落地场景。字节、快手等平台拥有海量高质量、带用户行为标注的视频数据,为模型训练提供了独特优势。同时,AI视频技术在中国已快速应用于电商视频、广告制作、短剧创作等商业场景,形成了从生成到变现的闭环,而美国工具目前仍多处于实验阶段。 然而,挑战同样存在。美国企业在算力规模上仍有显著优势,中国AI公司面临版权纠纷、商业化成本高以及基础语言模型能力存在代差等问题。目前中国在视频生成这一垂直领域取得领先,但整体AI生态的竞争依然激烈。

文 | 字母AI

有消息称,字节跳动视频生成模型Seedance 2.1将于近期发布,预计生成效果较2.0版本提升20%。字节对字母AI表示,此消息为假消息。

虽然Seedance 2.1未必会于近期发布,但是Seedance 2.0在海外热度大涨却是真的。

原因在于,周末,一篇标题为《中国人工智能企业在视频生成竞赛中领跑美国对手》(Chinese AI groups pull ahead of US rivals in video generation race)的文章在海外刷屏了。

文章以Seedance 2.0和可灵3.0为核心论据,得出了一个让人意外的结论“中国在AI视频生成领域,不仅领先于美国,而且这个优势还将永远保持下去。”

这个判断听起来多少有点反直觉,它更像是一种对中国AI的吹捧。毕竟过去几年,AI行业从来都是硅谷先推出某种产品,然后才有中国类似的产品,这点我们有目共睹。

但阅读完外媒的观点后我发现,确实是我想的太片面了,中国AI视频生成这块,还真就领先于美国。

文章中特地采访了几位美国AI创业者,以及使用AI视频生成技术的电影制作人,结果就是,大家一致认为中国的AI视频工具已经全面超越了美国同行。

更关键的是,这种领先不是那种阶段性的技术领先,而是一种全面领先,从数据到落地,每一个环节都领先。

不光如此,这个领先是那种“无法被超越”的领先。也就是说,这个领先地位会一直保持下去。

遥遥领先成真了?

中国AI为何将永远领先于美国AI?

文章的一个论据是,在AI视频生成领域,算法层面的差距正在快速缩小。

当前各家公司在技术架构上已经“大差不差”了。Transformer、扩散模型、时空注意力机制,这些底层技术路线已经相对透明。

所以关键问题就在于,谁掌握的训练数据质量更高、数量更多。

这正好撞上了字节和快手最擅长的地方。 抖音、快手本来就是全球最大的视频生产机器之一。

更重要的是,这些数据带有完整的用户行为标注。

哪些视频被点赞收藏转发、哪些视频完播率高,后台数据一目了然。

而且这些标注不需要人工打标,它都是用户真实行为自然生成的。这种带标注的高质量数据,你在市场上花钱都不一定买得到的。

相比之下,OpenAI和Anthropic是没有视频数据积累的。

OpenAI在推出Sora时,主要依赖的是从互联网爬取的公开视频数据,以及部分授权的影视素材。

问题就是,互联网上的公开视频往往质量参差不齐,有大量的重复内容、低质量内容,甚至是带有水印和广告的二次加工内容。

所以在训练过程中,经常出现事倍功半的情况。

在全球评测平台Artificial Analysis上,字节的Seedance 2.0、快手的可灵3.0,与阿里的HappyHorse一起,这三款中国工具包揽了文生视频和图生视频榜单的前几名。

这个榜单是由真实用户投票产生的,这也就是说,大家都觉得这三家AI视频生成的内容好看。

虽然谷歌既有Youtube作为数据源,也有视频生成模型Veo 3。

但谷歌的问题就在于约束太多,Youtube上视频时长又普遍超过5分钟,但是现在的GPU还没办法容得下那么长、那么高清的视频作为训练数据,这会导致模型在训练过程中出现故障。

这就导致Veo 3的市场反响并没有很好,低于Seedance 2.0和可灵3.0这样的中国AI视频生成模型。

Director AI创始人Ben Chiang表示。“我们尝试过的大多数美国模型,但是在视频生成方面表现都不够好”。所以他目前主要使用可灵、Seedance 2.0和海螺等中国工具进行创作。

独立AI电影制作人George Won表示“Seedance 2.0是一个改变游戏规则的工具。它能处理激进的镜头角度和速度,而不会丢失角色的面部细节或光影对比。大多数AI模型在快速运动时会开始摇晃或漂移。”

而且这种数据优势还能让产品进行“自我强化”。

字节已经将Seedance 2.0整合进了剪映等创作工具,因此字节每天还能获得超过5000万条生成视频的反馈数据。

这样一来,字节就能知道说“这条视频是用户满意的,这条是用户不满意的”。

每收到一条这样的反馈,下一代Seedance产品的发展方向就更明确一点。

这种持续的、大规模的、真实场景下的反馈循环,同样也是OpenAI和Anthropic那样的实验室环境无法比拟的。

即便投入再多资源,也很难在短期内建立起类似的数据飞轮。

技术可以追赶,算法可以模仿,但生态和数据的积累需要时间,需要用户基础,需要一个完整的产品闭环。

落地场景

企业发展AI视频,它得有一个“目的”。

数据优势只是起点,真正让技术变成竞争力的,是找到能赚钱的应用场景。有了落地场景,企业才能有动力去发展AI视频生成。

在这个维度上,字节和快手同样优于美国AI。

第一个大规模落地的场景是电商视频。

过去,为一个商品拍摄一条专业视频的成本高达数千元。包括摄影师、灯光师、场地租赁、模特费用、后期剪辑等等。

对于大多数中小商家来说,一个普通的淘宝店铺可能有几百个商品,全拍下来至少几十万元成本。

AI视频生成技术改变了这一现状。

视频基础设施公司Firework的CEO Vincent Yang表示“一家零售商要求我们为其产品页面创建10万个视频。如果没有AI,这在成本上是完全不可行的。现在,每个产品都可以拥有自己的视频,甚至可以针对不同客户定制多个版本。”

数据显示,带有视频的商品页面转化率比纯图文页面高出30%到80%,而且抖音和快手本身就是中国最大的电商直播和短视频带货平台之一。

AI生成好了视频,出门右转就能直接投放。

阿里的HappyHorse模型也明确将电商视频作为核心落地场景。它支持商品展示短视频、虚拟主播口播视频的批量生成。一个商家可以上传商品图片和简单的文字描述,系统就能自动生成多个版本的带货视频,每个版本针对不同的目标人群,使用不同的话术和展示方式。

第二个场景是广告。

传统TVC(电视商业广告)制作周期太长了。

一条30秒的品牌广告,从创意策划到拍摄制作,往往需要好几周。

有了视频生成模型,几分钟就能生成几十个不同版本的广告创意。

第三个场景是短剧。

AI短剧在2026年迎来了爆发式增长。数据显示,2026年3月AI短剧在播数量较1月增长了138%,远超传统影视内容的制作速度。

通过AI视频生成,一个小团队甚至个人创作者,几天内就可以创作出来一部短剧。

还没完,字节旗下的红果短剧平台还接入了“识图找同款”功能。

这个功能很好理解,你看短剧的时候,如果对剧中角色的穿搭、场景中的家具、门口停的汽车感兴趣,可以直接点击识图,系统会推荐同款商品,直接下单购买。

相当于是把短剧变成了一个可以带来转化的商业场景。

反观美国市场,虽然有Netflix、YouTube等内容平台,但没有任何落地和转化。

美国的AI视频工具更多停留在创意实验阶段,唯一的商业落地场景就是订阅会员。

而且就产品功能上来说,也是中国视频生成模型更适合商业落地。

Seedance 2.0可以把多张素材照片、视频、声音都放进同一个AI视频里,Sora就不行,只能通过给模型指定一张图和文字来生成视频。

这不是因为Sora的技术不够好,而是因为它缺少一个完整的商业生态来承接这些技术能力。

算力鸿沟

但中国视频AI也有一道绕不过去的坎,那就是算力。

美国头部AI是视算力为黄金,收割市面上能买到的所有算力。

Anthropic近期签订的算力协议总计超过10吉瓦。

这个数字包括租下SpaceX Colossus 1数据中心的全部算力,涵盖22万张英伟达GPU;与亚马逊的5吉瓦协议;以及与谷歌和博通的3.5吉瓦协议。

OpenAI同样如此。

通过与微软的深度合作,OpenAI获得了数十万张高端GPU的使用权,微软还为OpenAI专门建设了多个超大规模数据中心。

相比之下,虽然中国企业在算法效率优化上取得了显著进展,但在绝对算力规模上仍存在差距。

根据外媒统计,中美在AI算力上的差距在2023年时约为3倍,到2026年初已经扩大到8倍左右。

除了算力,中国AI还有其他难题。

第一个就是版权了。

以Seedance 2.0为例,在刚发布一个月左右,迪士尼、华纳兄弟、派拉蒙、Skydance、Netflix等6家好莱坞巨头联合向字节发送停止侵权函,他们称Seedance 2.0在训练阶段,未经授权大规模使用受版权保护的影视素材。

随后,字节紧急暂停原定于3月中旬的Seedance 2.0全球发布计划。

如果你从2月份一直使用Seedance 2.0到现在就会发现,以前可以生成的IP角色,现在都不能使用了,转而只能使用“路人”形象。

第二个是商业化门槛正在抬高。

以Sora为代表的美国视频生成AI,经常会因为使用条款拒绝生成请求,中国工具更宽限,而且价格也更便宜。

但这也为中国AI公司们带来了”幸福的烦恼“。

Seedance 2.0自2月以来使用需求激增,一些用户已经遇到额度受限和排队时间变长的问题。

外媒称,字节对部分美国企业客户采取了更重的商业化方式,要求客户预先支付约200万美元,用于换取模型访问权限和使用额度。

快手方面也是一样的,他们正在拆分可灵业务,未来可能推动可灵单独上市。

这说明可灵是独立业务,有比快手主体更强的增长故事。

增长故事说得越大,账就越要算得清楚。

不过AI视频的成本更高一些。用户生成一段几秒钟的视频,背后消耗的算力远高于生成一段文字。

生成的视频质量越高、时长越长,推理成本就越高。

很多视频生成模型都是如此,一开始很便宜,甚至免费,等用户涌进来后,很快就开始限额、排队、涨价。

不是公司不想放量,是地主家也没余粮了。

所以中国视频AI接下来要面对的,不只是“能不能做出好模型”,而是“能不能把好模型变成一门好生意”。

如果价格太低,用户增长越快,亏损越大;如果价格太高,没有用户,那就得不偿失了。

第三个是模型能力代差。

归根结底,视频生成的能力是建立在语言模型之上的。

一个视频生成模型再怎么牛,它也需要语言理解能力作为基础,去理解用户的提示词。然后再用推理能力,来理解场景、角色的逻辑关系,并且保持生成内容的连贯。

根据外媒的评估,OpenAI的ChatGPT 5.5和Anthropic的Mythos已经将领先国内AI公司9个月至1年。

这个代差体现在多个方面,比如推理能力、上下文理解、多轮对话、复杂任务处理等。

虽然中国在AI视频等垂直领域领先美国AI,但在通用大模型上,还是能感受到比较明显的差距。

总的来说,中国AI在视频生成领域的领先是实实在在的,但也不是高枕无忧。算力和基础模型的差距始终是悬在头上的剑。不过至少现在,我们终于不用再仰望硅谷的背影了。

相关问答

Q这篇文章的主要观点是什么?

A这篇文章主要观点是:中国在AI视频生成领域已经全面领先于美国,这种领先主要体现在数据质量与规模、商业落地场景以及完整的用户反馈生态上。同时,文章也指出了中国AI视频公司面临的算力短缺、版权纠纷和商业化挑战。

Q文章认为中国AI视频生成领先于美国的核心优势是什么?

A文章认为核心优势在于数据。中国公司如字节跳动和快手拥有抖音、快手等平台,掌握了海量且附带用户行为标注的高质量视频数据。这些数据能用于训练更精准的模型,并能通过整合进自家产品(如剪映)形成持续改进的“数据飞轮”,这是美国同行(如OpenAI)难以在短期内复制的。

Q文章提到了中国AI视频生成技术哪些具体的落地场景?

A文章提到了三个主要的落地场景:1. 电商视频:低成本、大批量地为商品生成带货短视频,提升转化率。2. 广告制作:大幅缩短传统广告的制作周期,快速生成多版本创意。3. 短剧创作:赋能个人或小团队快速制作AI短剧,并与电商“识图找同款”等功能结合,实现内容变现。

Q文章指出的中国AI视频生成面临的主要挑战有哪些?

A文章指出了三大挑战:1. 算力鸿沟:中美在绝对算力规模上的差距正在拉大,中国公司面临算力短缺和成本压力。2. 版权纠纷:如Seedance 2.0曾因使用未经授权的影视素材训练而遭遇好莱坞巨头联名指控。3. 商业化与模型代差:如何将领先技术转化为可持续盈利的生意是一大难题;同时,在作为基础的通用大语言模型能力上,中国公司仍落后于美国顶尖模型约9个月至1年。

Q海外文章是如何评价中国AI视频生成工具的?

A根据文章引述的海外报道和评测,评价非常高。一篇刷屏文章称“中国在AI视频生成领域领跑美国对手,且优势将永远保持下去”。在用户评测平台Artificial Analysis上,中国的Seedance 2.0、可灵3.0和HappyHorse包揽了文生视频和图生视频榜单前列。美国AI创业者和电影制作人也认为中国工具(如Seedance 2.0、可灵)在视频生成质量、处理复杂镜头和细节保持方面超越了美国同行,是“改变游戏规则的工具”。

你可能也喜欢

沃什上任第一天,市场给个“下马威”:预期今年加息

美联储新任主席沃什于5月22日正式就职,上任首日即面临市场严峻考验。由于伊朗冲突推高能源与运输成本加剧通胀压力,加上美联储理事沃勒同日发表强硬鹰派言论,称未来加息与降息可能性“五五开”,市场加息预期急剧升温。美债遭抛售,2年期收益率升至2月以来新高,期货市场已完全定价美联储今年将加息25个基点。 沃勒在讲话中明确表示通胀已成为政策核心“驱动力”,并支持删除政策声明中的“宽松偏向”措辞。他承认近期数据已改变其长期宽松立场,虽称油价冲击可能消退且近期未必立即加息,但也无法排除未来因通胀持续而加息的可能性。 沃什即将于6月中旬首次主持FOMC会议,压力巨大。数据显示通胀指标已升至三年来高位。分析指出,若沃什在6月会议上选择不加息,即便经济未过热,市场也可能将此解读为变相宽松,因为在不加息的情况下应对广泛通胀风险等同于政策放松。 市场预期从年初的多次降息大幅转向为目前预期加息,形成鲜明反差。尽管长端美债估值略显便宜,但分析师指出,在宏观风险未变的情况下,其收益率仍面临结构性上行压力。 沃什是在白宫宣誓就职的格林斯潘以来首位美联储主席,其独立性备受关注。特朗普曾希望其更顺从降息要求,但当前市场明确传递信号:通胀是最紧迫议题,新主席几乎没有缓冲时间。

marsbit7小时前

沃什上任第一天,市场给个“下马威”:预期今年加息

marsbit7小时前

为什么外汇稳定币始终未能起飞?

文章探讨了外汇稳定币(如欧元、日元等非美元稳定币)未能像USDT、USDC等美元稳定币一样成功发展的原因。核心观点是,直接发行锚定其他法币的现货稳定币面临巨大挑战,主要因为难以复制美元稳定币已建立的庞大网络效应、流动性、分发渠道和合规基础设施。目前所有外汇稳定币总规模仅约6亿美元,与美元稳定币的4000亿美元相比差距悬殊,导致其存在流动性脆弱、接受度低、锚定易失效等问题。 作者指出,更好的解决方案是采用“合成外汇”模式,即借鉴传统金融中广泛使用的无本金交割远期外汇交易(NDF)。用户可继续持有USDT/USDC作为底层资产,同时通过链上NDF合约获得外币敞口,使账户余额以当地货币计价。这种方法能利用现有美元稳定币的深度流动性、收益机会和全球通道,同时规避了发行多币种现货稳定币的合规与运营难题。 文章认为,合成外汇将首先在稳定币数字银行、钱包和支付平台中落地,为用户提供多币种账户体验,并支持企业进行全球支付和外汇风险管理。此外,它还能开启链上外汇套息交易等新用例,其市场规模和稳定性可能超越现有的加密基差交易产品。总之,链上外汇的未来在于合成模式而非现货发行,这将为DeFi和稳定币的大规模零售及企业采用铺平道路。

链捕手8小时前

为什么外汇稳定币始终未能起飞?

链捕手8小时前

交易

现货
合约

热门文章

如何购买S

欢迎来到HTX.com!我们已经让购买Sonic(S)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Sonic(S)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Sonic(S)购买完您的Sonic(S)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Sonic(S)在HTX的现货市场轻松交易Sonic(S)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

2.3k人学过发布于 2025.01.15更新于 2025.03.21

如何购买S

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对S(S)币价的意见。

活动图片