阿里云能否重写自己?

marsbit发布于2026-05-20更新于2026-05-20

文章摘要

过去五个月,阿里云MaaS收入增长15倍,其核心是推动一场从“人使用云”到“Agent消费Token”的体系重构。此次阿里云峰会宣布完成“芯片-云-模型-推理”全栈Agent化升级。 关键举措包括:推出新一代自研AI芯片真武M890,并公布未来芯片路线图,旨在通过软硬一体优化控制每个Token的边际成本;将云产品彻底改造,封装为标准接口供Agent直接调用,并构建专属运行环境与任务调度逻辑,以承载Agent无规律、短生命周期的负载特性;发布旗舰模型Qwen3.7-Max,强调其长程自主执行复杂任务的能力,而非仅追求对话表现。 此次全栈重构意味着阿里云正从技术、产品到销售体系进行全面转型。销售团队开始面向业务部门,考核指标转向“高质量Token”和Agent任务闭环效率。尽管转型艰难且前景不确定,但阿里云认定AI是远超以往的巨大机会,正以激进姿态押注未来。

过去五个月,阿里云的MaaS收入增长了15倍,这只是阿里云重构自己的一个侧面。阿里云在峰会上宣布完成"芯片-云-模型-推理"全栈Agent化升级,同步推出全新AI产品官网"千问云"、搭载自研AI芯片真武M890的超节点服务器,以及最新旗舰模型Qwen3.7-Max。

用阿里云资深副总裁刘伟光的话说:"我们正在建设中国最大的AI工厂。"工厂这个比喻暗示了一套完整的生产逻辑,片是原材料,云是车间,模型是机器,推理平台是流水线,最终产出的商品是Token。

而这次重构的本质,是把过去17年围绕"人使用云"搭建的整套体系,改造成"Agent消费Token"的新体系。

芯片这张牌,为什么现在打

阿里云过去很少在公开场合强调芯片。这次峰会,不仅发布了新一代训推一体AI芯片真武M890,还破天荒地公布了未来两年的芯片路线图,真武V900、真武J900两代产品逐年推进。

真武M890配备144GB显存,片间互联带宽800GB/s,性能是上一代真武810E的3倍,搭配自研的ICN Switch互联芯片,128张AI芯片可以组成一台机器,P2P时延压到150纳秒以内

但参数之外,更关键的信息是规模,真武系列累计出货56万片,已经进入电信、一汽、浦发银行等20多个行业的400多家客户。

刘伟光反复用谷歌做类比,谷歌TPU和Gemini的深度绑定,让谷歌在自家框架里跑出了最优的性价比。阿里云当然想走同样的路,他把竞争逻辑归结为一句话:"如果未来拼的是每一块芯片都能跑出比竞争对手更多的高质量Token,那我们就胜利了。"

再加上倚天CPU、磐脉智能网卡、镇岳存储主控芯片,平头哥的芯片版图已经从单点延伸到了算力、网络、存储的完整覆盖。当推理需求指数级膨胀的时候,只有把芯片握在自己手里,才能控制住每个Token的边际成本。

道理不复杂。模型公司可以比拼参数,云厂商最终比的是谁的Token更便宜、更稳定、更快。芯片是这场成本战的起点。

云本身也得重写

芯片解决的是"跑得动"的问题,但Agent对云的需求远不止算力。

传统云产品的交互逻辑是给人设计的,打开控制台,看菜单,配参数,点按钮。这套东西对Agent来说完全不可用,Agent不看网页,不点按钮,它需要的是结构化的能力描述、标准化的调用协议和可预期的反馈。

阿里云CTO李飞飞用一组对比来说明问题:传统云的工作负载是稳态的,一台ECS开出来可能跑几个月甚至几年;但Agent的工作负载是"无规律弹性、短生命周期、瞬时起量即走",一个Agent执行完任务,沙箱就销毁了,下一个请求可能几毫秒后就来,也可能几小时后才来。

为此,阿里云做了三件事。

第一,把云产品Skill化、MCP化和CLI化。简单说就是把每个云产品封装成Agent可以直接调用的标准化接口,像调函数一样调云。

第二,为Agent构建专属的运行环境——轻量沙箱、多Agent协同、跨任务记忆、数据流转通路。

第三,重建调度逻辑,从"资源调度"转向"任务调度",因为当海量Agent同时并发的时候,传统的资源编排方式扛不住。

刘伟光表示,一些AI应用上线后,会自动在后台开通云资源——虚拟机、数据库实例、沙箱环境,全程不需要人介入,一个客户一天内自动开通的资源量,相当于过去人工操作两周。

"这已经等于说Agent在自己使用云了。"刘伟光给出了一个内部测算的换算关系:Token消耗可以按比例折算成GPU用量,而每一卡GPU的增长,大致带动一比一的CPU增长。也就是说,Token收入的增长不是在蚕食传统云收入,而是在拉动它,前提是云平台能够接得住Agent的工作负载。

因此,阿里云不是在原来的体系上加一层AI能力,而是从交互方式、调度逻辑、计费模型到产品形态全部推翻重来。

模型不是用来聊天的

全栈重构的第三层是模型。Qwen3.7-Max在Arena全球盲测总榜中排到了国产第一,超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,这次发布的重点,是阿里对模型能力方向的重新定义。

阿里巴巴通义大模型负责人周靖人表示,"过去我们追求模型'说得好',现在要求模型'做得到'。"

以阿里云在芯片的实践来看,在训练时从未接触过的真武M890芯片上,Qwen3.7-Max仅凭一份任务说明,从零开始自主工作了35个小时,独立完成了一个生产级AI计算内核的编写和调优,最终性能比官方版本提升了10倍,整个过程没有人类干预,没有中间指导。

这说明了模型在Agent场景下的核心能力,长程自主执行,接过一个任务,自己拆解、自己规划、自己写代码、自己调试,连续干35个小时不停。

为了支撑这种级别的推理需求,百炼平台也做了对应升级,并池调度提升GPU利用率,上下文缓存消除重复计算,吞吐弹性调度应对并发波峰。

在生态上,百炼保持开放接入,除了千问模型矩阵,还上线了智谱GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6等第三方模型。

刘伟光提到,"客户在实际使用中不会只用一个模型,是多模型组合。我们提供组合,客户在平台上找到最适合自己的搭配。"峰会现场,六家国内头部模型公司的高管集体站台,场面颇有"国内AI联盟"的意味。

近三个月内,千问旗舰模型连续迭代了3.5、3.6、3.7三个版本。这个发布节奏本身就在传递信号,模型能力的竞赛远没有结束,而阿里打算用自研芯片+自研模型的纵向整合来建立长期优势。

这场重构的真正赌注

回过头来看,阿里云这次全栈重构的底层逻辑简单纯粹,当AI收入的增长速度远超传统云业务,当Token有可能取代ECS成为最大的产品线,当Agent开始自动开通云资源而不再需要人类登录控制台,整套为人设计的技术体系就到了不得不改的时候。

但执行层面的难度是另一回事。刘伟光自己也承认,转型"说起来容易,做起来非常难"。过去销售团队跟客户的IT部门打交道,现在做MaaS要跟业务部门甚至CEO对话,

"你的对话能力、阅历,完全是另一个层次的要求"。阿里云已经在大客户上设立了专职的MaaS销售,与传统IaaS销售分开考核、独立作战。

考核指标也在变,不再只看调用量,而是看"高质量Token",解决实际问题的Token,而不是灌水聊天的Token。三个核心指标:付费客户数的日增长、核心业务系统接入模型的数量、Agent自主完成任务闭环的效率。

这些组织和机制层面的调整,往往比技术发布更能说明一家公司的真实判断,阿里云要重建收入结构、客户关系和销售体系。刘伟光表示,"以前我们做云的时候,客户的IT预算是能算出来的,线下多少台服务器,搬上来大概多少钱,能看到题目。但做MaaS,这个题的答案你是不知道的,进去之后可能超乎你的想象。"

题目看不到了,答案也不确定,但阿里云还是决定把整套体系拆开重写,因为唯一确定的是,AI是比以往大上十倍甚至百倍的机会。

这大概就是这次峰会最值得关注的信息:不是哪款芯片多出算力,哪个模型排名第几,而是中国最大的云厂商,正在用一种接近创业公司的激进姿态,赌一个它认定会到来的未来。(本文作者 | 张帅,编辑 | 杨林)

相关问答

Q阿里云在峰会中如何定义其正在进行的重构工作?

A阿里云将自身的重构工作比喻为“建设中国最大的AI工厂”。其本质是把过去17年围绕“人使用云”搭建的体系,改造成“Agent消费Token”的新体系,涉及从芯片、云平台到模型、推理平台的全栈Agent化升级。

Q阿里云为什么现在重点强调其自研芯片(如真武系列)的战略意义?

A阿里云过去较少公开强调芯片,现在重点推出真武系列AI芯片并公布路线图,是因为在AI时代,云厂商的竞争核心之一是控制每个Token的边际成本。自研芯片能与自研模型深度绑定优化,实现最优性价比,这是未来在提供更便宜、更稳定、更快Token的竞争中赢得优势的起点。

Q为了适应Agent的需求,阿里云对云平台本身进行了哪三方面的根本性改变?

A为了适应Agent的需求,阿里云对云平台进行了三方面的根本性重构:1. 把云产品Skill化、MCP化和CLI化,封装成Agent可直接调用的标准化接口。2. 为Agent构建专属的运行环境,包括轻量沙箱、多Agent协同、跨任务记忆和数据流转通路。3. 重建调度逻辑,从“资源调度”转向“任务调度”,以应对海量Agent并发、短生命周期、瞬时起量的工作负载。

Q文章中提到,阿里云对模型能力的定义发生了怎样的转变?

A阿里云对模型能力的定义从过去追求模型“说得好”,转变为现在要求模型“做得到”。其最新旗舰模型Qwen3.7-Max的核心能力体现为长程自主执行,例如在未训练过的自研芯片上,能仅凭任务说明自主完成一个生产级AI计算内核的编写和调优,连续工作35小时无需人工干预。

Q阿里云此次全栈重构背后,在组织和业务层面有哪些深层次的调整?

A在组织和业务层面,阿里云进行了深层次调整:1. 销售体系变革:在大客户设立专职的MaaS销售,与传统IaaS销售分开考核,以适应与客户业务部门甚至CEO对话的新需求。2. 考核指标变化:不再只看调用量,而是聚焦“高质量Token”,关注付费客户日增长、核心业务系统接入模型数量以及Agent自主完成任务闭环的效率。这旨在重建收入结构、客户关系和销售体系,以抓住AI带来的巨大机会。

你可能也喜欢

特朗普签署行政令,Kraken、Coinbase 等有望接入美联储支付通道

美国总统特朗普签署行政令,要求美联储评估向非银行金融公司(包括加密货币及金融科技公司)开放央行支付系统准入的政策。此举旨在审视并可能放宽阻碍金融创新的现有规则,推动建立更公平的竞争环境。 行政令核心指向“美联储主账户”,持有该账户的机构可直接使用包括Fedwire在内的大额美元支付系统。目前该权限基本限于传统银行,加密企业需依赖银行作为中介,导致效率低、成本高。行政令并非立即授权接入,而是要求美联储审查法律并明确申请流程。 今年3月,堪萨斯城联储已为Kraken旗下实体批准了一个限制性专用账户,成为首例。此类账户允许进行美元支付清算,但不享受计息、信贷等银行完整权限,被视为可能的未来模板。Ripple、Coinbase、Circle等公司已为此做好准备,希望借此提升其稳定币等业务的清算效率与资金流动性。 然而,美国银行业协会强烈反对,强调任何接入核心支付系统的机构都必须遵守与传统银行同等的严格监管标准,以防范金融风险。他们认为,在缺乏对等合规义务下放宽准入可能危及金融体系稳定。 此举标志着加密行业争取融入主流金融基础设施的关键一步,后续发展将取决于监管审查结果及如何在促进创新与维护金融安全之间取得平衡。

marsbit1小时前

特朗普签署行政令,Kraken、Coinbase 等有望接入美联储支付通道

marsbit1小时前

AI时代人类第一场大规模罢工,来自造AI的工厂里

三星电子工人因薪资与奖金分配问题计划发起18天罢工,虽在5月20日达成临时协议暂缓行动,但劳资矛盾的核心问题并未解决。此次罢工之所以引人注目,是因为三星身处全球AI供应链的核心,其生产的存储芯片(如HBM)对AI数据中心和大模型运行至关重要。若罢工持续,可能扰动全球DRAM和NAND供应,影响芯片价格与AI产业节奏。 工会要求加薪7%、将年度营业利润的15%作为员工奖金池,并取消奖金上限。三星则以财务公式(如EVA)和不同事业部盈亏差异为由拒绝。矛盾激化的一个关键参照是竞争对手SK海力士,该公司已将利润的10%用于员工奖金,人均奖金预计可观,这加剧了三星员工的不平。 背后是韩国财阀与劳工长期的历史张力。三星曾长期实行“无工会经营”,直至2020年才正式道歉并承诺改变。此次罢工反映了在AI技术飞速发展的光环下,底层劳动者对分享技术红利、保障自身尊严与确定性的强烈诉求。文章指出,AI时代常强调效率与增长,但普通劳动者的议价权可能被削弱。这场斗争不仅关乎薪资,更触及一个根本问题:当技术列车高速前进时,创造它的人能否确保自己不在车上被抛下?未来的发展不应只照亮车头的蓝图,也需照亮车尾那些具体而微的生活与尊严。

marsbit2小时前

AI时代人类第一场大规模罢工,来自造AI的工厂里

marsbit2小时前

交易

现货
合约
活动图片