阿里云能否重写自己?

marsbit发布于2026-05-20更新于2026-05-20

文章摘要

过去五个月,阿里云MaaS收入增长15倍,其核心是推动一场从“人使用云”到“Agent消费Token”的体系重构。此次阿里云峰会宣布完成“芯片-云-模型-推理”全栈Agent化升级。 关键举措包括:推出新一代自研AI芯片真武M890,并公布未来芯片路线图,旨在通过软硬一体优化控制每个Token的边际成本;将云产品彻底改造,封装为标准接口供Agent直接调用,并构建专属运行环境与任务调度逻辑,以承载Agent无规律、短生命周期的负载特性;发布旗舰模型Qwen3.7-Max,强调其长程自主执行复杂任务的能力,而非仅追求对话表现。 此次全栈重构意味着阿里云正从技术、产品到销售体系进行全面转型。销售团队开始面向业务部门,考核指标转向“高质量Token”和Agent任务闭环效率。尽管转型艰难且前景不确定,但阿里云认定AI是远超以往的巨大机会,正以激进姿态押注未来。

过去五个月,阿里云的MaaS收入增长了15倍,这只是阿里云重构自己的一个侧面。阿里云在峰会上宣布完成"芯片-云-模型-推理"全栈Agent化升级,同步推出全新AI产品官网"千问云"、搭载自研AI芯片真武M890的超节点服务器,以及最新旗舰模型Qwen3.7-Max。

用阿里云资深副总裁刘伟光的话说:"我们正在建设中国最大的AI工厂。"工厂这个比喻暗示了一套完整的生产逻辑,片是原材料,云是车间,模型是机器,推理平台是流水线,最终产出的商品是Token。

而这次重构的本质,是把过去17年围绕"人使用云"搭建的整套体系,改造成"Agent消费Token"的新体系。

芯片这张牌,为什么现在打

阿里云过去很少在公开场合强调芯片。这次峰会,不仅发布了新一代训推一体AI芯片真武M890,还破天荒地公布了未来两年的芯片路线图,真武V900、真武J900两代产品逐年推进。

真武M890配备144GB显存,片间互联带宽800GB/s,性能是上一代真武810E的3倍,搭配自研的ICN Switch互联芯片,128张AI芯片可以组成一台机器,P2P时延压到150纳秒以内

但参数之外,更关键的信息是规模,真武系列累计出货56万片,已经进入电信、一汽、浦发银行等20多个行业的400多家客户。

刘伟光反复用谷歌做类比,谷歌TPU和Gemini的深度绑定,让谷歌在自家框架里跑出了最优的性价比。阿里云当然想走同样的路,他把竞争逻辑归结为一句话:"如果未来拼的是每一块芯片都能跑出比竞争对手更多的高质量Token,那我们就胜利了。"

再加上倚天CPU、磐脉智能网卡、镇岳存储主控芯片,平头哥的芯片版图已经从单点延伸到了算力、网络、存储的完整覆盖。当推理需求指数级膨胀的时候,只有把芯片握在自己手里,才能控制住每个Token的边际成本。

道理不复杂。模型公司可以比拼参数,云厂商最终比的是谁的Token更便宜、更稳定、更快。芯片是这场成本战的起点。

云本身也得重写

芯片解决的是"跑得动"的问题,但Agent对云的需求远不止算力。

传统云产品的交互逻辑是给人设计的,打开控制台,看菜单,配参数,点按钮。这套东西对Agent来说完全不可用,Agent不看网页,不点按钮,它需要的是结构化的能力描述、标准化的调用协议和可预期的反馈。

阿里云CTO李飞飞用一组对比来说明问题:传统云的工作负载是稳态的,一台ECS开出来可能跑几个月甚至几年;但Agent的工作负载是"无规律弹性、短生命周期、瞬时起量即走",一个Agent执行完任务,沙箱就销毁了,下一个请求可能几毫秒后就来,也可能几小时后才来。

为此,阿里云做了三件事。

第一,把云产品Skill化、MCP化和CLI化。简单说就是把每个云产品封装成Agent可以直接调用的标准化接口,像调函数一样调云。

第二,为Agent构建专属的运行环境——轻量沙箱、多Agent协同、跨任务记忆、数据流转通路。

第三,重建调度逻辑,从"资源调度"转向"任务调度",因为当海量Agent同时并发的时候,传统的资源编排方式扛不住。

刘伟光表示,一些AI应用上线后,会自动在后台开通云资源——虚拟机、数据库实例、沙箱环境,全程不需要人介入,一个客户一天内自动开通的资源量,相当于过去人工操作两周。

"这已经等于说Agent在自己使用云了。"刘伟光给出了一个内部测算的换算关系:Token消耗可以按比例折算成GPU用量,而每一卡GPU的增长,大致带动一比一的CPU增长。也就是说,Token收入的增长不是在蚕食传统云收入,而是在拉动它,前提是云平台能够接得住Agent的工作负载。

因此,阿里云不是在原来的体系上加一层AI能力,而是从交互方式、调度逻辑、计费模型到产品形态全部推翻重来。

模型不是用来聊天的

全栈重构的第三层是模型。Qwen3.7-Max在Arena全球盲测总榜中排到了国产第一,超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,这次发布的重点,是阿里对模型能力方向的重新定义。

阿里巴巴通义大模型负责人周靖人表示,"过去我们追求模型'说得好',现在要求模型'做得到'。"

以阿里云在芯片的实践来看,在训练时从未接触过的真武M890芯片上,Qwen3.7-Max仅凭一份任务说明,从零开始自主工作了35个小时,独立完成了一个生产级AI计算内核的编写和调优,最终性能比官方版本提升了10倍,整个过程没有人类干预,没有中间指导。

这说明了模型在Agent场景下的核心能力,长程自主执行,接过一个任务,自己拆解、自己规划、自己写代码、自己调试,连续干35个小时不停。

为了支撑这种级别的推理需求,百炼平台也做了对应升级,并池调度提升GPU利用率,上下文缓存消除重复计算,吞吐弹性调度应对并发波峰。

在生态上,百炼保持开放接入,除了千问模型矩阵,还上线了智谱GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6等第三方模型。

刘伟光提到,"客户在实际使用中不会只用一个模型,是多模型组合。我们提供组合,客户在平台上找到最适合自己的搭配。"峰会现场,六家国内头部模型公司的高管集体站台,场面颇有"国内AI联盟"的意味。

近三个月内,千问旗舰模型连续迭代了3.5、3.6、3.7三个版本。这个发布节奏本身就在传递信号,模型能力的竞赛远没有结束,而阿里打算用自研芯片+自研模型的纵向整合来建立长期优势。

这场重构的真正赌注

回过头来看,阿里云这次全栈重构的底层逻辑简单纯粹,当AI收入的增长速度远超传统云业务,当Token有可能取代ECS成为最大的产品线,当Agent开始自动开通云资源而不再需要人类登录控制台,整套为人设计的技术体系就到了不得不改的时候。

但执行层面的难度是另一回事。刘伟光自己也承认,转型"说起来容易,做起来非常难"。过去销售团队跟客户的IT部门打交道,现在做MaaS要跟业务部门甚至CEO对话,

"你的对话能力、阅历,完全是另一个层次的要求"。阿里云已经在大客户上设立了专职的MaaS销售,与传统IaaS销售分开考核、独立作战。

考核指标也在变,不再只看调用量,而是看"高质量Token",解决实际问题的Token,而不是灌水聊天的Token。三个核心指标:付费客户数的日增长、核心业务系统接入模型的数量、Agent自主完成任务闭环的效率。

这些组织和机制层面的调整,往往比技术发布更能说明一家公司的真实判断,阿里云要重建收入结构、客户关系和销售体系。刘伟光表示,"以前我们做云的时候,客户的IT预算是能算出来的,线下多少台服务器,搬上来大概多少钱,能看到题目。但做MaaS,这个题的答案你是不知道的,进去之后可能超乎你的想象。"

题目看不到了,答案也不确定,但阿里云还是决定把整套体系拆开重写,因为唯一确定的是,AI是比以往大上十倍甚至百倍的机会。

这大概就是这次峰会最值得关注的信息:不是哪款芯片多出算力,哪个模型排名第几,而是中国最大的云厂商,正在用一种接近创业公司的激进姿态,赌一个它认定会到来的未来。(本文作者 | 张帅,编辑 | 杨林)

相关问答

Q阿里云在峰会中如何定义其正在进行的重构工作?

A阿里云将自身的重构工作比喻为“建设中国最大的AI工厂”。其本质是把过去17年围绕“人使用云”搭建的体系,改造成“Agent消费Token”的新体系,涉及从芯片、云平台到模型、推理平台的全栈Agent化升级。

Q阿里云为什么现在重点强调其自研芯片(如真武系列)的战略意义?

A阿里云过去较少公开强调芯片,现在重点推出真武系列AI芯片并公布路线图,是因为在AI时代,云厂商的竞争核心之一是控制每个Token的边际成本。自研芯片能与自研模型深度绑定优化,实现最优性价比,这是未来在提供更便宜、更稳定、更快Token的竞争中赢得优势的起点。

Q为了适应Agent的需求,阿里云对云平台本身进行了哪三方面的根本性改变?

A为了适应Agent的需求,阿里云对云平台进行了三方面的根本性重构:1. 把云产品Skill化、MCP化和CLI化,封装成Agent可直接调用的标准化接口。2. 为Agent构建专属的运行环境,包括轻量沙箱、多Agent协同、跨任务记忆和数据流转通路。3. 重建调度逻辑,从“资源调度”转向“任务调度”,以应对海量Agent并发、短生命周期、瞬时起量的工作负载。

Q文章中提到,阿里云对模型能力的定义发生了怎样的转变?

A阿里云对模型能力的定义从过去追求模型“说得好”,转变为现在要求模型“做得到”。其最新旗舰模型Qwen3.7-Max的核心能力体现为长程自主执行,例如在未训练过的自研芯片上,能仅凭任务说明自主完成一个生产级AI计算内核的编写和调优,连续工作35小时无需人工干预。

Q阿里云此次全栈重构背后,在组织和业务层面有哪些深层次的调整?

A在组织和业务层面,阿里云进行了深层次调整:1. 销售体系变革:在大客户设立专职的MaaS销售,与传统IaaS销售分开考核,以适应与客户业务部门甚至CEO对话的新需求。2. 考核指标变化:不再只看调用量,而是聚焦“高质量Token”,关注付费客户日增长、核心业务系统接入模型数量以及Agent自主完成任务闭环的效率。这旨在重建收入结构、客户关系和销售体系,以抓住AI带来的巨大机会。

你可能也喜欢

疯狂烧了数十亿美元 Token 之后,硅谷大厂开始限制员工 Token 用量了

近日,多家硅谷科技公司开始限制员工使用AI工具的Token(使用量),以应对高昂且效益不明的成本。此前,企业曾鼓励员工“tokenmaxxing”(最大化Token使用量)以体现数字化转型,但随后发现大量Token被用于非核心工作,如查天气或写祝福,且AI生成的代码存在高“流失率”(被抛弃或重写),导致隐性成本激增。数据显示,企业每花1美元在AI Token上,可能产生近80%的额外损耗用于修复Bug和审查。 管理层开始质疑AI投资的回报率(ROI),仅有少数CFO能看到明确回报。个人效率的提升未能转化为公司整体收益增长。例如,Uber和Salesforce面临数亿美元的年化AI支出,却难以将其与业务成果直接挂钩。微软已取消部分员工的Claude Code许可,Meta也下线了内部鼓励使用的排行榜。 市场随之出现AI成本管理工具,帮助企业监控支出并与业务成果关联。同时,部分AI厂商开始调整计费模式,从按Token用量转向按实际产出(如解决的对话数)收费。 行业正从盲目追求使用量转向理性评估价值。分析指出,真正的挑战在于用AI重新设计工作流程和商业模式,而非仅仅优化现有任务。如果企业仅将AI用于加速旧工作,成本压力终将迫使它们面对这一根本问题。

marsbit1小时前

疯狂烧了数十亿美元 Token 之后,硅谷大厂开始限制员工 Token 用量了

marsbit1小时前

我在Web3做了九年VC:亚洲基金正在经历「地狱模式」

作者联系了二十多位Crypto VC投资人,发现超过一半已离开行业,转投AI、创业或停止投资,反映了当前Web3投资市场的急剧降温。与2021-2024年的融资狂热相比,如今市场每日融资消息寥寥,活跃VC大幅减少。 IOSG Ventures创始人Jocy回顾了九年经历三轮牛熊的经验。他指出,当前Crypto VC的投资逻辑已彻底改变。IOSG调整了策略,目前投资组合约为50%一级市场、30%项目发币后(Post-TGE)和20%场外交易(OTC),以寻找价值错配机会并改善基金流动性。他认为,未来头部20%能为出资人(LP)提供清晰退出路径的VC将吸引市场80%的资金。 Jocy强调,当前市场对亚洲基金而言是“地狱模式”,融资极其困难,因此投资必须更加精准,只投行业顶尖项目。他指出,行业核心问题在于代币与真实价值长期脱轨:过去许多项目将盈利业务与公司股权绑定,而代币沦为融资工具,持有者无法分享协议收益。现在,趋势正向“价值代币”转变,即代币需与协议利益强绑定,通过透明机制(如程序化价值累积或回购)来捕获真实价值,类似Uniswap、Morpho等项目正在推动这一变化。 当下的市场低谷被视作去伪存真、重建秩序的机会。投资逻辑从赌叙事回归商业本质,重点关注有真实收入、清晰用户需求和现金流的项目。IOSG目前聚焦两大方向:一是真实收益与金融基础设施(如稳定币支付、链上信贷),二是AI与Crypto交叉的加密原生AI基础设施。 Jocy总结道,伟大项目常诞生于行业最悲观之时。泡沫退去后,坚持下来的构建者将决定行业的未来面貌。

marsbit1小时前

我在Web3做了九年VC:亚洲基金正在经历「地狱模式」

marsbit1小时前

交易

现货
合约
活动图片