苹果渴求的端侧AI杀出黑马：首个认知模型诞生，4B打平GPT-5.4

marsbit发布于2026-06-09更新于2026-06-09

文章摘要

在WWDC苹果展示端侧AI趋势之际，中国公司明日新程发布了行业首个端侧认知模型“新程Alpha”。该模型仅4B参数，通过将知识剥离、强化认知核心，在群体智能任务中实现了与GPT-5.4等千亿参数模型相当的效果，且支持在MacBook等设备上端侧部署。这一成果验证了Andrej Karpathy此前提出的“认知核心”方向，旨在解决大模型因算力和Token成本高昂而难以大规模落地的问题。新程Alpha通过独特的强化学习训练，提升了模型的泛化与抽象思考能力。其意义在于：提升多智能体决策质量、大幅降低云端与端侧部署成本，并为主动式智能体应用提供了经济可行的基础，有望推动AI产品从响应式向主动式演进。明日新程团队源自微软小冰，曾以3.6B模型击败更大参数模型。当前，其聚焦的群体多智能体赛道已获资本关注。随着认知模型将成本结构重构，AI产品的商业模式与形态或将迎来深刻变革。

【导读】在刚过去的 WWDC 上,苹果 Siri 借 AI 重生成为关键词,「端侧模型」已成趋势!更早些时候,Andrej Karpathy 呼吁把模型的知识剥离、只保留「认知核心」。一家中国公司称已将这一方向落地——4B 参数,在群体智能任务中打出千亿级大模型的效果。端侧认知模型到底能改变什么?

昨晚,Siri 借谷歌的 1.2 万亿参数 Gemini 重生了。

但另一头,亚马逊却关停了引发巨大争议的内部 AI 排行榜——员工大量使用 AI 工具,算力开销飙升到管理层坐不住的地步。

Token 成本成为 AI 大规模落地最硬的一道门槛。

Andrej Karpathy 之前在访谈中给出了一个方向:把模型里的海量知识剥离掉,只保留一个会思考、会规划、知道自己不知道什么的「认知核心」,1B 级别的参数就够。

https://www.youtube.com/watch?v=lXUZvyajciY

这个方向正在被验证。

一个 4B 参数的模型,在群体智能任务中打出了与 GPT-5.4 等千亿级大模型等效的结果,且支持端侧部署。

它来自一家创始团队,曾以 3.6B 参数击败 65B Llama、登顶日本 Hugging Face 排行榜。

这次,他们做出了行业首个端侧认知模型。

Karpathy 的预言与算力的账单

算力成本的压力已经从技术议题变成财务议题,亚马逊的案例只是缩影。

亚马逊员工通过内部 AI 工具频繁调用大模型推理能力,推高了整体算力支出,管理层不得不紧急叫停排行榜机制以遏制用量。

https://www.ft.com/content/b1a62a7f-6df5-4c90-94ce-64ce9c9961b6?syn-25a6b1a6=1

行业正在经历第一次「Token 大撤退」,部分公司的单日算力消耗已触及亿元量级。

大模型的商业模型正撞上一堵结构性的墙:能力越强、推理链越深,单次调用的成本越高。

GPU 成本营收比(GPU Cost / Revenue)是所有 AI 公司的命门指标,模型参数持续膨胀的趋势只会让这个指标更难看。

Karpathy 的思路指向了另一条路:他提出需要把模型中的「记忆 / 知识」剥离掉,保留他所说的「认知核心」——

一个被剥离了海量事实、知识,但保留了思考算法、智能魔力、问题解决策略的实体。

他判断,即便是 10 亿参数的规模,也能实现高效的类人思考:

它会像人类一样思考......如果你问它一个事实性问题,它可能需要查阅——它知道自己不知道,并且会去查。

这段话在技术社区引发广泛讨论。

方向上的共识正在形成,但能将「认知核心」从概念推到可部署产品的团队,才是真正的变量。

4B 打平千亿级,新程 Alpha 做了什么

把 Karpathy 描述的「认知核心」从概念推到产品的,是明日新程(Nextie)。

这家公司对开源推理模型进行强化学习训练,将知识与认知解耦——剥离模型中记忆性的知识储备,强化泛化和抽象思考能力。

产出的模型被命名为新程 Alpha,参数规模 4B,已完成训练并部署上线,是行业中首个被定义为「认知模型」的产品。

具体到其训练方法,其实是一个不常见的起点。

明日新程团队整理了 1800 年至 2020 年、跨越 220 年的人类学术论文,试图梳理出群体智能的演化脉络,为技术路线提供参照系。

在这套研究的基础上对开源推理模型做强化学习,专注于提升泛化和抽象能力。

举一个直观的例子:经过训练的模型能将围棋选手的决策模式迁移到日常生活场景——Karpathy 所说的「保留思考算法」,在这里有了具体的技术实现。

效果层面,新程 Alpha 在群体智能任务(辩论、反思、挑战、投票等环节)中,4B 参数达到了与 GPT-5.4 等大模型等效的输出质量,算力消耗和推理速度优势显著。

更值得关注的是这个模型解锁的场景空间,有三层递进的意义。

第一层,多智能体决策质量提升。

在 Harness 决策框架中,使用认知模型的输出效果优于推理模型。

底层模型从「推理」升级为「认知」,带来的是多智能体协作系统中决策链条整体质量的跃升。

第二层,算力成本量级缩减。

4B 相较于千亿参数模型,云端部署的算力开销大幅降低。

新程 Alpha 同时支持端侧部署——MacBook、具身智能设备均可直接运行,算力成本由此转化为电力成本。

这对具身智能领域意义尤为突出:用千亿参数大模型驱动一个家务机器人,每一次「思考」都在消耗大量 Token,综合成本可能比请人做家务还贵。

4B 端侧部署,从根本上改写了这笔账。

第三层,主动式(Proactive)场景解锁。

当前绝大多数 AI 产品运行在响应式(Reactive)模式下——用户发指令,模型响应。

Proactive 模式意味着智能体自主决策和执行任务,无需等待命令,商业规模远超 Reactive,但过去始终被算力成本挡在门外。

新程 Alpha 支持 24 小时不间断运行,成本可控,让此前因为太贵而搁置的主动式智能体成为可能。

团队底牌与赛道卡位

明日新程由微软小冰创始团队创立。

这个团队的标签是「用小参数赢大参数」——此前训练的开源模型 rinna(日本小冰)以 3.6B 参数登顶日本 Hugging Face 排行榜第一名,击败了 65B 参数的 Llama。

新程 Alpha 用 4B 打平千亿级大模型的效果,延续的是同一套技术基因。

明日新程重仓布局的赛道是——Harness 群体多智能体。

这条赛道正在获得头部资本的确认——2026 年 3 月,OpenAI 投资了初创公司 Isara,直接将其估值推至 6.5 亿美元,Isara 的研究方向正是多智能体协同与群体智能。

https://www.wsj.com/tech/ai/openai-backs-new-ai-startup-seeking-bot-army-breakthroughs-a0b1fedc

在该领域的智能深度评测(IDI)中,明日新程的综合表现显著高于任何单一大模型。

资本验证了赛道价值,评测数据则标定了明日新程在赛道内的位置。

两个信号叠加,指向同一个判断:群体多智能体是 AI 应用层的下一个高价值方向,认知模型是驱动它的关键基础设施。

认知模型改变的不只是参数,更是账本

GPU 成本营收比(GPU Cost / Revenue)是悬在所有 AI 公司头上的达摩克利斯之剑。

认知模型提供的解法,核心指向经济模型的重构——用 4B 达到千亿级才能达到的效果,意味着同样的输出质量对应一套完全不同的成本结构。

明日新程在采访中透露,团队正在训练泛化能力更强的 8B 认知模型。

如果 4B 已经能在群体智能任务中对标 GPT-5.4,8B 的能力边界值得期待。

一个更深远的问题留给整个行业:当端侧全天候运行一个认知模型的成本降至可忽略的水平,今天所有基于「用户发指令、模型响应」的响应式(Reactive)模式设计的 AI 产品,可能都需要重新审视自己的产品形态。

主动式(Proactive)智能体的商业想象空间,远超当前响应式(Reactive)智能体下的一切。

本文来自微信公众号“新智元”,作者:ASI启示录

你可能也喜欢

预测市场建议维持仓位，而Citadel Securities预测美联储将在特朗普施压之际加息

美联储将于7月28日至29日举行FOMC会议，市场普遍预期将维持利率在3.50-3.75%不变。CME FedWatch工具显示按兵不动的概率为66.3%，加息25个基点的概率为33.7%。Polymarket和Kalshi等预测市场也显示，维持利率的概率约为73%。 Citadel Securities宏观策略主管弗兰克·弗莱特提出不同观点，认为美联储可能在本周意外加息25个基点，以维护其对抗通胀的信誉。他认为主席沃什领导的美联储正转向更灵活、反应更迅速的政策立场。与此同时，前总统特朗普再次向美联储施压，呼吁大幅降息以刺激经济增长，称美国利率应低于其他主要经济体。 5月CPI同比上涨4.2%，主要受能源成本推动，加之中东局势导致的油价波动，为利率决策增添了不确定性。市场情绪已从视本次会议为常规事件，转向承认存在足够不确定性，需要为两种结果进行对冲。对于比特币等风险资产而言，若美联储按预期维持利率，市场反应可能平淡；若意外加息，可能推高美元并打压加密货币价格。交易员正密切关注机构投资者的对冲活动。无论本周结果如何，市场焦点都可能转向9月的会议。会后的新闻发布会将透露美联储未来的政策路径信号。

cryptonews.ru3分钟前

预测市场建议维持仓位，而Citadel Securities预测美联储将在特朗普施压之际加息

cryptonews.ru3分钟前

贝莱德向ETHA基金投资1175万美元，以太坊投资基金的流入再次超越比特币基金

机构资金对加密货币的需求本周开局分化。以太坊ETF持续吸引资金流入，而比特币ETF则延续了上周开始的资金外流压力。 7月27日周一，比特币ETF录得净流出1164万美元，为连续第三个交易日资金外流。其中，Blackrock的IBIT流出882万美元，Fidelity的FBTC流出282万美元。与此同时，以太坊ETF则获得净流入923万美元，主要由Blackrock的ETHA基金贡献了1175万美元的流入推动，尽管Invesco的QETH有252万美元的流出。其他山寨币ETF表现不一。Solana ETF吸引资金103万美元，主要由Bitwise的BSOL基金贡献。XRP ETF录得约59.2万美元的净流入，全部来自Franklin Templeton的XRPZ基金。而HYPE ETF则表现最弱，净流出289万美元，延续了其上市后的艰难时期。数据显示，机构资本并未撤离市场，而是变得更加挑剔，近期更青睐以太坊及部分山寨币，而比特币和HYPE相关基金则面临持续的卖压。有分析指出，比特币ETF通常是机构进入加密市场的第一步，它们降低了投资门槛，并帮助投资者进行更明智的资产配置决策。

cryptonews.ru3分钟前

cryptonews.ru3分钟前

分析师预测：在下一轮牛市反弹中，XRP将涨至6美元

加密货币分析师Egrag Crypto为XRP设定了下一轮牛市中的首个重要目标，预测其价格可能飙升至6.40美元。以当前约1.06美元的价格计算，这意味着潜在涨幅超过500%。分析师指出，XRP价格已测试了其多年对称三角形态的突破点，但同时警告，若该三角形态的上边界失守，价格可能回落至0.88美元附近的支撑位。关键阻力位方面，XRP需先突破1.23美元，才能进一步向1.65美元迈进。成功站上1.65美元后，将有望挑战3.00美元和3.50美元的历史高点区域。最终冲高至6.40美元的看涨前景，需要价格在21个月指数移动平均线的支撑下，稳定维持在历史高点之上，届时甚至可能打开通往30美元的路径。进入2026年以来，XRP价格已下跌近43%。截至发稿时，其24小时交易额约为13.3亿美元，市值为660.6亿美元。

cryptonews.ru13分钟前

cryptonews.ru13分钟前

在2022年崩盘中幸存的DeFi项目如今关停的真正原因

2026年，多个曾在2022年市场崩溃中幸存下来的DeFi项目（如Zapper、Botanix、Step Finance等）宣布关闭。尽管数据显示DeFi整体流动性集中度自2024年以来有所下降，但项目关闭潮背后主要有三大原因：首先，资本并未离开加密生态，而是发生了转移。经济活动从经典DeFi协议转向了新兴应用（如Hyperliquid、Polymarket），导致传统DeFi协议的收入份额被摊薄。虽然链上费用生成总量保持高位，但更多协议在瓜分市场。其次，资本变得更具辨别力。与过去盲目追逐短期收益耕作的激励不同，现今的资本（尤其是机构资本）更关注可持续的收益、过往业绩和项目的可靠性。仅靠代币激励已不足以维持协议生存。最后，行业基础设施正在整合，创新向应用层转移。开发者不再热衷于从头构建底层协议（如下一个Aave或Uniswap），而是更多基于现有成熟基础设施进行开发，专注于产品、分销和用户获取。未来的增长将来自于让传统金融公司更易于采用DeFi基础设施，或将协议嵌入用户已有的平台中。总之，市场在成熟，竞争加剧，资本更聪明，生存的关键在于可持续的经济模式、清晰的用户分布以及利用而非重复建设现有基础层。

cointelegraph18分钟前

cointelegraph18分钟前

随着日元兑美元再创40年新低，市场聚焦周五日本央行会议

日本央行本周成为市场焦点，因其利率会议召开之际，日元对美元汇率正逼近新的40年低点。关键点包括：日元兑美元汇率接近上周创下的40年低点；日本央行将于7月31日决定利率政策，目前1%的利率已是1995年9月以来最高；分析师警告日元套利交易可能再次平仓，重现2024年对加密货币市场的重大冲击。美元兑日元汇率正试图突破近期高点，日元作为全球主要融资货币的地位，使得日本央行政策对全球市场影响巨大。市场普遍预计本次会议将维持利率不变。日本央行六月曾暗示未来会继续加息，以应对通胀接近2%的目标及持续宽松的金融环境。但此后日元持续走弱，对美元汇率维持在160以上，这可能抑制消费支出和通胀增长。对加密货币市场而言，日元动态至关重要。日元套利交易是市场流动性的来源之一，日本央行为稳定汇率采取的任何干预行动都可能引发该交易的快速平仓，进而冲击比特币等加密资产。分析师指出，套利交易的维持依赖于日本极低利率和日元汇率稳定或贬值，一旦政策方向发生根本变化，其平仓过程可能因高杠杆而非常剧烈，对已习惯日本经济现状的全球经济产生广泛影响。

cointelegraph32分钟前

cointelegraph32分钟前

交易

现货

苹果渴求的端侧AI杀出黑马：首个认知模型诞生，4B打平GPT-5.4

文章摘要

Karpathy 的预言与算力的账单

4B 打平千亿级,新程 Alpha 做了什么

团队底牌与赛道卡位

认知模型改变的不只是参数,更是账本

热门币种推荐

相关问答

你可能也喜欢

预测市场建议维持仓位，而Citadel Securities预测美联储将在特朗普施压之际加息

贝莱德向ETHA基金投资1175万美元，以太坊投资基金的流入再次超越比特币基金

分析师预测：在下一轮牛市反弹中，XRP将涨至6美元

在2022年崩盘中幸存的DeFi项目如今关停的真正原因

随着日元兑美元再创40年新低，市场聚焦周五日本央行会议

交易

热门文章

如何购买S

Sonic：Andre Cronje主导升级，逆势上涨的Layer1新星

成长学院：学习“ Sonic“ ，瓜分价值 1000 USDT

相关讨论

热门问答

热门分类

热门标签