# 大语言模型的所有文章

在 HTX 新聞中心流覽與「大语言模型」相關的最新資訊與深度分析。潘蓋市場趨勢、專案動態、技術進展及監管政策,提供權威的加密行業洞察。

从一张午餐桌到无限宇宙,李飞飞押注AI的下一个维度

斯坦福大学教授、World Labs创始人李飞飞在近期的多次访谈中系统阐述了她对AI发展方向的判断:空间智能(Spatial Intelligence)是下一个前沿,而当前主流的大语言模型存在根本局限。 李飞飞指出,人类语言仅有约50万年历史,而视觉与空间感知能力则可追溯至5.4亿年前,是智能演化的基础。语言本质上是对世界的一种“有信息损失”的编码,无法完整捕捉物理世界的三维结构、运动和交互。她举例说明,当前AI模型甚至难以完成“数清视频中椅子数量”这类幼儿级空间任务,更无法像牛顿那样从观测数据中推导物理定律。 她创立的World Labs正致力于此方向,其首代模型Marble能够从文本、图像等输入生成可导航、可交互且具有几何一致性的3D环境,这与生成视频有本质区别。Marble模型规模远小于GPT-5,部分原因是高质量3D数据稀缺,且该领域尚处早期。该技术已应用于游戏开发、电影虚拟制作(将周期缩短40倍)、机器人训练、室内设计乃至为强迫症、恐高症患者定制个性化治疗环境。 李飞飞展望,空间智能技术将能创造“无限的宇宙”,应用于社交、旅行、创意等多领域,使人类未来可能生活在“多元宇宙”中。她同时也提醒,对AI的讨论应避免乌托邦或末日论的两极化,技术成功的终极标尺应是让人类文明更美好,并始终维护每个人的尊严与自主性。 她认为,从“谈论世界”到“理解世界”再到“在世界中行动”,是AI必须完成的进化。这条道路虽充满挑战,但意义深远,正如她所言:“感知先于语言,空间先于符号。”

marsbit05/27 00:14

从一张午餐桌到无限宇宙,李飞飞押注AI的下一个维度

marsbit05/27 00:14

从电力基础设施到 Token 经济:AI 产业链的「七层蛋糕」

本文提出,AI产业正从以模型训练为核心的“上半场”,进入以海量推理需求驱动的“Token工业时代”。未来消耗算力最多的将是遍布全球的AI Agent的每一次交互与任务执行。 文章借鉴并扩展了黄仁勋的“蛋糕”架构,将AI经济产业链描绘为围绕Token运转的“七层蛋糕”: 1. **电力**:AI时代的能源基础。 2. **AIDC(AI数据中心)**:集中GPU形成Token生产能力的“工厂”,趋势向轻量化、模块化的区域节点发展。 3. **GPU**:Token的核心生产设备,需求从训练向推理倾斜。 4. **LLM(大语言模型)**:Token的生产引擎,竞争焦点转向推理成本与效率。 5. **Token分发**:像电网一样分配算力的云平台与租赁服务。 6. **Token优化与智能调度**:根据任务复杂度、隐私要求等,动态调度算力与模型的关键“大脑”。 7. **AI Agent**:Token的最终消费者与价值实现层。 当前产业链各层之间存在割裂与效率瓶颈(如算力与能源不匹配、缺乏智能调度等)。只有当这七层基础设施被打通并高效协同时,AI产业才能从“工具时代”迈向真正的“大规模采用时代”。未来的竞争关键,可能不在于拥有最大的模型,而在于能否有效连接能源、算力、网络与Token流动,构建起支持数十亿AI Agent持续协作的智能基础设施网络。

marsbit05/26 05:43

从电力基础设施到 Token 经济:AI 产业链的「七层蛋糕」

marsbit05/26 05:43

投资人疯抢“没利润”的AI企业:一场关于“未来定义权”的豪赌

中国AI领域正经历一场资本狂欢,DeepSeek、智谱、MiniMax、Kimi这“四小龙”合计估值已超万亿元人民币,尽管它们普遍处于巨额亏损状态。投资者争相押注的并非短期利润,而是对未来技术标准与商业模式的“定义权”。国家集成电路产业投资基金等国资,以及腾讯、阿里等互联网巨头纷纷入局,凸显了这场竞赛的战略意义。 这些公司的估值逻辑已与传统财务模型脱钩。智谱和MiniMax作为全球稀有的纯AI大模型上市公司,其高市值部分源于“唯一性溢价”。摩根大通指出,这种稀缺性窗口期可能仅剩6-12个月,待更多同行上市后,溢价或将消退。 商业化进程正在加速。Kimi的年度经常性收入(ARR)在近期迅猛增长;智谱的API服务供不应求,甚至能够提价;MiniMax则凭借全球化AI应用实现营收,且海外收入占主导。技术层面,各家公司努力提升模型能力并压低推理成本,例如DeepSeek V4展现了显著的成本优势。 然而,狂欢背后存在隐忧:稀缺性窗口逐渐关闭、算力瓶颈制约需求释放、以及激烈的成本竞争可能重塑格局。互联网大厂在巨额投入的同时,也通过投资“四小龙”来对冲自身AI业务的不确定性。这场由国家资本和市场化资本共同推动的豪赌,最终将检验这些高估值公司能否用扎实的收入支撑起市值,答案或在未来一年内揭晓。

marsbit05/26 02:06

投资人疯抢“没利润”的AI企业:一场关于“未来定义权”的豪赌

marsbit05/26 02:06

TechFlow 情报局:华为发布"韬"定律半导体板块大涨;Meta 裁员 10%

AI在高难度纯数学领域取得突破,以低成本解决多道开放问题,可能改变数学研究范式。DeepSeek推出编程Agent,其推理能力引发社区讨论。研究指出LLM在复杂后端代码生成中易丢失约束,成为取代人类的瓶颈。开源模型Qwen在老旧GPU上实现高吞吐,引发关于本地推理性价比及NVIDIA垄断地位的讨论。 加密领域,以太坊基金会计划“瘦身”以减少ETH抛压。CZ相关谣言催生Meme币热潮,显示市场对名人叙事的敏感。DeFi中抵押贷款池成为新趋势,但清算与合规仍是挑战。 芯片方面,华为提出“韬定律”,旨在通过架构创新实现制程突破,引发半导体板块上涨。内存成本已成为AI芯片最大开支,推动行业转向内存优化架构。多家中国半导体公司高管在高位减持套现,引发市场争议。 科技公司动态:Meta裁员10%,加速AI转型;Google CEO演讲遭学生嘘声,反映对AI伦理的担忧;Google提前公开Chromium漏洞利用代码引发安全争议;小米严惩空调安装造假行为。 美股市场关注AMD市值冲击万亿美元的可能性,以及AI驱动的裁员预期。调查显示绝大多数CEO计划用AI替代部分岗位。Palantir获政府监控合同引发隐私争议。BlackBerry转型网络安全与汽车软件受关注。 财经宏观方面,美伊谈判进展致油价暴跌,避险情绪推高白银价格。全球石油库存因霍尔木兹海峡封锁持续而紧张。 新产品与安全趋势:研究揭示可通过音频向AI助手植入隐藏指令的新型攻击。CBS在社区抗议后暂停删除早期节目的盗版内容。 今日暗线串联起AI与芯片竞赛、就业影响、地缘政治及文明话语权博弈,显示技术竞争已扩展至更广泛的领域。

marsbit05/25 10:50

TechFlow 情报局:华为发布"韬"定律半导体板块大涨;Meta 裁员 10%

marsbit05/25 10:50

Agentic Design Patterns:一本让我重新理解"Agent 到底是什么"的书

《Agentic Design Patterns》一书由Google工程总监Antonio Gullí撰写,系统性地将AI Agent开发拆解为21种设计模式。文章作者阅读后,对Agent的本质有了更深刻的理解。 书中将Agent划分为四个等级:Level 0仅为裸LLM,不具备行动能力,并非真正的Agent;Level 1能自主调用工具完成任务;Level 2具备战略规划与上下文工程能力,能对信息进行裁剪和降噪,并进行自我反思;Level 3则是多智能体协作,像团队一样分工合作。 文章重点阐述了几个核心概念: 1. **上下文工程**:超越提示词工程,系统地为Agent构建包括系统指令、外部数据、隐式信息和反馈回路在内的四层上下文环境,以提升其准确性和效率。 2. **反思模式**:采用“生产者-批评者”双智能体模式,让一个智能体负责创作,另一个负责审查和提出修改意见,通过迭代循环显著提升输出质量,但需设置合理的迭代次数以控制成本。 3. **多智能体协作**:并非越复杂越好,应根据任务复杂度选择合适的通信拓扑结构(如独立执行、对等网络、中心调度等)。通常,一个达到Level 2的单智能体加上反思机制已能应对大多数场景。 4. **记忆三层模型**:分为会话层(临时对话上下文)、状态层(任务进行中的临时数据)和持久层(跨会话的长期记忆),需要设计相应的存储与检索策略。 书末还提出了对未来Agent发展的五个假设,其中最颠覆的是“变形多智能体”:系统能根据最终目标自动创建、调整、重组智能体团队,实现完全自主的任务规划与执行。 作者建议读者可立即实践三点:为现有智能体增加一个“批评者”角色以进行审查;开始实践系统的上下文工程而非仅关注提示词;优先将单智能体能力提升至Level 2,而非盲目追求多智能体系统。 这本书的价值在于,它将许多开发者在实践中摸索的经验系统化、模式化,为AI Agent开发提供了一份清晰的“地图”。

链捕手05/25 04:42

Agentic Design Patterns:一本让我重新理解"Agent 到底是什么"的书

链捕手05/25 04:42

DeepSeek永久降价,但梁文锋并不想做「赛博菩萨」

DeepSeek宣布将V4-Pro API的75%折扣永久化,全球同步生效,基础输入/输出价格大幅降低至0.435美元/百万Token和0.87美元/百万Token。在AI行业普遍涨价的背景下,这一逆势降价行动被社区称为“赛博菩萨”行为。但创始人梁文锋并非纯粹做慈善,而是选择了开源普惠的商业模式。 当前AI行业正变得越来越贵,微软、Uber等大公司的Token预算消耗远超预期,而Anthropic、OpenAI和谷歌等巨头已在过去六个月内悄悄提价。随着用户习惯建立,AI补贴时代已结束,供需关系反转导致价格上涨。 DeepSeek的持续降价展现了一种反向定价权。其竞争力来源于多个方面:国产昇腾算力支持未来将进一步降低成本;中国相对较低的AI人才成本;最重要的是能源体系优势——中国西部绿电价格仅为欧美的1/5到1/4,且拥有完整的电力结构和“东数西算”等调度能力,电力成本占AI运营成本的60%-70%,这构成了系统性的成本优势。 虽然DeepSeek V4与顶尖闭源模型仍有客观差距,且商业收入目前落后于国内其他AI公司,但其极低的推理成本(仅为GPT-5.5的约1%到11%)满足了大量实际商业场景对“勉强能用+足够便宜+足够稳定”的需求。当AI整体越贵,DeepSeek的性价比优势就越突出,其商业价值也由此体现。

marsbit05/24 12:19

DeepSeek永久降价,但梁文锋并不想做「赛博菩萨」

marsbit05/24 12:19

智谱凭什么一天暴涨近30%?

智谱(02513.HK)股价单日暴涨近30%,核心触发因素是公司面向企业客户开放的GLM-5.1高速版API,其模型输出速度达到每秒400个token,刷新全球大模型API速度上限。 这一速度约为行业平均水平的3到5倍,意味着每秒可生成约200个汉字,显著提升了AI任务的执行效率。在AI进入Agent(智能体)时代、任务需要模型进行多轮自我调用的背景下,速度成为关键竞争力,直接影响任务完成时间和智能上限。 实现这一突破依赖智谱在推理引擎、并行策略和网络架构三个层面的技术创新: 1. **TileRT推理引擎**:将整个模型编译成持续运行的流水线,避免传统框架中频繁启动和等待的开销,并通过“Warp专门化”让GPU内不同计算组并行工作。 2. **异构并行策略**:针对GLM-5.1采用的MLA注意力机制,让多块GPU分工协作(如有的负责稀疏检索,有的负责密集计算),优化计算流程。 3. **ZCube网络架构**:取代行业标准的树形网络拓扑,采用扁平化互联设计,使得任意两台GPU间通信路径唯一且最短(仅需2跳),从根本上避免了网络拥塞,提升了集群整体吞吐并降低了延迟。 技术升级带来直接效益:在同等GPU投入下,集群吞吐量提升15%,相当于免费获得更多算力;任务尾延迟下降40.6%,提升了稳定性;网络建设成本因精简结构而节省约三分之一。 从行业影响看,智谱的技术路径证明,在相同算力下可以产出更多,这有助于重构GPU之外的基础设施生态。长期可能侵蚀英伟达在网络侧的溢价,利好能够提供高密度交换机的厂商以及国内光模块企业。同时,该纯软件方案理论上可移植到国产AI芯片,有望降低其软件生态门槛。

marsbit05/23 01:22

智谱凭什么一天暴涨近30%?

marsbit05/23 01:22

刑拘 37 天,第一批靠“AI 中转站”发财的人开始进去了

2026年5月,据称一名AI中转站站长因非法逆向爬取、倒卖低价AI接口资源被刑事拘留37天,目前取保候审。此事揭示了当前火爆的AI中转站业务背后的法律与安全风险。 AI中转站为国内用户提供访问海外大模型(如OpenAI、Claude)的渠道,通过统一接口解决网络、支付等问题,因此需求激增。其盈利模式包括:转卖账号免费额度、利用退款机制套利、虚报计费Token、用低成本模型掉包高价模型,以及转卖用户对话数据。这些做法使得服务价格极低,但实质多为灰色操作。 从法律层面分析,该业务主要存在三大风险:1. **经营模式违法**:通过技术手段逆向获取接口、规避地区限制,且未取得电信业务经营许可,可能涉嫌非法经营罪。2. **数据安全缺失**:作为大量用户数据的经手方,多数中转站缺乏安全管理制度,一旦数据泄露,可能构成拒不履行信息网络安全管理义务罪。3. **违规收集出售数据**:未经用户同意收集并转卖包含个人或商业敏感信息的对话记录,极易达到侵犯公民个人信息罪的立案标准。 该事件反映出AI行业野蛮生长下的隐患。对用户而言,低价伴随数据暴露风险;对厂商而言,灰产消耗其资源、扰乱定价体系,损害行业可持续发展。行业正处规范化关键期,建立合规秩序与信任基础是长远发展的前提。

marsbit05/21 14:40

刑拘 37 天,第一批靠“AI 中转站”发财的人开始进去了

marsbit05/21 14:40

活动图片