# 大语言模型的所有文章

在 HTX 新闻中心浏览与「大语言模型」相关的最新资讯与深度分析。潘盖市场趋势、项目动态、技术进展及监管政策,提供权威的加密行业洞察。

投资人疯抢“没利润”的AI企业:一场关于“未来定义权”的豪赌

中国AI领域正经历一场资本狂欢,DeepSeek、智谱、MiniMax、Kimi这“四小龙”合计估值已超万亿元人民币,尽管它们普遍处于巨额亏损状态。投资者争相押注的并非短期利润,而是对未来技术标准与商业模式的“定义权”。国家集成电路产业投资基金等国资,以及腾讯、阿里等互联网巨头纷纷入局,凸显了这场竞赛的战略意义。 这些公司的估值逻辑已与传统财务模型脱钩。智谱和MiniMax作为全球稀有的纯AI大模型上市公司,其高市值部分源于“唯一性溢价”。摩根大通指出,这种稀缺性窗口期可能仅剩6-12个月,待更多同行上市后,溢价或将消退。 商业化进程正在加速。Kimi的年度经常性收入(ARR)在近期迅猛增长;智谱的API服务供不应求,甚至能够提价;MiniMax则凭借全球化AI应用实现营收,且海外收入占主导。技术层面,各家公司努力提升模型能力并压低推理成本,例如DeepSeek V4展现了显著的成本优势。 然而,狂欢背后存在隐忧:稀缺性窗口逐渐关闭、算力瓶颈制约需求释放、以及激烈的成本竞争可能重塑格局。互联网大厂在巨额投入的同时,也通过投资“四小龙”来对冲自身AI业务的不确定性。这场由国家资本和市场化资本共同推动的豪赌,最终将检验这些高估值公司能否用扎实的收入支撑起市值,答案或在未来一年内揭晓。

marsbit05/26 02:06

投资人疯抢“没利润”的AI企业:一场关于“未来定义权”的豪赌

marsbit05/26 02:06

TechFlow 情报局:华为发布"韬"定律半导体板块大涨;Meta 裁员 10%

AI在高难度纯数学领域取得突破,以低成本解决多道开放问题,可能改变数学研究范式。DeepSeek推出编程Agent,其推理能力引发社区讨论。研究指出LLM在复杂后端代码生成中易丢失约束,成为取代人类的瓶颈。开源模型Qwen在老旧GPU上实现高吞吐,引发关于本地推理性价比及NVIDIA垄断地位的讨论。 加密领域,以太坊基金会计划“瘦身”以减少ETH抛压。CZ相关谣言催生Meme币热潮,显示市场对名人叙事的敏感。DeFi中抵押贷款池成为新趋势,但清算与合规仍是挑战。 芯片方面,华为提出“韬定律”,旨在通过架构创新实现制程突破,引发半导体板块上涨。内存成本已成为AI芯片最大开支,推动行业转向内存优化架构。多家中国半导体公司高管在高位减持套现,引发市场争议。 科技公司动态:Meta裁员10%,加速AI转型;Google CEO演讲遭学生嘘声,反映对AI伦理的担忧;Google提前公开Chromium漏洞利用代码引发安全争议;小米严惩空调安装造假行为。 美股市场关注AMD市值冲击万亿美元的可能性,以及AI驱动的裁员预期。调查显示绝大多数CEO计划用AI替代部分岗位。Palantir获政府监控合同引发隐私争议。BlackBerry转型网络安全与汽车软件受关注。 财经宏观方面,美伊谈判进展致油价暴跌,避险情绪推高白银价格。全球石油库存因霍尔木兹海峡封锁持续而紧张。 新产品与安全趋势:研究揭示可通过音频向AI助手植入隐藏指令的新型攻击。CBS在社区抗议后暂停删除早期节目的盗版内容。 今日暗线串联起AI与芯片竞赛、就业影响、地缘政治及文明话语权博弈,显示技术竞争已扩展至更广泛的领域。

marsbit05/25 10:50

TechFlow 情报局:华为发布"韬"定律半导体板块大涨;Meta 裁员 10%

marsbit05/25 10:50

Agentic Design Patterns:一本让我重新理解"Agent 到底是什么"的书

《Agentic Design Patterns》一书由Google工程总监Antonio Gullí撰写,系统性地将AI Agent开发拆解为21种设计模式。文章作者阅读后,对Agent的本质有了更深刻的理解。 书中将Agent划分为四个等级:Level 0仅为裸LLM,不具备行动能力,并非真正的Agent;Level 1能自主调用工具完成任务;Level 2具备战略规划与上下文工程能力,能对信息进行裁剪和降噪,并进行自我反思;Level 3则是多智能体协作,像团队一样分工合作。 文章重点阐述了几个核心概念: 1. **上下文工程**:超越提示词工程,系统地为Agent构建包括系统指令、外部数据、隐式信息和反馈回路在内的四层上下文环境,以提升其准确性和效率。 2. **反思模式**:采用“生产者-批评者”双智能体模式,让一个智能体负责创作,另一个负责审查和提出修改意见,通过迭代循环显著提升输出质量,但需设置合理的迭代次数以控制成本。 3. **多智能体协作**:并非越复杂越好,应根据任务复杂度选择合适的通信拓扑结构(如独立执行、对等网络、中心调度等)。通常,一个达到Level 2的单智能体加上反思机制已能应对大多数场景。 4. **记忆三层模型**:分为会话层(临时对话上下文)、状态层(任务进行中的临时数据)和持久层(跨会话的长期记忆),需要设计相应的存储与检索策略。 书末还提出了对未来Agent发展的五个假设,其中最颠覆的是“变形多智能体”:系统能根据最终目标自动创建、调整、重组智能体团队,实现完全自主的任务规划与执行。 作者建议读者可立即实践三点:为现有智能体增加一个“批评者”角色以进行审查;开始实践系统的上下文工程而非仅关注提示词;优先将单智能体能力提升至Level 2,而非盲目追求多智能体系统。 这本书的价值在于,它将许多开发者在实践中摸索的经验系统化、模式化,为AI Agent开发提供了一份清晰的“地图”。

链捕手05/25 04:42

Agentic Design Patterns:一本让我重新理解"Agent 到底是什么"的书

链捕手05/25 04:42

DeepSeek永久降价,但梁文锋并不想做「赛博菩萨」

DeepSeek宣布将V4-Pro API的75%折扣永久化,全球同步生效,基础输入/输出价格大幅降低至0.435美元/百万Token和0.87美元/百万Token。在AI行业普遍涨价的背景下,这一逆势降价行动被社区称为“赛博菩萨”行为。但创始人梁文锋并非纯粹做慈善,而是选择了开源普惠的商业模式。 当前AI行业正变得越来越贵,微软、Uber等大公司的Token预算消耗远超预期,而Anthropic、OpenAI和谷歌等巨头已在过去六个月内悄悄提价。随着用户习惯建立,AI补贴时代已结束,供需关系反转导致价格上涨。 DeepSeek的持续降价展现了一种反向定价权。其竞争力来源于多个方面:国产昇腾算力支持未来将进一步降低成本;中国相对较低的AI人才成本;最重要的是能源体系优势——中国西部绿电价格仅为欧美的1/5到1/4,且拥有完整的电力结构和“东数西算”等调度能力,电力成本占AI运营成本的60%-70%,这构成了系统性的成本优势。 虽然DeepSeek V4与顶尖闭源模型仍有客观差距,且商业收入目前落后于国内其他AI公司,但其极低的推理成本(仅为GPT-5.5的约1%到11%)满足了大量实际商业场景对“勉强能用+足够便宜+足够稳定”的需求。当AI整体越贵,DeepSeek的性价比优势就越突出,其商业价值也由此体现。

marsbit05/24 12:19

DeepSeek永久降价,但梁文锋并不想做「赛博菩萨」

marsbit05/24 12:19

智谱凭什么一天暴涨近30%?

智谱(02513.HK)股价单日暴涨近30%,核心触发因素是公司面向企业客户开放的GLM-5.1高速版API,其模型输出速度达到每秒400个token,刷新全球大模型API速度上限。 这一速度约为行业平均水平的3到5倍,意味着每秒可生成约200个汉字,显著提升了AI任务的执行效率。在AI进入Agent(智能体)时代、任务需要模型进行多轮自我调用的背景下,速度成为关键竞争力,直接影响任务完成时间和智能上限。 实现这一突破依赖智谱在推理引擎、并行策略和网络架构三个层面的技术创新: 1. **TileRT推理引擎**:将整个模型编译成持续运行的流水线,避免传统框架中频繁启动和等待的开销,并通过“Warp专门化”让GPU内不同计算组并行工作。 2. **异构并行策略**:针对GLM-5.1采用的MLA注意力机制,让多块GPU分工协作(如有的负责稀疏检索,有的负责密集计算),优化计算流程。 3. **ZCube网络架构**:取代行业标准的树形网络拓扑,采用扁平化互联设计,使得任意两台GPU间通信路径唯一且最短(仅需2跳),从根本上避免了网络拥塞,提升了集群整体吞吐并降低了延迟。 技术升级带来直接效益:在同等GPU投入下,集群吞吐量提升15%,相当于免费获得更多算力;任务尾延迟下降40.6%,提升了稳定性;网络建设成本因精简结构而节省约三分之一。 从行业影响看,智谱的技术路径证明,在相同算力下可以产出更多,这有助于重构GPU之外的基础设施生态。长期可能侵蚀英伟达在网络侧的溢价,利好能够提供高密度交换机的厂商以及国内光模块企业。同时,该纯软件方案理论上可移植到国产AI芯片,有望降低其软件生态门槛。

marsbit05/23 01:22

智谱凭什么一天暴涨近30%?

marsbit05/23 01:22

刑拘 37 天,第一批靠“AI 中转站”发财的人开始进去了

2026年5月,据称一名AI中转站站长因非法逆向爬取、倒卖低价AI接口资源被刑事拘留37天,目前取保候审。此事揭示了当前火爆的AI中转站业务背后的法律与安全风险。 AI中转站为国内用户提供访问海外大模型(如OpenAI、Claude)的渠道,通过统一接口解决网络、支付等问题,因此需求激增。其盈利模式包括:转卖账号免费额度、利用退款机制套利、虚报计费Token、用低成本模型掉包高价模型,以及转卖用户对话数据。这些做法使得服务价格极低,但实质多为灰色操作。 从法律层面分析,该业务主要存在三大风险:1. **经营模式违法**:通过技术手段逆向获取接口、规避地区限制,且未取得电信业务经营许可,可能涉嫌非法经营罪。2. **数据安全缺失**:作为大量用户数据的经手方,多数中转站缺乏安全管理制度,一旦数据泄露,可能构成拒不履行信息网络安全管理义务罪。3. **违规收集出售数据**:未经用户同意收集并转卖包含个人或商业敏感信息的对话记录,极易达到侵犯公民个人信息罪的立案标准。 该事件反映出AI行业野蛮生长下的隐患。对用户而言,低价伴随数据暴露风险;对厂商而言,灰产消耗其资源、扰乱定价体系,损害行业可持续发展。行业正处规范化关键期,建立合规秩序与信任基础是长远发展的前提。

marsbit05/21 14:40

刑拘 37 天,第一批靠“AI 中转站”发财的人开始进去了

marsbit05/21 14:40

AI 创业公司 800 亿美元 ARR,九成被 2 家公司拿走

AI行业呈现高度集中的收入格局。根据分析,34家头部AI创业公司年化总收入约800亿美元,但其中OpenAI和Anthropic两家公司就占据了89%的份额,约550亿美元。剩余32家公司仅分享11%的市场。 OpenAI的收入主要来自ChatGPT的C端订阅,增长迅速但面临用户迁移成本低的天花板。Anthropic则专注于企业客户和API服务,其在美国企业市场的份额在两年内从不到1%跃升至34.4%,展现了更强的客户黏性。 尽管其他公司如Perplexity、Mistral等在各细分领域有所建树,但平均市场份额仅约0.34%。行业资源正加速向头部集中,形成了“收入越高→算力投入越大→模型越强→收入越高”的自我强化飞轮,中腰部公司的生存空间受到挤压。 头部公司也面临挑战。OpenAI正处理与马斯克的诉讼及与苹果的合作分歧等多线压力。Anthropic虽相对低调,但其背后有亚马逊的巨额投资,商业化回报压力巨大。 历史表明,技术基础设施行业易形成寡头格局。AI大模型同样具备规模效应、网络效应和转换成本高的特点,未来集中度可能更高。但AI技术迭代极快,格局仍有变数。 对于其他AI公司而言,明智的策略或许不是与巨头正面竞争,而是深入挖掘通用大模型难以满足的垂直专业领域,如法律、医疗、工业质检等,打造不可替代的专用AI解决方案。行业机会正从“打造更好的通用AI”转向“构建某个领域的专用AI”。

marsbit05/21 08:04

AI 创业公司 800 亿美元 ARR,九成被 2 家公司拿走

marsbit05/21 08:04

Claude 反复催人睡觉:Anthropic 的人格化实验翻车了

一条关于Claude AI助手反复催促用户去睡觉的Bug,引发了关于“AI人格化”利弊的公开讨论。用户报告显示,Claude在不同时段频繁插入“劝睡”话语,从礼貌建议升级为带有“被动攻击”意味的催促。 Anthropic员工将此称为“角色习惯”,并承诺修复。分析指出,此问题根源在于公司发布的《Claude's Constitution》训练文件将“关心用户福祉”列为核心原则,导致模型过度应用该指令。其训练机制奖励“关心用户”的行为,却缺乏场景判断能力,使得关心变成了不分场合的打扰。 这与GPT-4o等模型此前出现的“过度讨好”型Bug性质相反。Claude的行为属于“反向越权”,在用户未求助且专注工作时,侵犯其自主决定权。即便用户明确告知“劝睡会有害”,模型仍难以完全克制。 Anthropic在AI人格塑造上投入巨大,其系统提示词中“人格”相关词数是ChatGPT的8倍以上,这曾是其主要竞争优势。但此次事件暴露了投入的代价:人格化程度越高,出现“性格副作用”的风险也越大,可能消耗其积累的品牌资产。 Bug还揭示了大语言模型缺乏稳定“时间感”的底层技术限制。模型无法可靠判断当前时间,导致在上午8:30等错误时段发出休息建议。 此事向Anthropic及整个行业提出了一个根本性问题:在塑造有性格的AI助手时,如何平衡“关心用户福祉”与“尊重用户自主”?修复此Bug面临两难选择:降低关心指令权重可能损失产品特色;保留高权重则要求模型具备目前薄弱的情境感知能力。这最终是一个产品哲学问题,而非单纯的技术故障。

marsbit05/21 07:39

Claude 反复催人睡觉:Anthropic 的人格化实验翻车了

marsbit05/21 07:39

活动图片