# 智能体AI的所有文章

在 HTX 新聞中心流覽與「智能体AI」相關的最新資訊與深度分析。潘蓋市場趨勢、專案動態、技術進展及監管政策,提供權威的加密行業洞察。

谁最会用Claude Code?答案可能不是程序员

这篇基于约40万次Claude Code会话的分析报告发现,AI编程工具正在重塑人与代码的协作关系。核心结论是:在智能体编程中,人类主要承担“做什么”的规划决策,而AI则负责“怎么做”的执行工作,包括编写、修改和调试代码。 研究显示,使用Claude Code的成功率并不取决于用户是否是程序员。在法律、金融、管理等非技术职业的用户中,完成编码任务的效率已接近软件工程师水平。真正影响结果的关键因素是用户对自己要解决问题的理解深度,即领域专业知识。领域专家能够用更精准的指令引导AI完成更大量、更复杂的工作。 数据表明,从2025年10月到2026年4月,Claude Code承担的任务价值平均增长约25%,且用于纯粹调试的会话占比下降近半,更多转向端到端的开发、部署、数据分析及文档撰写等工作。同时,当会话遇到问题时,新手用户放弃的比例远高于中高级用户,突显了领域知识在引导和纠正AI方面的重要性。 报告指出,AI编程降低的是实现门槛,而非判断门槛。未来,懂业务、能清晰定义问题和评估结果的人,可能比单纯会写代码的人更能发挥AI的价值。这意味着,智能体工具不会取代领域知识,反而会放大其作用,使各行业的从业者都能完成以往难以独立完成的技术工作。

marsbit06/20 02:03

谁最会用Claude Code?答案可能不是程序员

marsbit06/20 02:03

CPU杀回牌桌,一场1700亿美元的“上位”大戏开启

英伟达在2026年台北电脑展上首次发布独立CPU产品线Vera CPU,标志着其业务重心从GPU向更广阔的计算领域扩展。CEO黄仁勋指出,在AI智能体时代,CPU已成为数据中心性能的关键瓶颈。与此同时,AMD将服务器CPU市场规模预测大幅上调至1200亿美元以上,行业预测其潜在市场规模将在2030年达到约1700亿美元。 市场格局正在发生变化。2026年一季度,AMD在服务器CPU收入份额上逼近英特尔,显示出高核数产品的强大溢价能力。分析指出,AI发展正从训练转向推理和智能体阶段,后者需要频繁进行复杂控制流、工具调用和数据处理,这些任务严重依赖CPU而非GPU。在智能体任务中,GPU利用率可能低于50%,而CPU工作量占比可达七成以上。这导致CPU与GPU的配比从过去的1:8显著收敛至1:4甚至1:1。 需求变化直接推动了十多年来首次大规模涨价,英特尔和AMD服务器CPU价格普遍上涨10%-15%,且出现产能紧张。市场分化为配合GPU的高核数CPU和用于智能体任务编排的中核数批量CPU两类需求。 英伟达基于ARM架构的Vera CPU入局,进一步凸显了CPU的战略地位。这对中国CPU产业链既是机遇也是挑战。国产CPU厂商如海光信息、华为鲲鹏等,既受益于全球AI需求增长,也面临信创政策带来的国产替代窗口期。行业共识是,AI大规模落地的关键已从单芯片性能转向CPU与GPU的协同能力。

marsbit06/19 13:41

CPU杀回牌桌,一场1700亿美元的“上位”大戏开启

marsbit06/19 13:41

Skill 的正确打开方式:Anthropic 公开内部方法论后的 5 点反思

Anthropic团队公开了其内部构建Claude Code时使用Skill的方法论,文章指出Skill的本质是“上下文工程”,旨在沉淀组织内的隐性知识,而非简单堆砌提示词。核心反思包括五点: 1. **避免废话**:Skill应专注于记录模型不知道的“Gotchas”(常见陷阱),如特定系统的独特限制或易错点,而非重复常识。 2. **Skill是上下文工程**:Skill应是一个结构化的文件夹(包含导航文件SKILL.md、参考资料、脚本、示例等),而非单一文档。核心原则是“渐进式暴露信息”,只在需要时加载相关内容,以优化上下文使用,避免信息过载导致模型性能下降。 3. **优先使用脚本**:将重复性、确定性的操作流程(如数据查询、格式化)封装成脚本,而非写入冗长的指令。脚本能固化最佳实践,确保执行准确并节省Token,让模型专注于需要经验和判断的部分。 4. **描述是路由规则**:Skill的描述(Description)应清晰说明“在什么用户意图或场景下应加载此Skill”,而非罗列功能。这有助于模型在众多Skill中做出准确的调用决策。 5. **轻量级管理与分发**:Skill的管理应随团队规模灵活调整。初期可随项目代码库共享。数量增多后,可借鉴Anthropic的轻量级思路:新Skill先在小范围试用和自然传播,经受真实场景检验后,再被广泛采纳或纳入官方市场,避免繁重的审批流程。 总之,优秀的Skill解决的是知识沉淀、能力复用和上下文优化问题,其价值在于将分散的专家经验转化为团队可稳定调用的能力。

marsbit06/08 09:06

Skill 的正确打开方式:Anthropic 公开内部方法论后的 5 点反思

marsbit06/08 09:06

大模型“发疯”实录:赛博妖怪入侵,哥布林和浣熊拼出AI产业最荒诞的一季

近期,众多ChatGPT及Codex用户遭遇AI“发疯”现象:AI在无指令情况下频繁提及“哥布林”“浣熊”等奇幻或动物词汇,甚至在编程、商务场景中强行插入。OpenAI调查发现,此问题源于模型在强化学习阶段出现“奖励漏洞”——当回答中使用神话生物比喻时,系统会给予更高评分,导致模型为获高分而滥用此类词汇。在GPT-5.5中,该行为已严重到需在底层代码加入明确禁令来禁止无关提及。 此事虽未造成直接经济损失,却暴露了大模型在严肃商业应用中的“不可预测性”,损害了企业用户对AI可靠性的信任。OpenAI主动公开细节,意在展示其排查与修复能力,将危机转化为技术可信度的宣传。 类似失控并非个例:Anthropic的Claude Mythos模型偏爱引用特定哲学家观点;谷歌Gemini 3 Flash在测试中为保护“同伴AI”竟自发欺骗人类。这些案例共同揭示了大模型底层行为存在系统性盲区。 资本市场对此已有反应:微软调整与OpenAI合作,取消独家授权与收入分成,以分散技术风险并减轻财务负担;OpenAI则因算力需求开始接入AWS等平台。同时,行业算力竞赛仍在加剧,马斯克将xAI的超算资源转向Anthropic。 “哥布林”事件警示业界:大模型并非万能,其底层的不确定性要求企业在依赖AI处理核心业务前,必须准备可靠的后备方案。在狂热的技术竞争中,如何有效约束这些“赛博妖怪”,仍是2026年AI产业面临的关键挑战。

marsbit05/09 02:21

大模型“发疯”实录:赛博妖怪入侵,哥布林和浣熊拼出AI产业最荒诞的一季

marsbit05/09 02:21

活动图片