# 自动化的所有文章

在 HTX 新聞中心流覽與「自动化」相關的最新資訊與深度分析。潘蓋市場趨勢、專案動態、技術進展及監管政策,提供權威的加密行業洞察。

机器人开始“吃数据”:从印度数据工厂到百亿美元人形机器人的隐秘生产链

随着具身智能行业的发展,机器人训练对高质量数据的需求急剧增长,催生了一条隐秘的数据生产链。与依赖互联网文本数据的大语言模型不同,具身模型面临物理世界的“数据荒漠”,人类第一视角视频(Ego Data)等真实世界经验成为关键。 在印度等地,出现了专门采集人类工作视频的“数据工厂”。工人们佩戴头戴摄像头和数据手套,按照严格规范完成整理、抓取等任务,产出结构化视频与动作数据,出售给欧美等地的机器人公司。这类Ego Data成本相对较低,可用于模型预训练,让机器人理解人类如何完成任务。 数据价值呈现“金字塔”结构:底层是低成本互联网视频;上层是带精细动作标注的Ego数据;再往上是仿真合成数据,可大规模生成但存在与现实差距;顶层是最稀缺、昂贵的真机遥操数据,直接指导机器人本体动作。 行业上游已分化为多类玩家:低成本数据工厂、专注动作捕捉与重定向的服务商、提供真机遥操数据的第三方、仿真合成数据公司,以及探索数据标准与流通的平台。机器人公司则采取“分层采购”策略:通用Ego数据倾向外包以快速获取规模;而关乎自身硬件适配的核心真机数据与部署中产生的失败数据,则多由自己掌控以构建壁垒。 当前,行业竞争焦点正从硬件与模型架构,转向高质量数据的持续供给与有效利用。能否建立高效的数据采集、标注、仿真扩增与反馈闭环,将成为影响机器人能力突破的关键。这条从全球劳动力密集区延伸到顶尖机器人公司的数据供应链,正在支撑着百亿美元估值的人形机器人迈向现实应用。

marsbit06/13 03:32

机器人开始“吃数据”:从印度数据工厂到百亿美元人形机器人的隐秘生产链

marsbit06/13 03:32

Anthropic警告的递归AI,田渊栋新公司刚刚走出了「第一步」

近日,Anthropic发布文章披露,其代码库超过80%由AI撰写,并警告AI“递归自我改进”(即AI自主设计、训练后续版本)可能带来风险,呼吁行业建立暂停机制。与此同时,由田渊栋等人联合创立的新公司Recursive Superintelligence结束了隐身状态,发布了其首项公开技术成果——“迈向自动化AI研究的第一步”。 该系统旨在将传统AI研究中“提出想法-编写代码-运行实验-分析结果”的人工闭环自动化。它能够针对给定目标自动生成实验思路、实现代码、运行验证并从中学习,从而自主推进研究进程,并内置了防止“奖励作弊”的机制。 Recursive在三个差异显著的基准测试中取得了领先结果: 1. **小模型训练优化**:在固定计算预算下,将模型验证损失进一步降低,相当于以更少时间达到同等效果。 2. **训练速度竞速**:在社区持续优化两年的基准上,将训练时间从79.7秒缩短至77.5秒,核心改进包括在注意力层使用FP8计算、为优化器添加退火噪声等。 3. **GPU内核优化**:在英伟达的底层计算内核基准测试中,将整体得分提升至0.754,缩小了与硬件理论极限的差距,而这些优化策略并非来自团队的专业知识,而是由系统自主发现。 Recursive团队阵容强大,已获得巨额融资,其目标是构建能够递归提升自身研发能力的AI系统。这与Anthropic的警告形成了微妙对比:一方正在实践AI加速AI研发的路径,另一方则呼吁为可能到来的“递归自我改进”时刻做好风险管控准备。当前成果虽仅是迈向自动化研究的初步尝试,但标志着一个能够自我增强的AI研发新范式已开始运转。

marsbit06/12 04:11

Anthropic警告的递归AI,田渊栋新公司刚刚走出了「第一步」

marsbit06/12 04:11

如何用 Claude 的 Dynamic Workflows 做深度研究

做技术调研容易陷入信息过载和结论模糊的陷阱。AI虽执行力强,但易困于当前信息且跨界联想弱。Claude近期推出的Dynamic Workflows(动态工作流)功能,旨在通过AI自动设计并执行任务流程来提升深度研究能力。 其核心是六种工作流模式:1) 路由模式:由主Agent判断任务类型并分发给最专业的子Agent处理,精准高效但处理模糊任务能力弱;2) 拆分合并模式:将任务拆分为多个独立子任务并行执行后合并结果,速度快但Token成本高,合并有挑战;3) 对抗验证模式:让多个Agent从反驳角度挑战同一结论,基于多数票通过,能有效减少确认偏误,但需基于事实而非观点;4) 生成与过滤模式:先生成大量候选方案,再用预设标准筛选出最优,能提升多样性,但过滤标准至关重要;5) 锦标赛模式:多个Agent竞争同一任务,通过两两对比逐轮淘汰选出最优,评判更稳定;6) 循环模式:通过自适应迭代不断尝试直至满足条件,擅长处理边界未知的任务,但有失控风险。 相较于作者自建的深度研究技能,官方的动态工作流增加了关键环节:问题拆解、信息可信度评估、交叉删除(投票淘汰而非简单合并)以及目标导向的输出。这有效解决了AI长任务中的目标漂移、过早停止、上下文污染和输出偏向等问题。 总之,Dynamic Workflows将研究流程本身结构化,通过多Agent的智能调度,显著提升了研究的效率和结论的可靠性,将以往可能需要十几次对话的调研压缩到3-4次,尽管Token消耗大幅增加。但它仍有局限:在验证机制上可能过于依赖官方文档而非事实数据;对于完全跨界、数据不足的深度思考支持有限;在解决方案的验证与成本权衡上仍有不足;在针对不同受众进行信息极致浓缩方面也需进一步优化。

marsbit06/09 03:07

如何用 Claude 的 Dynamic Workflows 做深度研究

marsbit06/09 03:07

GitHub,被 AI 打穿了

2026年2月9日,GitHub发生大规模服务中断,核心数据库集群因“缓存重写风暴”过载,导致网站、API、Actions及Copilot等服务瘫痪。事故根源是一个配置改动(缓存刷新时间从12小时改为2小时),但背后是平台面临的结构性挑战。 2026年前三个月,GitHub发生至少8次重大事故,故障原因各异但相互关联。深层原因是AI Agent的爆发式使用导致负载性质剧变。数据显示,2026年单周代码提交量达2.75亿次,按此推算全年将达140亿次,是2025年的14倍。AI贡献的提交量和PR数量在数月内增长数十倍。这些不眠不休的AI“用户”以远超人类的速率提交代码、创建仓库,使GitHub的负载模式从可预测的人类节奏转变为持续高压的自动化洪流。 同时,AI Agent(尤其是Agentic工作流)消耗的计算资源远超预期,使GitHub基于座位的Copilot订阅模式严重亏损。GitHub不得不实施限流,并于6月1日全面转向按用量计费。 为应对挑战,GitHub宣布需按当前规模的30倍重新设计架构,而非简单扩容,重点包括解耦服务、增强故障隔离、改进流量管控等。行业如Stripe、AWS也面临类似问题。 本质上,GitHub正从“人类协作平台”转变为“AI工作流的输出管道”。这不仅是基础设施的压力测试,也引发对其商业模式和核心身份的重塑。频繁的事故报告和高透明度,是平台在重建过程中争取社区耐心的方式。这次停机事件标志着软件开发在AI时代的一次深刻转折。

marsbit06/04 10:39

GitHub,被 AI 打穿了

marsbit06/04 10:39

活动图片