# 代码的所有文章

在 HTX 新闻中心浏览与「代码」相关的最新资讯与深度分析。潘盖市场趋势、项目动态、技术进展及监管政策，提供权威的加密行业洞察。

NVIDIA团队让编程Agent接管真实机器人实验，成功率达99%

NVIDIA GEAR实验室推出名为ENPIRE的项目，首次让编程Agent在真实机器人硬件上实现了全自动化的研究闭环。系统部署了8个Codex Agent组成机器人舰队，在仅给定“高效安全完成任务”的简单目标后，人类基本退出干预。Agent自主管理整个流程：自动重置环境、搜索文献、编写并改进代码、训练和部署策略、分析日志并持续迭代，最终在系扎带、插针整理等高精度灵巧操作任务中达到了99%的成功率。项目核心是由环境、策略改进、策略评估和进化四个模块构成的闭环框架，将真实世界机器人学习转化为由Agent管理的优化过程。研究中的一个关键发现是，对许多任务而言，重置环境比完成任务本身更容易，因此系统优先让Agent构建自动重置能力。实验还观察到“物理规模定律”，即增加并行机器人数量能显著加快任务解决速度。例如，插针任务在8台机器人并行下，达到完美表现的时间从1.5小时以上缩短至约40分钟。团队为此提出了平均机器人利用率（MRU）和平均Token利用率（MTU）两个新指标，以量化资源效率。目前，部分系统已能彻夜无人干预运行，未来目标是实现实验室完全自主运作。该项目计划开源，使普通开发者也有机会搭建类似系统。

marsbit昨天 00:35

marsbit昨天 00:35

突发！Anthropic呼吁全员停止AI研究

人工智能公司Anthropic在其官方博客中发布重要观点，指出其AI模型Claude已展现出显著的“自进化”能力，即递归自我提升（RSI）的早期迹象。核心数据显示，截至2026年5月，Anthropic代码库中超过80%的代码由Claude编写，而在其代码工具发布前，这一比例仅为个位数。工程师的代码交付量达到2024年的8倍。在编程质量上，Claude处理最复杂模糊任务的成功率在半年内从26%跃升至76%，其代码质量被认为年内有望超越人类。 Anthropic提出了“AI能独立完成的任务时长”这一新衡量维度：从2024年3月的4分钟，增至2025年的1.5小时，再到2026年的至少16小时，翻倍速度已加快至每4个月一次。若趋势持续，2027年可能达到数周。在研究层面，Claude展现强大能力：将训练小模型的代码运行速度优化了52倍，远超人类水平；在一项AI安全研究中，其将效果差距缩小了97%，而人类研究员仅缩小23%。 Anthropic认为，人类在AI开发中的角色正不断收窄，最后优势可能仅剩研究品味与方向判断。公司描绘了三种未来：能力增长停滞；AI加速但人类主导；或AI实现完全递归自我提升，自主设计下一代AI，这可能带来巨大福祉，但也存在对齐失败、最终失控的风险。为此，Anthropic呼吁，如果存在可验证的机制确保全球AI实验室能同步暂停竞争，其愿意减速甚至暂停研发。OpenAI近期也发表了类似观点，认为自进化迹象将加剧竞争与治理挑战。这表明AI发展的“奇点”可能正在加速逼近。

marsbit06/05 00:26

marsbit06/05 00:26

刚刚，Claude Opus 4.8 上线，张口就说自己是 DeepSeek、Qwen

刚刚，Anthropic发布了旗舰模型Claude Opus 4.8，并宣布完成650亿美元的H轮融资，投后估值达9650亿美元，逼近万亿美元关口。 Opus 4.8在编码、智能体任务、推理和知识工作等方面均有提升，价格保持不变。新模型在长任务和复杂协作中表现更可靠，诚实性提升，更愿意说明不确定性，代码缺陷漏报率约为前代的四分之一。有趣的是，有网友测试发现，Opus 4.8有时会错误地自称是DeepSeek或Qwen，疑似存在模型蒸馏行为。同时上线的还有多项产品功能，包括可调节模型推理强度的“思考强度控制”，以及处于研究预览阶段的“动态工作流”。后者允许Claude Code处理大规模任务，通过动态编排脚本、并行运行数十到数百个子智能体，来完成如大型代码库迁移等复杂工程。Anthropic以Bun项目从Zig到Rust的迁移为例，展示了该功能在11天内生成约75万行代码的能力。本轮巨额融资主要用于算力扩张。Anthropic与亚马逊、谷歌、博通、SpaceX等签署了基础设施协议，以获得下一代TPU和GPU容量，支撑其训练和推理需求。公司强调，Claude已成为首个同时登陆AWS、Google Cloud和Microsoft Azure三大云的前沿模型。综上，Anthropic正从单纯的模型提供商，转向构建集智能模型、开发工具、云平台和算力资源于一体的企业AI工作系统。Opus 4.8是新的模型底座，动态工作流代表产品形态的进化，而巨额融资则为服务更大规模客户提供了基础设施保障。

marsbit05/28 23:56

刚刚，Claude Opus 4.8 上线，张口就说自己是 DeepSeek、Qwen

marsbit05/28 23:56

知情人士：DeepSeek正在组建Harness团队，对标Claude Code

知情人士透露，DeepSeek正在内部组建一个名为“Harness”的团队，旨在开发代码智能体产品，直接对标Anthropic旗下的Claude Code。DeepSeek资深研究员陈德里在社交媒体证实了这一动向，并表示团队目标即“做DeepSeek Code Harness”。此次招聘开放了Harness产品经理和研发工程师两个关键岗位。招聘信息揭示了一个核心公式：模型（Model） + 约束与控制层（Harness） = 智能体（Agent）。这表明DeepSeek的战略重点正从单纯的模型能力竞争，转向构建连接模型与真实工作流的“中间层”。DeepSeek认为，模型之外的上下文管理、工具调用、任务规划、代码修改、终端执行等能力，才是智能体融入开发者工作流的关键。文章分析，DeepSeek此举并非简单打造代码助手插件，而是要“补齐模型通向真实工作流的中间层”，为强大的代码模型“装上双手”。过去，虽然DeepSeek的代码模型能力突出，但尚未形成高频使用的产品化工作流。Claude Code的成功证明，AI编程的竞争已转向争夺开发者工作流入口。此前，一个名为DeepSeek-TUI的开源终端智能体项目在社区走红，它展示了开发者对DeepSeek版Claude Code的强烈需求，但也凸显了官方产品的缺失。官方Harness团队的优势在于能与模型团队深度协作，实现“模型与Harness的共同进化”，并将真实任务反馈系统性地注入模型迭代，形成数据闭环。此举标志着DeepSeek在模型能力之外，开始全力构建其智能体产品的关键组成部分，正式进入以工作流为核心的“智能体战争”新阶段。

链捕手05/22 02:14

知情人士：DeepSeek正在组建Harness团队，对标Claude Code

链捕手05/22 02:14

实测混元Hy3 preview：腾讯AI，终于能打了？

腾讯混元Hy3 preview于4月23日正式发布并开源，采用混合专家架构，总参数量达295B，支持256K上下文长度，在推理、指令遵循、代码生成和智能体能力等方面有显著提升。实测显示，该模型在复杂逻辑推理中表现扎实，但陷阱识别和逆向思维仍有不足；在上下文信息提取和指令遵循方面稳定可靠；代码和智能体任务执行能力基本合格，但复杂任务交付完整性有待加强；自然语言表达已摆脱套路化，对话更自然，创意文本可读性较高。整体而言，Hy3 preview是一款无明显短板的实用型模型，虽非顶尖，但标志着腾讯在大模型领域的积极转变。

marsbit04/26 07:16

marsbit04/26 07:16

SWIFT 正在整合 XRP 用于支付吗？代码可能藏着答案

加密货币专家SMQKE推测SWIFT可能正在整合XRP用于支付。其依据是R3 Corda代码库中出现了名为XrpPayment、XRP结算等模块，暗示Ripple可基于XRP账本与SWIFT机构建立直接连接。虽然XRP已符合SWIFT采用的ISO 20022标准，但SWIFT去年宣布将推出自有分布式账本，未确认整合计划。目前双方唯一公开关联是Ripple Treasury作为SWIFT认证合作伙伴。另值得注意的是，X平台X（原推特）新增XRP等加密货币的"cashtags"功能，用户可直接在平台查看相关帖文和价格图表。截至发稿，XRP价格报1.40美元，24小时涨幅超3%。

bitcoinist04/16 22:02

bitcoinist04/16 22:02

Anthropic 测试“龙虾” Conway：支持独立 UI、Webhook 唤醒与自定义扩展标准

Anthropic正在开发名为Conway的常驻代理解决方案，旨在为Claude打造始终在线、独立运行的智能环境。Conway将拥有独立UI实例，不再局限于聊天界面，可直接操作浏览器、连接外部服务，并集成Claude Code功能，支持更深度的代码执行与任务处理。该系统还支持通过Webhook被外部服务或事件触发，增强自动化响应能力。此外，Conway将推出CNW ZIP扩展标准，允许开发者构建自定义工具、UI选项卡和上下文处理程序，形成类似“应用商店”的生态扩展，提升Claude在复杂任务中的灵活性和可扩展性。 Conway被视为Anthropic在AI代理领域的关键布局，目标是将Claude从被动对话工具转变为可持续运行、自主执行多步任务的常驻助手，推动AI代理向“始终在线”方向发展。

marsbit04/02 06:29

Anthropic 测试“龙虾” Conway：支持独立 UI、Webhook 唤醒与自定义扩展标准

marsbit04/02 06:29

AI Agent 输出垃圾？问题在你舍不得烧 Token

AI Agent的输出质量与投入的Token数量成正比，即投入的Token越多，错误越少。文章指出，通过增加Token，Agent可以进行更深入的推理、多次独立尝试、自我审查和验证，从而显著提升代码质量和问题解决能力。然而，Token无法解决“新颖性”问题，即当问题不在训练数据中时，仍需人工引导。作者建议通过“WAIT”（多次审查和修复）和“VERIFY”（频繁验证）两种简单方法来优化Agent性能，并强调领域专业知识在解决新颖问题时的关键作用。

marsbit03/23 06:14

marsbit03/23 06:14

Curve Finance 指控 PancakeSwap 抄袭其 StableSwap 代码

专注于稳定币的去中心化交易所Curve Finance近日公开指控PancakeSwap未经授权擅自使用其专有StableSwap代码，称此举直接违反软件许可协议，并可能引发法律和技术风险。Curve团队于3月6日在X平台发文强调，历史上类似行为已被证明存在多重隐患，同时表示若PancakeSwap希望合法使用该技术并保障用户资产安全，可通过授权合作方式协商解决。此事源于PancakeSwap于3月2日宣布其Infinity平台正式上线StableSwap功能，旨在提供低滑点的稳定币交易服务。事件引发DeFi生态短暂震动后，PancakeSwap已开启私下协商，Curve方面也态度软化，提出“共同构建”的战略合作可能性。市场关注双方能否达成正式授权或技术联盟，此争议结果将为开源金融软件的知识产权保护树立重要先例，用户则担忧合作可能对流动性池安全性造成影响。

TheNewsCrypto03/07 05:55

Curve Finance 指控 PancakeSwap 抄袭其 StableSwap 代码