# AI代理的所有文章

在 HTX 新聞中心流覽與「AI代理」相關的最新資訊與深度分析。潘蓋市場趨勢、專案動態、技術進展及監管政策,提供權威的加密行業洞察。

a16z:区块链为 AI 代理基础设施提供帮助的 5 种方式

人工智能代理正迅速从“副驾驶”转变为经济参与者,但其发展速度超过了现有基础设施的支持能力。当前代理缺乏标准化的方法证明身份、权限和跨环境报酬机制,身份无法跨平台共享,支付方式尚未实现可编程,协调工作也各自独立。 区块链技术为代理基础设施提供了关键支持,主要体现在五个方面: 1. **非人类身份**:代理经济当前的瓶颈是身份而非智能。区块链提供可移植的身份层、可编程钱包和可验证证明,帮助代理建立跨平台的可信身份(KYA,了解你的代理),解决权限证明和跨平台独立运作问题。 2. **AI运行系统治理**:当代理操作关键系统时,治理成为核心问题。区块链通过链上记录和自动执行决策,确保代理行为符合用户利益,防止模型供应商单方面控制结果,实现真正的去中心化治理。 3. **支付系统空白填补**:代理开始进行无头交易(如数据购买、API调用),稳定币成为默认支付方式。加密支付支持无许可编程和低风险承保,推动代理对代理的商业发展,如x402和MPP协议已处理大量代理驱动支付。 4. **重新定价信任**:当智能成本趋近于零时,验证成为稀缺资源。区块链提供可审计的历史记录和加密收据,确保代理行为的透明度和可追溯性,从而降低规模化风险,将信任硬编码到系统架构中。 5. **保留用户控制权**:随着用户将更多任务委托给代理,加密技术通过智能合约和基于意图的架构(如NEAR Intents)设定代理的行为边界,确保用户保持最终控制权,减少盲目信任。 人工智能降低了规模化门槛,但信任建立仍需依赖加密货币和区块链技术,以确保透明度、问责制和用户控制。互联网基础设施的设计需适应非人类行为者,以实现真正的代理经济。

marsbit04/21 03:22

a16z:区块链为 AI 代理基础设施提供帮助的 5 种方式

marsbit04/21 03:22

当钱包开始嵌入 AI Agent:ERC-8211 的新交互范式,为什么值得关注?

2025年起,用户逐渐习惯通过AI助手(如GPT、Gemini)一键完成如旅行规划等复杂任务。然而,在区块链领域,AI Agent执行多步DeFi操作(如兑换、跨链、存款)时,仍面临执行环节的断层问题:需逐步签名、面临滑点、Gas费用、跨链延迟等风险,导致操作易中断或失败。 问题核心在于现有链上执行层(如ERC-4337)支持批量处理但参数静态固化,无法适应DeFi动态环境(如汇率波动、流动性变化),导致AI决策与链上执行脱节。2026年4月,Biconomy与以太坊基金会提出ERC-8211标准,旨在解决这一问题。 ERC-8211将批量处理从“静态交易序列”升级为“动态求值程序”,通过三种核心原语实现: - Fetchers(取值器):实时获取链上状态(如余额); - Constraints(约束器):校验参数条件(如最小输出金额、滑点限制); - Predicates(触发条件):控制流程执行(如跨链到账后继续)。 这使得单次签名可原子化执行多步操作(如提取→兑换→存款),且参数实时更新、条件自动校验,避免失败或资金闲置。 该标准与智能钱包深度结合,推动钱包角色从“签名器”变为“意图解释器”,能清晰展示程序化执行逻辑(来源、条件、结果),保障用户主权与安全。同时,ERC-8211兼容ERC-4337等账户抽象标准,填补了AI Agent链上执行的最后缺口。 综上,ERC-8211代表了链上交互范式的第三次演进:从单次调用→静态批量→动态程序执行,为AI Agent提供了原生、安全、高效的链上操作基础,虽仍处草案阶段,但方向明确,值得关注。

marsbit04/20 10:20

当钱包开始嵌入 AI Agent:ERC-8211 的新交互范式,为什么值得关注?

marsbit04/20 10:20

谁才是OpenClaw真正的最强代理?23项真实任务测评榜单发布

MyToken发布OpenClaw代理能力测评榜单,基于23项真实任务测试各大模型代理成功率。测评仅关注“成功率”核心指标,采用标准化流程,包含精准提示词、预期行为定义和可验证的评分清单。 测评采用三种评分方式:自动化脚本检查客观结果、Claude Opus作为LLM裁判进行定性评估、以及两者结合的混合模式。所有任务定义和评分逻辑完全公开,确保可复现性。 测试涵盖23类实际任务,包括基础交互、文件操作、内容创作、研究分析、工具调用及持久化记忆等场景,例如:创建日历事件、股价查询、博客撰写、技术文档总结、竞品分析和多步骤API工作流等。 截至2026年4月7日,成功率排名前十的模型为: 1. Claude Opus 4.6(Anthropic)93.3%/82.0% 2. Trinity Large Thinking(Arcee AI)91.9%/91.9% 3. GPT-5.4(OpenAI)90.5%/81.7% 4. Qwen3.5-27B(Qwen)90.0%/78.5% 5. Minimax M2.7(MiniMax)89.8%/83.2% 6. Claude Haiku 4.5(Anthropic)89.5%/78.1% 7. Qwen3.5-397B-A17B(Qwen)89.1%/80.4% 8. Mimo V2 Flash(Xiaomi)88.8%/70.2% 9. Qwen3.6 Plus Preview(Qwen)88.6%/84.0% 10. Nemotron-3 Super 120B-A12B(NVIDIA)88.6%/75.5% Claude Opus 4.6在最高成功率上领先,而Arcee的Trinity在平均稳定性上表现突出,千问系列多款模型上榜显示出良好性价比。该基准测试完全透明,推荐用户结合实际场景进行验证。

marsbit04/08 14:45

谁才是OpenClaw真正的最强代理?23项真实任务测评榜单发布

marsbit04/08 14:45

活动图片