# AI代理的所有文章

在 HTX 新聞中心流覽與「AI代理」相關的最新資訊與深度分析。潘蓋市場趨勢、專案動態、技術進展及監管政策,提供權威的加密行業洞察。

黄仁勋 2026 GTC Taipei 演讲:AI 代理人时代来临,计算就是收入

在2026年GTC台北大会上,英伟达CEO黄仁勋宣布AI已进入“代理人”时代,AI从生成内容转变为能实际工作的利润与GDP创造者。其核心观点包括: 1. **AI代理人时代到来**:AI的计算模式发生根本改变,以“大语言模型+代理人框架”为核心的全新系统能理解、推理、规划并使用工具完成实际任务,每家公司都将成为运行代理人的公司。 2. **计算即收入**:在此模式下,AI生成的Token(计算单元)直接转化为收入和利润。AI工厂的经济核心是最大化每瓦电力产生的Token(收入),因此基础设施的吞吐量和能效至关重要。 3. **发布Vera Rubin系统**:英伟达推出史上最雄心勃勃的工程——Vera Rubin。它并非单一芯片,而是为运行代理人而设计的端到端完整系统,标志着英伟达从GPU公司、系统公司进一步转型为AI基础设施公司。 4. **推出Vera CPU**:首款专为AI代理人设计的CPU。代理人要求极低延迟和极高响应速度,Vera CPU强调顶级的单线程性能、每时钟指令数(IPC)和系统带宽,以满足代理人“没有耐心”的计算需求。 5. **与微软重新定义PC**:英伟达与微软合作推出新一代Windows PC产品线(桌面、笔记本、工作站),将代理式计算模式延伸至个人设备。新的PC操作系统将是传统系统与大语言模型的结合,应用程序将被“代理人运行时”取代。 6. **布局物理AI**:宣布了用于物理AI和机器人基础模型的Cosmos 3、用于自动驾驶的开放模型Alpamayo 2,以及完整的人形机器人技术栈与参考平台Isaac GR00T。这些系统遵循与云端代理人相同的“模型-框架-工具-运行时”模式。 **总结**:黄仁勋指出,过去六个月计算机行业因“有用AI”的实现而被彻底改变。未来十年,这种代理式计算模式将统一应用于云端、企业、PC、机器人及各类边缘设备。英伟达通过提供从芯片、系统到完整基础设施的全栈解决方案,旨在帮助客户建设高利润的AI工厂。对台湾供应链而言,AI工厂的交付效率、功耗控制及全栈协同能力将成为关键增长动力。

marsbit11 小時前

黄仁勋 2026 GTC Taipei 演讲:AI 代理人时代来临,计算就是收入

marsbit11 小時前

被AI吓崩的软件股,怎么突然成了美股最靓的仔?

近日,软件股在美股市场强势反弹,成为最亮眼板块。以Snowflake和Datadog为代表的公司股价大幅上涨,单月涨幅惊人。这标志着市场情绪发生了显著逆转——仅仅半年前,华尔街还普遍担忧人工智能(尤其是AI Agent)会颠覆传统软件公司,导致该板块遭到低配。 反弹的核心逻辑有二:首先,最新财报数据证伪了“AI冲击软件”的恐慌。例如,Snowflake不仅上调了业绩指引,还签署了巨额AI相关合作协议,表明AI工作流反而增加了对软件平台的需求。其他软件公司的业绩也普遍超预期,显示行业盈利增长依然强劲。 其次,机构此前对软件股的配置处于历史低位,业绩向好触发了大规模空头回补和资金涌入,推动了暴涨行情。市场观点也随之转变,有分析指出AI的利润重心正从硬件向软件转移。 文章进一步探讨了AI与软件的关系,指出AI Agent非但不会取代软件,反而会成为软件的新用户,增加对身份管理、数据调用和工作流协调等服务的需求,从而扩大了软件的市场空间。同时,企业级应用场景复杂,涉及经验积累、成本控制和合规治理,通用AI模型与具体业务结果之间仍有距离,而这正是软件公司的价值所在——将智能转化为稳定、可靠、可信任的业务流程。 最终结论是,AI不会杀死软件,而是会重新定义软件。能够成功将AI能力融入并增强自身产品、解决企业实际痛点的软件公司,将在新周期中胜出。

marsbit12 小時前

被AI吓崩的软件股,怎么突然成了美股最靓的仔?

marsbit12 小時前

推翻主流治幻觉思路:元认知,才是大模型破幻觉的全新解法

谷歌研究院与特拉维夫大学联合发表论文,提出对抗大模型“幻觉”问题的新思路:与其追求让AI全知全能或过度拒答,不如培养其“元认知”能力,即让模型能够感知并诚实表达自身对每个答案的确信程度。 论文指出,当前主流方法存在局限:一味增加知识覆盖无法穷尽所有事实;而通过大幅拒答来降低错误率则会征收沉重的“实用性税”,牺牲大量本可正确回答的问题。核心原因在于模型缺乏“判别力”,难以精准区分具体问题的对错,导致校准良好但实用性低下。 论文重新定义了“幻觉”:问题不在于AI输出错误信息,而在于其“没有资格确定却以确定的语气给出错误信息”。因此,解决路径应是实现“忠实不确定性”——让AI语言表达的确信度与其内部状态的真实确信度对齐。这比消灭所有错误更可行,是一个依赖内部信号的闭环问题。 在AI代理(Agent)时代,元认知更为关键。没有它,Agent在调用外部工具(如搜索)时将陷入“盲飞”,无法智能决策何时需要搜索、如何评估信息可信度。 实现元认知面临几大挑战:“自举悖论”涉及用静态数据训练动态能力的困难;“对齐破坏信号”指RLHF等训练可能磨灭模型原有的内部不确定性信号;“因果性评估”则需区分真正的元认知与对其的表演。 论文建议,评估反幻觉方法应超越单一准确率指标,转而分析完整的“实用性-错误率权衡曲线”,并关注其在其他任务上的“附带损伤”。最终目标是让AI学会诚实地沟通其认知状态,从而在保留实用性的同时,将错误信息的危害降至最低,建立可靠信任。

marsbit14 小時前

推翻主流治幻觉思路:元认知,才是大模型破幻觉的全新解法

marsbit14 小時前

Claude刷爆5亿,一夜涨60倍,你的Token账单还撑得住?

近日,科技圈曝出多起因AI使用不当导致天价账单的案例。一家企业因未设置使用上限,一个月内在Claude上消耗高达5亿美元;另有谷歌云用户因API密钥泄露,一夜收到1.8万美元账单;OpenAI内部实验也曾单月烧掉130万美元。这些事件共同揭示:在智能体时代,失控的密钥、无休的AI任务或疏于管理的账户,都可能导致Token账单瞬间“爆仓”。 背后原因是计费模式的转变。OpenAI、GitHub等平台正从包月制转向按Token用量计费,以应对智能体任务带来的成本差异——重度用户与轻度用户的消耗可能相差数个量级。新计费方式引发部分用户不满,有开发者晒出账单显示费用从几十美元飙升至数千美元,但亦有观点认为这能遏制滥用,促使资源合理分配。 企业内部也存在“为用AI而用AI”的浪费现象。例如亚马逊员工曾为冲上内部AI使用排行榜,刻意刷高Token消耗。这种将使用量等同于绩效的误区,加剧了成本失控。 面对高昂账单,市场开始出现优化方案。例如通过工具为AI提供精准上下文以减少冗余请求,或采用模型路由将任务智能分配至性价比更高的模型。研究表明,智能体任务的Token消耗可达普通任务的千倍,且更高消耗未必带来更好效果,成本预测往往偏低。 当前,AI成本在一些企业中已逼近甚至超过人力成本,迫使管理者重新审视ROI。随着免费畅用的窗口期关闭,如何让每个Token发挥最大价值,成为开发者与企业必须精打细算的课题。未来胜出的,将是那些最先学会算好“Token账”的玩家。

marsbit前天 11:17

Claude刷爆5亿,一夜涨60倍,你的Token账单还撑得住?

marsbit前天 11:17

三年之后:回看 2023 年我对 ChatGPT 的判断

2023年3月,在GPT-4发布前,作者王健硕对ChatGPT的未来做出了二十项预测。三年后的2026年,他使用AI agent对这些判断进行回顾验证,评估其准确性。 **主要看对的方面:** 1. **RAG成为主流**:预测通过外部检索而非修改模型来解决知识更新和幻觉问题,这已成为行业标准架构。 2. **LUI(自然语言界面)兴起**:预测自然语言交互将催生巨大新产业,Agent、MCP协议等发展印证了这一点,但LUI是与GUI共存而非取代。 3. **机器人网络与新寻址系统**:预测Agent将自动协作并需要新寻址方式,MCP、A2A等协议正朝此方向发展。 4. **中国能做出可用大模型**:预测中美模型差距会迅速缩小,事实如此,但真正领先的国内厂商与其当初点名不同。 5. **AI无意识与图灵测试本质**:核心判断“AI无意识,图灵测试仅测表象”基本成立,但“绝无意识”的绝对论断被后续研究置于灰区。 **看错或看偏的方面:** 1. **GPT-4参数数量**:所传“100T参数”严重错误,实际约为1.8T。 2. **LLM的数学能力**:诊断“数学差需外挂工具”正确,但“不可能自行学会”的结论被后续“推理模型”在IMO夺金证伪。 3. **价值捕获**:预测价值在应用层,但现实中算力层(如英伟达)捕获了最大利润,模型层反而亏损。 4. **版权问题**:判断“生成物可能无法登记版权”正确,但认为能“规避侵权”则错误,已出现巨额侵权赔偿案例。 5. **信息茧房与世界大同**:机制上AI会将观点向众数平均,但AI正快速走向“千人千面”的个性化,可能制造新茧房而非消解极化。 6. **大模型成本**:预测“局部战争”和玩家涌入正确,但“5-10亿美元封顶”的成本估算与前沿训练实际花费严重不符。 **总结规律:** 1. 判断**方向和机制**比具体数字、程度更可靠。 2. 倾向于**高估短期变化速度,低估长期能力上限**。 3. 容易忽略**问题内部的分布差异**(如总量正确但部分群体受损)。 4. **留有餘地、分层表述**的判断更经得起时间检验。 5. 一些根本性争论,**三年时间不足以给出最终答案**。 这次回顾表明,在快速变化的领域,把握大方向比追求精确预测更重要,同时需警惕绝对化表述并承认认知的局限性。

链捕手05/31 13:34

三年之后:回看 2023 年我对 ChatGPT 的判断

链捕手05/31 13:34

活动图片