校准相关新闻 - HTX 校准资讯汇总

推翻主流治幻觉思路：元认知，才是大模型破幻觉的全新解法

谷歌研究院与特拉维夫大学联合发表论文，提出对抗大模型“幻觉”问题的新思路：与其追求让AI全知全能或过度拒答，不如培养其“元认知”能力，即让模型能够感知并诚实表达自身对每个答案的确信程度。论文指出，当前主流方法存在局限：一味增加知识覆盖无法穷尽所有事实；而通过大幅拒答来降低错误率则会征收沉重的“实用性税”，牺牲大量本可正确回答的问题。核心原因在于模型缺乏“判别力”，难以精准区分具体问题的对错，导致校准良好但实用性低下。论文重新定义了“幻觉”：问题不在于AI输出错误信息，而在于其“没有资格确定却以确定的语气给出错误信息”。因此，解决路径应是实现“忠实不确定性”——让AI语言表达的确信度与其内部状态的真实确信度对齐。这比消灭所有错误更可行，是一个依赖内部信号的闭环问题。在AI代理（Agent）时代，元认知更为关键。没有它，Agent在调用外部工具（如搜索）时将陷入“盲飞”，无法智能决策何时需要搜索、如何评估信息可信度。实现元认知面临几大挑战：“自举悖论”涉及用静态数据训练动态能力的困难；“对齐破坏信号”指RLHF等训练可能磨灭模型原有的内部不确定性信号；“因果性评估”则需区分真正的元认知与对其的表演。论文建议，评估反幻觉方法应超越单一准确率指标，转而分析完整的“实用性-错误率权衡曲线”，并关注其在其他任务上的“附带损伤”。最终目标是让AI学会诚实地沟通其认知状态，从而在保留实用性的同时，将错误信息的危害降至最低，建立可靠信任。

marsbit19小时前

marsbit19小时前

# 校准的所有文章

推翻主流治幻觉思路：元认知，才是大模型破幻觉的全新解法

热门分类

热门标签

监管政策

市场分析