GoPlus Research:深入Eigenlayer,设计并构建AVS

区块律动发布于2002-09-24更新于2024-09-02

你可能也喜欢

Deepseek 能否为中国节省 1 万亿美元?

《DeepSeek 能否为中国节省 1 万亿美元?》一文探讨了DeepSeek如何通过技术创新,可能大幅降低中国AI基础设施的建设成本。 核心在于,AI硬件的成本正从计算芯片向昂贵的内存(如HBM)倾斜。DeepSeek通过三方面技术突破,系统性降低了对这类稀缺硬件的依赖: 1. **压缩“记性”**:采用多头潜在注意力(MLA)等技术,将长上下文对话所需的缓存(KV Cache)压缩至原来的极小部分,极大节省显存。 2. **按需唤醒“身体”**:利用混合专家(MoE)模型架构,每次只激活部分参数,并结合智能的存储调度,将多数参数移出昂贵显存。 3. **复用计算结果**:将算过的上下文作为缓存复用,用低成本的内存读取替代高成本的重复计算。 这些技术协同,使DeepSeek V4等模型在长上下文场景下,用同等硬件可能产出数倍的有效Token,等效于大幅提升硬件效率、摊薄单位成本。 文章据此进行推演:到2030年,全球AI硬件投资预计达数万亿美元。若DeepSeek的技术路线能使中国未来AI基建的硬件需求等效减少75%,在日均Token消耗达到数千万亿级的规模时,节省的投资额可能接近1万亿美元(约7万亿元人民币),相当于少建数万座智算中心。 更重要的是,此举将产业价值从受制于人的尖端算力芯片,部分转移至中国已有所突破的存储芯片及系统工程领域,提升了供应链安全性。DeepSeek的意义不在于“消灭硬件”,而在于通过极致优化,降低行业对最昂贵、最稀缺硬件的边际依赖,让AI能力更普惠,重塑未来AI基建的账本。 (注:文中关于万亿节省的具体数字属于基于行业趋势的推演观点。)

marsbit33分钟前

Deepseek 能否为中国节省 1 万亿美元?

marsbit33分钟前

推翻主流治幻觉思路:元认知,才是大模型破幻觉的全新解法

谷歌研究院与特拉维夫大学联合发表论文,提出对抗大模型“幻觉”问题的新思路:与其追求让AI全知全能或过度拒答,不如培养其“元认知”能力,即让模型能够感知并诚实表达自身对每个答案的确信程度。 论文指出,当前主流方法存在局限:一味增加知识覆盖无法穷尽所有事实;而通过大幅拒答来降低错误率则会征收沉重的“实用性税”,牺牲大量本可正确回答的问题。核心原因在于模型缺乏“判别力”,难以精准区分具体问题的对错,导致校准良好但实用性低下。 论文重新定义了“幻觉”:问题不在于AI输出错误信息,而在于其“没有资格确定却以确定的语气给出错误信息”。因此,解决路径应是实现“忠实不确定性”——让AI语言表达的确信度与其内部状态的真实确信度对齐。这比消灭所有错误更可行,是一个依赖内部信号的闭环问题。 在AI代理(Agent)时代,元认知更为关键。没有它,Agent在调用外部工具(如搜索)时将陷入“盲飞”,无法智能决策何时需要搜索、如何评估信息可信度。 实现元认知面临几大挑战:“自举悖论”涉及用静态数据训练动态能力的困难;“对齐破坏信号”指RLHF等训练可能磨灭模型原有的内部不确定性信号;“因果性评估”则需区分真正的元认知与对其的表演。 论文建议,评估反幻觉方法应超越单一准确率指标,转而分析完整的“实用性-错误率权衡曲线”,并关注其在其他任务上的“附带损伤”。最终目标是让AI学会诚实地沟通其认知状态,从而在保留实用性的同时,将错误信息的危害降至最低,建立可靠信任。

marsbit38分钟前

推翻主流治幻觉思路:元认知,才是大模型破幻觉的全新解法

marsbit38分钟前

交易

现货
合约

热门文章

加密市场宏观研报:美国“加密货币周”来袭,ETH开启机构军备赛高潮

本周,加密市场迎来两股重磅催化——华盛顿“加密货币周”的立法攻势与以太坊机构布局的密集爆发,共同构成加密行业2025年下半年的“政策拐点”与“资金拐点”。这一轮加密周期的深层逻辑,正从比特币转向以太坊、稳定币及链上金融基础设施。我们认为:美国的政策明朗化+以太坊的机构化扩展,标志着加密行业正进入结构性转正阶段,市场配置的重心亦应逐步从“价格博弈”过渡至“规则+基础设施的制度红利捕捉”。

1.7k人学过发布于 2025.07.17更新于 2025.07.17

加密市场宏观研报:美国“加密货币周”来袭,ETH开启机构军备赛高潮

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对ETH(ETH)币价的意见。

活动图片