拖更三年，北大校友翁荔最新长文刷屏

marsbit發佈於 2026-06-26更新於 2026-06-26

文章摘要

前OpenAI副总裁翁荔（Lilian Weng）发表了一篇关于AI扩展定律（Scaling Laws）的深度分析文章。文章指出，这条指导了AI行业数百亿美元投入的核心定律，远比人们想象的更为脆弱。文章回顾了Scaling Laws的基本思想，即模型性能随规模扩大而可预测地提升。然而，OpenAI与DeepMind在关键问题上得出了相反结论：给定算力，资源应更多分配给模型还是数据？OpenAI的Kaplan团队认为模型增长应更快，而DeepMind的Chinchilla团队则认为应等比增长。后来研究发现，这一分歧源于参数统计口径的差异和实验规模不足，导致Kaplan的结论仅适用于小规模场景。更关键的是，被行业广泛采纳的Chinchilla最优配比公式本身也存在方法论瑕疵。2024年有团队复现发现，其损失函数因取均值而非求和，导致优化器提前停止，输出并非最优解。此外，用于外推的关键参数精度不足，放大了误差。文章进一步指出，经典Scaling Laws的根本前提——高质量数据无限供应——正在崩塌。数据重复训练不可避免，新研究引入了惩罚项来修正公式，并发现大模型对数据重复更敏感。这解释了行业为何转向强化学习、测试时计算和合成数据等新路径。翁荔的博客以其清晰深入的技术解析著称，这篇文章历时三年完成。她于2025年联合创立了新公司Thinking Machines Lab。文章强调，下一代AI的进步不仅依赖算力规模，更取决于对这些基础定律细节更精确的理解与运用。

拖更了三年的博客，Lilian Weng终于发出来了。

就在刚刚，前OpenAI副总裁Lilian Weng一篇拖了三年多的长文刷屏了。

在这篇名为《Scaling Laws, Carefully》博客里，她直接把Scaling Laws从头拆到尾——

AI行业砸了数百亿美元押注的这条定律，远比任何人想象的脆弱。

一分钟速览：这篇万字长文讲了什么

一条公式管了全行业五年。Scaling Laws说「模型做大、数据喂多、算力堆够，性能就会按固定比例往上涨」。它让AI从玄学变成了能算账的生意，间接指挥了上千亿美金的流向。

OpenAI和DeepMind给出了相反的答案。同一个问题「算力预算怎么分配」，2020年OpenAI说模型该比数据涨得快，2022年DeepMind说两边得一起涨。后来发现，分歧的根源是一个参数统计口径的差异，加上实验规模不够大。

赢家的公式里也藏着bug。DeepMind那条被全行业照抄两年的最优配比，2024年被人逐行复现时发现：损失函数取了均值而不是求和，导致优化器提前停了，输出的参数根本不是最优解。

拿小模型的规律去预测大模型，要非常小心。这条曲线是在相对小的模型上拟合出来的，外推到万亿参数级别时，一个四舍五入的差别就能让结论差出一大截。博客里附了一个交互式模拟器，拖一下滑块就能亲眼看到。

还有个更根本的问题：数据快用完了。公式默认数据可以无限供应，但高质量文本是有限的。这也是为什么整个行业集体转向强化学习、测试时计算和合成数据。

一条直线，千亿美金

众所周知，Scaling Laws的核心可以简单地总结成一句话——

模型越大、数据越多、算力越猛，表现就越好。而且这个「越好」不是随机的，它有精确的数学规律。

把模型训练的损失画在对数坐标上，它随着模型参数量N、数据量D、算力C的增加，呈一条直线下降。

用公式写就是L(x) = E + A/x^α，其中x可以是N、D或C，E是理论最优损失（数据本身的熵），A和α是拟合出来的常数。

训练一个N参数的模型跑D个token，总算力C ≈ 6ND——前向传播2ND，反向传播4ND。

这条直线意味着性能提升是可预测的。

先跑几个小模型，拟合出那条直线，往右外推，就能预估大模型训出来的表现。不用真花几亿美元把大模型训完才知道它行不行。

在这之前，深度学习一直被讥讽为「炼金术」，知道什么有效，不知道为什么有效。

2020年OpenAI的Kaplan发表了这条幂律，第一次把玄学拽进了「可预测」的地界。

这就是所有大模型公司敢砸钱的底气。

但公式给出的最关键建议，给定算力预算，模型和数据怎么分配，OpenAI和DeepMind给出了相反的答案。

同一道题

OpenAI和DeepMind做出了相反的答案

2020年OpenAI的Kaplan团队得出的结论是：最优模型大小N_opt ∝ C^0.73。

翻译过来就是：算力翻10倍，5.5倍给模型、1.8倍给数据——模型涨得要比数据快得多。

这直接指导了GPT-3的训练方案。

1750亿参数的模型，只喂了3000亿个token（token是模型处理文本的最小单位，大约一个词对应1-2个token）。

按后来的标准看，这属于严重训练不足。

2022年DeepMind的Chinchilla团队得出了相反的结论：N_opt ∝ C^0.50，模型和数据应该等比增长。

工程师们后来把它提炼成一个张口就来的数字：最优token和参数比大约20:1。

然后DeepMind做了一场正面对决。

自家的Gopher，2800亿参数配3000亿token。Chinchilla，700亿参数配1.4万亿token。两个模型用了相同的算力。

Chinchilla全面碾压。

一个又小又「吃得多」的模型，把又大又「饿着」的对手打趴下了。

整个行业的共识因此翻转：从「把模型做大」变成「大多数模型都训练不足」。

0.73 vs 0.50，同一个问题，相反的答案，会让你把算力预算往两个完全不同的方向分配。

原因竟是一个「簿记问题」

2024年，两位研究者在机器学习顶刊TMLR发了一篇调和论文，把这个分歧追到了底。

结论让人哭笑不得。

第一个原因：两边数参数的方式不一样。

模型里有一类叫embedding的参数层，负责把文字转换成模型能理解的数字向量。小模型里这一层占总参数量的比例非常大，几千万参数的模型可能占到三分之一。

Kaplan在统计参数量时把embedding排除在外，Chinchilla则把它算进去了。

就这么一个参数统计口径的差异，就足以扭曲最终拟合出来的幂律指数。

他们给出了一个简洁的校正公式：N = N_\E + ω·N_\E^(1/3)，其中N_\E是去掉embedding后的参数量，ω是常数。小模型时第二项占比大，embedding影响显著；模型越大，第二项趋近于零，两种数法殊途同归。

第二个原因：Kaplan的实验规模太小。

Kaplan测试的最大模型只到15亿参数，而Chinchilla的实验扫到了160亿以上。在对数坐标里，微小的拟合偏差在外推时会被急剧放大。

他们用统一的参数统计口径重新推导了Chinchilla的公式，发现了一个关键规律——

幂律指数会随着算力规模的增大而变化。在Kaplan的小规模实验范围内，指数确实接近0.73；但规模增大后，指数收敛到0.50。

Kaplan没有「错」，他在自己的实验范围内是对的。

但他把一个局部成立的规律，外推成了全局结论。

一个参数怎么数的簿记问题，加上实验规模不够大，就让两个顶级团队给出了相反的资源分配建议。

全行业照着这个结论调了两年的训练配方。

连赢家也有bug

Kaplan被Chinchilla纠正了，这是大家都知道的标准叙事。

但Weng往前走了一步——Chinchilla自己的方法论，也有问题。

Chinchilla论文用了三种独立方法交叉验证自己的结论：

方法1固定模型大小变数据量

方法2画等算力曲线（IsoFLOP profiles）

方法3直接对损失公式L(N,D) = E + A/N^α + B/D^β做参数拟合

三条路指向同一个结论，看起来非常扎实。

方法3的数学推导尤其优雅：在约束C ≈ 6ND下对L(N,D)求最优，可以得到闭合解N_opt ∝ (C/6)^(β/(α+β))。当α ≈ β时，指数约等于0.5，也就是模型和数据等比增长。这就是0.50的数学来源。

2024年，AI研究机构Epoch AI的团队从Chinchilla论文的图表中手动提取原始数据点，重新跑了方法3的拟合。

两个bug，一个比一个离谱。

Bug 1：损失函数取了均值而不是求和。

Chinchilla在拟合这五个参数时，需要最小化预测损失和实际损失之间的差距。

完整的优化目标如下：min Σ Huber_δ(log L̂(Nᵢ,Dᵢ) − log Lᵢ)，其中Huber Loss是一种对异常值不敏感的损失函数（δ = 10⁻³），配合L-BFGS-B优化器来搜索最优解。

问题出在一个细节上：他们对每个样本的Huber Loss取了平均值（mean）而不是求和（sum）。几百个样本一平均，损失值被压缩到了极小的量级。

L-BFGS-B优化器有一个内置的收敛判据。当损失值足够小时自动停止。它看到这么小的数值，误以为已经收敛，直接停了。

优化器根本没有跑完。输出的参数不是真正的最优值。

Bug 2：关键参数只保留了两位小数。

Chinchilla论文里有两个控制幂律形状的核心指数，只保留到了小数点后两位。

看起来是无伤大雅的四舍五入。

但从这两个粗糙的数反推其他常数时，误差被指数级放大。最终的置信区间窄得不合理，窄到需要超过60万次实验才能达到的精度，而他们实际只跑了不到500次。

一个被全行业奉为圭臬的公式，背后藏着一个loss函数没跑完的bug，而且这个bug藏了整整两年。

Weng在博客里还附了一个交互式模拟器，三个滑块分别控制损失精度、损失噪声和拟合区间。

每动一下，拟合出来的Scaling Law就变一个样。

OpenAI的结论有局部性偏差，DeepMind的结论有方法论瑕疵。AI行业最重要的学术争论，双方都有裂缝。

数据快烧完了

前面三节讲的都是拟合方法的问题，参数怎么数、损失怎么算、精度取几位。

但即使这些问题全部修好，经典Scaling Laws还有一个更根本的隐患——

它假设每个训练数据都是唯一的，不重复、不训多轮，默认你有无限的数据。

现实是，高质量文本数据预计在2026到2028年之间就会被各大实验室扫荡殆尽。

数据重复训练不可避免，经典公式的前提正在崩塌。

2023年的一项大规模实验训了约400个模型，从千万到90亿参数，最多重复训练1500轮。

核心思路是引入「有效数据量」的概念来替代实际数据量——

如果你有U条唯一数据重复了R轮，有效数据量并不是U×R，而是按D_eff = U·(1 - e^(-R))的指数衰减曲线折算。第一轮重复还能学到不少新东西，到第五轮、第十轮，边际学习收益趋近于零。

他们还发现了一个反直觉的结论：多余的参数比重复的数据「贬值」得更快。也就是，预算有限时，与其加大模型，不如多跑几轮训练更划算。

2026年5月的一篇新论文换了思路。

他们不折算有效数据量，而是直接在经典损失公式后面加了一个显式的过拟合惩罚项——模型重复看同一批数据越多次，惩罚越大，而且这个惩罚和模型大小挂钩。

他们的完整公式长这样：

最后那个红色的惩罚项是关键。

R是重复次数，N/U是模型参数量和唯一数据量的比值（模型相对于数据有多「过剩」），P、δ、κ都是从实验中拟合出来的。重复越多、模型越大，惩罚越重。

这篇论文的核心发现是：大模型对数据重复更敏感。同样把数据重复训练10轮，一个5亿参数的模型可能还扛得住，但一个50亿参数的模型性能下降会严重得多。

另一个工程上直接有用的发现为：加强权重衰减（weight decay）可以显著缓解重复训练带来的过拟合。

这也是为什么2025到2026年，整个行业的注意力集体转向了三条绕过数据墙的路——

强化学习，DeepSeek R1、OpenAI o系列，让模型在数学和编程等可验证的任务上自我博弈，产生训练信号。

测试时计算，不增加训练成本，让模型在回答问题时多「想」几步来换取更好的表现。

合成数据，用现有的强模型生成新数据来训练下一代模型。

三条路的潜台词一样：纯粹靠「堆规模」的那条幂律，已经不够用了。

从北大到OpenAI到自己的公司

Lilian Weng，北大本科，印第安纳大学伯明顿分校博士。

有意思的是，她的博士方向不是深度学习，而是网络科学与复杂系统，研究的是信息在社交网络里怎么传播。

她毕业后先去了Dropbox做数据科学，又去了金融科技公司Affirm，2018年才加入OpenAI。

来到OpenAI后，Weng参与的第一个项目是机器人。那只花了两年学会解魔方的机械手Dactyl，她是核心贡献者之一。

后来转去搭建应用研究团队，GPT-4发布后被委任组建Safety Systems团队，到她离开时这个团队已有80多位科学家、工程师和政策专家。

2024年8月头衔升为VP of Research and Safety，三个月后宣布离开。

2017年，Weng刚接触深度学习不久，开了一个叫Lil'Log的个人博客，最初只是为了整理自己的学习笔记。

她曾说过，「把一个概念讲清楚，是检验自己是否真正理解它的最好方式」。

结果一写就是九年，强化学习、扩散模型、大模型agent，每一篇都从基础原理写起，几十页长文配自己画的图解。

这个博客后来成了AI领域被引用最多的个人技术博客之一，很多大学直接拿来当教材。

2025年2月，她和前OpenAI CTO Mira Murati成立Thinking Machines Lab，联创还包括OpenAI联创John Schulman、前研究VP Barret Zoph和Luke Metz。a16z领投种子轮20亿美元，估值120亿。

而她在公司高速推进的同时，花时间写完了这篇拖了三年的Scaling Laws长文。

你每天用的ChatGPT、Claude、Gemini，背后都是这些公式在决定下一代怎么训。

下一代AI好不好用，不取决于谁的GPU多，而取决于谁把这些细节处理得更精确。

参考资料：

https://x.com/lilianweng/status/2070237256070389897?s=20

https://lilianweng.github.io/posts/2026-06-24-scaling-laws/

本文来自微信公众号“新智元”，作者：ASI启示录，编辑：摩西

你可能也喜歡

稳定币正成为沃什版美联储的下一个政策难题

美联储理事沃勒在近期会议中将稳定币纳入美元国际角色的研究议程，标志着其从加密市场工具转变为美联储关注的美元政策传导渠道。随着USDT和USDC等稳定币规模不断扩大，其已能影响短期国债需求、银行融资及全球美元流动性，成为私人数字美元债权流动的关键部分。美联储开始研究稳定币作为与传统银行并行的美元中介渠道，关注其储备管理、赎回机制及对金融系统的潜在影响。稳定币的增长可能改变银行存款结构，并在边际上影响短期国债收益率。政策制定者正观察其发展是由海外美元需求驱动还是国内存款替代，同时银行业尝试通过代币化存款应对挑战。一旦稳定币规模足够大且与金融系统深度连接，其将成为具有公共政策意义的美元流动性分配渠道。

marsbit1 小時前

marsbit1 小時前

烧掉900亿后，扎克伯格决定开个不能赌的赌场

Meta在元宇宙领域累计亏损近900亿美元后，扎克伯格亲自带队开发了一款名为Arena的预测市场应用。该应用允许用户对选举、体育等事件结果进行预测押注，但筹码仅为虚拟积分，而非真实货币。此举被视为Meta在尝试进入快速增长的预测市场领域，但选择了一种规避金融监管的方式。然而，核心矛盾在于，预测市场的价值在于用真金白银下注以形成准确的市场预测概率，而积分制的“游戏”可能无法实现这一功能。这更像是Meta利用其庞大流量，将预测作为一种社交互动形式，旨在增加用户参与时长，而非创建一个严肃的金融预测工具。文章指出，Meta此举是其惯用的“跟进”策略：在他人验证市场后，利用自身规模优势切入。但预测市场的特殊性可能使这一策略难以奏效。最终，Arena可能因预测不准而失去用户，重蹈其此前预测应用Forecast的覆辙。另一种可能是，Meta通过普及“预测”概念，实际上为需要真钱下注的专业预测平台（如Polymarket、Kalshi）做了市场教育。

marsbit1 小時前

marsbit1 小時前

暴涨380%，深圳千亿IPO敲钟了

6月26日，惠科股份在深交所主板上市，发行价10.12元/股，开盘股价暴涨，市值一度突破5000亿元。公司创始人王智勇从深圳华强北起步，历经近三十年，将惠科从显示器组装代工厂发展为全球显示面板产业的重要参与者，其电视、显示器、智能手机面板出货面积均位居全球前列。惠科股份的业务核心是半导体显示面板，收入占比超七成，客户包括三星、TCL、海信等知名品牌。面板行业属于重资产领域，惠科通过与重庆、绵阳、滁州、长沙等多地国资平台合作投资建厂，实现了快速扩张。在IPO前，京东方创投以及贵州、绵阳等地的国有资本也相继注资，共同分享了这场产业投资的回报。惠科的上市是深圳硬科技产业发展的一个缩影。近期，深圳在机器人、存储芯片等领域涌现出一批明星企业，如“存储五虎”（江波龙、大普微等）总市值已达万亿级别，南山“机器人谷”也聚集了大量产业链企业。这些从产业链深处成长起来的细分领域冠军，正共同构筑深圳新的产业纵深，孕育着未来的巨头。

marsbit1 小時前

marsbit1 小時前

历时233天、回撤超50%，当前熊市是以往最温和的一次？

截至2026年6月24日，当前的比特币熊市已持续233天，是自2014年以来第四长的熊市周期。本文定义“熊市”为比特币收盘价连续30天以上低于200日移动平均线（200 DMA）的时期。历史上，最长的熊市是2018-2019年（385天）和2022-2023年（381天），分别由ICO热潮退去和Terra/LUNA崩溃引发连锁破产所致。2014-2015年熊市（321天）则因Mt. Gox交易所倒闭。当前（2025-2026年）熊市从历史高点124,773美元最大回撤51.2%，是有记录以来最温和的一次。此前主要熊市跌幅在76.7%至83.6%之间。最接近的2021年中期调整回撤52.9%，但仅持续80天且处于牛市趋势中。目前比特币价格62,651美元，低于200 DMA（76,450美元）约22%。若以6月7日的周期低点60,861美元为底，按历史最快复苏速度估算，收复200 DMA可能需至2026年8月。当前市场结构可能更具韧性，但熊市是否结束尚待观察。

marsbit1 小時前

marsbit1 小時前

国内首张防爆资质、全球首个加油大脑方案，他们凭什么拿下两个“第一”

据统计，今年国内具身智能领域融资总额已突破370亿元，行业正进入商业化落地的关键阶段。然而，如何让机器人真正进入加油站、油气场站等易燃易爆的高危场景，是首要挑战。这些场景要求机器人必须通过严苛的防爆认证，确保其硬件在设计上杜绝任何点火风险。在加油站场景中，机器人需要完成一系列精细连贯的操作，如开盖、取枪、加油、归位等，且需适应不同车型的差异。而在场站巡检场景，则要求机器人具备长时间自主巡逻、多异常识别和即时响应的综合能力。此外，港口等多机器人协同场景也对系统架构提出了更高要求。目前多数具身智能系统采用“流水线式”架构，在复杂长序列任务中容易因微小偏差导致连锁失败。为解决这一问题，前沿研究提出了世界模型驱动的预测方法，例如H-GAR架构。该框架通过“生成目标观测—合成中间过渡帧—交互感知动作精炼”三步，让机器人在执行前就能预测任务终态并规划完整视觉轨迹，从而实现“终态对齐”，显著提升长序列操作的稳定性和容错性。实现特种场景落地需要“大脑”（智能算法）与“本体”（机械硬件）的深度耦合，以及从底层设计满足防爆等安全要求。随着行业加速商业化，那些能率先跑通“大脑-本体-数据”闭环的企业，将在竞争中占据先机。

marsbit2 小時前

marsbit2 小時前

交易

現貨

合約

熱門文章

什麼是 $S$

理解 SPERO：全面概述 SPERO 簡介隨著創新領域的不斷演變，web3 技術和加密貨幣項目的出現在塑造數字未來中扮演著關鍵角色。在這個動態領域中，SPERO（標記為 SPERO,$$s$）是一個引起關注的項目。本文旨在收集並呈現有關 SPERO 的詳細信息，以幫助愛好者和投資者理解其基礎、目標和在 web3 和加密領域內的創新。 SPERO,$$s$ 是什麼？ SPERO,$$s$ 是加密空間中的一個獨特項目，旨在利用去中心化和區塊鏈技術的原則，創建一個促進參與、實用性和金融包容性的生態系統。該項目旨在以新的方式促進點對點互動，為用戶提供創新的金融解決方案和服務。 SPERO,$$s$ 的核心目標是通過提供增強用戶體驗的工具和平台來賦能個人。這包括使交易方式更加靈活、促進社區驅動的倡議，以及通過去中心化應用程序（dApps）創造金融機會的途徑。SPERO,$$s$ 的基本願景圍繞包容性展開，旨在彌合傳統金融中的差距，同時利用區塊鏈技術的優勢。誰是 SPERO,$$s$ 的創建者？ SPERO,$$s$ 的創建者身份仍然有些模糊，因為公開可用的資源對其創始人提供的詳細背景信息有限。這種缺乏透明度可能源於該項目對去中心化的承諾——這是一種許多 web3 項目所共享的精神，優先考慮集體貢獻而非個人認可。通過將討論重心放在社區及其共同目標上，SPERO,$$s$ 體現了賦能的本質，而不特別突出某些個體。因此，理解 SPERO 的精神和使命比識別單一創建者更為重要。誰是 SPERO,$$s$ 的投資者？ SPERO,$$s$ 得到了來自風險投資家到天使投資者的多樣化投資者的支持，他們致力於促進加密領域的創新。這些投資者的關注點通常與 SPERO 的使命一致——優先考慮那些承諾社會技術進步、金融包容性和去中心化治理的項目。這些投資者通常對不僅提供創新產品，還對區塊鏈社區及其生態系統做出積極貢獻的項目感興趣。這些投資者的支持強化了 SPERO,$$s$ 作為快速發展的加密項目領域中的一個重要競爭者。 SPERO,$$s$ 如何運作？ SPERO,$$s$ 採用多面向的框架，使其與傳統的加密貨幣項目區別開來。以下是一些突顯其獨特性和創新的關鍵特徵：去中心化治理：SPERO,$$s$ 整合了去中心化治理模型，賦予用戶積極參與決策過程的權力，關於項目的未來。這種方法促進了社區成員之間的擁有感和責任感。代幣實用性：SPERO,$$s$ 使用其自己的加密貨幣代幣，旨在在生態系統內部提供多種功能。這些代幣使交易、獎勵和平台上提供的服務得以促進，增強了整體參與度和實用性。分層架構：SPERO,$$s$ 的技術架構支持模塊化和可擴展性，允許在項目發展過程中無縫整合額外的功能和應用。這種適應性對於在不斷變化的加密環境中保持相關性至關重要。社區參與：該項目強調社區驅動的倡議，採用激勵合作和反饋的機制。通過培養強大的社區，SPERO,$$s$ 能夠更好地滿足用戶需求並適應市場趨勢。專注於包容性：通過提供低交易費用和用戶友好的界面，SPERO,$$s$ 旨在吸引多樣化的用戶群體，包括那些以前可能未曾參與加密領域的個體。這種對包容性的承諾與其通過可及性賦能的總體使命相一致。 SPERO,$$s$ 的時間線理解一個項目的歷史提供了對其發展軌跡和里程碑的關鍵見解。以下是建議的時間線，映射 SPERO,$$s$ 演變中的重要事件：概念化和構思階段：形成 SPERO,$$s$ 基礎的初步想法被提出，與區塊鏈行業內的去中心化和社區聚焦原則密切相關。項目白皮書的發布：在概念階段之後，發布了一份全面的白皮書，詳細說明了 SPERO,$$s$ 的願景、目標和技術基礎設施，以吸引社區的興趣和反饋。社區建設和早期參與：積極進行外展工作，建立早期採用者和潛在投資者的社區，促進圍繞項目目標的討論並獲得支持。代幣生成事件：SPERO,$$s$ 進行了一次代幣生成事件（TGE），向早期支持者分發其原生代幣，並在生態系統內建立初步流動性。首次 dApp 上線：與 SPERO,$$s$ 相關的第一個去中心化應用程序（dApp）上線，允許用戶參與平台的核心功能。持續發展和夥伴關係：對項目產品的持續更新和增強，包括與區塊鏈領域其他參與者的戰略夥伴關係，使 SPERO,$$s$ 成為加密市場中一個具有競爭力和不斷演變的參與者。結論 SPERO,$$s$ 是 web3 和加密貨幣潛力的見證，能夠徹底改變金融系統並賦能個人。憑藉對去中心化治理、社區參與和創新設計功能的承諾，它為更具包容性的金融環境鋪平了道路。與任何在快速發展的加密領域中的投資一樣，潛在的投資者和用戶都被鼓勵進行徹底研究，並對 SPERO,$$s$ 的持續發展進行深思熟慮的參與。該項目展示了加密行業的創新精神，邀請人們進一步探索其無數可能性。儘管 SPERO,$$s$ 的旅程仍在展開，但其基礎原則確實可能影響我們在互聯網數字生態系統中如何與技術、金融和彼此互動的未來。

107 人學過發佈於 2024.12.17更新於 2024.12.17

什麼是 AGENT S

Agent S：Web3中自主互動的未來介紹在不斷演變的Web3和加密貨幣領域，創新不斷重新定義個人如何與數字平台互動。Agent S是一個開創性的項目，承諾通過其開放的代理框架徹底改變人機互動。Agent S旨在簡化複雜任務，為人工智能（AI）提供變革性的應用，鋪平自主互動的道路。本詳細探索將深入研究該項目的複雜性、其獨特特徵以及對加密貨幣領域的影響。什麼是Agent S？ Agent S是一個突破性的開放代理框架，專門設計用來解決計算機任務自動化中的三個基本挑戰：獲取特定領域知識：該框架智能地從各種外部知識來源和內部經驗中學習。這種雙重方法使其能夠建立豐富的特定領域知識庫，提升其在任務執行中的表現。長期任務規劃：Agent S採用經驗增強的分層規劃，這是一種戰略方法，可以有效地分解和執行複雜任務。此特徵顯著提升了其高效和有效地管理多個子任務的能力。處理動態、不均勻的界面：該項目引入了代理-計算機界面（ACI），這是一種創新的解決方案，增強了代理和用戶之間的互動。利用多模態大型語言模型（MLLMs），Agent S能夠無縫導航和操作各種圖形用戶界面。通過這些開創性特徵，Agent S提供了一個強大的框架，解決了自動化人機互動中涉及的複雜性，為AI及其他領域的無數應用奠定了基礎。誰是Agent S的創建者？儘管Agent S的概念根本上是創新的，但有關其創建者的具體信息仍然難以捉摸。創建者目前尚不清楚，這突顯了該項目的初期階段或戰略選擇將創始成員保密。無論是否匿名，重點仍然在於框架的能力和潛力。誰是Agent S的投資者？由於Agent S在加密生態系統中相對較新，關於其投資者和財務支持者的詳細信息並未明確記錄。缺乏對支持該項目的投資基礎或組織的公開見解，引發了對其資金結構和發展路線圖的質疑。了解其支持背景對於評估該項目的可持續性和潛在市場影響至關重要。 Agent S如何運作？ Agent S的核心是尖端技術，使其能夠在多種環境中有效運作。其運營模型圍繞幾個關鍵特徵構建：類人計算機互動：該框架提供先進的AI規劃，力求使與計算機的互動更加直觀。通過模仿人類在任務執行中的行為，承諾提升用戶體驗。敘事記憶：用於利用高級經驗，Agent S利用敘事記憶來跟蹤任務歷史，從而增強其決策過程。情節記憶：此特徵為用戶提供逐步指導，使框架能夠在任務展開時提供上下文支持。支持OpenACI：Agent S能夠在本地運行，使用戶能夠控制其互動和工作流程，與Web3的去中心化理念相一致。與外部API的輕鬆集成：其多功能性和與各種AI平台的兼容性確保了Agent S能夠無縫融入現有技術生態系統，成為開發者和組織的理想選擇。這些功能共同促成了Agent S在加密領域的獨特地位，因為它以最小的人類干預自動化複雜的多步任務。隨著項目的發展，其在Web3中的潛在應用可能重新定義數字互動的展開方式。 Agent S的時間線 Agent S的發展和里程碑可以用一個時間線來概括，突顯其重要事件： 2024年9月27日：Agent S的概念在一篇名為《一個像人類一樣使用計算機的開放代理框架》的綜合研究論文中推出，展示了該項目的基礎工作。 2024年10月10日：該研究論文在arXiv上公開，提供了對框架及其基於OSWorld基準的性能評估的深入探索。 2024年10月12日：發布了一個視頻演示，提供了對Agent S能力和特徵的視覺洞察，進一步吸引潛在用戶和投資者。這些時間線上的標記不僅展示了Agent S的進展，還表明了其對透明度和社區參與的承諾。有關Agent S的要點隨著Agent S框架的持續演變，幾個關鍵特徵脫穎而出，強調其創新性和潛力：創新框架：旨在提供類似人類互動的直觀計算機使用，Agent S為任務自動化帶來了新穎的方法。自主互動：通過GUI自主與計算機互動的能力標誌著向更智能和高效的計算解決方案邁進了一步。複雜任務自動化：憑藉其強大的方法論，能夠自動化複雜的多步任務，使過程更快且更少出錯。持續改進：學習機制使Agent S能夠從過去的經驗中改進，不斷提升其性能和效率。多功能性：其在OSWorld和WindowsAgentArena等不同操作環境中的適應性確保了它能夠服務於廣泛的應用。隨著Agent S在Web3和加密領域中的定位，其增強互動能力和自動化過程的潛力標誌著AI技術的一次重大進步。通過其創新框架，Agent S展現了數字互動的未來，為各行各業的用戶承諾提供更無縫和高效的體驗。結論 Agent S代表了AI與Web3結合的一次大膽飛躍，具有重新定義我們與技術互動方式的能力。儘管仍處於早期階段，但其應用的可能性廣泛且引人入勝。通過其全面的框架解決關鍵挑戰，Agent S旨在將自主互動帶到數字體驗的最前沿。隨著我們深入加密貨幣和去中心化的領域，像Agent S這樣的項目無疑將在塑造技術和人機協作的未來中發揮關鍵作用。

885 人學過發佈於 2025.01.14更新於 2025.01.14

如何購買S

歡迎來到HTX.com！在這裡，購買Sonic (S)變得簡單而便捷。跟隨我們的逐步指南，放心開始您的加密貨幣之旅。第一步：創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步：前往買幣頁面，選擇您的支付方式信用卡/金融卡購買：使用您的Visa或Mastercard即時購買Sonic (S)。餘額購買：使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買：探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買：在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買：為大量交易者提供個性化服務和競爭性匯率。第三步：存儲您的Sonic (S)購買Sonic (S)後，將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步：交易Sonic (S)在HTX的現貨市場輕鬆交易Sonic (S)。前往您的帳戶，選擇交易對，執行交易，並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

1.9k 人學過發佈於 2025.01.15更新於 2026.06.02

拖更三年，北大校友翁荔最新长文刷屏

文章摘要

一分钟速览：这篇万字长文讲了什么

一条直线，千亿美金

同一道题

OpenAI和DeepMind做出了相反的答案

原因竟是一个「簿记问题」

连赢家也有bug

数据快烧完了

从北大到OpenAI到自己的公司

熱門幣種推薦

相關問答

你可能也喜歡

稳定币正成为沃什版美联储的下一个政策难题

烧掉900亿后，扎克伯格决定开个不能赌的赌场

暴涨380%，深圳千亿IPO敲钟了

历时233天、回撤超50%，当前熊市是以往最温和的一次？

国内首张防爆资质、全球首个加油大脑方案，他们凭什么拿下两个“第一”

交易

熱門文章

什麼是 $S$

什麼是 AGENT S

如何購買S

相關討論

熱門問答

熱門分類

熱門標籤