因一篇14页论文被谷歌“赶走”，超4000人为其声援，6年后再看：当年她几乎预言了整个AI时代

marsbit發佈於 2026-06-08更新於 2026-06-08

文章摘要

2020年，谷歌伦理AI团队联合负责人Timnit Gebru因一篇未发表的论文与公司发生冲突并遭解雇，事件引发超4000人联名声援。这篇名为《随机鹦鹉的危险》的论文在当时极具前瞻性，指出大型语言模型本质是复现语言模式而非真正理解，并预警了多个风险：模型会生成看似合理但错误的信息（即如今的“AI幻觉”）；会学习并放大训练数据中的偏见；训练大模型将带来巨大的能源消耗与环境影响；训练数据难以审计，可能包含有害内容；AI生成内容充斥互联网将导致“模型崩溃”，并使话语权集中于少数科技巨头。如今，这些预言几乎全部应验，成为AI行业面临的现实挑战。Gebru离开谷歌后创立了分布式AI研究所，专注于研究科技巨头可能回避的伦理与社会问题。六年后再看，她并非反对AI发展，而是更早地看到了其中潜藏的深刻问题。

如果把时间拨回 2020 年,大多数 AI 从业者讨论的还是 GPT-3 到底有多强。

彼时,生成式 AI 尚未成为全球焦点,ChatGPT 还要两年后才会问世,大模型更没有掀起如今席卷全球的投资狂潮。可就在那一年,一位谷歌顶级 AI 研究员却因为一篇尚未发表的论文,与公司爆发激烈冲突,并最终失去了工作。

当时很多人以为,这不过是硅谷又一次关于职场管理、学术发表和企业文化的争议;可如今再回头看,人们才发现,那篇论文中的警告,几乎全部在现实世界中应验了。

而被解雇的研究员,正是 AI 伦理研究领域最具影响力的人物之一——Timnit Gebru。

一场震动 AI 圈的“解雇事件”

2020 年 12 月,Timnit Gebru 在社交平台发布消息称,自己已被谷歌解雇。

消息迅速引爆整个 AI 研究圈。因为当时的 Gebru 并非一名普通的研究员,而是谷歌伦理 AI 团队(Ethical AI Team)联合负责人,也是全球 AI 公平性与算法偏见研究领域的知名学者之一。

出生于埃塞俄比亚的 Gebru 长期关注 AI 中的种族偏见、性别歧视以及社会公平问题。在加入谷歌之前,她曾在斯坦福大学从事研究。2018 年,她参与发表的一篇关于算法偏见的研究,被许多人视为 AI 公平性研究的重要转折点。同年,谷歌将她招入麾下,并高调展示公司对“负责任 AI(Responsible AI)”的重视。

然而仅仅两年后,双方便走向决裂。

当时,谷歌对外给出的说法是 Gebru 主动辞职,但 Gebru 本人则给出了完全不同的版本:她表示,自己是在休假期间收到公司邮件,被告知离职立即生效,所有内部系统权限和邮箱访问权限同时被关闭。

在她看来,这是一场毫无疑问的解雇。

随后,超 4000 名谷歌员工和业内人士签署公开信,对公司的处理方式提出质疑,要求给 Gebru 复职——而这一切的导火索,是一篇仅有 14 页的学术论文。

一篇14页的论文引发争议

这篇论文名为《On the Dangers of Stochastic Parrots》(《随机鹦鹉的危险》),作者包括 Timnit Gebru、华盛顿大学语言学教授 Emily Bender,以及另外两位研究人员,被引用次数目前已超 1.4 万次。

后来,“随机鹦鹉”这个名称也广为流传。(论文地址:https://s10251.pcdn.co/pdf/2021-bender-parrots.pdf)

论文中指出,大型语言模型本质上是在统计规律基础上复现语言模式:它们能够生成流畅、自然甚至富有逻辑的文本,却并不真正理解语言的含义——就像一只学会模仿人类说话的鹦鹉,看似聪明,实则这种模仿只是建立在海量互联网文本之上。而互联网本身充满了偏见、歧视和仇恨内容。因此,大模型极有可能将这些问题一并学习进去,并在生成内容时继续放大。

要知道,那可是 2020 年,当时 GPT-3 刚发布、ChatGPT 尚未诞生、大模型热潮也远未到来,这篇论文就已经提前预言了今天整个行业最头疼的问题之一。

该论文提交至顶级 AI 伦理会议后,谷歌管理层却提出要求:撤回论文,或者移除谷歌研究人员的署名。而 Gebru 拒绝了,她要求公司说明具体原因,并希望双方能展开进一步讨论。

与此同时,她还向谷歌内部员工群组发了一封措辞激烈的邮件。

在邮件中,Gebru 批评谷歌在推动少数族裔招聘和解决内部不平等问题上缺乏实际行动。她写道:“当你开始为弱势群体发声时,你的处境就会越来越糟。你会让其他领导层感到不舒服。”她还表示:如果公司始终无法解释为何要撤回论文,那她将在适当的时候选择离职。

事情的发展远超她的预料。Gebru 表示,谷歌随后回复称不会满足她提出的要求,并直接接受了她的“辞职”,立即取消了她的所有访问权限。

当时,该事件迅速演变成全球 AI 领域最具争议的话题之一。

当年看似激进的观点,如今已成现实

真正让这起事件持续被讨论至今的,并不是解雇本身,而是那篇论文里的内容——因为今天回头再看,其中提出的几乎每一个担忧,都已经变成AI行业正在面对的现实问题。

(1)第一项预警:模型会“胡说八道”

2020 年时,GPT-3 刚刚发布。当时人们惊叹于模型生成文本的能力,却很少有人认真讨论其可靠性。

Gebru 和 Bender 则指出:随着模型规模不断扩大,人们会越来越容易把流畅表达误认为真正理解。模型看起来像是在思考,实际上只是在预测下一个最可能出现的词,因此,它们迟早会生成看似合理却完全错误的信息。

而今天,这个问题有了一个所有人都熟悉的名字:AI幻觉(Hallucination)。无论是 ChatGPT、Gemini、Claude 还是其他先进模型,幻觉问题至今仍未被彻底解决。

某种意义上来说,该论文在“幻觉”成为行业热词之前,就已经准确预见了它。

(2)第二项预警:偏见不会消失,而会被放大

论文还指出,互联网本身并不是中立的数据来源,训练数据天然就包含各种种族、性别、文化和地域偏见。模型不仅会学习这些偏见,还可能因为优化机制进一步强化它们。

后来,各种现实问题验证了这一担忧:

亚马逊曾尝试利用AI筛选求职简历,结果系统会自动降低包含“women(女性)”等关键词简历的评分。

美国多家大型医院使用的医疗风险评估系统被发现,长期低估黑人患者的医疗需求。

苹果信用卡 Apple Card 也曾因女性获得的信用额度远低于男性而引发监管关注。

这些案例都说明,算法并没有自动实现公平,相反还可能将现实世界中的不平等以更加隐蔽的方式固化下来。

(3)第三项预警:AI 的能源消耗将成为新问题

在 2020 年,算力成本远没有今天这样受到关注,但那篇论文已经开始讨论训练超大模型带来的环境影响。据研究人员测算,训练一个大型语言模型所产生的碳排放量,相当于五辆汽车整个生命周期的排放总和——当时,这一说法被不少人认为过于悲观。

然而,随着 AI 基础设施建设进入军备竞赛阶段,问题迅速显现:根据谷歌公开披露的数据,2024 年公司温室气体排放量相比 2019 年增长 48%;微软同期也增长约 29%。这两家公司都明确表示,AI 数据中心和算力基础设施是重要原因之一。

有些讽刺的是,这些科技巨头几年前还在高调宣传碳中和目标。

(4)第四项预警:没人真正知道训练数据里有什么

在很多人眼中,训练数据似乎只是一个工程问题。但 Gebru 认为,随着数据规模越来越大,完整审计训练数据将变得几乎不可能。

她的观点再次应验:2023 年,研究人员发现广泛用于训练图像生成模型的数据集 LAION-5B 中,存在大量儿童虐待图片,包括 Stable Diffusion 在内的多个主流模型都曾使用这一数据集。

意料之中,许多开发者此前并不知道这些内容的存在。也就是说,即便是模型开发者自己,也未必真正了解模型“吃进去”的是什么——而这恰恰是论文最早提出的问题之一。

(5)第五项预警:互联网将逐渐被 AI 内容占据

在谷歌看来,这可能才是整篇论文最敏感的部分。Gebru 和 Bender 认为,大模型的发展最终会把语言和文化的话语权集中到极少数科技巨头手中。原因很简单:训练超大模型需要海量资金、算力和数据资源,真正有能力参与竞争的公司屈指可数。

久而久之,互联网中的主流声音将逐渐演变成:由少数公司训练出的统计平均值,然后再以“中立助手”的身份向全世界传播。与此同时,那些在训练数据中占比较低的语言和文化则会被进一步边缘化。

更严重的是,当 AI 生成内容再次进入互联网,并成为下一轮训练数据时,问题还会不断自我强化——这正是如今研究人员所说的:“模型崩溃(Model Collapse)”。

2024 年的一项研究就发现,英文互联网新增内容中,约 57% 已经是 AI 生成或 AI 辅助生成;而针对低资源语言的研究则发现,由于训练数据越来越多地来自 AI 生成内容,部分语言的翻译质量已经出现明显退化。

换句话说,这篇论文不仅预测到了“模型崩溃”现象,甚至在这个概念正式出现之前,就已经指出了其形成机制。

离开谷歌后,她选择继续研究

当年事件发生后,很多人后来将 Gebru 描述成“反 AI 人士”。其实并不是的,她从未主张停止发展 AI。从始至终,她质疑的是另一件事:

到底是谁在决定 AI 的发展方向?

在她看来,推动大模型发展的研究人员和管理层往往拥有相似背景,服务于相似的商业目标,并受到相同的竞争压力驱动。在这样的激励机制下,更快地发布产品、更快地扩大用户规模、更快地赢得市场竞争,往往比安全、公平和伦理问题拥有更高的优先级。

而所有试图减缓这一进程的人,都可能被视为阻碍者。讽刺的是,Gebru 正是在谷歌内部提出的这一观点,而谷歌通过解雇她,也让这一观点获得了最具戏剧性的现实注脚。

更令人唏嘘的是,事件发生后不久,另一位伦理AI团队联合负责人 Margaret Mitchell 也被解雇——短短 90 天内,谷歌曾经那个引以为傲的伦理 AI 团队基本被瓦解。

离开谷歌后,2021 年 Gebru 创立了分布式 AI 研究所(DAIR,Distributed AI Research Institute)。与大型科技公司不同,这家机构希望在商业利益之外开展 AI 研究,其目标很直接:研究那些科技巨头未必愿意面对的问题。过去几年里,DAIR 持续关注数据来源、算法公平性、语言多样性以及 AI 产业权力集中等议题。

而随着生成式 AI 爆发式发展,越来越多研究者也开始重新关注那篇《随机鹦鹉的危险》:因为他们发现,当年论文中被视为过度担忧的问题,如今已成为行业每天都在讨论的现实。

或许,她只是比其他人更早看到了问题

六年过去,关于 Timnit Gebru 与谷歌之间的是非争议,外界或许永远无法获得一个所有人都认同的答案。

谷歌认为,那是一场正常的学术审查与离职事件;Gebru则认为,自己因为坚持发表研究成果而遭到打压。但有一点已经越来越难以否认:

那篇导致她离开谷歌的论文,并没有随着争议结束而失去意义。

恰恰相反,它讨论的幻觉、偏见、数据污染、环境成本、模型崩溃和权力集中等问题,如今已经成为整个 AI 产业无法回避的话题。

有时,历史会以一种出人意料的方式给出评价。

2020 年,很多人觉得 Timnit Gebru 太悲观了;

2026 年,人们开始意识到,她或许只是比其他人更早看到了问题。

参考链接:https://www.tumblr.com/dreaminginthedeepsouth/817865966907228160/darren-oconnor-timnit-gebru-was-fired-from

本文来自微信公众号“CSDN”,整理:郑丽媛

你可能也喜歡

AI 投资人的 2026 焦虑：当模型吞噬一切，创业公司的护城河还剩什么？

本文探讨了AI投资人面对大模型快速进步时产生的“2026焦虑”：当模型能力持续超越人类，除了巨头如Anthropic和英伟达，创业公司的护城河还剩下什么？文章指出，真正的护城河并不在于公开的基准测试成绩，而存在于那些“不可训练”的领域。模型在可衡量、可优化的任务上（如标准编码测试）进步神速，正使许多表层应用变得商品化。然而，许多工作的核心价值是私有的、难以衡量的：例如理解一个公司陈旧的特定代码库、改变律师的工作流程、或获得医生对诊断工具的信任。这些价值建立于长期的系统集成、领域专精、客户关系以及责任承担之上，无法通过基准测试反映，也无法被更聪明的模型快速复制。因此，创业公司的机会在于深入特定垂直领域，做“不起眼的翻译”工作：将客户的私有现实（数据、流程、习惯）与AI能力相结合，并在此过程中定义该领域“什么是好结果”。这需要时间积累信任、处理复杂集成，并承担最终责任。虽然通用能力在商品化，但在私有、前沿且正确性难以公开验证的角落，依托深度集成的专业应用仍能建立持久的壁垒。未来的价值将不断滑向这些模型本身无法直接触及的地方。

marsbit29 分鐘前

marsbit29 分鐘前

三年新高砸碎降息梦，谁在借 CPI 清洗巨鲸筹码？

北京时间6月10日，美国公布2026年5月CPI数据，同比上涨4.2%，创三年新高，主要由地缘冲突推高的能源价格驱动。数据令市场对美联储年内降息的预期大幅降温，甚至开始出现加息的讨论。报告显示，能源价格环比上涨3.9%，贡献了整体通胀涨幅的60%以上。不过，核心CPI环比增速放缓至0.2%，显示潜在通胀压力尚未全面失控。多数机构认为，这强化了“高利率维持更久”的预期，但距离重启加息周期尚有距离。作为典型风险资产，加密市场和美股均承压。比特币价格在6.1万至6.2万美元区间震荡，现货ETF持续净流出，市场经历了显著的去杠杆化。分析指出，虽然市场杠杆已重置，估值指标处于低位，但真正的需求复苏尚未出现。美股方面，尽管面临压力，部分投行仍维持乐观，认为盈利增长是主要动力，但同时也承认通胀环境已发生变化，股票与债券的相关性可能上升，给传统投资组合带来挑战。市场焦点转向美联储6月会议，这将是对新任主席沃十的一次重要考验。

Foresight News49 分鐘前

Foresight News49 分鐘前

从未失手的以太坊指标再次发出信号，本次指向700美元

以太坊（ETH）价格目前徘徊在约1,606美元，正尝试巩固在去年4月以来的低位，月度跌幅达31%，较历史高点4,945美元下跌近70%。分析师Ali Martinez指出，曾成功预测前两次市场底部的Delta Price指标目前指向708美元，暗示若熊市持续，ETH可能还需从当前水平再跌56%，较历史高点累计下跌约85%。短期关键水平方面，Martinez此前强调周线图上的1,850美元为重要关口，失守后跌势加速；下行目标1,560美元已在周末被跌破（ETH曾跌至1,500美元）。若跌势延续，下一重要支撑位在1,070美元，即多年区间的下轨。要扭转看跌趋势，以太坊需满足两个条件：首先收复200周简单移动平均线（约2,500美元），然后有效突破50周简单移动平均线（约3,100美元）。目前市场卖压持续，两者均未接近实现。

bitcoinist1 小時前

bitcoinist1 小時前

特朗普加密帝国：一场23亿美元的财富转移实验

2026年6月，路透社调查揭示特朗普家族重返白宫后，通过四大加密业务（World Liberty Financial、$TRUMP迷因币、American Bitcoin及ALT5 Sigma/AI Financial）累计获利约23亿美元，而同期参与投资者总体浮亏也接近23亿美元。这些业务涉足不同领域，但核心逻辑均非技术创新，而是将特朗普的政治影响力与话题效应转化为金融资产进行变现。特朗普过去曾公开批评加密货币，但随着加密行业政治影响力上升及市场情绪助推，其立场转变，并被塑造为“加密总统”。家族以此为核心资产，构建商业网络。其中，World Liberty Financial（WLFI）是最重要的盈利来源，通过发行锁仓治理代币和高比例销售分成，为家族创造约16亿美元收益，投资者却因流动性受限和价格下跌承受损失。$TRUMP迷因币则直接金融化特朗普品牌，家族通过预留代币获利超6亿美元，而代币价格后期暴跌使高位接盘散户严重亏损。American Bitcoin作为矿业公司，因“特朗普概念”获得高估值，但基本面无法支撑，股价回落令投资者受损。ALT5 Sigma更名为AI Financial后，叠加AI、加密和特朗普概念，股价经历资本狂欢后因实际增长不足而回调。这四个项目遵循共同模式：利用政治品牌建立信任与关注，通过媒体放大情绪，吸引资金进入后，家族通过股权、代币销售等方式实现收益变现，而市场投资者承担后端风险。特朗普家族成功完成了一次大规模的品牌变现，但对于投资者而言，这再次警示：基于情绪、名人效应而非基本面的投资，往往风险巨大。这场23亿美元的财富转移实验，成为政治影响力、资本市场与投资心理相互作用的现实一课。

marsbit1 小時前

marsbit1 小時前

CFTC拟立预测市场新规，重新定义哪些事件能上、谁能参与

美国商品期货交易委员会（CFTC）近日发布一项拟议规则，计划对预测市场中的事件合约建立新的审查框架。该提案旨在明确哪些事件可以被“金融化”为可交易合约，哪些可能因涉及恐怖主义、战争、暗杀或违法行为而被禁止，以防止其损害公共利益。 CFTC并未采取一刀切的禁止清单方式，而是提议对具体合约进行个案审查。监管重点在于区分“预测风险影响”和“预测伤害发生”，后者更容易触碰底线。例如，直接预测恐怖袭击的合约可能被禁，而预测受地缘局势影响的商业数据（如原油运输量）则可能被允许。对于交易量庞大的体育预测市场，提案释放了相对积极的信号。基于比赛胜负、比分、赛季表现等整体结果的合约，因具备价格发现功能，有望获得合规空间。但涉及球员伤病、裁判判罚、未成年人赛事等更易被操纵或诱导不当行为的细分市场，将面临严格审查。提案的核心关切在于防范内幕交易和市场操纵。预测市场的独特风险在于，某些事件的结局可能由少数知情者决定，如果他们参与交易，市场公平性将遭破坏。近期已出现多起涉嫌利用内幕信息（如军方行动、公司内部数据）进行交易的案例。然而，争议远未结束。美国多州监管机构和博彩业认为，体育预测合约本质上是体育博彩，应受州级博彩法规管辖，而非绕过这些规定成为CFTC监管的全国性金融产品。这预示着联邦与州之间的监管权之争将继续。总体而言，CFTC的提案标志着预测市场从粗放扩张迈向更制度化的新阶段。未来，行业的增长将更依赖于证明其市场的公平性、结算透明度和风险可控性，使其运作更接近传统金融市场。

marsbit1 小時前

marsbit1 小時前

交易

現貨

合約

因一篇14页论文被谷歌“赶走”，超4000人为其声援，6年后再看：当年她几乎预言了整个AI时代

文章摘要

一场震动 AI 圈的“解雇事件”

一篇14页的论文引发争议

当年看似激进的观点,如今已成现实

离开谷歌后,她选择继续研究

或许,她只是比其他人更早看到了问题

相關問答

你可能也喜歡

AI 投资人的 2026 焦虑：当模型吞噬一切，创业公司的护城河还剩什么？

三年新高砸碎降息梦，谁在借 CPI 清洗巨鲸筹码？

从未失手的以太坊指标再次发出信号，本次指向700美元

特朗普加密帝国：一场23亿美元的财富转移实验

CFTC拟立预测市场新规，重新定义哪些事件能上、谁能参与

交易

熱門文章

如何購買ERA

相關討論

熱門問答

熱門分類

熱門標籤