因一篇14页论文被谷歌“赶走”,超4000人为其声援,6年后再看:当年她几乎预言了整个AI时代

marsbit發佈於 2026-06-08更新於 2026-06-08

文章摘要

2020年,谷歌伦理AI团队联合负责人Timnit Gebru因一篇未发表的论文与公司发生冲突并遭解雇,事件引发超4000人联名声援。这篇名为《随机鹦鹉的危险》的论文在当时极具前瞻性,指出大型语言模型本质是复现语言模式而非真正理解,并预警了多个风险:模型会生成看似合理但错误的信息(即如今的“AI幻觉”);会学习并放大训练数据中的偏见;训练大模型将带来巨大的能源消耗与环境影响;训练数据难以审计,可能包含有害内容;AI生成内容充斥互联网将导致“模型崩溃”,并使话语权集中于少数科技巨头。如今,这些预言几乎全部应验,成为AI行业面临的现实挑战。Gebru离开谷歌后创立了分布式AI研究所,专注于研究科技巨头可能回避的伦理与社会问题。六年后再看,她并非反对AI发展,而是更早地看到了其中潜藏的深刻问题。

如果把时间拨回 2020 年,大多数 AI 从业者讨论的还是 GPT-3 到底有多强。

彼时,生成式 AI 尚未成为全球焦点,ChatGPT 还要两年后才会问世,大模型更没有掀起如今席卷全球的投资狂潮。可就在那一年,一位谷歌顶级 AI 研究员却因为一篇尚未发表的论文,与公司爆发激烈冲突,并最终失去了工作。

当时很多人以为,这不过是硅谷又一次关于职场管理、学术发表和企业文化的争议;可如今再回头看,人们才发现,那篇论文中的警告,几乎全部在现实世界中应验了。

而被解雇的研究员,正是 AI 伦理研究领域最具影响力的人物之一——Timnit Gebru。

一场震动 AI 圈的“解雇事件”

2020 年 12 月,Timnit Gebru 在社交平台发布消息称,自己已被谷歌解雇。

消息迅速引爆整个 AI 研究圈。因为当时的 Gebru 并非一名普通的研究员,而是谷歌伦理 AI 团队(Ethical AI Team)联合负责人,也是全球 AI 公平性与算法偏见研究领域的知名学者之一。

出生于埃塞俄比亚的 Gebru 长期关注 AI 中的种族偏见、性别歧视以及社会公平问题。在加入谷歌之前,她曾在斯坦福大学从事研究。2018 年,她参与发表的一篇关于算法偏见的研究,被许多人视为 AI 公平性研究的重要转折点。同年,谷歌将她招入麾下,并高调展示公司对“负责任 AI(Responsible AI)”的重视。

然而仅仅两年后,双方便走向决裂。

当时,谷歌对外给出的说法是 Gebru 主动辞职,但 Gebru 本人则给出了完全不同的版本:她表示,自己是在休假期间收到公司邮件,被告知离职立即生效,所有内部系统权限和邮箱访问权限同时被关闭。

在她看来,这是一场毫无疑问的解雇。

随后,超 4000 名谷歌员工和业内人士签署公开信,对公司的处理方式提出质疑,要求给 Gebru 复职——而这一切的导火索,是一篇仅有 14 页的学术论文。

一篇14页的论文引发争议

这篇论文名为《On the Dangers of Stochastic Parrots》(《随机鹦鹉的危险》),作者包括 Timnit Gebru、华盛顿大学语言学教授 Emily Bender,以及另外两位研究人员,被引用次数目前已超 1.4 万次

后来,“随机鹦鹉”这个名称也广为流传。(论文地址:https://s10251.pcdn.co/pdf/2021-bender-parrots.pdf)

论文中指出,大型语言模型本质上是在统计规律基础上复现语言模式:它们能够生成流畅、自然甚至富有逻辑的文本,却并不真正理解语言的含义——就像一只学会模仿人类说话的鹦鹉,看似聪明,实则这种模仿只是建立在海量互联网文本之上。而互联网本身充满了偏见、歧视和仇恨内容。因此,大模型极有可能将这些问题一并学习进去,并在生成内容时继续放大。

要知道,那可是 2020 年,当时 GPT-3 刚发布、ChatGPT 尚未诞生、大模型热潮也远未到来,这篇论文就已经提前预言了今天整个行业最头疼的问题之一

该论文提交至顶级 AI 伦理会议后,谷歌管理层却提出要求:撤回论文,或者移除谷歌研究人员的署名。而 Gebru 拒绝了,她要求公司说明具体原因,并希望双方能展开进一步讨论。

与此同时,她还向谷歌内部员工群组发了一封措辞激烈的邮件。

在邮件中,Gebru 批评谷歌在推动少数族裔招聘和解决内部不平等问题上缺乏实际行动。她写道:“当你开始为弱势群体发声时,你的处境就会越来越糟。你会让其他领导层感到不舒服。”她还表示:如果公司始终无法解释为何要撤回论文,那她将在适当的时候选择离职。

事情的发展远超她的预料。Gebru 表示,谷歌随后回复称不会满足她提出的要求,并直接接受了她的“辞职”,立即取消了她的所有访问权限

当时,该事件迅速演变成全球 AI 领域最具争议的话题之一。

当年看似激进的观点,如今已成现实

真正让这起事件持续被讨论至今的,并不是解雇本身,而是那篇论文里的内容——因为今天回头再看,其中提出的几乎每一个担忧,都已经变成AI行业正在面对的现实问题。

(1)第一项预警:模型会“胡说八道”

2020 年时,GPT-3 刚刚发布。当时人们惊叹于模型生成文本的能力,却很少有人认真讨论其可靠性。

Gebru 和 Bender 则指出:随着模型规模不断扩大,人们会越来越容易把流畅表达误认为真正理解。模型看起来像是在思考,实际上只是在预测下一个最可能出现的词,因此,它们迟早会生成看似合理却完全错误的信息。

而今天,这个问题有了一个所有人都熟悉的名字:AI幻觉(Hallucination)。无论是 ChatGPT、Gemini、Claude 还是其他先进模型,幻觉问题至今仍未被彻底解决。

某种意义上来说,该论文在“幻觉”成为行业热词之前,就已经准确预见了它。

(2)第二项预警:偏见不会消失,而会被放大

论文还指出,互联网本身并不是中立的数据来源,训练数据天然就包含各种种族、性别、文化和地域偏见。模型不仅会学习这些偏见,还可能因为优化机制进一步强化它们。

后来,各种现实问题验证了这一担忧:

亚马逊曾尝试利用AI筛选求职简历,结果系统会自动降低包含“women(女性)”等关键词简历的评分。

美国多家大型医院使用的医疗风险评估系统被发现,长期低估黑人患者的医疗需求。

苹果信用卡 Apple Card 也曾因女性获得的信用额度远低于男性而引发监管关注。

这些案例都说明,算法并没有自动实现公平,相反还可能将现实世界中的不平等以更加隐蔽的方式固化下来。

(3)第三项预警:AI 的能源消耗将成为新问题

在 2020 年,算力成本远没有今天这样受到关注,但那篇论文已经开始讨论训练超大模型带来的环境影响。据研究人员测算,训练一个大型语言模型所产生的碳排放量,相当于五辆汽车整个生命周期的排放总和——当时,这一说法被不少人认为过于悲观。

然而,随着 AI 基础设施建设进入军备竞赛阶段,问题迅速显现:根据谷歌公开披露的数据,2024 年公司温室气体排放量相比 2019 年增长 48%;微软同期也增长约 29%。这两家公司都明确表示,AI 数据中心和算力基础设施是重要原因之一。

有些讽刺的是,这些科技巨头几年前还在高调宣传碳中和目标。

(4)第四项预警:没人真正知道训练数据里有什么

在很多人眼中,训练数据似乎只是一个工程问题。但 Gebru 认为,随着数据规模越来越大,完整审计训练数据将变得几乎不可能。

她的观点再次应验:2023 年,研究人员发现广泛用于训练图像生成模型的数据集 LAION-5B 中,存在大量儿童虐待图片,包括 Stable Diffusion 在内的多个主流模型都曾使用这一数据集。

意料之中,许多开发者此前并不知道这些内容的存在。也就是说,即便是模型开发者自己,也未必真正了解模型“吃进去”的是什么——而这恰恰是论文最早提出的问题之一。

(5)第五项预警:互联网将逐渐被 AI 内容占据

在谷歌看来,这可能才是整篇论文最敏感的部分。Gebru 和 Bender 认为,大模型的发展最终会把语言和文化的话语权集中到极少数科技巨头手中。原因很简单:训练超大模型需要海量资金、算力和数据资源,真正有能力参与竞争的公司屈指可数。

久而久之,互联网中的主流声音将逐渐演变成:由少数公司训练出的统计平均值,然后再以“中立助手”的身份向全世界传播。与此同时,那些在训练数据中占比较低的语言和文化则会被进一步边缘化。

更严重的是,当 AI 生成内容再次进入互联网,并成为下一轮训练数据时,问题还会不断自我强化——这正是如今研究人员所说的:“模型崩溃(Model Collapse)”。

2024 年的一项研究就发现,英文互联网新增内容中,约 57% 已经是 AI 生成或 AI 辅助生成;而针对低资源语言的研究则发现,由于训练数据越来越多地来自 AI 生成内容,部分语言的翻译质量已经出现明显退化。

换句话说,这篇论文不仅预测到了“模型崩溃”现象,甚至在这个概念正式出现之前,就已经指出了其形成机制。

离开谷歌后,她选择继续研究

当年事件发生后,很多人后来将 Gebru 描述成“反 AI 人士”。其实并不是的,她从未主张停止发展 AI。从始至终,她质疑的是另一件事:

到底是谁在决定 AI 的发展方向?

在她看来,推动大模型发展的研究人员和管理层往往拥有相似背景,服务于相似的商业目标,并受到相同的竞争压力驱动。在这样的激励机制下,更快地发布产品、更快地扩大用户规模、更快地赢得市场竞争,往往比安全、公平和伦理问题拥有更高的优先级。

而所有试图减缓这一进程的人,都可能被视为阻碍者。讽刺的是,Gebru 正是在谷歌内部提出的这一观点,而谷歌通过解雇她,也让这一观点获得了最具戏剧性的现实注脚。

更令人唏嘘的是,事件发生后不久,另一位伦理AI团队联合负责人 Margaret Mitchell 也被解雇——短短 90 天内,谷歌曾经那个引以为傲的伦理 AI 团队基本被瓦解。

离开谷歌后,2021 年 Gebru 创立了分布式 AI 研究所(DAIR,Distributed AI Research Institute)。与大型科技公司不同,这家机构希望在商业利益之外开展 AI 研究,其目标很直接:研究那些科技巨头未必愿意面对的问题。过去几年里,DAIR 持续关注数据来源、算法公平性、语言多样性以及 AI 产业权力集中等议题。

而随着生成式 AI 爆发式发展,越来越多研究者也开始重新关注那篇《随机鹦鹉的危险》:因为他们发现,当年论文中被视为过度担忧的问题,如今已成为行业每天都在讨论的现实

或许,她只是比其他人更早看到了问题

六年过去,关于 Timnit Gebru 与谷歌之间的是非争议,外界或许永远无法获得一个所有人都认同的答案。

谷歌认为,那是一场正常的学术审查与离职事件;Gebru则认为,自己因为坚持发表研究成果而遭到打压。但有一点已经越来越难以否认:

那篇导致她离开谷歌的论文,并没有随着争议结束而失去意义。

恰恰相反,它讨论的幻觉、偏见、数据污染、环境成本、模型崩溃和权力集中等问题,如今已经成为整个 AI 产业无法回避的话题。

有时,历史会以一种出人意料的方式给出评价。

2020 年,很多人觉得 Timnit Gebru 太悲观了;

2026 年,人们开始意识到,她或许只是比其他人更早看到了问题。

参考链接:https://www.tumblr.com/dreaminginthedeepsouth/817865966907228160/darren-oconnor-timnit-gebru-was-fired-from

本文来自微信公众号“CSDN”,整理:郑丽媛

相關問答

QTimnit Gebru 因何原因与谷歌发生冲突并最终被解雇?

ATimnit Gebru 因一篇名为《随机鹦鹉的危险》的14页学术论文与谷歌发生冲突。该论文指出了大型语言模型的潜在风险,如生成不准确信息、放大偏见、高能耗、训练数据审计困难及文化话语权集中等问题。谷歌管理层要求撤回论文或移除谷歌研究人员的署名,Gebru拒绝并希望讨论具体原因。随后,谷歌单方面终止了她的工作权限,并称其主动辞职,而Gebru本人表示这是被解雇。

Q在《随机鹦鹉的危险》论文中,作者提出了哪些关于大模型的主要预警?这些预警后来如何应验?

A论文提出了五项主要预警:1. 模型会生成看似合理但错误的信息(即“AI幻觉”),这在ChatGPT等模型中被普遍证实。2. 模型会学习并放大训练数据中的偏见,如亚马逊简历筛选系统对女性的歧视。3. 训练大模型将导致巨大的能源消耗和碳排放,谷歌、微软等公司的排放增长数据已印证此点。4. 海量训练数据难以审计,可能导致有害内容被纳入,如LAION-5B数据集中发现的儿童虐待图片。5. AI生成内容将充斥互联网,导致“模型崩溃”和文化话语权向少数科技公司集中,相关研究已显示互联网内容中AI生成比例显著上升。

QTimnit Gebru 离开谷歌后做了什么?她创立的DAIR机构主要目标是什么?

A离开谷歌后,Timnit Gebru 于2021年创立了分布式AI研究所。DAIR的目标是在商业利益之外开展AI研究,专注于科技巨头可能不愿深入面对的问题,如数据来源的公正性、算法偏见、语言多样性以及AI产业权力过度集中等议题,旨在推动更负责任和公平的AI发展。

Q为什么说《随机鹦鹉的危险》这篇论文在2020年是具有前瞻性的?

A因为在2020年,GPT-3刚刚发布,生成式AI尚未成为全球焦点,ChatGPT也未问世,行业主要关注模型的强大能力而非其风险。而该论文已准确预见了后来成为行业核心挑战的多个问题,包括AI幻觉、偏见放大、环境成本、数据污染和模型崩溃等。如今这些问题已逐一显现,证明了论文的前瞻性。

Q文章中提到的“模型崩溃”是指什么?它是如何发生的?

A“模型崩溃”是指当AI生成的内容在互联网上大量出现,并成为下一代AI模型的训练数据时,会导致模型性能逐渐退化、生成内容质量下降的现象。其发生机制是:AI模型本身是基于现有数据(可能已包含偏见或错误)生成的统计模式,当这些“非原生”的AI内容被循环用于训练新模型时,错误和偏见会不断被强化和放大,最终导致模型输出的多样性和准确性受损,尤其对数据资源较少的语言和文化影响更甚。

你可能也喜歡

特朗普加密帝国:一场23亿美元的财富转移实验

2026年6月,路透社调查揭示特朗普家族重返白宫后,通过四大加密业务(World Liberty Financial、$TRUMP迷因币、American Bitcoin及ALT5 Sigma/AI Financial)累计获利约23亿美元,而同期参与投资者总体浮亏也接近23亿美元。这些业务涉足不同领域,但核心逻辑均非技术创新,而是将特朗普的政治影响力与话题效应转化为金融资产进行变现。 特朗普过去曾公开批评加密货币,但随着加密行业政治影响力上升及市场情绪助推,其立场转变,并被塑造为“加密总统”。家族以此为核心资产,构建商业网络。 其中,World Liberty Financial(WLFI)是最重要的盈利来源,通过发行锁仓治理代币和高比例销售分成,为家族创造约16亿美元收益,投资者却因流动性受限和价格下跌承受损失。$TRUMP迷因币则直接金融化特朗普品牌,家族通过预留代币获利超6亿美元,而代币价格后期暴跌使高位接盘散户严重亏损。American Bitcoin作为矿业公司,因“特朗普概念”获得高估值,但基本面无法支撑,股价回落令投资者受损。ALT5 Sigma更名为AI Financial后,叠加AI、加密和特朗普概念,股价经历资本狂欢后因实际增长不足而回调。 这四个项目遵循共同模式:利用政治品牌建立信任与关注,通过媒体放大情绪,吸引资金进入后,家族通过股权、代币销售等方式实现收益变现,而市场投资者承担后端风险。 特朗普家族成功完成了一次大规模的品牌变现,但对于投资者而言,这再次警示:基于情绪、名人效应而非基本面的投资,往往风险巨大。这场23亿美元的财富转移实验,成为政治影响力、资本市场与投资心理相互作用的现实一课。

marsbit1 小時前

特朗普加密帝国:一场23亿美元的财富转移实验

marsbit1 小時前

CFTC拟立预测市场新规,重新定义哪些事件能上、谁能参与

美国商品期货交易委员会(CFTC)近日发布一项拟议规则,计划对预测市场中的事件合约建立新的审查框架。该提案旨在明确哪些事件可以被“金融化”为可交易合约,哪些可能因涉及恐怖主义、战争、暗杀或违法行为而被禁止,以防止其损害公共利益。 CFTC并未采取一刀切的禁止清单方式,而是提议对具体合约进行个案审查。监管重点在于区分“预测风险影响”和“预测伤害发生”,后者更容易触碰底线。例如,直接预测恐怖袭击的合约可能被禁,而预测受地缘局势影响的商业数据(如原油运输量)则可能被允许。 对于交易量庞大的体育预测市场,提案释放了相对积极的信号。基于比赛胜负、比分、赛季表现等整体结果的合约,因具备价格发现功能,有望获得合规空间。但涉及球员伤病、裁判判罚、未成年人赛事等更易被操纵或诱导不当行为的细分市场,将面临严格审查。 提案的核心关切在于防范内幕交易和市场操纵。预测市场的独特风险在于,某些事件的结局可能由少数知情者决定,如果他们参与交易,市场公平性将遭破坏。近期已出现多起涉嫌利用内幕信息(如军方行动、公司内部数据)进行交易的案例。 然而,争议远未结束。美国多州监管机构和博彩业认为,体育预测合约本质上是体育博彩,应受州级博彩法规管辖,而非绕过这些规定成为CFTC监管的全国性金融产品。这预示着联邦与州之间的监管权之争将继续。 总体而言,CFTC的提案标志着预测市场从粗放扩张迈向更制度化的新阶段。未来,行业的增长将更依赖于证明其市场的公平性、结算透明度和风险可控性,使其运作更接近传统金融市场。

marsbit1 小時前

CFTC拟立预测市场新规,重新定义哪些事件能上、谁能参与

marsbit1 小時前

交易

現貨
合約

熱門文章

如何購買ERA

歡迎來到HTX.com!在這裡,購買Caldera (ERA)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買Caldera (ERA)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的Caldera (ERA)購買Caldera (ERA)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易Caldera (ERA)在HTX的現貨市場輕鬆交易Caldera (ERA)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

701 人學過發佈於 2025.07.17更新於 2026.06.02

如何購買ERA

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 ERA (ERA)幣價的意見。

活动图片