因一篇14页论文被谷歌“赶走”,超4000人为其声援,6年后再看:当年她几乎预言了整个AI时代

marsbit发布于2026-06-08更新于2026-06-08

文章摘要

2020年,谷歌伦理AI团队联合负责人Timnit Gebru因一篇未发表的论文与公司发生冲突并遭解雇,事件引发超4000人联名声援。这篇名为《随机鹦鹉的危险》的论文在当时极具前瞻性,指出大型语言模型本质是复现语言模式而非真正理解,并预警了多个风险:模型会生成看似合理但错误的信息(即如今的“AI幻觉”);会学习并放大训练数据中的偏见;训练大模型将带来巨大的能源消耗与环境影响;训练数据难以审计,可能包含有害内容;AI生成内容充斥互联网将导致“模型崩溃”,并使话语权集中于少数科技巨头。如今,这些预言几乎全部应验,成为AI行业面临的现实挑战。Gebru离开谷歌后创立了分布式AI研究所,专注于研究科技巨头可能回避的伦理与社会问题。六年后再看,她并非反对AI发展,而是更早地看到了其中潜藏的深刻问题。

如果把时间拨回 2020 年,大多数 AI 从业者讨论的还是 GPT-3 到底有多强。

彼时,生成式 AI 尚未成为全球焦点,ChatGPT 还要两年后才会问世,大模型更没有掀起如今席卷全球的投资狂潮。可就在那一年,一位谷歌顶级 AI 研究员却因为一篇尚未发表的论文,与公司爆发激烈冲突,并最终失去了工作。

当时很多人以为,这不过是硅谷又一次关于职场管理、学术发表和企业文化的争议;可如今再回头看,人们才发现,那篇论文中的警告,几乎全部在现实世界中应验了。

而被解雇的研究员,正是 AI 伦理研究领域最具影响力的人物之一——Timnit Gebru。

一场震动 AI 圈的“解雇事件”

2020 年 12 月,Timnit Gebru 在社交平台发布消息称,自己已被谷歌解雇。

消息迅速引爆整个 AI 研究圈。因为当时的 Gebru 并非一名普通的研究员,而是谷歌伦理 AI 团队(Ethical AI Team)联合负责人,也是全球 AI 公平性与算法偏见研究领域的知名学者之一。

出生于埃塞俄比亚的 Gebru 长期关注 AI 中的种族偏见、性别歧视以及社会公平问题。在加入谷歌之前,她曾在斯坦福大学从事研究。2018 年,她参与发表的一篇关于算法偏见的研究,被许多人视为 AI 公平性研究的重要转折点。同年,谷歌将她招入麾下,并高调展示公司对“负责任 AI(Responsible AI)”的重视。

然而仅仅两年后,双方便走向决裂。

当时,谷歌对外给出的说法是 Gebru 主动辞职,但 Gebru 本人则给出了完全不同的版本:她表示,自己是在休假期间收到公司邮件,被告知离职立即生效,所有内部系统权限和邮箱访问权限同时被关闭。

在她看来,这是一场毫无疑问的解雇。

随后,超 4000 名谷歌员工和业内人士签署公开信,对公司的处理方式提出质疑,要求给 Gebru 复职——而这一切的导火索,是一篇仅有 14 页的学术论文。

一篇14页的论文引发争议

这篇论文名为《On the Dangers of Stochastic Parrots》(《随机鹦鹉的危险》),作者包括 Timnit Gebru、华盛顿大学语言学教授 Emily Bender,以及另外两位研究人员,被引用次数目前已超 1.4 万次

后来,“随机鹦鹉”这个名称也广为流传。(论文地址:https://s10251.pcdn.co/pdf/2021-bender-parrots.pdf)

论文中指出,大型语言模型本质上是在统计规律基础上复现语言模式:它们能够生成流畅、自然甚至富有逻辑的文本,却并不真正理解语言的含义——就像一只学会模仿人类说话的鹦鹉,看似聪明,实则这种模仿只是建立在海量互联网文本之上。而互联网本身充满了偏见、歧视和仇恨内容。因此,大模型极有可能将这些问题一并学习进去,并在生成内容时继续放大。

要知道,那可是 2020 年,当时 GPT-3 刚发布、ChatGPT 尚未诞生、大模型热潮也远未到来,这篇论文就已经提前预言了今天整个行业最头疼的问题之一

该论文提交至顶级 AI 伦理会议后,谷歌管理层却提出要求:撤回论文,或者移除谷歌研究人员的署名。而 Gebru 拒绝了,她要求公司说明具体原因,并希望双方能展开进一步讨论。

与此同时,她还向谷歌内部员工群组发了一封措辞激烈的邮件。

在邮件中,Gebru 批评谷歌在推动少数族裔招聘和解决内部不平等问题上缺乏实际行动。她写道:“当你开始为弱势群体发声时,你的处境就会越来越糟。你会让其他领导层感到不舒服。”她还表示:如果公司始终无法解释为何要撤回论文,那她将在适当的时候选择离职。

事情的发展远超她的预料。Gebru 表示,谷歌随后回复称不会满足她提出的要求,并直接接受了她的“辞职”,立即取消了她的所有访问权限

当时,该事件迅速演变成全球 AI 领域最具争议的话题之一。

当年看似激进的观点,如今已成现实

真正让这起事件持续被讨论至今的,并不是解雇本身,而是那篇论文里的内容——因为今天回头再看,其中提出的几乎每一个担忧,都已经变成AI行业正在面对的现实问题。

(1)第一项预警:模型会“胡说八道”

2020 年时,GPT-3 刚刚发布。当时人们惊叹于模型生成文本的能力,却很少有人认真讨论其可靠性。

Gebru 和 Bender 则指出:随着模型规模不断扩大,人们会越来越容易把流畅表达误认为真正理解。模型看起来像是在思考,实际上只是在预测下一个最可能出现的词,因此,它们迟早会生成看似合理却完全错误的信息。

而今天,这个问题有了一个所有人都熟悉的名字:AI幻觉(Hallucination)。无论是 ChatGPT、Gemini、Claude 还是其他先进模型,幻觉问题至今仍未被彻底解决。

某种意义上来说,该论文在“幻觉”成为行业热词之前,就已经准确预见了它。

(2)第二项预警:偏见不会消失,而会被放大

论文还指出,互联网本身并不是中立的数据来源,训练数据天然就包含各种种族、性别、文化和地域偏见。模型不仅会学习这些偏见,还可能因为优化机制进一步强化它们。

后来,各种现实问题验证了这一担忧:

亚马逊曾尝试利用AI筛选求职简历,结果系统会自动降低包含“women(女性)”等关键词简历的评分。

美国多家大型医院使用的医疗风险评估系统被发现,长期低估黑人患者的医疗需求。

苹果信用卡 Apple Card 也曾因女性获得的信用额度远低于男性而引发监管关注。

这些案例都说明,算法并没有自动实现公平,相反还可能将现实世界中的不平等以更加隐蔽的方式固化下来。

(3)第三项预警:AI 的能源消耗将成为新问题

在 2020 年,算力成本远没有今天这样受到关注,但那篇论文已经开始讨论训练超大模型带来的环境影响。据研究人员测算,训练一个大型语言模型所产生的碳排放量,相当于五辆汽车整个生命周期的排放总和——当时,这一说法被不少人认为过于悲观。

然而,随着 AI 基础设施建设进入军备竞赛阶段,问题迅速显现:根据谷歌公开披露的数据,2024 年公司温室气体排放量相比 2019 年增长 48%;微软同期也增长约 29%。这两家公司都明确表示,AI 数据中心和算力基础设施是重要原因之一。

有些讽刺的是,这些科技巨头几年前还在高调宣传碳中和目标。

(4)第四项预警:没人真正知道训练数据里有什么

在很多人眼中,训练数据似乎只是一个工程问题。但 Gebru 认为,随着数据规模越来越大,完整审计训练数据将变得几乎不可能。

她的观点再次应验:2023 年,研究人员发现广泛用于训练图像生成模型的数据集 LAION-5B 中,存在大量儿童虐待图片,包括 Stable Diffusion 在内的多个主流模型都曾使用这一数据集。

意料之中,许多开发者此前并不知道这些内容的存在。也就是说,即便是模型开发者自己,也未必真正了解模型“吃进去”的是什么——而这恰恰是论文最早提出的问题之一。

(5)第五项预警:互联网将逐渐被 AI 内容占据

在谷歌看来,这可能才是整篇论文最敏感的部分。Gebru 和 Bender 认为,大模型的发展最终会把语言和文化的话语权集中到极少数科技巨头手中。原因很简单:训练超大模型需要海量资金、算力和数据资源,真正有能力参与竞争的公司屈指可数。

久而久之,互联网中的主流声音将逐渐演变成:由少数公司训练出的统计平均值,然后再以“中立助手”的身份向全世界传播。与此同时,那些在训练数据中占比较低的语言和文化则会被进一步边缘化。

更严重的是,当 AI 生成内容再次进入互联网,并成为下一轮训练数据时,问题还会不断自我强化——这正是如今研究人员所说的:“模型崩溃(Model Collapse)”。

2024 年的一项研究就发现,英文互联网新增内容中,约 57% 已经是 AI 生成或 AI 辅助生成;而针对低资源语言的研究则发现,由于训练数据越来越多地来自 AI 生成内容,部分语言的翻译质量已经出现明显退化。

换句话说,这篇论文不仅预测到了“模型崩溃”现象,甚至在这个概念正式出现之前,就已经指出了其形成机制。

离开谷歌后,她选择继续研究

当年事件发生后,很多人后来将 Gebru 描述成“反 AI 人士”。其实并不是的,她从未主张停止发展 AI。从始至终,她质疑的是另一件事:

到底是谁在决定 AI 的发展方向?

在她看来,推动大模型发展的研究人员和管理层往往拥有相似背景,服务于相似的商业目标,并受到相同的竞争压力驱动。在这样的激励机制下,更快地发布产品、更快地扩大用户规模、更快地赢得市场竞争,往往比安全、公平和伦理问题拥有更高的优先级。

而所有试图减缓这一进程的人,都可能被视为阻碍者。讽刺的是,Gebru 正是在谷歌内部提出的这一观点,而谷歌通过解雇她,也让这一观点获得了最具戏剧性的现实注脚。

更令人唏嘘的是,事件发生后不久,另一位伦理AI团队联合负责人 Margaret Mitchell 也被解雇——短短 90 天内,谷歌曾经那个引以为傲的伦理 AI 团队基本被瓦解。

离开谷歌后,2021 年 Gebru 创立了分布式 AI 研究所(DAIR,Distributed AI Research Institute)。与大型科技公司不同,这家机构希望在商业利益之外开展 AI 研究,其目标很直接:研究那些科技巨头未必愿意面对的问题。过去几年里,DAIR 持续关注数据来源、算法公平性、语言多样性以及 AI 产业权力集中等议题。

而随着生成式 AI 爆发式发展,越来越多研究者也开始重新关注那篇《随机鹦鹉的危险》:因为他们发现,当年论文中被视为过度担忧的问题,如今已成为行业每天都在讨论的现实

或许,她只是比其他人更早看到了问题

六年过去,关于 Timnit Gebru 与谷歌之间的是非争议,外界或许永远无法获得一个所有人都认同的答案。

谷歌认为,那是一场正常的学术审查与离职事件;Gebru则认为,自己因为坚持发表研究成果而遭到打压。但有一点已经越来越难以否认:

那篇导致她离开谷歌的论文,并没有随着争议结束而失去意义。

恰恰相反,它讨论的幻觉、偏见、数据污染、环境成本、模型崩溃和权力集中等问题,如今已经成为整个 AI 产业无法回避的话题。

有时,历史会以一种出人意料的方式给出评价。

2020 年,很多人觉得 Timnit Gebru 太悲观了;

2026 年,人们开始意识到,她或许只是比其他人更早看到了问题。

参考链接:https://www.tumblr.com/dreaminginthedeepsouth/817865966907228160/darren-oconnor-timnit-gebru-was-fired-from

本文来自微信公众号“CSDN”,整理:郑丽媛

相关问答

QTimnit Gebru 因何原因与谷歌发生冲突并最终被解雇?

ATimnit Gebru 因一篇名为《随机鹦鹉的危险》的14页学术论文与谷歌发生冲突。该论文指出了大型语言模型的潜在风险,如生成不准确信息、放大偏见、高能耗、训练数据审计困难及文化话语权集中等问题。谷歌管理层要求撤回论文或移除谷歌研究人员的署名,Gebru拒绝并希望讨论具体原因。随后,谷歌单方面终止了她的工作权限,并称其主动辞职,而Gebru本人表示这是被解雇。

Q在《随机鹦鹉的危险》论文中,作者提出了哪些关于大模型的主要预警?这些预警后来如何应验?

A论文提出了五项主要预警:1. 模型会生成看似合理但错误的信息(即“AI幻觉”),这在ChatGPT等模型中被普遍证实。2. 模型会学习并放大训练数据中的偏见,如亚马逊简历筛选系统对女性的歧视。3. 训练大模型将导致巨大的能源消耗和碳排放,谷歌、微软等公司的排放增长数据已印证此点。4. 海量训练数据难以审计,可能导致有害内容被纳入,如LAION-5B数据集中发现的儿童虐待图片。5. AI生成内容将充斥互联网,导致“模型崩溃”和文化话语权向少数科技公司集中,相关研究已显示互联网内容中AI生成比例显著上升。

QTimnit Gebru 离开谷歌后做了什么?她创立的DAIR机构主要目标是什么?

A离开谷歌后,Timnit Gebru 于2021年创立了分布式AI研究所。DAIR的目标是在商业利益之外开展AI研究,专注于科技巨头可能不愿深入面对的问题,如数据来源的公正性、算法偏见、语言多样性以及AI产业权力过度集中等议题,旨在推动更负责任和公平的AI发展。

Q为什么说《随机鹦鹉的危险》这篇论文在2020年是具有前瞻性的?

A因为在2020年,GPT-3刚刚发布,生成式AI尚未成为全球焦点,ChatGPT也未问世,行业主要关注模型的强大能力而非其风险。而该论文已准确预见了后来成为行业核心挑战的多个问题,包括AI幻觉、偏见放大、环境成本、数据污染和模型崩溃等。如今这些问题已逐一显现,证明了论文的前瞻性。

Q文章中提到的“模型崩溃”是指什么?它是如何发生的?

A“模型崩溃”是指当AI生成的内容在互联网上大量出现,并成为下一代AI模型的训练数据时,会导致模型性能逐渐退化、生成内容质量下降的现象。其发生机制是:AI模型本身是基于现有数据(可能已包含偏见或错误)生成的统计模式,当这些“非原生”的AI内容被循环用于训练新模型时,错误和偏见会不断被强化和放大,最终导致模型输出的多样性和准确性受损,尤其对数据资源较少的语言和文化影响更甚。

你可能也喜欢

黄仁勋「拯救」韩国股市:锁定SK海力士内存,芯片短缺还将持续

6月5日,韩国股市经历“黑色星期五”,KOSPI指数暴跌。6月8日盘中跌幅一度超8%,触发熔断,三星与SK海力士股价重挫。在此市场动荡之际,英伟达CEO黄仁勋的访韩起到了“救市”作用。 6月7日晚,黄仁勋与SK集团及SK海力士高层共进晚餐。餐后,他确认英伟达新款Vera CPU将采用SK海力士的DRAM,双方正为下半年及明年的“超大规模合作”做准备,并预计当前的内存芯片短缺将持续数年。随后,双方官宣了一份多年期技术合作协议,涉及AI超级计算机、机器人、数字孪生和半导体制造等领域。黄仁勋更公开表示,当前AI公司股价极具吸引力。 合作具体包括:英伟达将Vera CPU等产品线的内存供应锚定SK海力士,共同开发下一代内存以支持AI基础设施。同时,SK海力士将利用英伟达的CUDA-X库和AI技术加速其芯片设计与制造流程,如计算光刻和构建晶圆厂数字孪生,目标是实现完全自主的工厂运营。 此次合作早有铺垫。2025年10月,双方曾宣布在韩国合作建设大型AI工厂。尽管与SK海力士深化绑定,但英伟达在下一代HBM4内存上并未独家采购,三星、SK海力士和美光均已获得认证并将共同供货。黄仁勋指出,由于AI工厂建设导致需求激增,从晶圆到封装等整个半导体供应链的短缺状况预计将持续数年。 黄仁勋此行还会见了现代、LG、三星等韩国企业,表明英伟达正系统性深化与韩国科技产业的联系,SK集团是其中的关键一环。

marsbit54分钟前

黄仁勋「拯救」韩国股市:锁定SK海力士内存,芯片短缺还将持续

marsbit54分钟前

纳指单日跌幅4.2%,“黑色星期五”戳破美股泡沫?

2026年6月5日,美股遭遇剧烈回调,纳指重挫4.18%,创一年多最大单日跌幅,标普500指数结束九周连涨,半导体板块领跌。直接导火索是远超预期的5月非农就业数据,引发市场对经济过热和美联储推迟降息的担忧,美债收益率跳升,高估值的科技股首当其冲。 此次暴跌暴露出AI板块积聚的脆弱性。过去18个月推动股市上涨的AI叙事出现裂痕,部分云服务商削减芯片订单,企业端AI应用变现不及预期,导致前期拥挤的交易出现踩踏式平仓。 市场估值处于历史高位,多项指标(如席勒市盈率、巴菲特指标)显示美股已进入高估区间。同时,散户情绪乐观、杠杆水平高,而“聪明钱”如巴菲特的公司已囤积大量现金。技术面上,标普500指数关键支撑位被击穿,面临进一步调整压力。 华尔街对此看法分化:空方认为这可能是泡沫调整的开始,经济存在滞胀风险;多方则认为这是牛市中的健康回调,经济基本面依然稳固,企业盈利增长仍有支撑。未来走势关键取决于即将公布的5月CPI数据和6月的美联储议息会议,其结果将重塑市场对利率路径的预期。 总而言之,支撑美股高估值的核心支柱——降息预期发生动摇,AI叙事面临现实检验。市场正进入由宏观数据和盈利基本面主导的敏感阶段,投资者需保持谨慎,密切关注通胀数据与美联储政策信号。

marsbit58分钟前

纳指单日跌幅4.2%,“黑色星期五”戳破美股泡沫?

marsbit58分钟前

纳指单日跌幅4.2%,“黑色星期五”戳破美股泡沫?

2026年6月5日,美股遭遇剧烈回调。纳斯达克综合指数重挫4.18%,创2025年4月以来最大单日跌幅;标普500指数下跌2.64%,终结连续九周上涨纪录。费城半导体指数暴跌逾10%,英伟达、美光等AI核心股领跌。 此次暴跌的直接导火索是强劲的非农就业数据。美国5月非农新增就业远超预期,引发市场对经济过热和通胀反弹的担忧,导致美债收益率跳升。由于科技股对利率高度敏感,高估值的AI板块因此遭受重创,叠加市场对AI资本开支可持续性的质疑,形成抛售潮。 暴跌引发了关于“美股是否见顶”的广泛讨论。暴跌前,多项指标显示市场估值已处历史高位,如标普500的席勒市盈率接近历史峰值,“巴菲特指标”也进入“严重高估”区间。同时,市场情绪曾极度乐观,而“聪明钱”与企业内部人士已出现减持迹象。技术面上,关键支撑位的跌破也为市场前景蒙上阴影。 华尔街观点出现分化。看空派认为,当前高估值面临利率压力,AI泡沫可能破裂,市场存在显著回调风险。看多方则认为,这是牛市中的健康调整,强劲经济数据意味着衰退风险低,企业盈利增长仍将提供支撑。 未来走势的关键在于通胀数据与美联储政策。即将公布的5月CPI数据以及随后美联储会议的点阵图,将成为决定市场调整性质的关键。若通胀持续粘性导致降息预期进一步推迟,市场可能继续承压。 总之,极端估值、政策转向预期、核心AI叙事松动等多重风险信号同时出现,市场的风险收益比已显著恶化。投资者需保持谨慎,密切关注即将到来的关键宏观数据与政策信号。

Odaily星球日报1小时前

纳指单日跌幅4.2%,“黑色星期五”戳破美股泡沫?

Odaily星球日报1小时前

智能体第一案,判了什么

4月30日,广州互联网法院作出国内智能体领域首份行为保全裁定,责令一款开源智能体软件停止提供下载、停止避开平台技术措施、删除相关教程和数据。该软件通过调用操作系统“无障碍服务”权限,绕过平台规则实现自动化操作,被诉侵害原告平台权益。 此前,美国法院也在类似案件(Amazon起诉Perplexity)中发出禁令,理由同样是智能体绕过平台API直接操作页面,破坏了技术管理措施。两案共同指向智能体发展的核心法律问题:操作平台不仅需要用户授权,还需获得平台方授权,即“双重授权”原则。 文章指出,平台反对此类绕过行为,主要出于权责对等的考量。若智能体绕过平台审核与安全机制,将导致内容管理、数据安全和隐私保护体系失效,责任归属模糊。这不仅是商业竞争,更是法律责任问题。 以豆包手机为例,其1.0版本曾尝试通过系统权限直接操作其他App,但遭遇阻力;2.0版本则转向与生态厂商(如阿里)谈判授权、通过API接口合作,体现了从“绕过”到“合规”的战略调整。 综合分析,中美司法案例及行业实践表明,智能体“野蛮生长”阶段已结束,行业正进入“合规竞赛”时代。合规成本成为重要门槛,“双重授权”渐成行业标准,开源亦不能免责。监管通过对激进典型案例的裁决,旨在引导整个行业走向规范合作。未来,预计将有更多智能体与平台通过授权对接,推动行业游戏规则重构。

marsbit1小时前

智能体第一案,判了什么

marsbit1小时前

交易

现货
合约

热门文章

如何购买ERA

欢迎来到HTX.com!我们已经让购买Caldera(ERA)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Caldera(ERA)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Caldera(ERA)购买完您的Caldera(ERA)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Caldera(ERA)在HTX的现货市场轻松交易Caldera(ERA)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

1.2k人学过发布于 2025.07.17更新于 2026.06.02

如何购买ERA

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对ERA(ERA)币价的意见。

活动图片