没有KPI,也能领先OpenAI?从“内部观察者”视角看顶级AI实验室如何运作

marsbit發佈於 2026-04-07更新於 2026-04-07

文章摘要

文章探讨了DeepMind、OpenAI和Anthropic等顶级AI实验室在组织模式、技术路线和资源管理上的差异。DeepMind创始人哈萨比斯兼具天才、好胜和谦逊的特质,其独特的管理方式结合了自由探索和集中攻坚,通过“突击小组”模式成功推动AlphaGo、AlphaFold等突破性项目。DeepMind早期依靠愿景吸引人才,后被谷歌收购获得资金和算力支持,但双方在安全治理上存在文化冲突。与OpenAI的激进和Anthropic的保守相比,DeepMind在安全与产品化间保持平衡。AGI竞争不仅是模型能力的比拼,更是组织效率和资源配置的长期博弈,未来进展将依赖“规模+技术”的组合驱动。

在人工智能竞争持续升温的当下,围绕 DeepMind、OpenAI 与 Anthropic 的讨论,已经不再只是“谁的模型更强”的问题,而是逐渐演变为一个更深层的命题:顶级 AI 实验室究竟如何组织研究、选择技术路线,并在算力、资本与安全之间做出长期取舍。

在近日 InfoQ 对《哈萨比斯:谷歌 AI 之脑》(TheInfinityMachine)作者、知名科技史学家、金融史学家塞巴斯蒂安·马拉比(Sebastian Mallaby)的采访中,我们尝试从一个更接近“内部观察者”的视角,重新理解 DeepMind 的成长逻辑,以及它与 OpenAI、Anthropic 之间真正的结构性差异。

作为长期跟踪哈萨比斯及其团队的观察者,马拉比认为,DeepMind 的优势并不仅仅来自谷歌提供的算力和资金,更来自一种独特的组织方式:既允许科学家长期自由探索,又能在关键时刻迅速形成突击小组推动突破。这种机制,使它能够持续攻克 AlphaGo、AlphaFold 这样需要十年以上投入的问题。

与此同时,不同实验室在“安全与速度”之间的取舍差异,也正在成为影响 AGI 竞争格局的重要变量。而随着 AI 规模化(scaling) 从训练阶段扩展到推理阶段乃至未来智能体层面,AI 进步的动力结构本身也正在发生变化。

从这个意义上说,今天的 AI 竞争,已经不再只是模型能力的竞赛,而是一场围绕组织模式、研究方法与系统资源配置展开的长期博弈。

DeepMind 为什么能成功?

InfoQ:您在书中提到,哈萨比斯在 MIT 的导师托马索·波吉奥(Tomaso Poggio)曾表示,他遇到的很多诺奖得主,既才华横溢又运气极佳。有少数诺奖得主天赋异禀,无论研究什么注定会获奖。2009 年辛顿遇到哈萨比斯,认为他是比自己更争强好胜的人。如果让您用几个词形容哈萨比斯,会是什么?为什么这么说?

马拉比:让我用三个词来形容他的话,我会说天造之才、争强好胜、友善谦逊。

天才这个自然不必多说了。争强好胜是他发自内心地渴望胜利,渴望做出一番了不起的成就。我觉得这和他从小参加国际象棋比赛有关。他才六岁的时候,就早早地置身于激烈的竞争之中,也因此变得极具好胜心。这份好胜心,成了他前进的动力。

但反过来想,如果一个人只是争强好胜、天赋异禀,为人却不友善,那别人就不会愿意为他效力,也不会喜欢他,甚至会想方设法给他使绊子、阻碍他。而他的优势就在于,大家都很喜欢他。人们和他接触后,都会觉得他为人正派,价值观很好,希望人工智能能为人类带来福祉。正因如此,大家才愿意支持他的事业。我很难想象,如果没有这份善良,他还能否取得今天这般成就

InfoQ:所以你认为 DeepMind 如今的成功与哈萨比斯这个创始人谦逊、善良的个性有关吗?与其他 AI 实验室相比,DeepMind 又有哪些独特之处?

马拉比:是的,我认为这些都与哈萨比斯的个性密切相关。

DeepMind 的独特之处首先在于,它成立于 2010 年,那时候人工智能甚至连一张猫咪的照片都识别不出来。当时相关技术还完全不成熟,可还是有人愿意加入这家公司,投身于一项尚未成功的事业。正是这份超前的投入与远见,让 DeepMind 在最初大约十年里一直处于行业领先地位,直到 ChatGPT 问世,赛道才迎来了激烈角逐。而在那之前的十年,他们始终遥遥领先,这一切都源于起步之早,而这无疑直接归功于哈萨比斯。他从 18 岁、进入剑桥大学之前,就坚信人工智能的可能性,早早地就对这份愿景矢志不渝。这或许也是造就他的另一项特质:他不仅好胜、是天才、为人善良,更是一位具有远见卓识的先行者

InfoQ:您书中提到,哈萨比斯其实并不喜欢商业管理。他的理想组织形态是“贝尔实验室 + 学术研究所”。DeepMind 团队一直在英国独立办公,团队早期很多制度是允许科学家长期研究、不要求短期产品以及他们的论文可以公开发表,这和硅谷很多公司完全不同。这些看起来“过于自由”的条件,会不会给哈萨比斯的管理带来困难?通常习惯了自由的人,尤其是天才们,是不愿意受到约束的。

马拉比:我认为 DeepMind 最关键的一点,是他们给了这些顶尖人才极大的自由。研究员们可以自主决定研究方向,发表学术论文,拥有类似在大学里的研究自由。

但如果 DeepMind 只有自由,那只会变成一群人各做各的研究,最终拿不出任何成型的产品。而哈萨比斯把自由探索和集中攻坚结合了起来——当他判断某个研究方向已经具备取得重大突破的条件时,就会下令:“好了,这条路线可以落地了,我们要组建专门团队,全速推进,实行自上而下的集中管理。”

他把这类团队称作“突击小组(strike team)”。从最早开发雅达利游戏智能体,到后来的 AlphaGo,再到 AlphaZero 直至 AlphaFold 在内的一系列模型,背后都有这样的突击小组。在突击小组里,会有负责人统一指挥,所有人朝着同一个目标冲刺,有时间压力和截止日期,工作强度极高。

所以哈萨比斯的天才之处,就在于把自由探索和成果转化结合在了一起——利用理论科学上的突破,落地打造出 AlphaGo 这样的产品。

他之所以懂学术自由,是因为自己读过博士,了解大学的研究模式;而组建突击小组的思路,则来自他的游戏行业经历——他曾在游戏公司任职,还自己创办过一家,很清楚游戏公司如何赶工期、按时交付产品。他正是把这两种模式完美融合在了一起。

InfoQ:像 DeepMind 这样的顶级 AI 实验室是如何组织和管理人才的?例如如何招聘科学家?如何管理顶级研究人员?是否会给他们很高的薪酬或者更多的资源?

马拉比:在最初阶段,公司给的薪资其实并不高,因为当时他们的资金非常有限。虽然会提供公司期权,但大多数加入的人并不认为这些期权未来会有价值——因为当时的 AI 既没有成熟的产品,也没有清晰的盈利模式。

因此,在创业早期,要吸引优秀人才其实是很困难的。我认为,德米斯能做到这一点,很大程度上是因为他和他的联合创始人沙恩·莱格(Shane Legg) 本身都是非常受尊敬的科学家,这使得其他研究人员愿意加入他们的团队。

另外,还有一些人加入的原因是,他们并不想处理创业公司中的那些“非科研”事务,比如和律师打交道、对接投资人、考虑办公场所等。这些事情在他们看来既烦琐又无聊。如果德米斯愿意负责这些组织和管理工作,他们就可以专注于自己擅长的科学研究。因此,一些人(比如参与雅达利项目的研究者姆尼赫)就提到,这正是他加入的原因。

不过到 2014 年之后,情况发生了明显变化。被谷歌收购后,DeepMind 获得了充足的资金支持,不仅能够提供更具竞争力的薪酬,也建立了更加稳定、完善的工作环境,包括更优质的办公条件和高质量的免费餐食。整体而言,收购之后,这里的工作体验显著提升。

此外,随着 AI 技术不断发展,科研对算力的依赖也越来越强。要让模型真正取得突破性效果,需要大量先进的半导体和计算资源。因此,对于科学家来说,能否获得充足的算力成为一个关键因素。而在 DeepMind 工作,可以直接使用谷歌的算力和芯片资源,这也成为吸引顶尖人才加入的重要原因之一。

InfoQ:DeepMind 在被谷歌收购时并非完全处于“被动求生”状态,您在上次分享中也提到过,当时 Meta CEO 扎克伯格曾邀请哈萨比斯共进晚餐商议收购之事,马斯克也曾向他们抛出橄榄枝,也就是说,DeepMind 在进入谷歌体系之前就已自带光环了。那是不是可以解读成 DeepMind 进入 Alphabet 体系中享有很高的话语权?这是 DeepMind 成功的因素之一吗?

马拉比:是的,我认为,当时有其他公司也有意收购他们,这一点在他们最终卖给 Alphabet 时,实际上增强了他们的谈判筹码。

不过,我也认为更关键的一点在于 Alphabet 的领导层——尤其是拉里·佩奇(Larry Page),以及后来接任的桑达尔·皮查伊(Sundar Pichai)——在与德米斯接触之后,很快意识到他是一个非常特别的人。他们非常希望能够留住他,并且愿意按照他的想法去推进事情,因为他们认为他极具价值。

在收购 DeepMind 时,来自加拿大的深度学习先驱杰弗里·辛顿(Geoffrey Hinton)曾开玩笑地说:“就算只买德米斯一个人,也值 1 亿到 1.5 亿英镑。”这其实反映了他们对德米斯的高度评价——他不仅是一个创业者,更是一个具有天才级洞察力的人。

正因为如此,谷歌在收购之后给予了 DeepMind 极高的重视和充分的资源支持,包括大量的研究资金。这也是 DeepMind 后来能够持续取得成功的重要原因之一——本质上,是因为谷歌对德米斯的认可与信任,并愿意长期支持他的研究方向。

InfoQ:即使有很高的话语权,但谷歌毕竟是一家商业公司,DeepMind 是如何在长期科研和短期成果之间取得平衡的?

马拉比:在相当长一段时间里,DeepMind 的重心一直是长期科研,而不是产品化。它基本没有推出真正意义上的商业产品,虽然也曾尝试过一些医疗应用,但那更多是因为德米斯的联合创始人穆斯塔法·苏莱曼( Mustafa Suleyman)的推动,而不是谷歌的核心诉求。

谷歌当时是允许,甚至支持 DeepMind 专注于基础研究的。它每年投入近 10 亿美元来支持这些研究项目——这是一个非常大的投入,但对于现金充裕的谷歌来说,是可以承担的。

这种局面在 2022 年发生了根本性变化。随着 ChatGPT 的推出,谷歌突然意识到,传统搜索引擎可能会被基于大语言模型的新型搜索方式所颠覆。这种威胁让谷歌感到紧张,因此他们迅速转向,希望与 OpenAI 竞争,并开始要求 DeepMind 从以科学研究为主,转向更偏产品化的方向,尤其是开发大语言模型。

一开始我也在想,德米斯是否会对此感到不适应,毕竟他本质上是一位科学家。

但后来我和他交流时,他的看法很有意思。他说:“你要记住,在创立 DeepMind 之前,我运营的是自己的创业公司万灵药工作室(Elixir Studios),那是一家游戏公司,我们是做产品的。我并不排斥做产品,而且我本身也是一个很有竞争心的人,我也希望在这场竞争中获胜。”

他还提到,到了这个阶段,AI 的发展已经进入一个新的状态:构建大语言模型,一方面是在打造产品,另一方面本身也是在推进科学前沿。

事实上,自从 ChatGPT 出现之后,我们已经看到大量新的技术进展不断涌现,比如:

  • 更长上下文窗口的模型(可以记住更多信息)
  • 能处理图像、视频和语音的多模态模型
  • 具备复杂推理能力的模型
  • 以及能够执行任务的智能体(Agent)模型

这些前沿探索本身就发生在“产品形态”之中。因此,在当前阶段,科学研究与产品开发并不是二选一的关系,而是可以同时推进的两条路径。

赚几十亿美金,抵不过拿一个诺贝尔奖

InfoQ:在收购后的最初几年里,DeepMind 与谷歌之间最大的文化冲突是什么?谷歌在多大程度上允许 DeepMind 保持科研独立?

马拉比:这些文化上的分歧,主要集中在“安全性”问题上。DeepMind 希望建立一套更独立、更特殊的治理机制,以确保 AI 不会仅仅被用于服务某一家公司的商业利益。他们设想成立一个类似“伦理和安全审查委员会”的机构,成员可能包括像美国前总统奥这样的人物,由这个机构来决定 AI 应该如何被使用。

对于这个想法,谷歌在表面上有时似乎表示支持,但实际上并没有真正打算落实。因此,双方围绕这一问题,与律师、投行顾问等一起,进行了长达三年的反复博弈。

在这段时间里,德米斯甚至曾尝试寻找其他出路,比如去接触阿里巴巴创始人马云,希望获得资金支持,让 DeepMind 重新独立运作。这可以说是双方最核心的一次“文化冲突”

不过,在科研层面上,双方的分歧其实并不明显。谷歌一直非常支持 DeepMind 开展前沿研究,比如 AlphaGo 项目。

事实上,在 AlphaGo 于韩国比赛期间,谷歌的联合创始人谢尔盖·布林(Sergey Brin),以及当时的 CEO 埃里克·施密特(Eric Schmidt)等高层都亲自前往现场观赛,他们对这一项目非常投入,也非常享受这一历史性时刻。

InfoQ:您提到谷歌和 DeepMind 之间曾爆发了激烈的文化冲突,您在书中也提到德米斯差点就带着团队离开了谷歌。但最后为什么又决定留下来了,谷歌做了一些什么样的妥协吗?

马拉比:其实归根结底,德米斯在那段时间最想做的还是科研。因为如果真要为了自立门户再去创办一家新公司,他不仅得四处奔波拉投资,还得雇一堆律师去跟谷歌法务部“撕破脸”,这肯定会让谷歌那边大动肝火。对他来说,与其深陷这种无休止的商业纠葛,他显然更愿意把全部精力都放在攻克 AI 科学难题上。

所以我觉得,这才是他最终选择留下的原因。

还有一个很有趣的点:德米斯的大本营在伦敦,而不是硅谷。在硅谷,那种“你必须得拥有自己公司”的创业狂热几乎是一种信仰;但在伦敦,这种氛围没那么激进。德米斯 显然更愿意坚守最初把公司卖给谷歌时的那份初心。

在他面前,其实摆着两条截然不同的路:一条是靠独立打拼建立一个庞大的商业帝国,成为身家百亿的超级富豪;另一条则是深耕科学领域,发明真正的 AI,最终问鼎诺贝尔奖。

显然,比起那几十亿美金,他更渴望那一枚诺贝尔奖章

InfoQ:我们能否讨论一个假设,如果 DeepMind 没有被谷歌收购,它今天会是什么样?

马拉比:在我生活的英国,常能听到一种声音:“唉,要是当初 DeepMind 没卖给谷歌该多好,那样我们现在就有一家独立的英国 AI 巨头了。”

但我完全不这么看。

我认为当时的 DeepMind 真的太缺钱了。你完全可以换个角度来看待这桩收购:这根本不是什么“英国 AI 产业的损失”,正相反,这是英国的一大胜利。像德米斯这样天才的英国创业者,凭本事说服了一家美国巨头,心甘情愿地每年往伦敦的 AI 实验室里砸近10 亿美元

想一想,美国人拿着大把钞票来投资英国,这难道不是天大的好事吗?

如果德米斯当时没把公司卖给谷歌,凭他的天赋和那股子不服输的劲头,他肯定也能成功。他大概率会保持独立,或者转头去拿埃隆·马斯克之类大佬的投资。但那条路肯定要难走得多,因为手里的钱会缩水,而且还得整天面对各种“内耗”——毕竟马斯克可是个极度好斗的人

如果没有谷歌的财力支持,像 AlphaGo 这样的奇迹可能要推迟很久才会出现。但无论如何,德米斯最终还是会成为 AI 领域的领军人物。那是他的使命,也是他的天赋所在——只要是他想做成的事,这世界上恐怕没什么能拦得住他。

AlphaGo 与 AlphaFold 背后,是选择问题的能力

InfoQ:AlphaGo 可以说让 DeepMind 一战成名。在谷歌内部,伴随着 AlphaGo 的成功,谷歌高层有没有重新评估 AGI 价值?您认为这场胜利是否改变了 DeepMind 在集团内部的话语权?具体体现在哪些方面?

马拉比:对于谷歌的每一个人来说,DeepMind 在 AlphaGo 上的胜利无异于一记具有震撼性的警钟。

通过那场比赛,所有人真切地看到了 AI 蕴含的恐怖力量。早些时候,谢尔盖·布林还曾断言:“要做出一个能下围棋的系统肯定难如登天。”结果,德米斯用事实狠狠地打了他的脸。谷歌高层不得不承认,AI 的进化速度早已远超他们的预期。

从那时起,研发预算开始疯狂飙升。原本 DeepMind 的经费就已经很高了,AlphaGo 之后更是又翻了一番。

可以说,这场胜利成了德米斯手里最有力的筹码,让他能说服谷歌源源不断地砸钱。而一年后(2017 年)横空出世的AlphaZero,则进一步巩固了他的地位,证明了这种投入是完全值得的。

InfoQ:无论是 AlphaGo,还是 AlphaFold,都在业内备受关注。在您看来,AlphaGo 与 AlphaFold 在方法论上有什么共通之处?

马拉比:它们其实都是“无限机器”的例子

以围棋为例,先手一开始可以在 361 个交叉点中选择任意一个落子,然后轮到后手有 360 种选择。接下来依次是 359、358......如果把这些可能性相乘,很快就会得到一个极其庞大的数字——每一步棋、每一个应对,以及对应对的再应对,都会形成爆炸式增长的可能性空间。

所以,这是一个巨大的搜索空间,一个几乎无限的可能性集合。我把它称为“无限机器”。也就是说,像 AlphaGo 这样的系统,本质上是一台能够从几乎无限的可能走法中提取出“意义”的机器。

如果你再看蛋白质结构——一张蛋白质的图像,你会看到它是如何折叠的。里面有无数细小的弯曲,而每一个弯曲都可能朝不同方向变化。因此,蛋白质可能形成的结构组合,比围棋还要大得多,某种意义上说,已经非常接近“无限”。

但 DeepMind 仍然发明了一种机器,能够在所有这些可能的组合中预测出正确的蛋白质结构——这些组合所涉及的原子数量甚至超过宇宙中的原子数。所以,从这个角度看,它同样是一台“无限机器”。我认为这就是两者之间最核心的联系:如何从如此庞大的数据和可能性中提取出有意义的结果。

AlphaFold 的确是一个非常重要、具有里程碑意义的成就,在全球范围内都是如此。那么,为什么 DeepMind 选择把它开源?

一方面,是出于帮助全世界、推动科学进步的考虑;另一方面,也是因为 DeepMind 认为,他们之所以能够做出 AlphaFold,很大程度上得益于一个长期积累的科学共同体。

比如 CASP 这个竞赛——它是由学术界发起的,每两年举行一次,让不同科研团队竞赛蛋白质结构预测。在 DeepMind 于 2020 年获胜之前,这个竞赛已经持续了大约 18 年。

也就是说,在 DeepMind 解决这个问题之前,整个领域已经有了大量的基础研究工作。因此,DeepMind 也希望通过回馈学术界的方式,来表达感谢——他们把 AlphaFold 系统开放出来,让整个领域都能使用这些预测结果。

如果他们只是利用了所有人的开放研究成果,却不公开自己的研究,那在道义上会显得不太合适。所以,这也是他们选择开源的重要原因之一。

当然,还有一个现实层面的因素:在商业应用,比如药物研发中,仅仅是 AlphaFold 2(也就是后来获得诺贝尔奖的版本)其实还不够。

你不仅需要知道蛋白质的结构,还需要理解蛋白质之间、蛋白质与其他分子之间是如何相互作用的。这正是 AlphaFold 3 和 4 要解决的问题。

而 AlphaFold 4 并没有开源,它是专有的系统。这也意味着它正在逐渐走向产品化阶段,因此 DeepMind 和谷歌选择将其保留在内部

InfoQ:无论 AlphaGo,还是 AlphaFold 都是非常伟大的成就,那 DeepMind 是如何选择“值得投入十年的课题”的?有哪些判断依据是可复制的?

马拉比:德米斯经常提到一个概念,叫作“科学品味”(Scientific Taste)。

他有一种敏锐的直觉:能“嗅”出 AI 领域中哪些悬而未决的问题虽然极具挑战,但只要拼命攻关两年就一定能捅破那层窗户纸。他极其擅长进行这种战略豪赌。这种能力不仅源于他对科学前沿的深刻理解,更源于他看透了科学家这个群体的运作逻辑。

他曾跟我讲过一个关于 AlphaFold 的精彩故事。

2018 年时,团队已经研发了两年,做出的系统虽然贵为全球最强,但还远没有达到能预测“所有蛋白质形状”的终极目标。它只是比其他 AI 强,但离解决问题还差得远。当时,团队负责人安德鲁·西尼尔(Andrew Senior)甚至有些灰心地对德米斯说:“这题我们解不出来,实在太难了。我们已经尽力了,2018 版系统表现不错,已经领先全人类了,但求你别逼我们去预测自然界所有的蛋白质,那根本不可能。”

但德米斯直觉认为,预测所有蛋白质是有可能的。为了验证自己的判断,他亲自参加了 AlphaFold 团队的每一次技术研讨会

他在会上并不多说话,而是在冷静地观察团队的讨论是否“流畅”(fluent)。

所谓的“流畅”,是指大家是否在源源不断、快速地蹦出新的研究灵感。德米斯认为,只要灵感还在流淌——哪怕有些想法现在看起来不一定对——只要大家还有“产生新点子的能力”,就说明科学进步的空间远未枯竭。

基于这种观察,德米斯决定顶住压力,拒绝关闭项目。他不仅没有听从老负责人的撤退建议,反而换了主帅,提拔了年轻的约翰·江珀(John Jumper)

江珀坚信成功就在前方,德米斯则给了他毫无保留的支持。两年后,他们交出了足以问鼎诺贝尔奖的科研成果。

这个故事告诉我们:作为领导者,你不仅需要那种判断“什么能成”的科学品味,更要学会坐在会议室里,去捕捉那些思维碰撞的火花,去倾听灵感流动的声音

InfoQ:AlphaGo、AlphaFold 都只是 AGI 路线上的阶段实验。您赞同这个说法吗?

马拉比:嗯,可以这么说。我认为它们确实都推动了人工智能科学的发展。而在这条漫长路径的尽头,将会是通用人工智能(AGI)。

不过从另一个角度来看,你也可以认为,大语言模型的成功源自人工智能研究中的另一条技术路线,这条路线并不包括强化学习,因此它和 AlphaGo 的路径并不相同。

而且,它与 AlphaFold 也有一定程度的分离。AlphaFold 的确使用了 Transformer 模型,但那是一种特殊形式的 Transformer。关于 AlphaFold 和 Transformer 的相关研究,大致集中在 2018 到 2020 年之间,更准确地说是在 2019 到 2020 年。

与此同时,OpenAI 已经在基于 Transformer 架构构建大语言模型了。因此,我更倾向于把这看作是人工智能进展中的另一条独立技术路线。

所以,从宏观上看,任何在 AI 领域的重要突破,都会推动未来的发展;但从更具体的技术起源来看,大语言模型的诞生路径,其实是相对独立的。

AGI 竞争的真实格局

InfoQ:根据您对 AI 行业的了解,您认为 DeepMind、OpenAI、Anthropic 的核心差异是什么?

马拉比:首先,一个很大的差异在于它与谷歌的关系。就像我之前说的,DeepMind 有来自谷歌的大量资金支持,这是一个非常大的优势。因为即便在今天,训练这些模型的成本依然极其高昂,而它们带来的收入其实并不多。

所以现阶段,你必须有充足的资金支撑,而德米斯很幸运,有谷歌在背后支持。相比之下,Anthropic 和 OpenAI 需要不断去找投资人融资,这本身就很困难——这是一个很关键的差别。

不过在其他方面,它们其实又很相似。比如说,它们都有自己的大语言模型,而且这些模型整体水平都很高。不同时间点上,可能某一家会领先另外两家,但这种领先是动态变化的。

如果换一个角度来看它们的差异,可以从“安全性”入手。Anthropic 对安全问题非常重视,甚至不久前还因为 AI 在军事系统中的应用问题,与五角大楼发生过争议。

而 DeepMind 在这方面的表现则不太一样。我认为德米斯本人也是重视安全的,包括在军事应用方面,但他并没有和政府发生正面冲突。所以你可以说,Anthropic 是最愿意为推动安全议题而承担风险的公司;DeepMind(以及谷歌)排在中间。

至于 OpenAI,就很有意思了。从外部表现来看,它似乎没有那么强调安全——比如在 Anthropic 和五角大楼发生争议时,OpenAI 的态度更像是:“没问题,我们可以提供 AI。”

这在某种程度上也类似他们发布 ChatGPT 时的策略:他们并不介意推出一个可能存在风险的产品,而是选择先发布再迭代。相比之下,Anthropic 和 DeepMind 都曾因为更谨慎,而没有发布一些模型。

所以如果做一个粗略排序:

  • 最激进(最不保守):OpenAI
  • 中间:谷歌 DeepMind
  • 最强调安全:Anthropic

你提到 OpenAI 最近招募了 OpenClaw 的开源项目创始人彼得·斯坦伯格(Peter Steinberger),也在问这会不会对谷歌或 DeepMind 构成威胁,尤其是在 OpenClaw 现在很火的情况下。

我认为,在谷歌 DeepMind 内部,本身就有大量在做智能体的优秀研究人员。即使招募了一个做出 OpenClaw 的人,也不太可能从根本上改变整个竞争格局。

另外一点很关键:OpenClaw 确实令人印象深刻,但它同样也具有一定的风险性。真正的挑战在于,如何做出既强大又安全的系统——只有这样,它才真正具备大规模应用价值。而至于彼得是否能够做到这一点,目前其实还无法确定。

InfoQ:谷歌、OpenAI、xAI、Anthropic 以及中国的 DeepSeek、阿里巴巴、腾讯等公司,您认为谁最接近 AGI?

马拉比:AGI(通用人工智能)的定义一直都是不精确的,人们其实并没有一个统一、清晰的标准。

从某种角度来说,你完全可以这样理解:现在这些优秀的大语言模型,本身就具备“通用性”(general)、“人工性”(artificial)以及一定程度的“智能”(intelligent)。因此,也有人会认为——某种意义上的 AGI 其实已经出现了。

但这本质上取决于你如何定义 AGI。

一种更务实的理解方式是:AGI 应该是一种在现实世界中极其有用的机器,尤其是在商业环境里,能够执行原本由人类完成的工作。换句话说,它不只是“聪明”,而是“能干活”。

在这个维度上,你可以看到一些非常具体的进展。例如,Claude Code 这样的系统,已经能够非常高效地编写代码,以至于企业对程序员的需求结构可能发生变化——过去可能需要 20 个工程师,未来也许只需要 10 个,因为有一半的代码是由模型完成的。

当然,这并不是某一家独有的能力。其他公司也在做类似的事情:比如 OpenAI Codex,以及谷歌 DeepMind 自己的代码生成模型,中国的一些模型在代码生成方面也表现不俗。

所以问题就变成了:谁现在最好?也许此刻可以说是 Claude,但六个月之后,很可能格局就会变化。

换句话说,在“是否接近 AGI”这个问题上,我们已经进入了一个新的阶段:关键不再只是“有没有”,而是“谁在什么任务上更实用、替代性更强”,以及这种能力能否持续、稳定地提升。

InfoQ:那您认为,AGI 突破更可能来自模型规模,还是新的算法?

马拉比:到目前为止我们取得的进展,其实是多方面共同作用的结果。

很重要的一点是要理解:无论是来自谷歌、OpenAI,还是 Anthropic 的进展,虽然它们确实在不断扩大算力规模(scaling compute),但这并不是全部。与此同时,它们也在持续改进算法、优化工程实现,并进行各种技术创新,这些共同推动了整个 AI 科学的发展。

所以,本质上这是一个“规模 + 技术”的组合驱动过程。而我也认为,未来大概率仍然会延续这种组合路径。

当然,现在很多人在讨论一个问题:算力扩展是否会遇到瓶颈?我的看法是,每当人们认为“扩展快到极限了”的时候,总会出现新的扩展方式。

比如说,早期的基础模型通过扩大训练规模获得了巨大提升,但后来这种边际收益可能开始下降。于是,又出现了新的扩展路径——比如在推理阶段对“推理模型”进行扩展,这又带来了新的性能提升空间。

再往未来看,也许还会出现新的规模化维度,比如智能体或者具身智能的扩展。

因此,我的判断是:规模化本身不会消失,它只是在不断换一种形式出现,并且仍然会是一个长期存在的核心竞争优势。

本文来自微信公众号“AI前线”(ID:ai-front),作者:冬梅,编辑:蔡芳芳

相關問答

QDeepMind 的成功主要归功于哪些独特的组织方式?

ADeepMind 的成功主要归功于其独特的组织方式,即结合了自由探索和集中攻坚。它允许科学家长期自由研究,同时在关键时刻组建‘突击小组’进行高强度、目标明确的集中攻关,以推动重大突破。

Q哈萨比斯具备哪些个人特质,这些特质如何影响 DeepMind 的发展?

A哈萨比斯被形容为天造之才、争强好胜、友善谦逊。他的天才和好胜心驱动他追求卓越成就,而他的善良和谦逊使他能够吸引并留住顶尖人才,共同推动 DeepMind 的成功。

QDeepMind 在被谷歌收购后,如何平衡长期科研与短期商业成果?

A在被谷歌收购后的很长一段时间里,DeepMind 专注于长期基础研究,谷歌每年投入近10亿美元支持其科研。直到 ChatGPT 出现后,谷歌因竞争压力才开始要求 DeepMind 更注重产品化,但哈萨比斯认为当前阶段产品开发和前沿探索可以同步进行。

QAlphaGo 和 AlphaFold 在方法论上有何共通之处?

AAlphaGo 和 AlphaFold 都是‘无限机器’的例子,它们都涉及从近乎无限的可能性空间中提取有意义的结果。无论是围棋的走法还是蛋白质的结构预测,都需要处理巨大的搜索空间,并从中找到最优解。

Q在 AGI 竞争中,DeepMind、OpenAI 和 Anthropic 的核心差异是什么?

A三者的核心差异主要体现在资金支持、安全策略和发布风格上。DeepMind 有谷歌的雄厚资金支持;Anthropic 最强调安全,甚至因此与政府产生争议;OpenAI 则相对激进,倾向于先发布产品再迭代。在安全态度上,OpenAI 最激进,DeepMind 居中,Anthropic 最保守。

你可能也喜歡

以太坊获机构瞩目——Etherealize CEO如是说

加密货币领域持续发展,以太坊(ETH)正获得越来越多的机构关注,其角色已超越单纯的数字资产。Etherealize首席执行官Vivek Raman表示,以太坊正逐渐成为机构投资组合中的核心资产,与比特币地位相当,并可能成为下一代金融基础设施的基础层。 Raman指出,随着资产增长,机构对ETH的配置是必然趋势。他提到哈佛大学从比特币现货ETF转向以太坊现货ETF的例子,并强调ETH的权益证明机制能带来可观收益,这些因素将推动其成为新的价值存储手段,并促进价格上涨。 此外,Raman还讨论了以太坊网络上资产代币化和稳定币的显著增长,认为大多数高价值的代币化资产和稳定币将在该网络上发行。由于ETH作为去中心化、抗审查的抵押资产,其价值将随着区块链上资产代币化的发展而提升。 长期来看,尽管以太坊短期走势疲软,但前景依然乐观。有分析师预测,到2033年ETH价格可能达到12,000至38,000美元,另有人预测2030年将达60,000美元。当前ETH价格约为2,300美元,短期增长已被市场消化。 专家指出,以太坊生态系统年手续费收入达38.2亿美元,第二层网络处理了大部分交易。随着稳定币规模增长、技术升级持续推进以及机构采用率提升,以太坊被严重低估,未来潜力巨大。

bitcoinist1 小時前

以太坊获机构瞩目——Etherealize CEO如是说

bitcoinist1 小時前

交易

現貨
合約

熱門文章

什麼是 GROK AI

Grok AI: 在 Web3 時代革命性改變對話技術 介紹 在快速演變的人工智能領域,Grok AI 作為一個值得注意的項目脫穎而出,橋接了先進技術與用戶互動的領域。Grok AI 由 xAI 開發,該公司由著名企業家 Elon Musk 領導,旨在重新定義我們與人工智能的互動方式。隨著 Web3 運動的持續蓬勃發展,Grok AI 旨在利用對話 AI 的力量回答複雜的查詢,為用戶提供不僅具資訊性而且具娛樂性的體驗。 Grok AI 是什麼? Grok AI 是一個複雜的對話 AI 聊天機器人,旨在與用戶進行動態互動。與許多傳統 AI 系統不同,Grok AI 接納更廣泛的查詢,包括那些通常被視為不恰當或超出標準回應的問題。該項目的核心目標包括: 可靠推理:Grok AI 強調常識推理,根據上下文理解提供邏輯答案。 可擴展監督:整合工具協助確保用戶互動既受到監控又優化質量。 正式驗證:安全性至關重要;Grok AI 採用正式驗證方法來增強其輸出的可靠性。 長上下文理解:該 AI 模型在保留和回憶大量對話歷史方面表現出色,促進有意義且具上下文意識的討論。 對抗魯棒性:通過專注於改善其對操控或惡意輸入的防禦,Grok AI 旨在維護用戶互動的完整性。 總之,Grok AI 不僅僅是一個信息檢索設備;它是一個沉浸式的對話夥伴,鼓勵動態對話。 Grok AI 的創建者 Grok AI 的腦力來源無疑是 Elon Musk,這個名字與各個領域的創新息息相關,包括汽車、太空旅行和技術。在專注於以有益方式推進 AI 技術的 xAI 旗下,Musk 的願景旨在重塑對 AI 互動的理解。其領導力和基礎理念深受 Musk 推動技術邊界的承諾影響。 Grok AI 的投資者 雖然有關支持 Grok AI 的投資者的具體細節仍然有限,但公開承認 xAI 作為該項目的孵化器,主要由 Elon Musk 本人創立和支持。Musk 之前的企業和持股為 Grok AI 提供了強有力的支持,進一步增強了其可信度和增長潛力。然而,目前有關支持 Grok AI 的其他投資基金或組織的信息尚不易獲得,這標誌著未來潛在探索的領域。 Grok AI 如何運作? Grok AI 的運作機制與其概念框架一樣創新。該項目整合了幾種尖端技術,以促進其獨特的功能: 強大的基礎設施:Grok AI 使用 Kubernetes 進行容器編排,Rust 提供性能和安全性,JAX 用於高性能數值計算。這三者確保了聊天機器人的高效運行、有效擴展和及時服務用戶。 實時知識訪問:Grok AI 的一個顯著特點是其通過 X 平台(以前稱為 Twitter)訪問實時數據的能力。這一能力使 AI 能夠獲取最新信息,從而提供及時的答案和建議,而其他 AI 模型可能會錯過這些信息。 兩種互動模式:Grok AI 為用戶提供“趣味模式”和“常規模式”之間的選擇。趣味模式允許更具玩樂性和幽默感的互動風格,而常規模式則專注於提供精確和準確的回應。這種多樣性確保了根據不同用戶偏好量身定制的體驗。 總之,Grok AI 將性能與互動相結合,創造出既豐富又娛樂的體驗。 Grok AI 的時間線 Grok AI 的旅程標誌著反映其發展和部署階段的關鍵里程碑: 初始開發:Grok AI 的基礎階段持續了約兩個月,在此期間進行了模型的初步訓練和微調。 Grok-2 Beta 發布:在一個重要的進展中,Grok-2 beta 被宣布。這一版本推出了兩個版本的聊天機器人——Grok-2 和 Grok-2 mini,均具備聊天、編碼和推理的能力。 公眾訪問:在其 beta 開發之後,Grok AI 向 X 平台用戶開放。那些通過手機號碼驗證並活躍至少七天的帳戶可以訪問有限版本,使這項技術能夠接觸到更廣泛的受眾。 這一時間線概括了 Grok AI 從創建到公眾參與的系統性增長,強調其對持續改進和用戶互動的承諾。 Grok AI 的主要特點 Grok AI 包含幾個關鍵特點,促成其創新身份: 實時知識整合:訪問當前和相關信息使 Grok AI 與許多靜態模型區別開來,從而提供引人入勝和準確的用戶體驗。 多樣化的互動風格:通過提供不同的互動模式,Grok AI 滿足各種用戶偏好,邀請創造力和個性化的對話。 先進的技術基礎:利用 Kubernetes、Rust 和 JAX 為該項目提供了堅實的框架,以確保可靠性和最佳性能。 倫理話語考量:包含圖像生成功能展示了該項目的創新精神。然而,它也引發了有關版權和尊重可識別人物描繪的倫理考量——這是 AI 社區內持續討論的議題。 結論 作為對話 AI 領域的先驅,Grok AI 概括了數字時代轉變用戶體驗的潛力。由 xAI 開發,並受到 Elon Musk 願景的驅動,Grok AI 將實時知識與先進的互動能力相結合。它努力推動人工智能能夠達成的界限,同時保持對倫理考量和用戶安全的關注。 Grok AI 不僅體現了技術的進步,還體現了 Web3 環境中新對話範式的出現,承諾以靈活的知識和玩樂的互動吸引用戶。隨著該項目的持續演變,它成為技術、創造力和類人互動交匯處所能實現的見證。

468 人學過發佈於 2024.12.26更新於 2024.12.26

什麼是 GROK AI

什麼是 ERC AI

Euruka Tech:$erc ai 及其在 Web3 中的雄心概述 介紹 在快速發展的區塊鏈技術和去中心化應用的環境中,新項目頻繁出現,每個項目都有其獨特的目標和方法論。其中一個項目是 Euruka Tech,該項目在加密貨幣和 Web3 的廣闊領域中運作。Euruka Tech 的主要焦點,特別是其代幣 $erc ai,是提供旨在利用去中心化技術日益增長的能力的創新解決方案。本文旨在提供 Euruka Tech 的全面概述,探索其目標、功能、創建者的身份、潛在投資者以及它在更廣泛的 Web3 背景中的重要性。 Euruka Tech, $erc ai 是什麼? Euruka Tech 被描述為一個利用 Web3 環境提供的工具和功能的項目,專注於在其運作中整合人工智能。雖然有關該項目框架的具體細節仍然有些模糊,但它旨在增強用戶參與度並自動化加密空間中的流程。該項目的目標是創建一個去中心化的生態系統,不僅促進交易,還通過人工智能整合預測功能,因此其代幣被命名為 $erc ai。其目的是提供一個直觀的平台,促進更智能的互動和高效的交易處理,並在不斷增長的 Web3 領域中發揮作用。 Euruka Tech, $erc ai 的創建者是誰? 目前,關於 Euruka Tech 背後的創建者或創始團隊的信息仍然不明確且有些模糊。這一數據的缺失引發了擔憂,因為了解團隊背景通常對於在區塊鏈行業建立信譽至關重要。因此,我們將這些信息歸類為 未知,直到具體細節在公共領域中公開。 Euruka Tech, $erc ai 的投資者是誰? 同樣,關於 Euruka Tech 項目的投資者或支持組織的識別在現有研究中並未明確提供。對於考慮參與 Euruka Tech 的潛在利益相關者或用戶來說,來自知名投資公司的財務合作或支持所帶來的保證是至關重要的。沒有關於投資關係的披露,很難對該項目的財務安全性或持久性得出全面的結論。根據所找到的信息,本節也處於 未知 的狀態。 Euruka Tech, $erc ai 如何運作? 儘管缺乏有關 Euruka Tech 的詳細技術規範,但考慮其創新雄心是至關重要的。該項目旨在利用人工智能的計算能力來自動化和增強加密貨幣環境中的用戶體驗。通過將 AI 與區塊鏈技術相結合,Euruka Tech 旨在提供自動交易、風險評估和個性化用戶界面等功能。 Euruka Tech 的創新本質在於其目標是創造用戶與去中心化網絡所提供的廣泛可能性之間的無縫連接。通過利用機器學習算法和 AI,它旨在減少首次用戶的挑戰,並簡化 Web3 框架內的交易體驗。AI 與區塊鏈之間的這種共生關係突顯了 $erc ai 代幣的重要性,成為傳統用戶界面與去中心化技術的先進能力之間的橋樑。 Euruka Tech, $erc ai 的時間線 不幸的是,由於目前有關 Euruka Tech 的信息有限,我們無法提供該項目旅程中主要發展或里程碑的詳細時間線。這條時間線通常對於描繪項目的演變和理解其增長軌跡至關重要,但目前尚不可用。隨著有關顯著事件、合作夥伴關係或功能添加的信息變得明顯,更新將無疑增強 Euruka Tech 在加密領域的可見性。 關於其他 “Eureka” 項目的澄清 值得注意的是,多個項目和公司與 “Eureka” 共享類似的名稱。研究已經識別出一些倡議,例如 NVIDIA Research 的 AI 代理,專注於使用生成方法教導機器人複雜任務,以及 Eureka Labs 和 Eureka AI,分別改善教育和客戶服務分析中的用戶體驗。然而,這些項目與 Euruka Tech 是不同的,不應與其目標或功能混淆。 結論 Euruka Tech 及其 $erc ai 代幣在 Web3 領域中代表了一個有前途但目前仍不明朗的參與者。儘管有關其創建者和投資者的細節仍未披露,但將人工智能與區塊鏈技術相結合的核心雄心仍然是關注的焦點。該項目在通過先進自動化促進用戶參與方面的獨特方法,可能會使其在 Web3 生態系統中脫穎而出。 隨著加密市場的持續演變,利益相關者應密切關注有關 Euruka Tech 的進展,因為文檔創新、合作夥伴關係或明確路線圖的發展可能在未來帶來重大機會。當前,我們期待更多實質性見解的出現,以揭示 Euruka Tech 的潛力及其在競爭激烈的加密市場中的地位。

408 人學過發佈於 2025.01.02更新於 2025.01.02

什麼是 ERC AI

什麼是 DUOLINGO AI

DUOLINGO AI:將語言學習與Web3及AI創新結合 在科技重塑教育的時代,人工智能(AI)和區塊鏈網絡的整合預示著語言學習的新前沿。進入DUOLINGO AI及其相關的加密貨幣$DUOLINGO AI。這個項目旨在將領先語言學習平台的教育優勢與去中心化的Web3技術的好處相結合。本文深入探討DUOLINGO AI的關鍵方面,探索其目標、技術框架、歷史發展和未來潛力,同時保持原始教育資源與這一獨立加密貨幣倡議之間的清晰區分。 DUOLINGO AI概述 DUOLINGO AI的核心目標是建立一個去中心化的環境,讓學習者可以通過實現語言能力的教育里程碑來獲得加密獎勵。通過應用智能合約,該項目旨在自動化技能驗證過程和代幣分配,遵循強調透明度和用戶擁有權的Web3原則。該模型與傳統的語言習得方法有所不同,重點依賴社區驅動的治理結構,讓代幣持有者能夠建議課程內容和獎勵分配的改進。 DUOLINGO AI的一些顯著目標包括: 遊戲化學習:該項目整合區塊鏈成就和非同質化代幣(NFT)來表示語言能力水平,通過引人入勝的數字獎勵來激發學習動機。 去中心化內容創建:它為教育者和語言愛好者提供了貢獻課程的途徑,促進了一個有利於所有貢獻者的收益共享模型。 AI驅動的個性化:通過採用先進的機器學習模型,DUOLINGO AI個性化課程以適應個別學習進度,類似於已建立平台中的自適應功能。 項目創建者與治理 截至2025年4月,$DUOLINGO AI背後的團隊仍然是化名的,這在去中心化的加密貨幣領域中是一種常見做法。這種匿名性旨在促進集體增長和利益相關者的參與,而不是專注於個別開發者。部署在Solana區塊鏈上的智能合約註明了開發者的錢包地址,這表明對於交易的透明度的承諾,儘管創建者的身份未知。 根據其路線圖,DUOLINGO AI旨在演變為去中心化自治組織(DAO)。這種治理結構允許代幣持有者對關鍵問題進行投票,例如功能實施和財庫分配。這一模型與各種去中心化應用中社區賦權的精神相一致,強調集體決策的重要性。 投資者與戰略夥伴關係 目前,沒有與$DUOLINGO AI相關的公開可識別的機構投資者或風險投資家。相反,該項目的流動性主要來自去中心化交易所(DEX),這與傳統教育科技公司的資金策略形成鮮明對比。這種草根模型表明了一種社區驅動的方法,反映了該項目對去中心化的承諾。 在其白皮書中,DUOLINGO AI提到與未具名的「區塊鏈教育平台」建立合作,以豐富其課程提供。雖然具體的合作夥伴尚未披露,但這些合作努力暗示了一種將區塊鏈創新與教育倡議相結合的策略,擴大了對多樣化學習途徑的訪問和用戶參與。 技術架構 AI整合 DUOLINGO AI整合了兩個主要的AI驅動組件,以增強其教育產品: 自適應學習引擎:這個複雜的引擎從用戶互動中學習,類似於主要教育平台的專有模型。它動態調整課程難度,以應對特定學習者的挑戰,通過針對性的練習加強薄弱環節。 對話代理:通過使用基於GPT-4的聊天機器人,DUOLINGO AI為用戶提供了一個參與模擬對話的平台,促進更互動和實用的語言學習體驗。 區塊鏈基礎設施 建立在Solana區塊鏈上的$DUOLINGO AI利用了一個全面的技術框架,包括: 技能驗證智能合約:此功能自動向成功通過能力測試的用戶頒發代幣,加強了對真實學習成果的激勵結構。 NFT徽章:這些數字代幣標誌著學習者達成的各種里程碑,例如完成課程的一部分或掌握特定技能,允許他們以數字方式交易或展示自己的成就。 DAO治理:持有代幣的社區成員可以通過對關鍵提案進行投票來參與治理,促進一種鼓勵課程提供和平台功能創新的參與文化。 歷史時間線 2022–2023:概念化 DUOLINGO AI的基礎工作始於白皮書的創建,強調了語言學習中的AI進步與區塊鏈技術去中心化潛力之間的協同作用。 2024:Beta發佈 限量的Beta版本推出了流行語言的課程,作為項目社區參與策略的一部分,獎勵早期用戶以代幣激勵。 2025:DAO過渡 在4月,進行了完整的主網發佈,並開始流通代幣,促使社區討論可能擴展到亞洲語言和其他課程開發的問題。 挑戰與未來方向 技術障礙 儘管有雄心勃勃的目標,DUOLINGO AI面臨著重大挑戰。可擴展性仍然是一個持續的擔憂,特別是在平衡與AI處理相關的成本和維持響應靈敏的去中心化網絡方面。此外,在去中心化的提供中確保內容創建和審核的質量,對於維持教育標準來說也帶來了複雜性。 戰略機會 展望未來,DUOLINGO AI有潛力利用與學術機構的微證書合作,提供區塊鏈驗證的語言技能認證。此外,跨鏈擴展可能使該項目能夠接觸到更廣泛的用戶基礎和其他區塊鏈生態系統,增強其互操作性和覆蓋範圍。 結論 DUOLINGO AI代表了人工智能和區塊鏈技術的創新融合,為傳統語言學習系統提供了一種以社區為中心的替代方案。儘管其化名開發和新興經濟模型帶來某些風險,但該項目對遊戲化學習、個性化教育和去中心化治理的承諾為Web3領域的教育技術指明了前進的道路。隨著AI的持續進步和區塊鏈生態系統的演變,像DUOLINGO AI這樣的倡議可能會重新定義用戶與語言教育的互動方式,賦能社區並通過創新的學習機制獎勵參與。

412 人學過發佈於 2025.04.11更新於 2025.04.11

什麼是 DUOLINGO AI

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 AI (AI)幣價的意見。

活动图片