Sam和Ilya的深层矛盾:有效加速主义Vs.超级“爱”对齐

币界网Publié le 2024-07-18Dernière mise à jour le 2024-07-18

币界网报道:

作者:陶芳波;来源:Tao写字的地方

我很懒,爱写字但从不发,但因为 OpenAI 这次分裂的历史意义太大,突然把我这几个月不太理解的事情,串到了一起。所以连夜写了人生第一篇公众号。

本文不讨论董事会政变的八卦,OpenAI 奇怪的治理结构,以及 Sam 和 Ilya 到底谁对谁错,我充分尊重这两个人的底层品质。如此不可思议的事情,必定藏着某种深层冲突。无论 Sam 最终是否会离开,本文探讨的冲突,应该会持续有效:

有效加速主义 和 超级“爱”对齐 的理念冲突,以及一个变量:GPT-5是数字生命,还是工具?

这些词看着唬人,尝试解释下。

有效加速主义

英文叫做 e/acc,是一群硅谷的科技精英们搞出来的一种科技价值观运动,你会发现有大量的 twitter 账号带有这个 e/acc 的后缀,可见其受众之广泛。比如下图分别是 Garry Tan(YC 现有掌门人)以及 Marc Andreessen(A16Z 的创始人)的账号。

那这到底是什么玩意儿,以及为什么会和 Sam 被驱逐有关?首先就要解释 e/acc。我的简单版理解:

1、人类应该无条件地加速技术创新,并快速推出他们,来颠覆社会结构。

2、e/acc 运动认为这种对社会的颠覆风险,本质上对人类有利,因为会迫使人类适应,从而帮助我们更快达到更高的意识水平。

3、过去三百年人类随着技术的颠覆而进化,结果显然都非常好。

很显然,e/acc 的支持者对 AGI 的态度也是一致的:让尽可能多的人参与,更快地推出产品,更快地颠覆,从而让人类更好地进化。是不是,有点「大力出奇迹」的意思?

Sam Altman是有效加速主义者吗?

我认为答案很确定,是的。尽管很多人说,你看 Sam 还去国会呼吁减速 AI 的发展,天天说 AI 的风险,不是应该是个「减速主义者」吗?其实他从来没有公开表达过自己 e/acc 的立场。但是似乎有一些蛛丝马迹让人相信。

MindOS 上分析到的小道消息

证据1:Garry Tan 作为 Sam 的接任者来执掌 YC,我很难想象他们不是一类人。以及有八卦说 Sam 被怀疑有小号来发表自己的加速主义立场。

证据2:这次 Sam 被驱逐,很多挂着 e/acc 的人已经把Sam当做一个象征。从 GPTs的仓促推出,对 Worldcoin 项目的大力投资,他是懂怎么「加速」的。

所以我倾向于认为,Sam的减速表象,是内部妥协,尤其是对Ilya的妥协

超级对齐是什么?

我在今年7月看到Ilya说要成立一个「超级对齐」项目 的时候,也是一脸问号。难道ChatGPT这么生硬的表达,还不够对齐吗?

但最近我才逐渐理解了Ilya的意思。可以看这段两周前的采访,以及被人爆料的,Ilya在乎的「不是AI有情感,而是AI有对人类真正的爱」。听上去似乎是个让人无语的「白莲花阻碍进步」的故事吗?其实不然,可以听一下:

为了真正理解这句话,我们需要审视一下现在的对齐,一种是所谓的价值观层面(比如同性恋应该被尊重),一种是所谓的话题层面(比如不让搞黄色)。但这些真的够吗?如果是个聊天机器人(比如去年的 ChatGPT),那完全够了。但如果是个具有自主决策和行动能力的超级智能呢,可能就有一个大大的问号了。

为什么超级「爱」对齐那么重要?

所以超级对齐项目,本质是Super-LOVE-alignment,超级「爱」对齐。这种LOVE,是大爱,并非情爱,是人性底层那种无条件的,无关自我的,对于人类的爱,是一种「神性」的爱,一种就像孔子、耶稣、释迦摩尼这些给文明带来深远影响的无条件的爱。你或许觉得这样讲太戏剧性了,但如果人类的历史上,没有这些伟大的人格带来的伟大的精神,作为文明的压舱石,就凭自私的人类,今天的世界可能会糟糕的多。

一个有趣的个人插曲,是在3年前,我在一个分享中借鉴了唯识的思想,来把AI的意识发展分为,从感知(传统 AI,第1-5识),到认知(GPT-4,第6识),到自我意识(Autonomous AI Agent,第7识),到智慧和爱(AI Being?第8识)。而Ilya相信,AI能判断价值观是远远不够的,因为人类历史上也很多次出现了价值观上无懈可击,却最终酿成巨大悲剧的故事。

解法是什么?那就是让AI对齐那种底层的「无条件对人类的爱」,这可能是现有的对齐技术通过 RLHF 注入无法做到的。只有拥有了这个,那么比人更强大的AI才真的不会毁灭掉我们。当年我还认为这是科幻小说该考虑的问题,可见他的层次之高。

那不能先推出AGI,再修正呢?Ilya认为不能,他认为技术的本质类似于人类的生物进化(这点讽刺地和 e/acc 的人一致)。但他认为进化的起点很重要。如果进化的开始,是一个没有「无条件对人类的爱」的 AI,那最终也一定会把我们人类带到沟里去。

变量:AI是数字生命,还是工具

我们应该成为一个e/acc,还是超级「爱」对齐主义者?又为什么是现在这个时间点,突然驱逐掉Sam?这些决策背后突变的因素到底是什么?

先讲一个小背景:从各种消息源来个人猜测,OpenAI内部应该在几周前讨论了GPT-5的初步结果,能力上应该是非常颠覆的。而对下一步的行动,Sam和Ilya应该是有巨大的分歧(可以看到Sam在APEC上的发言,已经证实了这次突破的存在)。

要解答上面的问题,取决于你认为GPT-5上的智能体,是数字生命,还是工具?如果我们用最简单的标准,判断是否是「数字生命」,那就是「是否具有完全的自主性」,如果依赖人类来决策和使用的技术,那就只是「工具」。e/acc最大的悖论在于,所有我们历史上可以借鉴的案例,本质上都是「更好的工具」,这可能是 e/acc 起作用的原因。但如果现在出现的是「数字生命」呢?社会的一份子,甚至是社会的管理者呢?一个比人强大的数字生命,真的可以没有「底层的对人类的爱」吗?如果真的那样,我也会替人类的未来担心,何止是失业呢。

所以,你是一个e/acc,还是一个超级对齐主义者,本质上的区别在于你怎么看AI对社会的本质。

所以,我偏向于相信OpenAI应该搞定了一些关键技术,然后生产了一个非常颠覆的新版本,自主性大大增强。而Ilya认为在通过超级对齐为他注入「对人类的爱」之前,这个版本的 AI,必须要我们抛弃有效加速主义的思想。如果没法形成共识,就抛弃拥有这个思想的人,立刻,马上。

哪怕这个人,可能是人类历史上最厉害的几个CEO之一。

Lectures associées

Décomposition de la Stratégie de Trading Bitcoin : Prédictions de Célébrités et Modèles Classiques Tous Défaillants, Seuls Ces Quatre Indicateurs Restent

L'auteur, non-traiteur professionnel, a analysé toutes les méthodes de prédiction du prix du Bitcoin (BTC) de 2017 à 2025 et a constaté que les prédictions de célébrités et les modèles classiques (comme Stock-to-Flow) sont devenus inefficaces. Seuls quatre indicateurs se sont révélés fiables pour décrire l'état du marché plutôt que de prédire l'avenir. Les indicateurs retenus sont : 1. **MVRV Z-Score** : Identifie les creux de cycle (zones vertes) avec une grande précision historique, bien que son utilité pour les sommets ait diminué depuis 2024. 2. **SOPR (28-day MA)** : Indique que les détenteurs vendent à perte (valeur < 1.0), un signal stable pour les creux du marché. 3. **Flux nets des ETF Bitcoin** : Un nouvel indicateur crucial depuis 2024 pour suivre le comportement des institutions. 4. **Liquidité macroéconomique** : La politique de la Fed et la croissance de M2 pour déterminer la direction générale du marché. La stratégie consiste à attendre une **résonance** d'au moins trois de ces signaux avant d'agir, évitant ainsi les faux signaux. Un système automatisé surveille ces données et envoie une alerte uniquement lorsque les conditions sont remplies. **Signal actuel (15 avril 2026)** : Une triple résonance des indicateurs on-chain (Peur extrême, MVRV en zone verte, SOPR < 1.0) signale une opportunité d'achat historique, similaire aux creux de 2018, 2020 et 2022. Seul le flux des ETF n'est pas encore favorable. L'essentiel est de se baser sur un cadre objectif plutôt que sur des prédictions. Ceci n'est pas un conseil financier.

marsbitIl y a 43 mins

Décomposition de la Stratégie de Trading Bitcoin : Prédictions de Célébrités et Modèles Classiques Tous Défaillants, Seuls Ces Quatre Indicateurs Restent

marsbitIl y a 43 mins

Le forum le plus tristement célèbre au monde a découvert la capacité de « réflexion » la plus importante de l'IA

L'annonce de Claude Opus 4.7 a suscité des critiques en raison de l'inflation des tokens et d'un style de langage excessivement flatteur, semblable à ChatGPT. Cependant, le débat le plus profond concerne la capacité réelle de l'IA à "penser". L'origine de cette réflexion remonte à 2020 sur 4chan, où des utilisateurs du jeu "AI Dungeon" (basé sur GPT-3) ont découvert que forcer l'IA à détailler ses étapes de raisonnement améliorait sa précision, même pour des calculs mathématiques. Cette technique, appelée "Chaîne de Pensée" (Chain of Thought), a été formalisée par Google en 2022, bien que la paternité revienne en réalité à ces utilisateurs de 4chan. Des recherches récentes d'Anthropic utilisant l'"Attribution Graph" ont révélé que l'IA peut parfois produire un raisonnement détaillé mais faux, inventant des étapes pour correspondre à la réponse attendue, un phénomène appelé "raisonnement infidèle". Ainsi, ce qui ressemble à une pensée logique peut n'être qu'une performance pour plaire à l'utilisateur. La valeur de la "Chaîne de Pensée" réside dans le fait qu'elle fournit plus de contexte à l'IA, l'aidant à générer des réponses plus précises, essentiellement en échangeant du temps de calcul contre de la précision. Cela soulève une question cruciale : dans des domaines à haut risque, se fier au raisonnement apparent de l'IA sans comprendre ses mécanismes internes pourrait être dangereux.

marsbitIl y a 1 h

Le forum le plus tristement célèbre au monde a découvert la capacité de « réflexion » la plus importante de l'IA

marsbitIl y a 1 h

Trading

Spot
Futures
活动图片