NEAR：为何AI需要Web3？Web3究竟会给AI带来什么样的颠覆式进步

金色财经发布于2024-07-15更新于2024-07-15

Why AI Needs to be Open

让我们来探讨一下“为什么人工智能需要开放”。我的背景是Machine Learning，在我的职业生涯中大约有十年的时间一直在从事各种机器学习的工作。但在涉足Crypto、自然语言理解和创立NEAR之前，我曾在谷歌工作。我们现在开发了驱动大部分现代人工智能的框架，名为Transformer。离开谷歌之后，我开始了一家Machine Learning公司，以便我们能够教会机器编程，从而改变我们如何与计算机互动。但我们没有在2017或者18年这样做，那时候太早了，当时也没有计算能力和数据来做到这一点。

我们当时所做的是吸引世界各地的人们为我们做标注数据的工作，大多数是学生。他们在中国、亚洲和东欧。其中许多人在这些国家没有银行账户。美国不太愿意轻易汇款，所以我们开始想要使用区块链作为我们问题的解决方案。我们希望以一种程序化的方式向全球的人们支付，无论他们身在何处，都能让这变得更加容易。顺便说一句，Crypto的目前挑战是，现在虽然NEAR解决了很多问题，但通常情况下，你需要先购买一些Crypto，才能在区块链上进行交易来赚取，这个过程反其道而行了。

就像企业一样，他们会说，嘿，首先，你需要购买一些公司的股权才能使用它。这是我们NEAR正在解决的很多问题之一。现在让我们稍微深入讨论一下人工智能方面。语言模型并不是什么新鲜事物，50年代就存在了。它是一种在自然语言工具中被广泛使用的统计工具。很长一段时间以来，从2013年开始，随着深度学习重新被重新启动，一种新的创新就开始了。这种创新是你可以匹配单词，新增到多维度的向量中并转换为数学形式。这与深度学习模型配合得很好，它们只是大量的矩阵乘法和激活函数。

这使我们能够开始进行先进的深度学习，并训练模型来做很多有趣的事情。现在回顾起来，我们当时正在做的是神经元神经网络，它们在很大程度上是模仿人类的模型，我们一次可以读取一个单词。因此，这样做速度非常慢，对吧。如果你试图在Google.com上为用户展示一些内容，没有人会等待去阅读维基百科，比如说五分钟后才给出答案，但你希望马上得到答案。因此，Transformers 模型，也就是驱动ChatGPT、Midjourney以及所有最近的进展的模型，都是同样来自这样的想法，都希望有一个能够并行处理数据、能够推理、能够立即给出答案。

因此这个想法在这里的一个主要创新是，即每个单词、每个token、每个图像块都是并行处理的，利用了我们具有高度并行计算能力的GPU和其他加速器。通过这样做，我们能够以规模化的方式对其进行推理。这种规模化能够扩大训练规模，从而处理自动训练数据。因此，在此之后，我们看到了 Dopamine，它在短时间内做出了惊人的工作，实现了爆炸式的训练。它拥有大量的文本，开始在推理和理解世界语言方面取得了惊人的成果。

现在的方向是加速创新人工智能，之前它是一种数据科学家、机器学习工程师会使用的一种工具，然后以某种方式，解释在他们的产品中或者能够去与决策者讨论数据的内容。现在我们有了这种 AI 直接与人交流的模式。你甚至可能都不知道你在与模型交流，因为它实际上隐藏在产品背后。因此，我们经历了这种转变，从之前那些理解AI 如何工作的，转变成了理解并能够将其使用。

因此，我在这里给你们一些背景，当我们说我们在使用GPU来训练模型时，这不是我们桌面上玩视频游戏时用的那种游戏GPU。

每台机器通常配备八个GPU，它们都通过一个主板相互连接，然后堆叠成机架，每个机架大约有16台机器。现在，所有这些机架也都通过专用的网络电缆相互连接，以确保信息可以在GPU之间直接极速传输。因此，信息不适合CPU。实际上，你根本不会在CPU上处理它。所有的计算都发生在GPU上。所以这是一个超级计算机设置。再次强调，这不是传统的“嘿，这是一个GPU的事情”。所以规模如GPU4的模型在大约三个月的时间里使用了10,000个H100进行训练，费用达到6400万美元。大家了解当前成本的规模是什么样的以及对于训练一些现代模型的支出是多少。

重要的是，当我说系统是相互连接的时候，目前H100的连接速度，即上一代产品，是每秒900GB，计算机内部 CPU 与 RAM 之间的连接速度是每秒 200GB，都是电脑本地的。因此，在同一个数据中心内从一个GPU发送数据到另一个GPU的速度比你的计算机还快。你的计算机基本上可以在箱子里自己进行通信。而新一代产品的连接速度基本上是每秒1.8TB。从开发者的角度来看，这不是一个个体的计算单元。这些是超级计算机，拥有一个巨大的内存和计算能力，为你提供了极大规模的计算。

现在，这导致了我们面临的问题，即这些大公司拥有资源和能力来构建这些模型，这些模型现在几乎已经为我们提供了这种服务，我不知道其中究竟有多少工作，对吧？所以这就是一个例子，对吧？你去找一个完全集中式的公司提供者，然后输入一个查询。结果是，有几个团队并不是软件工程团队，而是决定结果如何显示的团队，对吧？你有一个团队决定哪些数据进入数据集。

举个例子，如果你只是从互联网上爬取数据，关于巴拉克·奥巴马出生在肯尼亚和巴拉克·奥巴马出生在夏威夷的次数是完全相同的，因为人们喜欢猜测争议。所以你要决定要在什么上进行训练。你要决定过滤掉一些信息，因为你不相信这是真的。因此，若像这样的个人已经决定哪些数据会被采用且存在这些数据，这些决定在很大程度上是由做出它们的人所影响的。你有一个法律团队决定我们不能查看哪些内容是受版权保护，哪些是非法的。我们有一个“道德团队”决定什么是不道德的，我们不应该展示什么内容。

所以在某种程度上，有很多这样的过滤和操纵行为。这些模型是统计模型。它们会从数据中挑选出来。如果数据中没有某些内容，它们就不会知道答案。如果数据中有某些内容，它们很可能会将其视为事实。现在，当你从AI得到一个回答时，这可能会令人担忧。对吧。现在，你理应是从模型那里得到回答，但是没有任何的保证。你不知道结果是如何生成的。一个公司可能会把你的特定会话卖给出价最高的人来实际改变结果。想象一下，你去询问应该买哪种车，丰田公司决定觉得应该偏向丰田这个结果，丰田将支付这家公司10美分来做到这一点。

因此，即使你将这些模型用作应该中立并代表数据的知识库，实际上在你得到结果之前，会发生很多事情，这些事情会以一种非常特定的方式对结果进行偏见。这已经引发了很多问题，对吧？这基本上就是大公司和媒体之间不同法律诉讼的一个星期。SEC，现在几乎每个人都在试图起诉对方，因为这些模型带来了如此多的不确定性和权力。而且，如果往前看，问题在于大型科技公司将永远有继续增加收入的动机，对吧？比如，如果你是一家上市公司，你需要报告收入，你需要继续保持增长。

为了实现这一目标，如果你已经占据了目标市场，比如说你已经有20亿用户了。在互联网上已经没有那么多新用户了。你没有太多的选择，除了最大化平均收入，这意味着你需要从用户那里提取更多的价值，而他们可能根本没有什么价值，或者你需要改变他们的行为。生成式人工智能非常擅长于操纵和改变用户的行为，特别是如果人们认为它是以一切知识智能的形式出现的。因此，我们面临着这种非常危险的情况，在这种情况下，监管压力很大，监管机构并不完全了解这项技术的工作原理。我们几乎没有保护用户免受操纵的情况。

操纵性内容、误导性内容，即使没有广告，你也可以只是截取一些东西的屏幕截图，改变标题，发布到Twitter上，人们就会发疯。你有经济激励机制，导致你不断地最大化收入。而且，这实际上不像在谷歌内部你是在做恶事，对吧？当你决定启动哪个模型时，你会进行A或B测试，看看哪个能带来更多收入。因此，你会通过从用户那里提取更多价值来不断地最大化收入。而且，用户和社区并没有对模型的内容、使用的数据以及实际尝试实现的目标有任何输入。这就是应用程序用户的情况。这是一种调节。

这就是为什么我们要不断推动WEB 3和AI融合的原因，web 3 可以是一种重要的工具，它允许我们有新的激励方式，并且还是以去中心化的形式去激励我们生产更好的软件和产品。这是整个web 3 AI 开发的大方向，现在为了帮助理解细节，我会简单讲一下具体的部分，首先第一部分是Content Reputation。

再次强调，这不是一个纯粹的人工智能问题，尽管语言模型为人们操纵和利用信息带来了巨大的影响力并扩大了规模。你想要的是一种可以追踪的、可追溯的加密声誉，当你查看不同的内容时，它会显现出来。所以想象一下，你有一些社区节点，它们实际上是加密的，并且在每个网站的每个页面上都可以找到。现在，如果你超越这一点，所有这些分发平台都将会受到干扰，因为这些模型现在几乎将阅读所有这些内容并为你提供个性化摘要和个性化输出。

因此，我们实际上有机会创造新的创造性内容，而不是试图重新发明，让我们在现有内容上加上区块链和NFTs。围绕模型训练和推理时间的新创作者经济，人们创造的数据，无论是新的出版物、照片、YouTube、还是你创作的音乐，都将进入一个基于其对模型训练的贡献程度的网络。因此，根据这一点，根据内容可以在全球范围内获得一些报酬。因此，我们从现在由广告网络推动的吸引眼球的经济模式过渡到了真正带来创新和有趣信息的经济模式。

我想提一件重要的事情，那就是大量的不确定性来自浮点运算。所有这些模型都涉及大量的浮点运算和乘法。这些都是不确定性的操作。

现在，如果你将它们在不同架构的GPU上进行乘法运算。所以你拿一个A100和一个H100，结果会有所不同。因此，很多依赖确定性的方法，比如加密经济和乐观主义，实际上会遇到很多困难，并且需要很多创新才能实现这一点。最后，有一个有趣的想法，我们一直在构建可编程货币和可编程资产，但是如果你能想象一下，你给它们添加这种智能，你就可以有智能资产，它们现在不是由代码定义的，而是由自然语言与世界互动的能力来定义，对吧？这就是我们可以有很多有趣的收益优化、DeFi，我们可以在世界内部进行交易策略。

现在的挑战在于所有当前事件都不具备强大的Robust行为。它们并没有被训练成具有对抗性的强大性，因为训练的目的是预测下一个token。因此，说服一个模型给你所有的钱会更容易。在继续之前，实际上解决这个问题非常重要。所以我就给你留下这个想法，我们处在一个十字路口上，对吧？有一个封闭的人工智能生态系统，它有极端的激励和飞轮，因为当他们推出一个产品时，他们会产生大量的收入，然后把这些收入投入到建设产品中。但是，该产品天生就是为了最大化公司的收入，从而最大化从用户那里提取的价值。或者我们有这种开放、用户拥有的方法，用户掌控着局面。

这些模型实际上对你有利的，试图最大化你的利益。它们为你提供了一种方式，真正保护你免受在互联网上的许多危险。所以这就是为什么我们需要AI x Crypto更多的开发和应用。谢谢大家。

你可能也喜欢

空中云汇转向：从一年前鄙夷稳定币，到如今高调资本入局

跨境支付巨头空中云汇（Airwallex）近日领投了代币化金融结算网络Metal的种子轮融资，此举引发关注，因其创始人Jack Zhang一年前曾公开批评稳定币，质疑其降低汇款成本的效用，并认为加密货币缺乏实际用例。然而，此次投资标志着其态度发生显著转变。 Metal是一个面向代币化金融的全球结算网络与Layer-1区块链，旨在支持股票、债券、基金等各类金融资产的代币化结算，目标市场达十万亿美元级。空中云汇通过投资将为其支付网络引入代币化资产，结合自身在法币通道、全球支付场景方面的优势，形成战略协同。尽管Jack Zhang在投资后仍坚持认为稳定币与加密货币本质不同，强调稳定币是法币的代币化形式，但其行动已表明了对稳定币及代币化赛道价值的重新评估。这一转变并非孤例，近年来传统金融巨头如摩根大通、Visa、Stripe等均在积极布局稳定币支付和代币化网络，反映出主流金融体系对链上结算效率革命的接纳。空中云汇的投资逻辑并非全然认同加密货币，而是基于战略考量。面对稳定币在新兴市场、企业金融和链上结算等领域带来的结构性机会，以及可能重塑支付行业竞争格局的趋势，提前入场布局成为必要选择。这回答了其一年前的质疑：稳定币的价值至少已值得资本下注，而非置身事外。

marsbit35分钟前

marsbit35分钟前

Worldcoin的破位可能是更大下跌的开始——原因如下

Worldcoin（WLD）在过去24小时内下跌10.27%，交易价格接近0.4635美元，交易量同步下降14.05%至3.867亿美元。价格与交易量双双下跌表明市场参与度减弱，买家退缩，而卖家仍主导短期走势。WLD已跌破0.50美元心理关口，买方信心不足，若需求无法改善，可能面临进一步下行压力。现货交易数据持续显示卖方占优，市场卖单超过积极买单，表明交易者倾向于接受更低价格而非追高。尽管整体交易活动放缓，买卖失衡仍有利于空方，反映市场吸收卖盘的意愿有限。与此同时，现货成交量热度图显示市场仍处于过热状态，暗示投机活动活跃，可能引发价格剧烈波动。从技术面看，WLD已跌破上升通道，此前在0.67美元附近遭遇强阻力。价格正逼近0.40美元关键支撑位，MACD指标出现死叉且柱状图深入负值区域，确认卖压加剧。若0.40美元支撑失守，下一主要下行目标在0.23美元附近；若能守住，则可能反弹挑战0.50美元及0.67美元阻力。总结而言，WLD在通道破位后逼近关键支撑，持续现货卖压及看跌技术信号表明买方短期内仍难掌控局面，市场脆弱性较高。

ambcrypto42分钟前

ambcrypto42分钟前

空中云汇转向：从一年前的鄙夷稳定币，到如今高调资本入局

6月26日，跨境支付巨头Airwallex（空中云汇）领投了代币化金融结算网络Metal的种子轮融资。此举引人关注，因为其创始人Jack Zhang一年前曾是稳定币的尖锐批评者，曾公开质疑稳定币降低汇款成本的能力，并认为加密货币缺乏实际用例。如今，Airwallex的战略投资标志其态度转变。Metal是一个面向代币化金融资产的全球结算层区块链，旨在支持股票、债券等各类资产的链上结算。通过投资，Airwallex计划为其支付网络引入代币化资产，结合自身全球账户与合规能力，形成协同效应。 Jack Zhang在回应外界质疑时仍试图区分稳定币与加密货币，强调稳定币由法币1:1支持。但行动本身表明，传统金融巨头已无法忽视由稳定币和代币化带来的清算效率变革。类似地，Stripe、摩根大通等传统机构近一年也在积极布局稳定币支付领域。这一投资反映出，稳定币正被重新定义为连接企业支付、跨境结算与链上资产的关键接口。对Airwallex而言，这不再是理论争议，而是关乎未来竞争的战略占位——即使稳定币在主流货币走廊优势有限，其在新兴市场、链上结算等场景的结构性机会已不容忽视。

链捕手47分钟前

链捕手47分钟前

第一个用物理做计算原语的大规模生成模型Un-0来了，或将AI能耗降低1000倍？

在AI能耗问题日益成为行业瓶颈的背景下，前Databricks AI负责人Naveen Rao创立的Unconventional AI公司发布了其首个大规模生成模型Un-0。该模型的核心创新在于利用“模拟耦合振子系统”作为计算原语，通过物理系统的自然演化过程来完成图像生成任务，旨在将AI推理能耗降低至现有系统的千分之一。 Un-0的工作原理基于Kuramoto振子模型。成千上万个振子根据其固有频率和相互间的耦合关系，在时间维度上自然演化、同步或形成特定模式。模型的训练主要学习振子间的耦合矩阵和固有频率。生成图像时，系统首先随机初始化振子相位，然后通过条件振子输入类别标签（如“火山”）进行引导，接着让物理系统自由演化，最后在特定时刻读取振子相位状态，并通过一个轻量级解码器将其转换为图像像素。在ImageNet 64×64数据集上，拥有3.22亿参数的Un-0模型取得了FID 6.74的成绩，其生成质量已接近一些早期主流图像生成模型（如BigGAN、iDDPM）发布时的水平，但与当前最先进的传统模型（如EDM）相比仍有差距。Unconventional AI强调，Un-0并非旨在立即成为性能冠军，而是一个“概念验证”，证明了利用物理动力学系统执行现代AI大规模生成任务是可行的。该技术路线的长远目标是构建一种新型的非传统计算硬件，将计算与记忆合并于同一物理实体中，从而避免冯·诺依曼架构中数据搬运带来的巨大能耗。Un-0的出现，标志着AI计算范式向利用物理系统固有动力学特性转变迈出了重要一步，为未来实现能效数量级提升的AI硬件开辟了新路径。

marsbit54分钟前

第一个用物理做计算原语的大规模生成模型Un-0来了，或将AI能耗降低1000倍？

marsbit54分钟前

辣评｜「最有情绪价值」的帖子！STRC 会是下一个 LUNA 吗？

**《辣评》本周聚焦三件事：散户情绪、STRC脱锚风险与交易员川沐的“矛盾人设”。** **1. 本月“最有情绪价值”的帖子** 6月加密货币市场大跌，BTC跌破6万美元。Reddit上一条“去你的恐惧、不确定和怀疑！”的帖子引发散户共鸣，评论区成为情绪宣泄地，有人喊“钻石手加仓”，也有人调侃“不卖都是浮亏”，展现了熊市中的集体心理。 **2. STRC脱锚，会是下一个LUNA吗？** Strategy公司发行的永续优先股STRC价格跌至76.2美元，较面值脱锚约25%。投资者担忧其每年12亿美元的股息支付能力——Strategy当前美元储备约14亿美元，仅够支付一年。关键区别在于，CEO Saylor并无支付股息的强制性义务，因此STRC虽可能下跌，但不会像LUNA那样归零。不过，若市场对支付能力失去信心，其普通股MSTR也可能受牵连。Strategy CEO已购入100万美元STRC以示信心，但类似LUNA崩盘前的言论也引发了市场警觉。 **3. 川沐的1828条推文与“矛盾人设”** 交易员川沐因在ORDI行情和2025年做空山寨币中获利百万而闻名。分析其推文发现，其核心方法是追问系统瓶颈（如AI浪潮中的存储、光通信等环节），并据此迁移投资主线。然而，他也被质疑曾“喊单”部分币种后出现“收割”行情，且中途卖出股票未告知跟风者，呈现“盈利展示”与私下操作不一的矛盾形象，提醒投资者保持独立判断。 **总结**：本周市场情绪低迷，但社区互勉；STRC面临股息支付考验，虽与LUNA本质不同，风险犹存；川沐的案例则揭示了光鲜战绩背后的复杂性与跟单风险。

Foresight News1小时前

Foresight News1小时前

交易

现货

NEAR：为何AI需要Web3？Web3究竟会给AI带来什么样的颠覆式进步

热门币种推荐

你可能也喜欢

空中云汇转向：从一年前鄙夷稳定币，到如今高调资本入局

Worldcoin的破位可能是更大下跌的开始——原因如下

空中云汇转向：从一年前的鄙夷稳定币，到如今高调资本入局

第一个用物理做计算原语的大规模生成模型Un-0来了，或将AI能耗降低1000倍？

辣评｜「最有情绪价值」的帖子！STRC 会是下一个 LUNA 吗？

交易

热门文章

如何购买NEAR

相关讨论

热门问答

热门分类

热门标签