开山之作,从「Attention Is All You Need」眺望AI的未来

Odaily星球日报发布于2024-03-28更新于2024-03-28

文章摘要

当人们确信数据会受到加密保护并愿意贡献数据时,或许我们就将实现 AGI 突破。

原文作者:hmalviya 9 

原文编译:Frank,Foresight News

编者注:《Attention Is All You Need》论文发表于 2017 年,截止目前被引用超 11 万次,它不仅是当今以 ChatGPT 为代表的大模型技术起源之一,其中介绍的 Transformer 架构和注意力机制也被广泛用在了 Sora、AlphaFold 等众多或将改变世界的 AI 技术之中。

「Attention Is All You Need」,这篇研究论文彻底改变了现代人工智能(AI)的未来。在这篇文章里,我将深入探讨 Transformer 模型和 AI 的未来。

2017 年 6 月 12 日,八位谷歌工程师发表了一篇名为「Attention Is All You Need」的研究论文,这篇论文讨论了一种改变现代 AI 未来的神经网络架构。

开山之作,从「Attention Is All You Need」眺望AI的未来

而就在刚刚过去的 2024 年 3 月 21 日的 GTC 大会,英伟达创始人黄仁勋与那 8 位 Google 工程师进行了一次小组讨论,并感谢他们引入了 Transformer 架构,使现代 AI 成为可能,令人惊讶的是,NEAR 的创始人居然也在这份 8 人名单之中。

什么是 Transformer?

Transformer 是一种神经网络。

什么是神经网络?它受人类大脑结构和功能的启发,通过大量的人工神经元互相连接进行信息处理,但却并不是人类大脑的完全复制品。

简单理解的话,人脑就如同亚马逊雨林,拥有许多不同的区域,以及连接这些区域的众多通路。而神经元就好比这些通路间的连接器,它们可以向雨林的任何部分发送和接收信号,因此连接就是通路本身,负责联通两个不同的脑部区域。

开山之作,从「Attention Is All You Need」眺望AI的未来

这让我们的大脑拥有非常强大的学习能力,它可以快速学习、识别模式并提供准确的输出结果。而像 Transformer 这样的神经网络试图实现与人类大脑相同的学习能力,只不过它们目前的技术水平还达不到人类大脑的 1% 。

近年来,Transformer 在生成式 AI 方面取得了令人瞩目的进步。回顾现代人工智能的演变历程,我们可以看到早期的人工智能主要是像 Siri 以及其他一些语音 / 识别应用程序。

开山之作,从「Attention Is All You Need」眺望AI的未来

这些应用程序都使用循环神经网络(RNN)构建。RNNs 存在一些限制,而这些限制已经被 Transformers 所解决并改进——Transformers 引入了自注意力机制,使它们能够同时分析任一序列的所有部分,从而捕捉长距离依赖关系和上下文内容。

开山之作,从「Attention Is All You Need」眺望AI的未来

对于 Transformer 的创新周期来说,我们仍处于非常早期阶段。Transformer 有几种不同的衍生版本,例如 XLNet、BERT 和 GPT。

而 GPT 是其中最知名的一种,但它在事件预测方面仍然能力有限。

开山之作,从「Attention Is All You Need」眺望AI的未来

当大型语言模型(LLM)能够根据过去数据和模式预测事件时,这将标志着现代 AI 的下一个重大飞跃阶段,并且也将加速我们实现通用人工智能(AGI)的步伐。

为了实现这种预测能力,大型语言模型(LLM)需要采用时间融合转换器(TFT),它是一种基于不同数据集预测未来值的模型,还能够解释其做出的预测。

开山之作,从「Attention Is All You Need」眺望AI的未来

TFT 除了用于预测之外,还可以用于区块链领域。通过在模型中定义特定规则,TFT 可以自动执行以下操作:有效管理共识过程、提高出块速度、奖励诚实验证者、惩罚恶意验证者。

区块链网络本质上可以为具有较高声誉分数的验证者提供更多的区块奖励,这可以基于他们的投票历史、区块提案历史、Slash 历史、Staking 金额、活跃度和其他一些参数来建立。

公链的共识机制本质上是验证者之间的一种博弈,需要超过三分之二的验证者就谁来创建下一个区块达成一致。在这个过程中,可能会出现许多分歧和争论,这也是以太坊等公链网络效率低下的一个因素。

TFT 可以作为一种共识机制,通过提升出块时间并根据区块生产信誉奖励验证者,从而提高效率。譬如将 TFT 模型应用于共识过程的 BasedAI,就是将利用该模型在验证者和网络参与者之间分配代币发行量。

开山之作,从「Attention Is All You Need」眺望AI的未来

BasedAI 还提出利用 FHE 技术,让开发者可以在其名为「Brains」的去中心化 AI 基础设施上托管隐私保护的大型语言模型(Zk-LLMs),通过将 FHE 技术集成到大型语言模型中,可以做到在用户选择启用个性化 AI 服务时,保护他们的隐私数据。

当人们确信数据会受到加密保护并且完全隐私的前提下,愿意贡献数据的时候,或许我们就将实现通用人工智能(AGI)的突破,这一空白正在由专注于隐私的技术填补,例如 nillionnetwork Blind Computation、零知识机器学习(ZkML)和同态加密(FHE)技术。

然而,所有这些注重隐私保护的技术都需要大量的计算资源,这使得它们还处于应用的早期阶段。

热门币种推荐

你可能也喜欢

20 岁创始人,招 18 岁员工,被 19 岁的人投资

这篇文章探讨了当前人工智能(AI)领域出现的“年轻化”现象。随着大模型技术的快速发展,行业对AI人才的争夺异常激烈,并出现了明显的年龄偏好。许多顶尖高校的应届生或在校实习生能够获得高达数百万人民币的年薪或数千元的日薪,其薪酬水平远超传统互联网行业的资深从业者。 文章指出,这种现象背后是“AI Native”概念的兴起。企业认为,更年轻、从小接触AI的从业者(多为00后)在思维模式、学习速度和创新能力上更具优势,能更快适应技术的快速迭代。相比之下,拥有多年工作经验但转型较慢的从业者可能面临被淘汰的风险。因此,大厂和初创公司都竞相提前锁定优秀学生,通过高薪、重要项目主导权、灵活扁平的管理模式以及密集的社交活动来吸引他们。 这种趋势形成了一个围绕“年轻”的利益循环:年轻研究员凭借成果获得高薪或创业机会;年轻的创业者更容易获得年轻投资人的青睐和融资;而成功的年轻团队又倾向于雇佣和信任更年轻的成员。这在一定程度上冲击了传统的、基于资历和经验的行业规则,但也加剧了人才竞争和行业内部分化。文章最后也反思了这种狂热背后的隐忧,即技术革命在厚赏“非凡”年轻人的同时,也可能对无法快速适应的“平凡”从业者施以严厉的惩罚。

marsbit28分钟前

20 岁创始人,招 18 岁员工,被 19 岁的人投资

marsbit28分钟前

交易

现货
合约

热门文章

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

全球金融市场正经历一场由地缘冲突引发的系统性重估:霍尔木兹海峡封锁导致原油一度暴涨30%,G7紧急释放储备后涨幅收窄,滞胀风险取代通胀成为核心担忧,美元成为“唯一避风港”并逼近100大关,亚太及美股遭遇“黑色星期一”全线重挫;AI领域则冰火两重天,国家发改委提出“十五五”末10万亿规模目标,OpenClaw项目火爆推动概念股狂飙;比特币在宏观风暴中跌破70000美元关键防线。

593人学过发布于 2026.03.12更新于 2026.03.12

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对AI(AI)币价的意见。

活动图片