聊透 Agent,它是「同事」还是「工具」,创业机会和价值究竟是什么?

深潮發佈於 2025-06-13更新於 2025-06-13

AI 产品正在从「工具」走向「关系」,人需要决定建立怎样的关系。

整理:Moonshot

来源:极客公园

2025 年,是 Agent 按下加速键的一年。

从年初 DeepSeek 引发的惊叹,到 GPT-4o 和 Claude 3.5 接连登场,大模型的边界一次次被重写。但真正让 AI 产业链神经绷紧的,不是模型的性能迭代,而是 Agent 的横空出世。

Manus、Devin 等产品的爆火,都在重申一个共识:大模型将不再只是工具,而是要成为可以自我调度的智能体。

Agent 由此成为继大模型之后,全球科技圈最快形成共识的第二个风口。

从巨头的战略重构到创业赛道的快速跟进,Agent 正成为下一个全民下注的方向。但在 C 端产品密集涌现、开发者为其狂热的同时,真正跑通用户价值闭环的项目却凤毛麟角,越来越多的产品陷入了「用老需求套新技术」的焦虑。

热浪过后,市场也回归冷静:Agent 究竟是一场范式的重构,还是一次新的包装?所谓「通用」与「垂直」的路径分野,是否真的带来可持续的市场空间?而「新入口」背后,是交互方式的进化,还是旧世界的投影?

顺着这些疑问继续下探,我们会发现,Agent 的真正门槛,或许并不在模型能力,而在其赖以生存的底层设施。从可控运行环境,到记忆系统、上下文感知、工具调用,每一个基础模块的缺位,都是 Agent 从演示走向实用的最大阻力。

这些底层工程问题,构成了 Agent 从「潮流玩具」走向「生产力工具」的最大阻碍,也恰恰是当下最确定、最高价值的创业蓝海。

在这样一个供给溢出、需求未明的阶段,我们想借由这场对谈,回答一个越来越紧迫的问题:Agent 的真问题与真机会,究竟藏在哪些地方?

在本次深度对谈里,我们邀请到了身处一线的拾象科技创始人李广密与 拾象科技 AI Research Lead 钟凯祺,两位从业者将从产品形态、技术路径、商业模式、用户体验乃至 Infra 构建等多个维度,为我们拆解当下 Agent 的真问题与真机会。

我们将跟随他们的思考,探寻在巨头环伺的牌桌上,创业公司的真实机会藏于何处;一条从「Copilot」平滑过渡到「Agent」的务实成长路径是如何被一步步验证的 ;以及为何 Coding(编码)这一看似垂直的领域,却被视作通往 AGI 的「价值高地」与「关键指标」。

最终,这场对话将推向更远的未来,一窥人与 Agent 之间全新的协作关系,以及构建下一代智能基础设施所面临的核心挑战与无限机遇。

要点精选

  • 通用 Agent 领域做得最好的是「模型即 Agent」(Model as Agent)。

  • 做 Agent 这件事,并不一定要「以终为始」,一开始就瞄着完全自动化的 Agent 去做,它可以先从 Copilot 做起。在这个过程中收集用户数据、做好用户体验、占领用户心智,然后慢慢地转型。

  • AGI 有可能最先在 Coding(编码)环境下实现,因为这个环境最简单,它能锻炼 AI 的核心能力。Coding 是这个世界里的「万用之机」,有了它,AI 就可以去构建和创造。Coding 有可能拿走整个大模型产业阶段性 90% 的价值。

  • AI Native 的产品不只是给人用的,它必须同时服务于 AI。一个真正的 AI Native 产品,应该是内建了服务 AI 和人类的双向机制。

  • 今天的 AI 产品正在从「工具」走向「关系」。人不会和工具建立关系,但会和一个有记忆、懂你、能与你「心有灵犀」的 AI 建立关系。

以下为当天《今夜科技谈》直播沉淀,由极客公园整理。

01 热潮之下,哪些 Agent 产品已崭露头角?

张鹏:在过去一段时间,所有人都在讨论 Agent,认为这可能是现阶段的一个重要议题,也是创业公司的难得发展机会。

我看到拾象科技对 Agent 体系做了比较深入的研究,也体验和分析了很多相关产品。我想先听听两位,最近哪些 Agent 相关的产品给你们留下了比较深刻的印象?为什么?

李广密:我自己印象最深的是两个:一个是 Anthropic 的 Claude 在编程能力上的表现,另一个是 OpenAI ChatGPT 的 Deep Research 功能。

关于 Claude,主要是它的编程能力。我有一个观点:编程(Coding)是衡量 AGI 最关键的先验指标。如果 AI 不能规模化、端到端地进行软件应用开发,那么在其他领域的进展也会比较慢。我们必须先在 Coding 这个环境下实现很强的 ASI(Artificial Superintelligence),其他领域才可能加速。或者说,我们先在数字环境下实现 AGI,再拓展到其他领域。

全球首位 AI 程序员 Devin|图源:Cognition Labs

关于 Deep Research,它对我自己的帮助非常大,我几乎每天都在用。它其实就是一个搜索 Agent,帮我检索了大量的网页和资料,体验很好,极大地拓展了我的研究空间。

张鹏:凯祺,从你的视角看,哪些产品给你留下了深刻印象?

钟凯祺 (Cage):我可以介绍一下我平时观察和使用 Agents 的思维模型,然后在每个分类下介绍一两个代表性产品。

首先,大家经常会问:通用 Agent 还是垂直 Agent?我们认为通用 Agent 领域做得最好的是「模型即 Agent」(Model as Agent)。比如广密刚才提到的 OpenAI 的 Deep Research,以及 OpenAI 新发布的 o3 模型,它其实就是一个标准的「模型即 Agent」的范例。它把 Agent 的所有组件——大语言模型(LLM)、上下文(Context)、工具使用(Tool Use)和环境(Environment)——全都缝合到了一起,并进行了端到端的强化学习训练。训练之后的结果就是,各类 Agent 执行信息检索的任务它都能完成。

所以我的一个「暴论」是:通用 Agent 的需求基本上就是信息检索和轻度代码编写这两类,而 GPT-4o 已经完成得非常好了。因此,通用 Agent 市场基本上是大模型公司的主战场,创业公司很难仅仅服务于通用需求来做大。

让我印象比较深刻的创业公司基本都聚焦在垂直(Vertical)领域。

如果我们先说 ToB 的垂直领域,可以类比人的工作分为前台工作和后台工作。

后台工作的特点是重复性强、对高并发要求高,通常有一条很长的 SOP(Standard Operating Procedure),其中很多任务非常适合 AI Agent 去一对一地执行,并且适合在比较大的探索空间里进行强化学习。这里比较有代表性的,我想分享的是一些面向 AI for Science 的创业公司,他们做的是 Multi-agent system(多智能体系统)。

在这个系统里,各种科研任务都包含在内,比如文献检索、实验规划、预测前沿进展以及数据分析等。它的特点是,不再是像 Deep Research 那样的单个 Agent,而是一个非常复杂的、能针对科研系统做到更高分辨率的系统。它有一个很有意思的功能叫「Contradiction Finding」,可以处理对抗性的任务,例如发现两篇顶级期刊论文之间的矛盾之处。这代表了研究型 Agent 里一种非常有意思的范式。

前台工作很多时候是和人打交道,需要做外联,目前比较适合的是语音 Agent,例如医疗领域的护士电话回访、招聘、物流沟通等。

这里我想分享一家叫 HappyRobot 的公司,他们找到了一个听起来很小的场景,专门在物流和供应链领域做电话沟通。比如,一个卡车司机遇到问题,或者货到了之后,Agent 能快速给他打电话。这里发挥了 AI Agent 一个很特别的能力:7 天 24 小时无间断地响应并快速做出反应。这对于物流的大部分需求来说已经足够了。

除了以上两大类,还有一些比较特别的,比如 Coding Agent。

02 从 Copilot 到 Agent,是否存在一条更务实的成长路径?

钟凯祺:在代码开发这个领域,最近创业热情很火热,一个很好的例子是 Cursor。Cursor 1.0 的发布,基本上把一个原来看起来是 Copilot(辅助驾驶)的产品,变成了一个完全的 Agent 产品。它能后台异步操作,有记忆功能,这正是我们对 Agent 的想象。

它和 Devin 的对比很有意思,给我们的启发是:做 Agent 这件事,并不一定要「以终为始」,一开始就瞄着完全自动化的 Agent 去做,它可以先从 Copilot 做起。在这个过程中收集用户数据、做好用户体验、占领用户心智,然后慢慢地转型。国内做得不错的,像 Minus AI,他们最早的产品也是从 Copilot 形态做起的。

最后,我还会用「环境」这个思维模型来区分不同 Agent。比如,Manus 的环境是虚拟机(Virtual Machine),Devin 的环境是浏览器,flowith 的环境是笔记本,SheetZero 的环境是表格,Lovart 的环境是画布等等。这个「环境」就对应了强化学习里的环境定义,这也是一种值得参考的分类方式。

国内初创团队打造的 flowith |图源:flowith

张鹏:我们深入聊聊 Cursor 这个例子,它背后的技术栈和成长路径是怎样的?

钟凯祺 (Cage):自动驾驶的例子就很有意思,直到今天,特斯拉也不敢真的把方向盘、刹车和油门去掉。这说明在很多关键决策上,AI 还没办法完全超越人类。只要 AI 的能力和人类差不多,一些关键决策就一定需要人类介入。这正是 Cursor 一开始就想得比较明白的地方。

所以他们最早贴合的特性,就是一个人类最需要的功能:自动补全(Autocompletion),它把这个功能做成了 Tab 键触发,随着 Claude 3.5 这样的模型出来,Cursor 把 Tab 的准确率提高到 90% 以上。在这种准确率下,我可以在一个任务流中连续使用 5 到 10 次,心流体验就出现了。这是 Cursor 作为 Copilot 的第一个阶段。

第二个阶段,他们做的功能是代码重构(Code Refactoring)。Devin 和 Cursor 都想做这个需求,但 Cursor 做得更巧妙。它会跳出一个对话框,当我输入需求时,它可以在文件外开启一个平行的修改模式来重构代码。

这个功能刚出来时准确率也不高,但因为用户对它的预期是 Copilot,所以大家都能接受。而且他们很准确地预判到,模型的 coding 能力一定会快速提升。所以他们一边打磨产品功能,一边等待模型能力提升,Agent 能力就很顺利地浮现了。

第三步就是我们今天看到的 Cursor 状态了,一个相对端到端的、在后台(background)运行的 Agent。它背后有一个像沙盒一样的环境,我甚至可以在上班时把不想做的任务布置给它,它可以在后台用我的计算资源去完成,与此同时,我能专注于自己最想做的核心任务。

最后,它以异步交互的形式,像发邮件或飞书消息一样,把结果告诉我。这个过程很顺利地实现了从 Copilot 到 Autopilot(或者说 Agent)的转型。

关键还是要抓住人的交互心智,从一开始让用户更乐于接受同步交互,这样就能收集到大量的用户数据和反馈。

03 为何 Coding 是通往 AGI 的「关键试炼场」?

张鹏:广密刚才说「Coding 是通向 AGI 的关键,如果不能在这个领域实现 ASI(超级智能),其他领域也很难。」为什么?

李广密:有几个逻辑。第一,Code 这个数据是最干净、最容易闭环,并且结果是可以验证的。我有一个猜想,Chatbot 可能没有数据飞轮(一种反馈循环机制,通过从交互或流程中收集数据,持续优化 AI 模型,进而产生更优的结果和更有价值的数据)。但 Code 领域有机会跑出数据飞轮,因为它可以进行多轮的强化学习,而 Code 是跑多轮强化学习的关键环境。

我一方面把 Code 理解成编程工具,但更愿意把它理解成一个实现 AGI 的环境。AGI 有可能最先在这个环境下实现,因为这个环境最简单,它能锻炼 AI 的核心能力。如果 AI 连一个端到端的应用软件开发都做不了,那在其他领域就更难了。如果它在未来一段时间无法大规模替代基础的软件开发工作,那在其他领域也很难。

而且,coding 能力上来了,模型的指令遵循能力也会上来。比如处理很长的 prompt,Claude 就明显要强一些,我们猜测这跟它的 coding 能力有逻辑关系。

另外一个点,我想未来的 AGI 会先在数字世界实现。未来两年,Agent 能做人在手机和电脑上操作的几乎所有事情。一方面通过简单的 coding 完成,如果不行,它还可以调用其他虚拟工具。所以,先在数字世界里实现 AGI,让它跑得比较快,这是一个大的逻辑。

04 如何判定一个好 Agent?

张鹏:Coding 是这个世界里的「万用之机」,有了它,AI 就可以去构建和创造。而且编程这个领域相对结构化,适合 AI 发挥。当评价一个 Agent 的好坏时,除了用户体验,你们会从什么视角去评价一个 Agent 的潜力?

钟凯祺 (Cage):一个好的 Agent 首先得有一个环境来帮助构建数据飞轮,而且这个数据本身要是可验证的。

最近 Anthropic 的研究员提得比较多一个词叫 RLVR(Reinforcement Learning from Verifiable Reward),其中的「V」就是指可验证的回报。代码和数学就是非常标准的可验证领域,任务做完后,立马能验证对错,数据飞轮就自然地建立起来了。

数据飞轮的工作机制|图源:英伟达

所以,构建一个 Agent 产品,就是要构建这样一个环境。在这个环境里,用户执行任务的成功或失败都不重要,因为现在的 Agent 一定会失败。关键是在失败时,它能收集到有信号的数据,而不是噪音数据,来指导产品本身的优化。这些数据甚至可以作为强化学习环境的冷启动数据。

第二,产品是否做得足够「Agent Native」。就是说,在设计产品时,要同时思考人和 Agent 的需求。一个典型的例子是 The Browser Company,它为什么要做一款新的浏览器?因为之前的 Arc 纯粹是为了提升人类用户的效率而设计的。而他们新的浏览器在设计时,很多新功能未来是能给 AI Agent 自己使用的。当产品的底层设计逻辑发生改变,这就非常重要了。

从结果上来说,客观评估也很关键。

1.任务完成率 + 成功率:首先任务得能跑完,这样用户至少能收到一个反馈。其次是成功率。一个 10 步的任务,如果每一步准确率都是 90%,那最终成功率只有 35%。所以必须优化好每一步之间的衔接。目前行业里一个及格线可能是五成以上的成功率。

2.成本和效率:包括计算成本(token cost)和用户的时间成本。如果 GPT-4o 跑一个任务 3 分钟,而另一个 Agent 要跑 30 分钟,这对用户是很大的消耗。而且这 30 分钟里,算力消耗是巨大的,这会影响规模效应。

3.用户指标:最典型的是用户粘性。用户在尝鲜后是否愿意反复使用?比如日活 / 月活(DAU/MAU)比例、次月留存率、付费率等,这些是避免公司只有「虚假繁荣」(five minutes of fame)的根本指标。

李广密:我再补充一个视角:Agent 与当前模型能力的匹配程度。今天 Agent 80% 的能力依赖于模型这个引擎。比如,GPT 到了 3.5,多轮对话的通用范式出现了,Chatbot 这种产品形态就行得通了。Cursor 的崛起也是因为模型发展到了 Claude 3.5 的水平,它的代码补全能力才得以成立。

像 Devin 其实出来就得偏早了,所以创始团队对模型能力的边界理解非常重要,要清楚今天以及未来六个月模型能到哪一步,这与 Agent 能实现的目标息息相关。

张鹏:什么叫「AI Native」的产品?我觉得 AI Native 的产品不只是给人用的,它必须同时服务于 AI。

换句话说,如果一个产品里没有合理的数据去调试,没有为未来 AI 的工作环境做搭建,那它只是把 AI 当成一种降本增效的工具,这样的产品生命力是有限的,很容易被技术浪潮淹没。一个真正的 AI Native 产品,应该是内建了服务 AI 和人类的双向机制。简单来说,AI 在服务用户的时候,用户有没有也在服务 AI?

钟凯祺 (Cage):我非常喜欢这个概念。Agent 的数据在现实世界里是不存在的,没有人会在完成任务时把思考过程一步步拆解清楚。那怎么办?一个方法是找专业的标注公司,另一个方法就是要撬动(leverage)用户,把用户的真实使用方式和 Agent 自身的运行过程捕捉下来。

张鹏:那如果要通过 Agent 的方式让人类给 AI「投喂」数据,什么样的任务是最有价值的?

钟凯祺 (Cage):与其想着用数据服务 AI,不如想 AI 有什么长板应该被放大。比如科学研究,在 AlphaGo 之前,人类觉得围棋和数学是最难的。但用了强化学习之后发现,这些对 AI 反而是最简单的。在科学领域也一样,人类历史上已经很久没有一个学者能通晓每个学科的犄角旮旯了,但 AI 可以。所以我认为,科学研究这类任务对人类来说很难,但对 AI 不一定难。正因如此,我们才要多找一些数据和服务来支持它。这类任务的回报比大部分任务更 verifiable,未来甚至可能是人类帮 AI「摇试管」,然后告诉 AI 结果是对是错,帮助 AI 一起去点亮科技树。

李广密:一开始的数据冷启动是必要的。做一个 Agent 就像做一个创业公司,创始人肯定要做冷启动,要亲力亲为。接下来,搭建环境就很重要,决定了 Agent 往哪个方向走。再往后,更重要的是搭建奖励(Reward)系统。我觉得环境和奖励这两个因素非常关键。在这个基础上,Agent 的创业者做好这个 Agent 的「CEO」就好了。今天 AI 已经能写出人类看不懂但能运行的代码,我们不一定非要理解强化学习端到端的逻辑,只要搭好环境、设好奖励就行。

05 Agent 的商业模式将走向何方?

张鹏:最近我们看到很多 ToB 领域的 Agent,尤其是在美国,它们的商业模式和增长模式有什么变化吗?还是有新的模式出现?

钟凯祺 (Cage):现在最大的一个特点就是,有越来越多的产品从偏 C 端切入,在公司组织里自下而上(bottom-up)地被使用。最典型的就是 Cursor。除了它,还有很多 AI Agent 或 Copilot 产品,大家愿意自己先用起来。这就不再是传统 SaaS 那种需要先搞定 CIO、一对一签单的模式了,至少第一步不是这样。

另一个有意思的产品是 OpenEvidence,他们做的是医生这个群体。他们先把医生群体打下来,然后渐渐植入医疗器械和药品的广告。这些业务不需要一开始就和医院谈,因为和医院谈非常慢。AI 创业最关键的就是速度,光靠技术护城河是没用的,需要通过这种自下而上的方式增长。

AI 医疗独角兽 OpenEvidence|图源:OpenEvidence

关于商业模式,现在有一个趋势,就是慢慢地从基于成本(Cost-based)定价走向基于价值(Value-based)定价。

1.基于成本:这像传统云服务,在 CPU/GPU 成本之上加一层软件价值。

2.按次收费:在 Agent 这边,一种是按「动作」(Action)收费。比如我前面提到的物流 Agent,给卡车司机打一个电话收几毛钱。

3.按工作流收费:更高一层的抽象是按「工作流」(Workflow)收费,比如完成一整个物流订单。这离成本端更远,离价值端更近了,因为它真的参与到了工作中。但这需要一个相对收敛的场景。

4.按结果付费:再往上,就是按「结果」(Result)付费。因为 Agent 成功率不高,用户希望为成功的结果付费。这要求 Agent 公司对产品有极高的打磨能力。

5.按 Agent 本身付费:未来可能会真正地按「Agent」付费。比如,有一家叫 Hippocratic AI 的公司做 AI 护士,在美国招一个人类护士大概是每小时 40 美金,而他们的 AI 护士每小时只要 9 到 10 美金,降了四分之三的成本。在美国这种人力昂贵的市场,这非常合理。如果 Agent 未来能做得更好,我甚至可以给它发奖金、发年终奖。这些都是商业模式上的创新。

李广密:我们最期待的是按价值(Value-based)的计价方式。比如 Manus AI 做一个网站,这个价值是不是值 300 美金?它做一个应用,是不是值 5 万美金?但今天的任务价值还不好定价。如何建立一个好的衡量计价方式,是值得创业者去探索的。

另外,刚才凯祺提到按 Agent 付费,这就像企业要和员工签合同一样。未来我们雇佣了 Agent,是不是要给它发「身份证」?是不是要签「劳动合同」?这其实就是智能合约。我比较期待未来 Crypto 领域的智能合约如何应用到数字世界的 Agent 上,当任务完成后,通过一个好的衡量计价手段,去分配经济利益。这可能是 Agent 与 Crypto 智能合约结合的机会。

06 人类与 Agent 的协作关系会变成什么形态?

张鹏:最近在 Coding Agent 这个方向,有两个词讨论得比较多:「Human in the loop」和「Human on the loop」,这是在探讨什么?

钟凯祺 (Cage):「Human on the loop」是指人尽可能减少在循环中的决策,只在关键时刻参与一下。有点像特斯拉的 FSD,当系统遇到危险决策时,会警告人类接管油门刹车。在虚拟世界中,这通常指非即时的、异步的人机协作。人可以对 AI 拿不准的关键决策进行干预。

「Human in the loop」则更偏向于 AI 会时不时地「ping」你一下,来确认某件事。比如 Minus AI,它的右半边有一个虚拟机,我可以实时看到它在浏览器里做什么,这就像一个打开的白盒,我能大概知道 Agent 想做什么。

这两个概念不是非黑即白的关系,而是一个光谱。现在更多的是「in the loop」,人还是要在很多关键点上做审批。原因很简单,软件还没到那个阶段,出了问题总得有人负责。油门和刹车一定是去不掉的。

可以预见的是,未来高重复性的任务,最终结果一定是人只看摘要,自动化程度会非常高。对于一些难题,比如让 AI 看病理报告,我们可以把 Agent 的「假阳率」调高一点,让它更容易觉得「有问题」,然后「on the loop」地把这些案例作为邮件发给人类医生。这样,虽然人类医生需要复核的案例多了,但 Agent 所有判断为「阴性」的案例都可以被顺利审批掉。如果病理报告中只有 20% 真的有难度,那人类医生的工作带宽就已经放大了 5 倍。所以不用太纠结于「in」还是「on」,只要找到好的结合点,就能把人机协作做得很好。

李广密:鹏哥问的这个问题背后,其实有一个巨大的机会,就是「新的交互」以及「人与 Agent 如何协同」。这可以简单理解成在线(同步)和离线(异步)。比如我们开会直播,必须实时在线。但如果我作为一个 CEO 给同事布置任务,项目推进是异步的。

这里面更大的意义在于,当 Agent 大规模落地后,人与 Agent 如何协同交互,以及 Agent 与 Agent 之间如何协同交互,这是非常值得探索的。今天我们还是通过文本与 AI 交互,但未来与 Agent 的交互方式会有很多种。有些可能在后台自动化运行,有些则需要人在前面看着。探索新的交互是一个巨大的机会。

07 能力过剩、需求不足,Agent 的「杀手级应用」何时出现?

张鹏:Coding Agent 总体还是围绕 IDE 的延长线在做。未来会不会有变化?如果大家都挤在这条路上,后来者要如何追赶 Cursor?

钟凯祺 (Cage):IDE 只是一个环境,再去复刻一个 IDE 本身的价值不大。但在 IDE 或另一个好的环境里做 Agent,本身是有价值的。我会思考它的用户到底只是专业开发者,还是能拓展到专业开发者之外「平民开发者」——那些有很多自动化需求的白领工作者。

现在缺的是什么?不是供给能力,因为 Cursor 这类产品已经把 AI 的 coding 供给能力放大了 10 倍甚至 100 倍。以前我要做一个产品,需要外包一个 IT 团队,试错成本很高。现在理论上我只要说一句话,花 20 美元的月费就能试错。

现在缺的是需求。大家都在用老的需求去套新技术,有点「拿着锤子找钉子」的状态。目前的需求大多是做落地页(Landing page)或者基础的玩具网站。未来需要找到一个收敛的产品形态。这有点像当年推荐引擎出来的时候,它是一个很好的技术,后来出现了一种叫「信息流」的产品形态,把推荐引擎真正带给了大众。但 AI Coding 领域还没有找到像「信息流」这样的杀手级产品。

李广密:我觉得 Coding 有可能拿走整个大模型产业阶段性 90% 的价值。这个价值怎么长出来?今天的第一幕还是服务全球 3000 万程序员。我举个例子,Photoshop 服务的是全球两三千万专业设计师,门槛很高。但是当剪映、Canva、美图秀秀出来后,可能有 5 亿甚至更多的用户都可以使用这些工具,并做出更火爆的内容。

Code 有一个好处,它是一个创意的表达平台。这个社会上 90% 以上的任务都可以通过 Code 来表达,所以它有可能变成一个创意平台。以前应用开发门槛非常高,大量的长尾需求没有被满足。当门槛大幅降低后,这些需求就会被激发出来。我期待的是「应用的大爆发」。移动互联网生成的最大数据是内容,而 AI 这一波生成的最大内容可能就是新的应用软件。这就像优酷、爱奇艺这种长视频平台和抖音的区别。你可以把大模型比作摄像头,在它之上还能做出抖音和剪映这样的杀手级应用。这可能就是所谓的「Vibe Coding」(氛围编程)的本质,它是一个新的创意平台。

张鹏:要提升 Agent 的输出价值,输入(input)也变得非常重要。但在产品和技术上,有什么方法可以提升输入质量,从而确保更好的输出呢?

钟凯祺 (Cage):在产品上,我们不能觉得用户用不好产品是用户的问题。要下功夫最关键的一个词就是「上下文」(Context)。一个 Agent 能否建立「上下文感知」(Context Awareness)?

举个例子,如果我在互联网大厂里写代码,Agent 不光要看我手头的代码,还要看整个公司相关的代码库(Codebase),甚至要看我在飞书里和产品经理、同事的对话,以及我之前的编码和沟通习惯。把这些上下文都给 Agent,我的输入才能更高效。

所以对于 Agent 开发者来说,最关键的就是要把记忆(Memory)机制和上下文的连接能力做得足够好,这也是 Agent 基础设施(Infra)的一大挑战。

Agent 的挑战:好记忆机制和上下文连接|图源:零售科学

此外,对于开发者来说,怎么做好强化学习的冷启动数据、怎么定义清晰的奖励(Reward)也很重要。这个奖励背后意味着,当用户表达不清晰时,你怎么把他的需求拆解出来。比如,OpenAI 的 Deep Research 在我问得不清晰时,会先给出四个引导性问题。在和它交互的过程中,我其实也在想清楚自己的需求。

对于今天的用户来说,最主要还是要想怎么清晰地表达需求,以及怎么验收需求。虽然不用做到「以终为始」,但要对好坏有一个大概的预期。我们写 Prompt 也要像写代码一样,有清晰的指令和逻辑,这样能避免很多无效的输出。

李广密:我补充两点。第一,上下文的重要性。我们内部经常讨论,上下文做好了,会有新的支付宝、PayPal 级别的机会。

以前电商看的是成交总额(GMV),以后看的是任务完成率。而任务完成,一边是智能,另一边就是上下文。比如我要做一个个人网站,如果把我的 Notion 笔记、微信数据、邮件数据都提供给 AI,那我的个人网站内容肯定会非常丰富。

第二,自主学习。搭好环境后,Agent 要能迭代,这非常关键。如果不能持续学习迭代,结果就是被模型本身吃掉,因为模型就是一个学习系统。上一波移动互联网,没有做机器学习和推荐的公司都没做大。这一波如果 Agent 做不好端到端的自主学习和迭代,我觉得也做不起来。

08 巨头博弈下,还有哪些变化和机会?

张鹏:我们怎么判断未来 Agent 的能力会以一个超级接口的形式出现,还是离散地分布在各个场景里?

钟凯祺 (Cage):我看到一个比较大的趋势是,第一,肯定是多智能体(Multi-agent)的。即便是完成一个任务,在 Cursor 这类产品里,做代码补全和做单元测试的可能是不同的 Agent,因为它们需要的「性格」和擅长的点不一样。

第二,入口会不会有变化?我觉得入口是一个二阶的问题。首先要发生的是,大家有很多 Agent,并和它们协作。这些 Agent 背后会支撑起一张网络,我称之为「Botnet」。比如未来购物,60% 以上的固定消费可能都由 Agent 帮我完成。

在生产力场景也一样,未来程序员的每日例会可能会被 Agent 之间的协作所取代,由它们推送指标异常和产品开发进展。当这些发生后,入口的变化才可能出现。那个时候,API 的调用也不再主要是人类调用,而是 Agent 之间互相调用。

张鹏:那些有能力的大厂,比如 OpenAI, Anthropic, Google, Microsoft,在 Agent 上都是什么样的决策和行动状态?

李广密:我脑子里一个关键词是「分化」。去年大家都在追赶 GPT-4,但现在能做的事更多了,各家都开始分化。

第一个发生分化的就是 Anthropic。因为它比 OpenAI 晚,综合能力没那么强,所以它就专注在 Coding 上。我感觉它摸到了通往 AGI 大方向的第一张大牌,就是 Coding Agent。他们可能认为,通过 Coding 可以实现 AGI,可以带来指令遵循能力和 Agent 能力,这是一个逻辑自洽的闭环。

但 OpenAI 手上的大牌就更多了。第一张是 ChatGPT,Sam Altman 可能想把它做成 10 亿日活的产品。第二张是它的「o」系列模型(GPT-4o 等),预期很高,能带来更多泛化能力。第三张是多模态,它的多模态推理能力上来了,未来在生成上也能体现。所以,Anthropic 摸到了一张大牌,OpenAI 摸到了三张。

另一个大厂是 Google。我觉得到今年年底,Google 可能会在全方位赶上。因为它既有 TPU,又有 Google Cloud,有顶尖的 Gemini 模型,还有 Android 和 Chrome。你在全球找不到第二家拥有所有这些要素,还几乎不依赖外部的公司。Google 端到端能力是非常强的,很多人担心它的广告业务会被颠覆,但我感觉它未来可能会找到新的产品结合方式,从一个信息引擎变成一个任务引擎。

你看苹果,因为没有自己的 AI 能力,现在迭代就很被动。而微软是以开发者见长的,但 Cursor 和 Claude 其实抢了不少开发者的注意力。当然微软的盘子非常稳,有 GitHub 和 VS Code,但它也必须拥有非常强的 AGI 和模型能力。所以你看它也宣布 GitHub 的首选模型之一变成了 Claude,并迭代自己的开发者产品。微软在开发者这块必须守住,否则根基就没了。

所以大家开始分化了。可能 OpenAI 想成为下一个 Google,Anthropic 想成为下一个 Windows(靠 API 活着)。

张鹏:那与 Agent 相关的基础设施(Infra)有哪些变化和机会?

钟凯祺 (Cage):Agent 有几个关键组件。除了模型,第一个就是环境(Environment)。Agent 开发最早期,80% 的问题都出在环境上。像早期的 AutoGPT,要么用 Docker 启动,非常慢,要么直接在本地电脑部署,非常不安全。如果一个 Agent 要和我一起「上班」,我就得给它配一台「电脑」,所以环境的机会就出来了。

配「电脑」有两大需求:

1、虚拟机 / 沙盒:提供一个安全的执行环境。任务做错了能回退,执行过程不能伤害实际环境,并且要能快速启动、稳定运行。像 E2B、Modal Labs 这样的公司都在提供这类产品。

2、浏览器:信息检索是最大需求,Agent 需要到各种网站上爬取信息。传统的爬虫容易被封,所以需要给 Agent 搭一个专用的、能理解信息的浏览器。这就应运而生了像 Browserbase、Browser Use 这样的公司。

第二个组件是上下文(Context)。这包括:

  • 信息检索(Retrieval):传统的 RAG 公司还在,但也有新的公司,比如 MemGPT,它为 AI Agent 开发轻量化的记忆和上下文管理工具。

  • 工具发现:未来工具会非常多,需要一个像「大众点评」一样的平台来帮助 Agent 发现和挑选好用的工具。

  • 记忆(Memory):Agent 需要一套能模拟人类复杂的长短期记忆结合能力的 Infra。

第三个组件是工具(Tools)。包括简单的搜索,也包括复杂的支付、自动化后端开发等。

最后,当 Agent 能力再强一些,一个重要的机会就是 Agent 安全(Agent Security)。

李广密:Agent Infra 非常重要。我们可以「以终为始」地想,三年后,当几万亿的 Agent 在数字世界里执行任务,那 Infra 的需求就太大了,这将重构整个云计算和数字化世界。

但今天我们还不知道什么样的 Agent 能做大,它到底需要什么样的 Infra。所以现在对创业者是一个非常好的窗口期,可以和那些做得好的 Agent 公司共同设计(co-design)和共创 Infra 工具。

我觉得今天最重要的,第一是虚拟机,第二是工具。比如未来的 Agent 搜索肯定和人的搜索不一样,会产生天量的机器搜索需求。现在全网人类的搜索每天可能 200 亿次,未来机器搜索可能是几千亿甚至上万亿次。这种搜索不需要给人类做排序优化,可能一个大的数据库就够了,这里有很大的成本优化和创业机会。

09 当 AI 不再只是大模型,它会往哪个方向进化?

张鹏:Agent 始终绕不开模型,站在今天,你觉得模型技术在过去两年里走过了哪些关键的台阶?

李广密:我觉得关键的里程碑(milestone)可能就两个。一个是 GPT-4 代表的规模化定律(Scaling Law)范式,即在预训练阶段,扩大规模仍然是有效的,它能带来通用的泛化能力。

第二个大的里程碑是「o」系列模型所代表的「模型会思考」的范式。它通过更长的思考时间(思维链),显著提升了推理能力。

我觉得这两个范式是今天 AGI 的左膀右臂。在这个基础上,Scaling Law 远远没有停止,思考模式也会继续。比如,在多模态下可以继续 Scaling,也可以把「o」系列的思考能力加到多模态上,这样多模态就能有更长的推理能力,生成的可控性和一致性就会变得非常好。

我自己的感觉是,未来两年可能比过去两年进步要更快。今天可能正处在一个全球几千名顶尖 AI 科学家,共同推动人类科技文艺复兴的状态,资源充足,平台也具备了,很多地方都可能出现突破。

张鹏:你会比较期待接下来一两年,在 AI 领域看到哪些技术台阶的实现和跳跃?

钟凯祺 (Cage):第一个是多模态。现在多模态的理解和生成还是比较零散的,未来一定会走向「大一统」,即理解和生成一体化。这会极大地打开产品的想象力。

第二个是自主学习。我很喜欢 Richard Sutton(强化学习之父)提出的「经验的时代」(the era of experience)这个概念,即 AI 通过在线执行任务的体验来提升自己的能力。这在以前是看不到影子的,因为没有基座的世界知识。但从今年开始往后,这会是一个持续发生的事情。

2024 年图灵奖获奖者 Richard Sutton |图源:Amii

第三个是记忆。如果模型真的能在产品和技术层面把 Agent 的记忆做好,带来的突破会非常大。产品的粘性才真正出现。我感觉 GPT-4o 开始有记忆的那一刻,我才真正对 ChatGPT 这款应用产生了粘性。

最后是新交互。会不会有不再是文字输入框的新交互?因为打字这个门槛其实挺高的。未来会不会有更符合人类直觉和本能的交互方式?比如,我有一个「永远在线」(Always-on)的 AI 产品,它在后台不断地听我说话、异步思考,在我灵感迸发的那一刻,能捕捉到关键的上下文。我觉得这些都是我比较期待的。

张鹏:确实,今天我们面临的挑战和机遇并存。一方面,我们不能被技术发展的速度「拉爆」,要保持持续的关注。另一方面,今天的 AI 产品正在从「工具」走向「关系」。人不会和工具建立关系,但会和一个有记忆、懂你、能与你「心有灵犀」的 AI 建立关系。这种关系本质上就是习惯和惯性,这也是未来重要的壁垒。

今天的探讨非常深入,感谢广密和凯祺的精彩分享。也感谢直播间观众的陪伴。我们下期《今夜科技谈》再见。

李广密:谢谢。

钟凯祺 (Cage):谢谢。

熱門幣種推薦

你可能也喜歡

Kraken盯上Aave:CeFi为何开始“抄底”DeFi核心资产?

近日,市场传闻加密货币交易所Kraken的母公司Payward计划战略投资去中心化借贷协议Aave,以布局DeFi资产管理业务。尽管Aave联合创始人澄清了部分不实细节,但此事反映出中心化交易平台正加速进军链上金融核心领域。 Kraken此举意在拓展资产管理等高利润业务,超越传统交易收入模式。DeFi用户生命周期价值更高,而Aave作为借贷赛道的龙头,拥有成熟的模型、流动性优势和不断扩展的生态,代表了未来链上金融的重要入口。 尽管Aave今年曾遭遇跨链桥漏洞引发的巨额坏账事件,导致大量资金流出,但协议核心架构、治理机制和市场基础信用依然稳固。危机反而凸显了其韧性与长期价值。目前Aave年化协议收入已达1.34亿美元,归属于DAO,其估值相对于收入而言并不高。 更值得关注的是,Aave团队正在设计Aavenomics 3.0,计划引入自动化代币回购机制,将协议收入更直接地反馈给代币持有者,强化价值捕获能力。此外,Aave的愿景是超越加密资产,纳入现实世界资产(RWA),瞄准更广阔的链上资产管理市场。 无论交易最终是否达成,这起事件都标志着CeFi与DeFi的融合正在深化。竞争焦点正从单纯的代币价格转向谁能在下一代金融基础设施中占据核心地位。

marsbit19 分鐘前

Kraken盯上Aave:CeFi为何开始“抄底”DeFi核心资产?

marsbit19 分鐘前

企业资金库SBET恢复以太坊积累,购入5,000枚ETH

上市公司夏普林克(SharpLink,前身为SharpLink Gaming)据报道在暂停八个月后,恢复了以太坊的增持。消息援引比特币主义网站的报道和链上监控数据称,该公司通过机构经纪商FalconX进行了一笔转账,收购了约5,000枚ETH,价值约785万美元,交易时以太坊价格接近1,537美元,接近其年内低点。 若此报道准确,夏普林克的以太坊总持有量将增至约87.6万枚。需要强调的是,此消息源于链上数据追踪和媒体报道,并非公司的正式披露,因此在表述时应使用“据报道”等措辞。 此事之所以值得关注,是因为它反映了上市公司正将数字资产储备策略扩展至比特币之外。以太坊不仅是一种加密资产,还涉及质押、DeFi、稳定币结算和代币化金融等活动。因此,企业增持ETH既可能是看好其资产增值,也可能是押注其网络效用。此外,通过FalconX这样的机构渠道进行大额交易,也说明了专业基础设施对企业国库管理的重要性。 后续需关注夏普林克是否会通过文件或公告正式确认此次交易。市场也将观察是否还有其他上市公司在市场疲软时增持ETH,这可能强化以太坊作为企业储备资产的叙事。报道同时提醒,需警惕与此事相关的虚假赠品骗局。 对于读者而言,应将此消息置于更广泛的市场结构中理解——加密市场同时受到宏观经济、监管、股市、交易所基础设施、稳定币、衍生品和链上流动等多重因素影响。

bitcoinist1 小時前

企业资金库SBET恢复以太坊积累,购入5,000枚ETH

bitcoinist1 小時前

交易

現貨

熱門文章

什麼是 GROK AI

Grok AI: 在 Web3 時代革命性改變對話技術 介紹 在快速演變的人工智能領域,Grok AI 作為一個值得注意的項目脫穎而出,橋接了先進技術與用戶互動的領域。Grok AI 由 xAI 開發,該公司由著名企業家 Elon Musk 領導,旨在重新定義我們與人工智能的互動方式。隨著 Web3 運動的持續蓬勃發展,Grok AI 旨在利用對話 AI 的力量回答複雜的查詢,為用戶提供不僅具資訊性而且具娛樂性的體驗。 Grok AI 是什麼? Grok AI 是一個複雜的對話 AI 聊天機器人,旨在與用戶進行動態互動。與許多傳統 AI 系統不同,Grok AI 接納更廣泛的查詢,包括那些通常被視為不恰當或超出標準回應的問題。該項目的核心目標包括: 可靠推理:Grok AI 強調常識推理,根據上下文理解提供邏輯答案。 可擴展監督:整合工具協助確保用戶互動既受到監控又優化質量。 正式驗證:安全性至關重要;Grok AI 採用正式驗證方法來增強其輸出的可靠性。 長上下文理解:該 AI 模型在保留和回憶大量對話歷史方面表現出色,促進有意義且具上下文意識的討論。 對抗魯棒性:通過專注於改善其對操控或惡意輸入的防禦,Grok AI 旨在維護用戶互動的完整性。 總之,Grok AI 不僅僅是一個信息檢索設備;它是一個沉浸式的對話夥伴,鼓勵動態對話。 Grok AI 的創建者 Grok AI 的腦力來源無疑是 Elon Musk,這個名字與各個領域的創新息息相關,包括汽車、太空旅行和技術。在專注於以有益方式推進 AI 技術的 xAI 旗下,Musk 的願景旨在重塑對 AI 互動的理解。其領導力和基礎理念深受 Musk 推動技術邊界的承諾影響。 Grok AI 的投資者 雖然有關支持 Grok AI 的投資者的具體細節仍然有限,但公開承認 xAI 作為該項目的孵化器,主要由 Elon Musk 本人創立和支持。Musk 之前的企業和持股為 Grok AI 提供了強有力的支持,進一步增強了其可信度和增長潛力。然而,目前有關支持 Grok AI 的其他投資基金或組織的信息尚不易獲得,這標誌著未來潛在探索的領域。 Grok AI 如何運作? Grok AI 的運作機制與其概念框架一樣創新。該項目整合了幾種尖端技術,以促進其獨特的功能: 強大的基礎設施:Grok AI 使用 Kubernetes 進行容器編排,Rust 提供性能和安全性,JAX 用於高性能數值計算。這三者確保了聊天機器人的高效運行、有效擴展和及時服務用戶。 實時知識訪問:Grok AI 的一個顯著特點是其通過 X 平台(以前稱為 Twitter)訪問實時數據的能力。這一能力使 AI 能夠獲取最新信息,從而提供及時的答案和建議,而其他 AI 模型可能會錯過這些信息。 兩種互動模式:Grok AI 為用戶提供“趣味模式”和“常規模式”之間的選擇。趣味模式允許更具玩樂性和幽默感的互動風格,而常規模式則專注於提供精確和準確的回應。這種多樣性確保了根據不同用戶偏好量身定制的體驗。 總之,Grok AI 將性能與互動相結合,創造出既豐富又娛樂的體驗。 Grok AI 的時間線 Grok AI 的旅程標誌著反映其發展和部署階段的關鍵里程碑: 初始開發:Grok AI 的基礎階段持續了約兩個月,在此期間進行了模型的初步訓練和微調。 Grok-2 Beta 發布:在一個重要的進展中,Grok-2 beta 被宣布。這一版本推出了兩個版本的聊天機器人——Grok-2 和 Grok-2 mini,均具備聊天、編碼和推理的能力。 公眾訪問:在其 beta 開發之後,Grok AI 向 X 平台用戶開放。那些通過手機號碼驗證並活躍至少七天的帳戶可以訪問有限版本,使這項技術能夠接觸到更廣泛的受眾。 這一時間線概括了 Grok AI 從創建到公眾參與的系統性增長,強調其對持續改進和用戶互動的承諾。 Grok AI 的主要特點 Grok AI 包含幾個關鍵特點,促成其創新身份: 實時知識整合:訪問當前和相關信息使 Grok AI 與許多靜態模型區別開來,從而提供引人入勝和準確的用戶體驗。 多樣化的互動風格:通過提供不同的互動模式,Grok AI 滿足各種用戶偏好,邀請創造力和個性化的對話。 先進的技術基礎:利用 Kubernetes、Rust 和 JAX 為該項目提供了堅實的框架,以確保可靠性和最佳性能。 倫理話語考量:包含圖像生成功能展示了該項目的創新精神。然而,它也引發了有關版權和尊重可識別人物描繪的倫理考量——這是 AI 社區內持續討論的議題。 結論 作為對話 AI 領域的先驅,Grok AI 概括了數字時代轉變用戶體驗的潛力。由 xAI 開發,並受到 Elon Musk 願景的驅動,Grok AI 將實時知識與先進的互動能力相結合。它努力推動人工智能能夠達成的界限,同時保持對倫理考量和用戶安全的關注。 Grok AI 不僅體現了技術的進步,還體現了 Web3 環境中新對話範式的出現,承諾以靈活的知識和玩樂的互動吸引用戶。隨著該項目的持續演變,它成為技術、創造力和類人互動交匯處所能實現的見證。

793 人學過發佈於 2024.12.26更新於 2024.12.26

什麼是 GROK AI

什麼是 ERC AI

Euruka Tech:$erc ai 及其在 Web3 中的雄心概述 介紹 在快速發展的區塊鏈技術和去中心化應用的環境中,新項目頻繁出現,每個項目都有其獨特的目標和方法論。其中一個項目是 Euruka Tech,該項目在加密貨幣和 Web3 的廣闊領域中運作。Euruka Tech 的主要焦點,特別是其代幣 $erc ai,是提供旨在利用去中心化技術日益增長的能力的創新解決方案。本文旨在提供 Euruka Tech 的全面概述,探索其目標、功能、創建者的身份、潛在投資者以及它在更廣泛的 Web3 背景中的重要性。 Euruka Tech, $erc ai 是什麼? Euruka Tech 被描述為一個利用 Web3 環境提供的工具和功能的項目,專注於在其運作中整合人工智能。雖然有關該項目框架的具體細節仍然有些模糊,但它旨在增強用戶參與度並自動化加密空間中的流程。該項目的目標是創建一個去中心化的生態系統,不僅促進交易,還通過人工智能整合預測功能,因此其代幣被命名為 $erc ai。其目的是提供一個直觀的平台,促進更智能的互動和高效的交易處理,並在不斷增長的 Web3 領域中發揮作用。 Euruka Tech, $erc ai 的創建者是誰? 目前,關於 Euruka Tech 背後的創建者或創始團隊的信息仍然不明確且有些模糊。這一數據的缺失引發了擔憂,因為了解團隊背景通常對於在區塊鏈行業建立信譽至關重要。因此,我們將這些信息歸類為 未知,直到具體細節在公共領域中公開。 Euruka Tech, $erc ai 的投資者是誰? 同樣,關於 Euruka Tech 項目的投資者或支持組織的識別在現有研究中並未明確提供。對於考慮參與 Euruka Tech 的潛在利益相關者或用戶來說,來自知名投資公司的財務合作或支持所帶來的保證是至關重要的。沒有關於投資關係的披露,很難對該項目的財務安全性或持久性得出全面的結論。根據所找到的信息,本節也處於 未知 的狀態。 Euruka Tech, $erc ai 如何運作? 儘管缺乏有關 Euruka Tech 的詳細技術規範,但考慮其創新雄心是至關重要的。該項目旨在利用人工智能的計算能力來自動化和增強加密貨幣環境中的用戶體驗。通過將 AI 與區塊鏈技術相結合,Euruka Tech 旨在提供自動交易、風險評估和個性化用戶界面等功能。 Euruka Tech 的創新本質在於其目標是創造用戶與去中心化網絡所提供的廣泛可能性之間的無縫連接。通過利用機器學習算法和 AI,它旨在減少首次用戶的挑戰,並簡化 Web3 框架內的交易體驗。AI 與區塊鏈之間的這種共生關係突顯了 $erc ai 代幣的重要性,成為傳統用戶界面與去中心化技術的先進能力之間的橋樑。 Euruka Tech, $erc ai 的時間線 不幸的是,由於目前有關 Euruka Tech 的信息有限,我們無法提供該項目旅程中主要發展或里程碑的詳細時間線。這條時間線通常對於描繪項目的演變和理解其增長軌跡至關重要,但目前尚不可用。隨著有關顯著事件、合作夥伴關係或功能添加的信息變得明顯,更新將無疑增強 Euruka Tech 在加密領域的可見性。 關於其他 “Eureka” 項目的澄清 值得注意的是,多個項目和公司與 “Eureka” 共享類似的名稱。研究已經識別出一些倡議,例如 NVIDIA Research 的 AI 代理,專注於使用生成方法教導機器人複雜任務,以及 Eureka Labs 和 Eureka AI,分別改善教育和客戶服務分析中的用戶體驗。然而,這些項目與 Euruka Tech 是不同的,不應與其目標或功能混淆。 結論 Euruka Tech 及其 $erc ai 代幣在 Web3 領域中代表了一個有前途但目前仍不明朗的參與者。儘管有關其創建者和投資者的細節仍未披露,但將人工智能與區塊鏈技術相結合的核心雄心仍然是關注的焦點。該項目在通過先進自動化促進用戶參與方面的獨特方法,可能會使其在 Web3 生態系統中脫穎而出。 隨著加密市場的持續演變,利益相關者應密切關注有關 Euruka Tech 的進展,因為文檔創新、合作夥伴關係或明確路線圖的發展可能在未來帶來重大機會。當前,我們期待更多實質性見解的出現,以揭示 Euruka Tech 的潛力及其在競爭激烈的加密市場中的地位。

686 人學過發佈於 2025.01.02更新於 2025.01.02

什麼是 ERC AI

什麼是 DUOLINGO AI

DUOLINGO AI:將語言學習與Web3及AI創新結合 在科技重塑教育的時代,人工智能(AI)和區塊鏈網絡的整合預示著語言學習的新前沿。進入DUOLINGO AI及其相關的加密貨幣$DUOLINGO AI。這個項目旨在將領先語言學習平台的教育優勢與去中心化的Web3技術的好處相結合。本文深入探討DUOLINGO AI的關鍵方面,探索其目標、技術框架、歷史發展和未來潛力,同時保持原始教育資源與這一獨立加密貨幣倡議之間的清晰區分。 DUOLINGO AI概述 DUOLINGO AI的核心目標是建立一個去中心化的環境,讓學習者可以通過實現語言能力的教育里程碑來獲得加密獎勵。通過應用智能合約,該項目旨在自動化技能驗證過程和代幣分配,遵循強調透明度和用戶擁有權的Web3原則。該模型與傳統的語言習得方法有所不同,重點依賴社區驅動的治理結構,讓代幣持有者能夠建議課程內容和獎勵分配的改進。 DUOLINGO AI的一些顯著目標包括: 遊戲化學習:該項目整合區塊鏈成就和非同質化代幣(NFT)來表示語言能力水平,通過引人入勝的數字獎勵來激發學習動機。 去中心化內容創建:它為教育者和語言愛好者提供了貢獻課程的途徑,促進了一個有利於所有貢獻者的收益共享模型。 AI驅動的個性化:通過採用先進的機器學習模型,DUOLINGO AI個性化課程以適應個別學習進度,類似於已建立平台中的自適應功能。 項目創建者與治理 截至2025年4月,$DUOLINGO AI背後的團隊仍然是化名的,這在去中心化的加密貨幣領域中是一種常見做法。這種匿名性旨在促進集體增長和利益相關者的參與,而不是專注於個別開發者。部署在Solana區塊鏈上的智能合約註明了開發者的錢包地址,這表明對於交易的透明度的承諾,儘管創建者的身份未知。 根據其路線圖,DUOLINGO AI旨在演變為去中心化自治組織(DAO)。這種治理結構允許代幣持有者對關鍵問題進行投票,例如功能實施和財庫分配。這一模型與各種去中心化應用中社區賦權的精神相一致,強調集體決策的重要性。 投資者與戰略夥伴關係 目前,沒有與$DUOLINGO AI相關的公開可識別的機構投資者或風險投資家。相反,該項目的流動性主要來自去中心化交易所(DEX),這與傳統教育科技公司的資金策略形成鮮明對比。這種草根模型表明了一種社區驅動的方法,反映了該項目對去中心化的承諾。 在其白皮書中,DUOLINGO AI提到與未具名的「區塊鏈教育平台」建立合作,以豐富其課程提供。雖然具體的合作夥伴尚未披露,但這些合作努力暗示了一種將區塊鏈創新與教育倡議相結合的策略,擴大了對多樣化學習途徑的訪問和用戶參與。 技術架構 AI整合 DUOLINGO AI整合了兩個主要的AI驅動組件,以增強其教育產品: 自適應學習引擎:這個複雜的引擎從用戶互動中學習,類似於主要教育平台的專有模型。它動態調整課程難度,以應對特定學習者的挑戰,通過針對性的練習加強薄弱環節。 對話代理:通過使用基於GPT-4的聊天機器人,DUOLINGO AI為用戶提供了一個參與模擬對話的平台,促進更互動和實用的語言學習體驗。 區塊鏈基礎設施 建立在Solana區塊鏈上的$DUOLINGO AI利用了一個全面的技術框架,包括: 技能驗證智能合約:此功能自動向成功通過能力測試的用戶頒發代幣,加強了對真實學習成果的激勵結構。 NFT徽章:這些數字代幣標誌著學習者達成的各種里程碑,例如完成課程的一部分或掌握特定技能,允許他們以數字方式交易或展示自己的成就。 DAO治理:持有代幣的社區成員可以通過對關鍵提案進行投票來參與治理,促進一種鼓勵課程提供和平台功能創新的參與文化。 歷史時間線 2022–2023:概念化 DUOLINGO AI的基礎工作始於白皮書的創建,強調了語言學習中的AI進步與區塊鏈技術去中心化潛力之間的協同作用。 2024:Beta發佈 限量的Beta版本推出了流行語言的課程,作為項目社區參與策略的一部分,獎勵早期用戶以代幣激勵。 2025:DAO過渡 在4月,進行了完整的主網發佈,並開始流通代幣,促使社區討論可能擴展到亞洲語言和其他課程開發的問題。 挑戰與未來方向 技術障礙 儘管有雄心勃勃的目標,DUOLINGO AI面臨著重大挑戰。可擴展性仍然是一個持續的擔憂,特別是在平衡與AI處理相關的成本和維持響應靈敏的去中心化網絡方面。此外,在去中心化的提供中確保內容創建和審核的質量,對於維持教育標準來說也帶來了複雜性。 戰略機會 展望未來,DUOLINGO AI有潛力利用與學術機構的微證書合作,提供區塊鏈驗證的語言技能認證。此外,跨鏈擴展可能使該項目能夠接觸到更廣泛的用戶基礎和其他區塊鏈生態系統,增強其互操作性和覆蓋範圍。 結論 DUOLINGO AI代表了人工智能和區塊鏈技術的創新融合,為傳統語言學習系統提供了一種以社區為中心的替代方案。儘管其化名開發和新興經濟模型帶來某些風險,但該項目對遊戲化學習、個性化教育和去中心化治理的承諾為Web3領域的教育技術指明了前進的道路。隨著AI的持續進步和區塊鏈生態系統的演變,像DUOLINGO AI這樣的倡議可能會重新定義用戶與語言教育的互動方式,賦能社區並通過創新的學習機制獎勵參與。

701 人學過發佈於 2025.04.11更新於 2025.04.11

什麼是 DUOLINGO AI

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 AI (AI)幣價的意見。

活动图片