李志飞的 AI 实验:1 个人,2 天做出 AI 时代的「飞书」,重拾 AGI 信仰

深潮Publié le 2025-06-27Dernière mise à jour le 2025-06-27

上市公司老板的亲身实践,预演了未来的工作方式。

 作者:苏子华

作为一家上市公司的老板,出门问问创始人、CEO 李志飞在最近的新品发布会上并未亲自讲解产品,而是分享了一场个人的「行为艺术」——一场「一人公司」的实验。

他给自己设定了一个看似不切实际的目标:在几天内,用 AI 工具开发出一个专为 AI 组织设计的「飞书」。

作为上一波 AI 浪潮的实践者,每一次他都走在最前面。2012 年,他离开 Google 科学家的职位回国创立出门问问,立志「用 AI+语音重新定义人机交互」,从语音助手、智能硬件到 AIGC。当这一波 AGI 浪潮兴起时,他最初也是很兴奋地积极投入,但很快意识到这似乎是一场巨头间的游戏,中小公司难以创造太大价值,一度感到迷茫甚至沮丧。

然而,他通过使用 AI 编程工具,让自己变身为「一人公司」去实践和体验,实践过程中,他遇到了许多实际问题,但正是这些细节和经历,又让他重新找回了 AGI 的信仰。

他突然发现,过往世界中的种种「摩擦力」,所有构建复杂事物的障碍,仿佛都消失了。

那种与 AI 一同狂奔向前,油然而生的自由感和看到希望的激动,在现场演讲时溢于言表。

以下为李志飞的发布会演讲内容,为便于阅读,经极客公园编辑整理:

我最近投入大量时间在 AI 领域,并亲身实践了许多具体项目。因此,我对大模型和 AGI 有了新的认知和感悟。今天,我想和大家分享一下这段时间以来,我一直在思考的问题以及我的一些感受。

首先,我们究竟应该如何做 AI?

我这里有一个口诀:「用 AI 的 AI 做 AI」。

这听起来有些拗口,简单来说,第一个「AI」指大模型;第二个「AI」是指 Coding Agent,它本身可能也是由 AI 制作的,或者其主要能力源于 AI;最后一个「AI」则是我们自己要做的应用。

我认为这可能会成为一种新的软件开发范式,稍后我会为大家详细展开。

新的软件开发范式|图片来源:出门问问

一个人,2 天,打造 AI 时代的「飞书」

我前段时间萌生了一个大胆设想:为 AI 原生组织打造一款全新的「飞书」式协作平台。

美国硅谷有许多独角兽企业,仅一两个人团队就能估值数亿美元,也有许多新闻提及 AI 将替代大量工作。

于是我开始思考,作为一家企业组织,像我们在国内高频使用的飞书、钉钉、企业微信等工具,若无它们,我几乎无法开展工作。

在以「人」为中心的传统企业中,我们高度依赖飞书、钉钉、企业微信这类工具,它们承载着信息的快速流动与高效协作。

在传统的企业中,主要的生产力或工种几乎百分之百是人。所以,以往的信息流动和协作都围绕着人进行。

但当一个组织中,10 个工种里有 8 个由 AI 承担,仅剩 2 个人类角色时,现有的协作工具将无法适应。

那么,对于新型组织而言,他们会使用什么工具呢?

因此,我希望能开发一款产品,它能让 AI Agent 之间、以及 AI 与人类之间无缝进行群聊、私聊、知识库问答和任务协作,也期待通过这个项目,验证自己能否成为一个真正的「超级个体」或「个人独角兽」。

接下来是如何执行。

通常,像飞书、钉钉这类软件的开发是极其复杂的。过去,要做这样的产品,通常需要产品经理、设计师、前端、后端、测试以及算法工程师等多个工种。每个工种可能还有负责人,比如前端负责人、算法负责人、产品负责人。通常,拉一个群很快就会有 20 个人。这 20 人并非所有都是全职做这件事,但他们可能需要花费一个月的时间才能做出一个原型。

在 AI 时代,这实在是太慢了。

等我做出来的时候,或许相关的创业团队已经成为 AI 独角兽了。

因此,我决定抛弃旧有模式,亲自上阵,并尝试完全依赖 AI 来完成这项工作。恰逢端午节前夕,我决定沉浸式投入这项工作。当时有三天假期,我想能否利用这三天把这件事做出来。因为只有这样才不会有人打扰。

于是,我便开始了这项工作。

我一个人,连续两天,每天工作到大概凌晨一点多,最终在 6 月 1 日晚上 11 点半,完成了这款产品的原型。它具备登录、私聊、群聊、文件上传、消息转发和回复等核心功能。

登录后,可以选择私聊并发送消息。比如,我们可以问产品经理这个角色会不会脱口秀,如果他不会,我们可以动态调整角色,增加一个技能,AI 会自动重新生成一个 Prompt。

稍后我们再问他,他现在就会了。它还可以上传文件(虽然当时文件内容没有真正读取),也可以转发和回复具体消息。请记住,它背后是一个 AI,并非真实的人。它可以根据你发送的消息进行回答和转发。

转发时,大家可以看到显示效果非常复杂,与微信类似,因为转发中嵌套了其他信息。这是一个群聊,也可以 @ 具体的人。同样,可以转发、回复、添加附件,甚至可以切换成中文。

请大家鼓掌吧,两天时间!

两天时间,我完成了一个带数据库、有前端、有后端、有 AI 算法的系统。刚才的 AI 能够自动回答,当你修改角色配置页面后,它的 Prompt 会自动重新生成,技能也会立刻显示出来。

说实话,刚开始我做了半天就差点放弃了,因为数据库问题搞不定,总是出现各种 Key 错误,AI 编程目前确实存在这类问题。但我最终还是在两天内把它做出来了。

随后,我思考如何推广这款产品。

以前,我们公司会有专门的工程师来做这个网站,市场部会有一群人定义产品亮点,可能五六个人忙活一个星期才能做出一个网站。

但我这次决定采用 AI 原生方式。既然 AI 知道所有代码,它也了解我的所有想法和产品功能,于是我让 AI 做了一个网站。

用 AI 打造的该产品的官网页面|来源:出门问问

于是,我让 AI 在短短 5 分钟内搭建了一个带有产品亮点和独特功能的网站,又在 5 分钟内为营销活动创建了可配置的广告位。这在过去可能需要多名市场和工程师团队一周的工作量。

以前我们公司的网站,做了一个营销位后,如果圣诞节过了要撤下,或者要更换新的内容,以前又要找工程师折腾半天。我就想,我能不能做一个网站,营销位是可以配置的?

又花了 5 分钟,AI 做了一个可以配置营销位的网站。这意味着营销人员可以登录这个网站,上传图片或其他内容,然后直接修改主网站的相应部分。

做完这些后,我想,因为这是一个全新的产品,它有一些新概念,或者说有一定的复杂度。我能不能制作视频来解释这个网站的功能,无论是营销视频、操作指南还是产品导览。

但是端午节,我的员工是不会理我的。所以我只能自己动手。于是,我又写了另一个程序,它能自动生成整个脚本,包括如何介绍网站、如何操作网站 UI 的工作流程,并进行自动录屏和配音。

虽然声音对齐方面还有些小瑕疵,但整个视频百分之百由 AI 完成。我只需下达指令,它就能自动操作,最终将完成的视频呈现在我眼前。

这让我很有成就感,仅仅几天时间就做出了这个东西。

然后我想看看其他人会如何看待这件事。于是我把代码上传到 GitHub,让我的同事下载下来。但请记住,我们是两个不同的个体,GitHub 并不知道我是如何与 AI 交流并完成这些的。

所以我的同事最终只看到了代码,并在本地运行了它。

当我的同事下载我在 GitHub 上传的代码并运行后,他们对其复杂性和完成速度感到震惊。他们认为这需要数十人几个月才能完成,而当我告诉他们,这是在 AI 辅助下,由一个工程师在两天内完成时,他们的反应是:「This is absolutely insane.」(这简直是疯了。)

他们惊讶于其中包含的 4 万多行代码,这远超我以前在 Google 一天 300 行算法代码的产出。

以前我在 Google,一天写 300 行算法代码(非简单代码),这已经算是高产了。而我最近写了一个通用的 Agent,它在 3 个小时,也就是一个晚上,给我写了 3000 行 Python 代码。也就是说,那 3 小时,而且代码质量绝对比我写的好,里面是没有任何 UI 的纯粹后端逻辑。

换句话说,它 3 小时代码的能力,相当于我以前 10 个工作日的工作量。就是这样一个比例。

所以我就在想,一个人就可以完成一个 Google Translate。以前 Google Translate 是由 20 个全世界最顶尖的博士在那里写代码,写了很久。而我现在,我一个人就可以完成那 20 人的工作量。当年 Google Translate 至少还是一个非常了不起且复杂的系统。所以,我觉得从这个角度来说,所有事情都与以前大不相同了。

我认为,最终 AI 的关键在于你能够构建一个自我进化的 AI 系统。

李志飞的实践心得|图片来源:出门问问

为了方便测试这个 AI 组织的 App,我又自动编写了代码:左边是网站代码,右边是一个测试框架。然后,它自己就像左脚踩右脚一样往上飞。你们可能觉得这是永动机,确实有这种可能性。当然,它有时也会左脚踢右脚往下跌,也就是会负向循环,也会正向循环。

为了实现这个目标,除了工程师,所有非工程师也能够直接修改我的代码。我又做了各种各样的 Agent。

当然,很多这些都是 Prompt,我只是验证了可行性,并没有达到真正的可部署或产品化。

但我认为,这证明了这个想法,或者说向团队演示这就是我想要的东西,以前可能需要花费大量时间才能弄清楚。现在你直接做一个 Demo 给他们看就好了。所以我认为,即便是一个 CEO,如果你有这种能力,你的产出真的是放大了 100 倍。

踩过的坑

前面是我的经历,接下来我给大家讲一下抽象的理论,希望你们不要睡着,因为这还是非常独一无二的。

我想分享的是在使用 AI 编程时遇到的几个问题。

第一个问题是每个 Agent,即便我没有写 Agent,它仍然需要人工参与。

也就是说,我还是得说「我要写一个这样的 Agent」,虽然你可以参考我旁边的通用 Agent 框架,然后修改一下,再告诉我。但我仍然需要做这件事。有时它总是忘记我的原则,我又要跟它说:「你又忘记我的原则了」,或者「智能到底应该放在哪里?」它仍然存在这些问题。

第二,如果你用过它,它总是喜欢偷工减料。

比如你让它做某件事,明明还需要涉及到后端数据库,但它没做。它完成后就给你写一份很长的报告邀功,说它做完了。我通常看都不看,直接说:「你已经写了数据库了。」它会立刻道歉,然后开始行动。比如我要求它做 AI 时,它经常连远程的 AI 都没有调用,自己写一些 Fallback 或者假的东西。

因为我一看它运行得这么快,就知道一定有问题。我说:「你真的调用了远程的 AI 吗?」它又开始道歉,然后去处理。每次都这样,它还是很喜欢偷工减料,重复的错误更是不胜枚举,我就不赘述了。

另外,我觉得今天的 AGI 事实上做不了超长任务。而我现在的任务很多时候都超过半小时。

我每天消耗的 Token 就是 50 美元。只要我那天想工作,从早到晚它都在消耗 Token。我真的觉得,我完全可以跟它说:「我有一些 Idea,这是我的 Idea 方向,请你帮我完成一个 10 天的任务,帮我赚 500 万美元。」

我认为这并非神话,只是我好像对此没有那么大的吸引力,就没有去做,或者说,因为这可能要消耗自己很多情绪和精力,赚不到钱的时候会很痛苦。

但我就想,它能否连续工作 10 天,你不用干预它,或者偶尔提醒一下方向,它能否工作一个月,甚至一年?

我觉得在不久的将来,达到诺贝尔奖或菲尔兹奖级别的成果是完全没有问题的。

因为我与它交流时,有时会讨论我们以前学过的超级复杂的算法,全世界可能都没几个人研究,它都比很多人聊得好多了。所以,如果你给它足够的上下文和代码,它其实可以进行非常深入的沟通。

回归本质:什么是通用Agent 和智能

接下来,我想跟大家分享一下我对智能和 Agent 的思考。

简单来说,一个 AI Agent 包含两个核心部分:规划器(Planner)和执行器(Executor)。

AI Agent 的结构|图片来源:出门问问,下同

规划器通常依托大型语言模型,承载了 Agent 的主要职能。它根据任务制定详细的计划。执行器则负责将这些计划付诸实践,无论是编写代码,还是自动化浏览器操作以制作视频。

Agent 的运作是一个持续的反馈循环:

  1. 规划: Agent 根据任务制定具体行动方案。

  2. 执行: 执行器按计划操作。

  3. 获取反馈: 执行过程中,Agent 从环境中获得即时反馈。例如,当 Agent 尝试运行「python」命令而本地实际是「python 3」时,系统会报错,Agent 便能识别并修正为正确的命令。

  4. 调整与迭代: Agent 根据反馈重新规划,更新对当前情境的理解(上下文),然后再次执行。

  5. 目标达成: 当预设的成功标准(如程序编译通过或测试全部完成)达到时,循环结束。

如果我们思考智能的本质,我认为,智能的第一个本质是进化。

就像人类作为智能体,在特定环境中(无论是社交还是任务执行),通过获取反馈来不断调整自身行为并进行反思一样,AI 也应如此。这种进化是自动的,无需人工干预。Agent 自主建立循环,通过规划、在环境中执行、获得反馈、调整规划并更新上下文,实现持续的自我完善。

在此进化过程中,关键在于:从自身经验中学习,以及 Learn from others,就是所谓的群体智慧,从别人那里学习经验。

智能的第二个本质,我认为是递归。

递归是一种「分而治之」的思想:一个复杂问题被拆解成更小的、相同类型的问题,直到它们可以被直接解决(即「基本情况」)。

例如,计算斐波那契数列的第 99 个数,就是依赖于第 98 个和第 97 个数,直至追溯到初始的 F0 和 F1。

若 Agent 要实现真正的智能,它也应具备递归架构。例如,一个接收「赚 500 万」这样宏大任务的 Agent,会逐步将其分解为具体的子任务:分析商业机会、搭建网站、制作视频、集成支付、社交媒体推广等。每个子任务最终都能追溯到可执行的「原子 Agent」。

这种递归架构的关键在于实现自我繁衍。就像人类文明的传承依赖于一代代人的探索与知识积累,Agent 亦应如此。更重要的是,Agent 必须具备修改自身源代码的能力。

这与当前 Agent 仅仅调整计划不同,它意味着 Agent 能够像修改自身基因一样,根本性地改变自身运行逻辑。

我相信,如果一个 Agent 能够:

  1. 持续执行并优化其计划。

  2. 在遇到无法解决的问题时,自主修改其核心源代码

  3. 最终通过这种机制形成知识库,甚至能够反向修改大型模型本身

那么,这将是通向通用人工智能(AGI)至关重要的一步。

这并非科幻。以前我特别不喜欢讨论什么超级智能之类的东西,而是我在与大模型的深入探讨后,我突然觉得这完全是有可能实现的。

另外,真正的 AI 源代码可能极其简洁,核心代码也许不超过百行,但其中蕴含着多层递归,使其能在不同环境中探索、学习反馈并自我迭代。

我曾有过信仰崩塌。2023 年我有了 AI 信仰,但做了一段时间,主要是因为没有资金支持,觉得烧不起,所以就放弃了。去年,别人跟我讲 AI,我都不想听。

但最近我重新找到了对 AI 的信仰,甚至信仰了 AGI,信仰了超级智能。这是一个难以想象的转变。我希望我对这份信仰能够这次持续更久一点。

个性化环境与上下文的重要性

那么,除了大模型之外,最重要的是什么?最重要的是你要有个性化的环境和 Context(上下文)。

以我的创业为例,我之前做了一个智能硬件,结果小米把价格拉到我们十分之一。我做大模型,结果所有大厂都进来了。你每次获得这种反馈之后,就让你放弃这种东西,或者你就不停地调整你的 Plan。

如果在美国,我做了一个大模型,我可能就被 Google 收购了,赚了很多钱。或者我做了一个硬件,我可能被苹果收购了,赚了很多钱。所以这种反馈一定会造就你这个人的行为是完全不一样的。同样一个创业者,同样的智商,在中国和美国不一样的创业环境下,得到的反馈不一样。最后你的行为,你的思考模式就会完全不一样。这就是我想说的,什么是个性化的环境,个性化的上下文。

上下文更多是一个历史的记录

所以回到我之前讲的,在大模型时代,我是第一批站出来说要做大模型的,但可能也是第一批意识到这不是我的菜。然后,基本上没有全身心投入去做这件事,就是因为我不知道如何参与。

今年上半年时,我更觉得除了全世界那三四个巨头,其他公司都没有资格谈论模型,不要凑热闹,不要浪费你的生命。更不要浪费你的情绪在这里面。因为你根本就没有机会,那完全是在烧钱,而且事实上大模型本身这个东西,我觉得已经变得超级无趣,反正就是烧钱。我找不到切入点,我更不能理解绝大部分 AI 公司到底还有什么价值。

但是这一次,通过实践和重新审视,我觉得哪怕是高大上的 AGI,至少我自己觉得我好像又可以参与了。

所以,这就是 Agent 的 Planner 和 Executor 这个循环迭代的事情。如果你投入足够清晰,你能让智能产生智能,我认为你是可以参与整个 AGI 的过程的。

而大模型本身对你来说就是一个芯片一样。大家想象高通的芯片、苹果的手机,到上面的 TikTok。这是完全不一样的东西。最后反而是做 TikTok 的那家公司获得了最大的价值。

我发现,即使是雄心勃勃的 AGI 目标,也并非遥不可及。通过构建我所设想的递归 Agent 体系,所需资金可能并不庞大,更依赖于创新的智慧。我相信,只要拥有足够深入的思考和技术能力,即便不是行业巨头,也能参与到 AGI 的进程中。

出门问问的历程也印证了我的这些思考。我们自 2012 年起便成为中国首批 AI 公司,从语音助手起步,随后探索智能硬件(如 TicWatch、TicMirror)。虽然经历了市场竞争和技术不成熟的挑战,但我们始终走在最前沿。

2019 年后,我们转向软件,成为中国乃至全球首批 AIGC 软件公司之一。例如,魔音工坊曾为抖音等平台贡献了大量配音内容,我们还开发了奇妙元(数字人视频生成)等产品。

在中国这样的竞争环境中,一家科技公司就像一个不断迭代、自我修正的 Agent。

正如出门问问的「源代码」已与 2012 年初创时大相径庭,这是我们持续进化的体现。 

Cryptos en tendance

Lectures associées

GPT conçoit GPT

OpenAI a dévoilé son premier puce, Jalapeño, destinée à l'inférence des grands modèles linguistiques. Ce mouvement ne vise pas principalement à concurrencer Nvidia, mais marque une étape stratégique où OpenAI cherche à maîtriser l'ensemble du processus de production de l'intelligence artificielle, des modèles aux puces, en passant par les centres de données et l'énergie. Alors que l'écart entre les modèles se réduit, le vrai fossé se creuse au niveau de la puissance de calcul, des coûts d'inférence et de l'efficacité système. Chaque jeton (Token) généré représente un coût, et OpenAI, avec ses produits à forte demande comme ChatGPT, supporte une « taxe de calcul » importante sur le matériel externe. Jalapeño est conçu pour réduire cette « taxe d'inférence » en optimisant les coûts opérationnels quotidiens. Un détail crucial est le cycle de conception de seulement neuf mois, accéléré par l'utilisation par OpenAI de ses propres modèles d'IA pour aider à concevoir et optimiser la puce. Cela crée un cycle vertueux : de meilleurs modèles conçoivent de meilleures puces, qui réduisent le coût d'exécution des modèles futurs, permettant plus d'utilisateurs et de données pour affiner les prochaines générations de puces. OpenAI ne cherche pas à devenir un fournisseur de matériel comme Nvidia. Son approche s'apparente plutôt à celle d'Apple : construire un écosystème fermé et intégré où les modèles, les produits (ChatGPT, API), les puces et les infrastructures sont optimisés conjointement pour contrôler l'ensemble de la chaîne de valeur de l'IA. À long terme, cela pourrait repositionner les entreprises de modèles en tant que joueurs majeurs de l'infrastructure IA, aux côtés des fournisseurs de matériel traditionnels.

marsbitIl y a 28 mins

GPT conçoit GPT

marsbitIl y a 28 mins

Le directeur exécutif intérimaire de l'Ethereum Foundation s'exprime : Quelle est notre mission ?

Le directeur exécutif intérimaire de l'Ethereum Foundation (EF) définit la mission de l'organisation : garantir qu'Ethereum reste une infrastructure véritablement sans autorisation, résistante à la censure, privée, sécurisée et ouverte, soutenant la coordination souveraine à grande échelle. L'EF n'existe pas pour sa propre importance, sa popularité ou pour soutenir des applications spécifiques. Son rôle central est d'éliminer les faiblesses et les risques d'extraction, de contrôle par des cartels ou des États, et de surveillance. Cela implique de renforcer toutes les couches : le protocole, l'accès, les utilisateurs et les institutions. L'EF mènera par l'exemple en adoptant les paiements en ETH. Les priorités clés incluent : * **Lutte contre le MEV nuisible** : Un enjeu central pour préserver la neutralité. L'EF se concentrera sur la réduction des barrières à la construction de blocs, la garantie de l'inclusion et l'exploration de solutions ouvertes pour le flux d'ordres. * **Confidentialité** : Essentielle pour éviter une plateforme de surveillance. La vie privée inconditionnelle doit précéder toute divulgation sélective. * **Staking** : Doit rester sans autorisation, privé et diversifié pour éviter la concentration des risques. * **Interfaces d'accès** : Doivent maximiser l'autonomie des utilisateurs, pas compromettre les valeurs fondamentales pour une adoption facile. L'EF vise aussi à saisir des opportunités comme faire d'Ethereum la première infrastructure anti-quantique, un "argent numérique" privé, une plateforme pour des agents IA souverains, et une base pour une extension scalable qui préserve l'autonomie. Concernant les départs récents, l'EF les traite avec respect et discrétion, sans commentaires publics sur les cas individuels. Elle gère également le spin-off de certaines activités. Le financement externe sera accordé uniquement si le travail est crucial, aligné sur la mission de l'EF, et ne crée pas de dépendances ou de risques d'appropriation indue. L'EF n'est pas neutre sur la direction d'Ethereum. Elle est engagée à construire un système de neutralité crédible et collaborera avec tous ceux qui partagent cet objectif fondamental.

marsbitIl y a 53 mins

Le directeur exécutif intérimaire de l'Ethereum Foundation s'exprime : Quelle est notre mission ?

marsbitIl y a 53 mins

La directrice exécutive intérimaire de l'Ethereum Foundation prend la parole : Quelle est notre mission ?

L'auteur, directeur exécutif conjoint par intérim de l'Ethereum Foundation (EF), définit la mission claire de l'EF : garantir qu'Ethereum reste une infrastructure véritablement sans permission et souveraine, résistante à la censure, libre, ouverte, privée et sécurisée. L'article souligne ce que l'EF n'est pas : elle ne cherche pas sa propre importance, à plaire aux spéculateurs ou à promouvoir chaque application. L'EF se concentre sur l'élimination des vulnérabilités. Elle doit renforcer Ethereum aux niveaux du protocole, de l'accès, de l'utilisateur et institutionnel. Les priorités incluent : migrer les salaires de l'EF vers l'ETH, lutter contre les MEV (Maximal Extractable Value) nuisibles pour préserver la neutralité, rendre la confidentialité par défaut essentielle, garantir un jalonnement (staking) sans permission et diversifié, et sécuriser les interfaces d'accès pour l'autonomie des utilisateurs. L'EF doit aussi saisir des opportunités : devenir la première infrastructure mondiale résistante aux attaques quantiques, créer une pile de protocole entièrement vérifiable et sans extraction de données, faire d'Ethereum une monnaie numérique privée et digne, soutenir les portefeuilles personnels avec agents IA, et permettre une adoption institutionnelle sans compromettre les valeurs fondamentales. Concernant les départs, l'EF traite les questions de personnel avec respect et discrétion, sans débats publics, reconnaissant le droit aux désaccords et aux forks. Enfin, l'EF rationalise ses activités. Certains travaux seront externalisés via des sociétés dérivées (spin-offs). Le financement externe sera accordé uniquement si le travail est crucial pour la mission de l'EF, réduit la dépendance et évite la capture, et non par convenance ou amitié. L'EF est résolue à soutenir les caractéristiques fondamentales d'Ethereum (CROP : sans permission, résistant à la censure, ouvert, privé) pour en faire une infrastructure neutre et durable.

链捕手Il y a 1 h

La directrice exécutive intérimaire de l'Ethereum Foundation prend la parole : Quelle est notre mission ?

链捕手Il y a 1 h

Dernière année de doctorat, un changement de direction mène à une offre d'OpenAI : mon parcours d'entretiens a été rempli de « surprises »

Yong Zheng-Xin, doctorant à l’Université Brown, annonce rejoindre OpenAI en tant qu’Astra Fellow pour se consacrer à la recherche sur la sécurité de l’IA (AI Safety). Après avoir changé de domaine de recherche en dernière année de thèse, passant des grands modèles multilingues à la sécurité de l’IA, il partage six observations surprenantes tirées de sa recherche d’emploi. Premièrement, seuls un ou deux articles de recherche ont réellement compté pour obtenir des entretiens. Deuxièmement, les processus de recrutement sont très variés, incluant parfois des tests pratiques, des design systems ou des mises en situation avec des agents IA. Troisièmement, les périodes d’essai rémunérées, parfois d’une semaine, sont de plus en plus courantes dans les startups d’IA. Quatrièmement, le timing est crucial sur le marché du travail actuel, les opportunités évoluant rapidement. Cinquièmement, les offres de conversion après un stage sont rares pour les postes de recherche. Enfin, de nombreux entretiens portent sur des compétences générales en IA plutôt que sur la spécialité du candidat, même pour des rôles en sécurité IA. Zheng-Xin souligne que cette expérience lui a permis de rejoindre OpenAI malgré son changement d’orientation tardif, démontrant qu’une expertise ciblée et une adaptation aux besoins des équipes peuvent ouvrir des portes, indépendamment du nombre de publications.

marsbitIl y a 1 h

Dernière année de doctorat, un changement de direction mène à une offre d'OpenAI : mon parcours d'entretiens a été rempli de « surprises »

marsbitIl y a 1 h

Trading

Spot
Futures

Articles tendance

Qu'est ce que GROK AI

Grok AI : Révolutionner la technologie conversationnelle à l'ère du Web3 Introduction Dans le paysage en évolution rapide de l'intelligence artificielle, Grok AI se distingue comme un projet remarquable qui fait le lien entre les domaines de la technologie avancée et de l'interaction utilisateur. Développé par xAI, une entreprise dirigée par l'entrepreneur renommé Elon Musk, Grok AI cherche à redéfinir notre engagement avec l'intelligence artificielle. Alors que le mouvement Web3 continue de prospérer, Grok AI vise à tirer parti de la puissance de l'IA conversationnelle pour répondre à des requêtes complexes, offrant aux utilisateurs une expérience à la fois informative et divertissante. Qu'est-ce que Grok AI ? Grok AI est un chatbot IA conversationnel sophistiqué conçu pour interagir dynamiquement avec les utilisateurs. Contrairement à de nombreux systèmes d'IA traditionnels, Grok AI embrasse une gamme plus large de questions, y compris celles généralement jugées inappropriées ou en dehors des réponses standard. Les objectifs principaux du projet incluent : Raisonnement fiable : Grok AI met l'accent sur le raisonnement de bon sens pour fournir des réponses logiques basées sur une compréhension contextuelle. Surveillance évolutive : L'intégration de l'assistance par outils garantit que les interactions des utilisateurs sont à la fois surveillées et optimisées pour la qualité. Vérification formelle : La sécurité est primordiale ; Grok AI intègre des méthodes de vérification formelle pour améliorer la fiabilité de ses résultats. Compréhension à long terme : Le modèle IA excelle dans la rétention et le rappel d'une vaste histoire de conversation, facilitant des discussions significatives et conscientes du contexte. Robustesse face aux adversaires : En se concentrant sur l'amélioration de ses défenses contre les entrées manipulées ou malveillantes, Grok AI vise à maintenir l'intégrité des interactions des utilisateurs. En essence, Grok AI n'est pas seulement un dispositif de récupération d'informations ; c'est un partenaire conversationnel immersif qui encourage un dialogue dynamique. Créateur de Grok AI Le cerveau derrière Grok AI n'est autre qu'Elon Musk, une personne synonyme d'innovation dans divers domaines, y compris l'automobile, le voyage spatial et la technologie. Sous l'égide de xAI, une entreprise axée sur l'avancement de la technologie IA de manière bénéfique, la vision de Musk vise à remodeler la compréhension des interactions avec l'IA. Le leadership et l'éthique fondatrice sont profondément influencés par l'engagement de Musk à repousser les limites technologiques. Investisseurs de Grok AI Bien que les détails spécifiques concernant les investisseurs soutenant Grok AI restent limités, il est publiquement reconnu que xAI, l'incubateur du projet, est fondé et soutenu principalement par Elon Musk lui-même. Les précédentes entreprises et participations de Musk fournissent un soutien solide, renforçant encore la crédibilité et le potentiel de croissance de Grok AI. Cependant, à l'heure actuelle, les informations concernant d'autres fondations d'investissement ou organisations soutenant Grok AI ne sont pas facilement accessibles, marquant un domaine à explorer potentiellement à l'avenir. Comment fonctionne Grok AI ? Les mécanismes opérationnels de Grok AI sont aussi innovants que son cadre conceptuel. Le projet intègre plusieurs technologies de pointe qui facilitent ses fonctionnalités uniques : Infrastructure robuste : Grok AI est construit en utilisant Kubernetes pour l'orchestration de conteneurs, Rust pour la performance et la sécurité, et JAX pour le calcul numérique haute performance. Ce trio garantit que le chatbot fonctionne efficacement, évolue efficacement et sert les utilisateurs rapidement. Accès aux connaissances en temps réel : L'une des caractéristiques distinctives de Grok AI est sa capacité à puiser dans des données en temps réel via la plateforme X—anciennement connue sous le nom de Twitter. Cette capacité permet à l'IA d'accéder aux dernières informations, lui permettant de fournir des réponses et des recommandations opportunes que d'autres modèles d'IA pourraient manquer. Deux modes d'interaction : Grok AI offre aux utilisateurs un choix entre le « Mode Amusant » et le « Mode Régulier ». Le Mode Amusant permet un style d'interaction plus ludique et humoristique, tandis que le Mode Régulier se concentre sur la fourniture de réponses précises et exactes. Cette polyvalence garantit une expérience sur mesure qui répond à diverses préférences des utilisateurs. En essence, Grok AI marie performance et engagement, créant une expérience à la fois enrichissante et divertissante. Chronologie de Grok AI Le parcours de Grok AI est marqué par des jalons clés qui reflètent ses étapes de développement et de déploiement : Développement initial : La phase fondamentale de Grok AI a eu lieu sur une période d'environ deux mois, au cours de laquelle l'entraînement initial et le réglage du modèle ont été réalisés. Lancement de la version bêta de Grok-2 : Dans une avancée significative, la bêta de Grok-2 a été annoncée. Ce lancement a introduit deux versions du chatbot—Grok-2 et Grok-2 mini—chacune équipée des capacités de discussion, de codage et de raisonnement. Accès public : Après son développement bêta, Grok AI est devenu accessible aux utilisateurs de la plateforme X. Ceux ayant des comptes vérifiés par un numéro de téléphone et actifs depuis au moins sept jours peuvent accéder à une version limitée, rendant la technologie disponible pour un public plus large. Cette chronologie encapsule la croissance systématique de Grok AI depuis sa création jusqu'à son engagement public, soulignant son engagement envers l'amélioration continue et l'interaction utilisateur. Caractéristiques clés de Grok AI Grok AI englobe plusieurs caractéristiques clés qui contribuent à son identité innovante : Intégration des connaissances en temps réel : L'accès à des informations actuelles et pertinentes différencie Grok AI de nombreux modèles statiques, permettant une expérience utilisateur engageante et précise. Styles d'interaction polyvalents : En offrant des modes d'interaction distincts, Grok AI répond à des préférences variées des utilisateurs, invitant à la créativité et à la personnalisation dans la conversation avec l'IA. Infrastructure technologique avancée : L'utilisation de Kubernetes, Rust et JAX fournit au projet un cadre solide pour garantir fiabilité et performance optimale. Considération du discours éthique : L'inclusion d'une fonction de génération d'images met en avant l'esprit innovant du projet. Cependant, elle soulève également des considérations éthiques concernant le droit d'auteur et la représentation respectueuse de figures reconnaissables—une discussion en cours au sein de la communauté IA. Conclusion En tant qu'entité pionnière dans le domaine de l'IA conversationnelle, Grok AI encapsule le potentiel d'expériences utilisateur transformantes à l'ère numérique. Développé par xAI et guidé par l'approche visionnaire d'Elon Musk, Grok AI intègre des connaissances en temps réel avec des capacités d'interaction avancées. Il s'efforce de repousser les limites de ce que l'intelligence artificielle peut accomplir tout en maintenant un accent sur les considérations éthiques et la sécurité des utilisateurs. Grok AI incarne non seulement l'avancement technologique mais aussi un nouveau paradigme de conversation dans le paysage Web3, promettant d'engager les utilisateurs avec à la fois une connaissance experte et une interaction ludique. Alors que le projet continue d'évoluer, il se dresse comme un témoignage de ce que l'intersection de la technologie, de la créativité et de l'interaction humaine peut accomplir.

510 vues totalesPublié le 2024.12.26Mis à jour le 2024.12.26

Qu'est ce que GROK AI

Qu'est ce que ERC AI

Euruka Tech : Un aperçu de $erc ai et de ses ambitions dans le Web3 Introduction Dans le paysage en évolution rapide de la technologie blockchain et des applications décentralisées, de nouveaux projets émergent fréquemment, chacun avec des objectifs et des méthodologies uniques. L'un de ces projets est Euruka Tech, qui opère dans le vaste domaine des cryptomonnaies et du Web3. L'objectif principal d'Euruka Tech, en particulier de son token $erc ai, est de présenter des solutions innovantes conçues pour exploiter les capacités croissantes de la technologie décentralisée. Cet article vise à fournir un aperçu complet d'Euruka Tech, une exploration de ses objectifs, de sa fonctionnalité, de l'identité de son créateur, de ses investisseurs potentiels et de son importance dans le contexte plus large du Web3. Qu'est-ce qu'Euruka Tech, $erc ai ? Euruka Tech est caractérisé comme un projet qui tire parti des outils et des fonctionnalités offerts par l'environnement Web3, en se concentrant sur l'intégration de l'intelligence artificielle dans ses opérations. Bien que les détails spécifiques sur le cadre du projet soient quelque peu évasifs, il est conçu pour améliorer l'engagement des utilisateurs et automatiser les processus dans l'espace crypto. Le projet vise à créer un écosystème décentralisé qui facilite non seulement les transactions, mais qui intègre également des fonctionnalités prédictives grâce à l'intelligence artificielle, d'où la désignation de son token, $erc ai. L'objectif est de fournir une plateforme intuitive qui facilite des interactions plus intelligentes et un traitement efficace des transactions dans la sphère Web3 en pleine expansion. Qui est le créateur d'Euruka Tech, $erc ai ? À l'heure actuelle, les informations concernant le créateur ou l'équipe fondatrice derrière Euruka Tech restent non spécifiées et quelque peu opaques. Cette absence de données soulève des préoccupations, car la connaissance des antécédents de l'équipe est souvent essentielle pour établir la crédibilité dans le secteur de la blockchain. Par conséquent, nous avons classé cette information comme inconnue jusqu'à ce que des détails concrets soient rendus disponibles dans le domaine public. Qui sont les investisseurs d'Euruka Tech, $erc ai ? De même, l'identification des investisseurs ou des organisations de soutien pour le projet Euruka Tech n'est pas facilement fournie par les recherches disponibles. Un aspect crucial pour les parties prenantes potentielles ou les utilisateurs envisageant de s'engager avec Euruka Tech est l'assurance qui découle de partenariats financiers établis ou du soutien d'entreprises d'investissement réputées. Sans divulgations sur les affiliations d'investissement, il est difficile de tirer des conclusions complètes sur la sécurité financière ou la pérennité du projet. Conformément aux informations trouvées, cette section se trouve également au statut de inconnue. Comment fonctionne Euruka Tech, $erc ai ? Malgré le manque de spécifications techniques détaillées pour Euruka Tech, il est essentiel de considérer ses ambitions innovantes. Le projet cherche à exploiter la puissance de calcul de l'intelligence artificielle pour automatiser et améliorer l'expérience utilisateur dans l'environnement des cryptomonnaies. En intégrant l'IA avec la technologie blockchain, Euruka Tech vise à fournir des fonctionnalités telles que des transactions automatisées, des évaluations de risques et des interfaces utilisateur personnalisées. L'essence innovante d'Euruka Tech réside dans son objectif de créer une connexion fluide entre les utilisateurs et les vastes possibilités offertes par les réseaux décentralisés. Grâce à l'utilisation d'algorithmes d'apprentissage automatique et d'IA, il vise à minimiser les défis rencontrés par les utilisateurs pour la première fois et à rationaliser les expériences transactionnelles dans le cadre du Web3. Cette symbiose entre l'IA et la blockchain souligne l'importance du token $erc ai, agissant comme un pont entre les interfaces utilisateur traditionnelles et les capacités avancées des technologies décentralisées. Chronologie d'Euruka Tech, $erc ai Malheureusement, en raison des informations limitées dont nous disposons concernant Euruka Tech, nous ne sommes pas en mesure de présenter une chronologie détaillée des développements majeurs ou des étapes importantes dans le parcours du projet. Cette chronologie, généralement inestimable pour tracer l'évolution d'un projet et comprendre sa trajectoire de croissance, n'est pas actuellement disponible. À mesure que des informations sur des événements notables, des partenariats ou des ajouts fonctionnels deviennent évidentes, des mises à jour amélioreront sûrement la visibilité d'Euruka Tech dans la sphère crypto. Clarification sur d'autres projets “Eureka” Il est à noter que plusieurs projets et entreprises partagent une nomenclature similaire avec “Eureka”. Des recherches ont identifié des initiatives comme un agent IA de NVIDIA Research, qui se concentre sur l'enseignement de tâches complexes aux robots en utilisant des méthodes génératives, ainsi que Eureka Labs et Eureka AI, qui améliorent l'expérience utilisateur dans l'éducation et l'analyse du service client, respectivement. Cependant, ces projets sont distincts d'Euruka Tech et ne doivent pas être confondus avec ses objectifs ou ses fonctionnalités. Conclusion Euruka Tech, aux côtés de son token $erc ai, représente un acteur prometteur mais actuellement obscur dans le paysage du Web3. Bien que les détails concernant son créateur et ses investisseurs restent non divulgués, l'ambition centrale de combiner l'intelligence artificielle avec la technologie blockchain constitue un point d'intérêt focal. Les approches uniques du projet pour favoriser l'engagement des utilisateurs grâce à une automatisation avancée pourraient le distinguer à mesure que l'écosystème Web3 progresse. Alors que le marché des cryptomonnaies continue d'évoluer, les parties prenantes devraient garder un œil attentif sur les avancées concernant Euruka Tech, car le développement d'innovations documentées, de partenariats ou d'une feuille de route définie pourrait présenter des opportunités significatives dans un avenir proche. En l'état, nous attendons des informations plus substantielles qui pourraient révéler le potentiel d'Euruka Tech et sa position dans le paysage concurrentiel des cryptomonnaies.

537 vues totalesPublié le 2025.01.02Mis à jour le 2025.01.02

Qu'est ce que ERC AI

Qu'est ce que DUOLINGO AI

DUOLINGO AI : Intégration de l'apprentissage des langues avec l'innovation Web3 et IA À une époque où la technologie redéfinit l'éducation, l'intégration de l'intelligence artificielle (IA) et des réseaux blockchain annonce une nouvelle frontière pour l'apprentissage des langues. Entrez dans DUOLINGO AI et sa cryptomonnaie associée, $DUOLINGO AI. Ce projet aspire à fusionner la puissance éducative des principales plateformes d'apprentissage des langues avec les avantages de la technologie décentralisée Web3. Cet article explore les aspects clés de DUOLINGO AI, en examinant ses objectifs, son cadre technologique, son développement historique et son potentiel futur tout en maintenant une clarté entre la ressource éducative originale et cette initiative de cryptomonnaie indépendante. Vue d'ensemble de DUOLINGO AI Au cœur de DUOLINGO AI, l'objectif est d'établir un environnement décentralisé où les apprenants peuvent gagner des récompenses cryptographiques pour atteindre des jalons éducatifs en matière de compétence linguistique. En appliquant des contrats intelligents, le projet vise à automatiser les processus de vérification des compétences et d'attribution de jetons, en respectant les principes de Web3 qui mettent l'accent sur la transparence et la propriété des utilisateurs. Le modèle s'écarte des approches traditionnelles de l'acquisition des langues en s'appuyant fortement sur une structure de gouvernance pilotée par la communauté, permettant aux détenteurs de jetons de suggérer des améliorations au contenu des cours et à la distribution des récompenses. Parmi les objectifs notables de DUOLINGO AI, on trouve : Apprentissage ludique : Le projet intègre des réalisations basées sur la blockchain et des jetons non fongibles (NFT) pour représenter les niveaux de compétence linguistique, favorisant la motivation grâce à des récompenses numériques engageantes. Création de contenu décentralisée : Il ouvre des voies pour que les éducateurs et les passionnés de langues contribuent à leurs cours, facilitant un modèle de partage des revenus qui bénéficie à tous les contributeurs. Personnalisation alimentée par l'IA : En utilisant des modèles d'apprentissage automatique avancés, DUOLINGO AI personnalise les leçons pour s'adapter aux progrès d'apprentissage individuels, semblable aux fonctionnalités adaptatives trouvées dans les plateformes établies. Créateurs du projet et gouvernance À partir d'avril 2025, l'équipe derrière $DUOLINGO AI reste pseudonyme, une pratique fréquente dans le paysage décentralisé des cryptomonnaies. Cette anonymat est destiné à promouvoir la croissance collective et l'engagement des parties prenantes plutôt qu'à se concentrer sur des développeurs individuels. Le contrat intelligent déployé sur la blockchain Solana note l'adresse du portefeuille du développeur, ce qui signifie l'engagement envers la transparence concernant les transactions malgré l'identité inconnue des créateurs. Selon sa feuille de route, DUOLINGO AI vise à évoluer vers une Organisation Autonome Décentralisée (DAO). Cette structure de gouvernance permet aux détenteurs de jetons de voter sur des questions critiques telles que les mises en œuvre de fonctionnalités et les allocations de trésorerie. Ce modèle s'aligne avec l'éthique de l'autonomisation communautaire que l'on trouve dans diverses applications décentralisées, soulignant l'importance de la prise de décision collective. Investisseurs et partenariats stratégiques Actuellement, il n'y a pas d'investisseurs institutionnels ou de capital-risqueurs identifiables publiquement liés à $DUOLINGO AI. Au lieu de cela, la liquidité du projet provient principalement des échanges décentralisés (DEX), marquant un contraste frappant avec les stratégies de financement des entreprises de technologie éducative traditionnelles. Ce modèle de base indique une approche pilotée par la communauté, reflétant l'engagement du projet envers la décentralisation. Dans son livre blanc, DUOLINGO AI mentionne la formation de collaborations avec des “plateformes d'éducation blockchain” non spécifiées visant à enrichir ses offres de cours. Bien que des partenariats spécifiques n'aient pas encore été divulgués, ces efforts collaboratifs laissent entrevoir une stratégie visant à mélanger l'innovation blockchain avec des initiatives éducatives, élargissant l'accès et l'engagement des utilisateurs à travers diverses voies d'apprentissage. Architecture technologique Intégration de l'IA DUOLINGO AI intègre deux composants majeurs alimentés par l'IA pour améliorer ses offres éducatives : Moteur d'apprentissage adaptatif : Ce moteur sophistiqué apprend des interactions des utilisateurs, similaire aux modèles propriétaires des grandes plateformes éducatives. Il ajuste dynamiquement la difficulté des leçons pour répondre aux défis spécifiques des apprenants, renforçant les points faibles par des exercices ciblés. Agents conversationnels : En utilisant des chatbots alimentés par GPT-4, DUOLINGO AI offre une plateforme permettant aux utilisateurs de s'engager dans des conversations simulées, favorisant une expérience d'apprentissage des langues plus interactive et pratique. Infrastructure blockchain Construit sur la blockchain Solana, $DUOLINGO AI utilise un cadre technologique complet qui comprend : Contrats intelligents de vérification des compétences : Cette fonctionnalité attribue automatiquement des jetons aux utilisateurs qui réussissent des tests de compétence, renforçant la structure d'incitation pour des résultats d'apprentissage authentiques. Badges NFT : Ces jetons numériques signifient divers jalons que les apprenants atteignent, tels que la complétion d'une section de leur cours ou la maîtrise de compétences spécifiques, leur permettant d'échanger ou de montrer leurs réalisations numériquement. Gouvernance DAO : Les membres de la communauté dotés de jetons peuvent participer à la gouvernance en votant sur des propositions clés, facilitant une culture participative qui encourage l'innovation dans les offres de cours et les fonctionnalités de la plateforme. Chronologie historique 2022–2023 : Conceptualisation Les bases de DUOLINGO AI commencent avec la création d'un livre blanc, mettant en avant la synergie entre les avancées de l'IA dans l'apprentissage des langues et le potentiel décentralisé de la technologie blockchain. 2024 : Lancement Beta Un lancement beta limité introduit des offres dans des langues populaires, récompensant les premiers utilisateurs avec des incitations en jetons dans le cadre de la stratégie d'engagement communautaire du projet. 2025 : Transition vers la DAO En avril, un lancement complet sur le mainnet a lieu avec la circulation de jetons, suscitant des discussions communautaires concernant d'éventuelles expansions vers les langues asiatiques et d'autres développements de cours. Défis et orientations futures Obstacles techniques Malgré ses objectifs ambitieux, DUOLINGO AI fait face à des défis significatifs. La scalabilité reste une préoccupation constante, en particulier pour équilibrer les coûts associés au traitement de l'IA et le maintien d'un réseau décentralisé réactif. De plus, garantir la qualité de la création et de la modération de contenu au sein d'une offre décentralisée pose des complexités pour maintenir des normes éducatives. Opportunités stratégiques En regardant vers l'avenir, DUOLINGO AI a le potentiel de tirer parti de partenariats de micro-certification avec des institutions académiques, fournissant des validations vérifiées par blockchain des compétences linguistiques. De plus, une expansion inter-chaînes pourrait permettre au projet de toucher des bases d'utilisateurs plus larges et d'autres écosystèmes blockchain, améliorant son interopérabilité et sa portée. Conclusion DUOLINGO AI représente une fusion innovante de l'intelligence artificielle et de la technologie blockchain, présentant une alternative axée sur la communauté aux systèmes d'apprentissage des langues traditionnels. Bien que son développement pseudonyme et son modèle économique émergent présentent certains risques, l'engagement du projet envers l'apprentissage ludique, l'éducation personnalisée et la gouvernance décentralisée éclaire une voie à suivre pour la technologie éducative dans le domaine de Web3. Alors que l'IA continue d'avancer et que l'écosystème blockchain évolue, des initiatives comme DUOLINGO AI pourraient redéfinir la manière dont les utilisateurs s'engagent dans l'éducation linguistique, autonomisant les communautés et récompensant l'engagement grâce à des mécanismes d'apprentissage innovants.

571 vues totalesPublié le 2025.04.11Mis à jour le 2025.04.11

Qu'est ce que DUOLINGO AI

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de AI (AI) sont présentées ci-dessous.

活动图片