YC合伙人:如何打造一家自我进化的AI原生公司

marsbit发布于2026-05-20更新于2026-05-20

文章摘要

YC合伙人Tom Blomfield提出,AI正促使公司形态发生根本性变革。未来公司不应再效仿层级森严的“罗马军团”模式,而应构建为由递归、自我改进的AI闭环构成的智能系统。 这种AI原生公司的核心在于:将散落在邮件、聊天、文档和人脑中的业务知识提取并转化为AI可读、可调用的“组织上下文”。系统通过传感器层(如客户邮件、产品数据)感知外部变化,经过策略、工具和质量关卡自动决策与执行,并根据结果反馈持续学习和修正。例如,YC内部已有agent能自动监控查询失败、分析原因、提交代码并部署修复,实现“在公司睡觉时持续优化”。 这意味着公司瓶颈将从“员工数量”转向“token消耗量”与“组织知识质量”。中层管理的协调功能将被AI大幅替代,个人贡献者(IC)和直接负责人的角色则更为关键。 创始人需推动组织全面对AI可读:记录一切沟通与运营数据,并视其为核心资产。在此基础上生成的软件可以是临时、可丢弃的,真正重要的是持续积累和迭代的业务上下文与技能集。 人类的作用将转向位于“公司大脑”的边缘,处理高风险、高情绪或高度陌生的现实世界交互。最终,公司的目标不再是构建静态团队,而是打造一套能够自主学习和进化的智能系统。

编者按:在这场 YC 最新 batch talk 中,YC 普通合伙人 Tom Blomfield 讨论的不是「如何用 AI 提高员工效率」,而是一个更底层的问题:当 AI 不再只是 Copilot,而是能够感知、决策、调用工具、接受反馈并自我修正时,公司本身应该被重新设计成什么样?

Tom 的核心判断是,传统公司仍然像「罗马军团」一样运转:信息依靠层级向上传递,命令依靠管理链条向下分发。但 AI 正在打破这一组织假设。真正重要的,不是让工程师多写 20% 的代码,而是把散落在邮件、Slack、会议、文档和人脑中的业务知识提取出来,变成 AI 可读取、可调用、可迭代的组织上下文。

在他看来,未来的 AI 原生公司会由一系列递归、自我改进的 AI loop 构成:系统从客户邮件、客服工单、产品数据中感知外部变化,再通过规则层、工具层和质量关卡执行决策,最后根据结果自动学习和修正。YC 内部已经在尝试类似机制:agent 不只是回答问题,还会监控哪些查询失败,判断是否需要新工具、新数据库或新索引,并自动提交代码、审查、合并和部署。也就是说,公司可以在创始人睡觉时继续优化。

这也意味着,AI 对公司的影响不会停留在工具层,而会进一步改变组织结构。Tom 提出「burn tokens, not headcount」——未来创业公司的瓶颈可能不再是员工数量,而是 token 使用、业务上下文质量和组织知识的可读性。中层管理承担的协调功能会被 AI 大幅替代,而 IC、直接负责人和能够与现实世界处理高风险判断的人类角色,将变得更加重要。

最值得关注的,不是 AI 让公司变得更高效,而是它正在改变「公司」这个组织形态本身。当软件可以临时生成、流程可以自动改进、经验可以被持续沉淀为公司大脑,创始人真正要构建的,可能不再是一支层级清晰的团队,而是一套能够持续学习和自我优化的智能系统。

以下为原文:

重写运转方式:公司不该再像罗马军团一样运转

这部分内容有一点基于 Diana 之前的一次演讲。周末那段视频已经上线了,非常精彩。另外,Jack Dorsey 大概两三周前发过一些推文,我觉得也很有意思,所以我「偷」了不少他的想法,塞进了这次分享里。

这场分享会比较概念化、比较高层次,主要是讨论我们应该如何重新思考公司建设。

罗马军团的设计,本质上是为了从罗马这个中心向外投射权力,覆盖两个大陆,甚至一直延伸到苏格兰附近的哈德良长城一带。它依靠的是一种嵌套式层级结构,每一层都有稳定的管理幅度。每一个层级都有明确的负责人,他们负责把命令向下传递,再把信息向上传回。

如果你观察今天大多数公司,会发现它们其实仍然像一支罗马军团:人是信息上下流动的通道。Jack Dorsey 那组推文里让我印象很深的一点是,我们一直默认,层级化组织就是组织经济价值单元的最佳方式。但我认为,AI 基本上正在打破这个假设。

一年前,如果你问大家 AI 有什么用,他们通常会谈「生产力」:比如 Copilot 让工程师效率提升 20%,把 Copilot 接入工作流,帮助团队交付更多软件。但我觉得,这其实是一种有问题的理解方式。这就像是在旧的工作方式上,装了一个更强大的引擎。真正值得思考的,不是如何给旧组织加一个 AI 工具,而是重新想象公司本身是什么、它该如何运转。

比如 Garry 刚才讲到的内容,我真的相信,他一个人现在能产出的代码,可能比一整个工程团队还多。真正让我一直在想的,是如何把公司内部的领域知识提取出来,并把它定义成上下文、技能集,或者任何你愿意称呼它的东西。

所谓领域知识、业务知识、know-how,原本散落在人脑里、Slack 消息里、邮件里、Notion 文档里。这些信息共同定义了你的公司如何运作。一旦你能让这些知识变得清晰、可读取,你就可以从层级化组织,转向一种由 AI 原生软件驱动的智能组织。

让公司在睡觉时变好:AI 闭环如何自动发现、修复和部署

AI 不是一个外挂在公司旁边的东西。它不只是给工程师用来提高效率的工具。我认为,我们可以把公司重新想象成一组递归、自我改进的 AI 循环。这个点非常重要,因为一旦公司走到这一步,它甚至会在你睡觉的时候持续自我优化。

举个例子。

Diana 在她的演讲里也提到过这个 AI loop。它首先有一个「传感器层」。这个词听起来很高级,但其实可以很简单:客户发来的邮件、客服工单、代码变更、用户取消订阅、产品遥测数据,这些都是传感器数据,用来从外部世界获取信息。

然后是策略层或决策层,也就是规则:AI 可以做什么,哪些事情必须请求人类许可,哪些操作必须记录。再往下是工具层,这有点像 Garry 提到的 skills 和 code,本质上是确定性的 API,例如查询数据库、查看日历等,也就是 AI 可以调用的一组工具。

接着是质量关卡,比如 Eva 提到的确定性检查、安全过滤,以及高风险事项的人类审查。最后是学习机制:系统与真实世界互动,发现自己哪里不起作用,然后把反馈重新送回循环的起点。

如果每一个步骤都能在没有人类干预,或只有极少人类干预的情况下运行,那么系统就会在你睡觉的时候变得越来越好。

我可以给你们一些我们现在实际运行中的例子。最开始,我们做了一个 agent,你可以向它提问,它有一些确定性工具,可以查询我们的数据库。比如一个很简单的问题:我上一次和这家公司做 office hours 是什么时候?

后来它变聪明了一点。比如我正在和某家公司做 office hours,他们需要认识石化行业相关的人。这个系统就可以用不同方式查询数据库,结合 RAG 等方法,找出五位相关创始人,推荐给你认识。

但这仍然只是一个 sidekick,一个助手型 agent。它还是去年那种 AI 使用方式:AI 让我作为 group partner 更有效率,让我的工作效率提升 20% 或 30%。

真正让我有「aha moment」的,是我们在这套系统之上加了一个监控 agent。它会查看每一位 YC 员工发起的每一个查询,判断哪些查询成功了,哪些失败了。然后它会问:为什么失败?怎样才能让这个查询成功?我们需要新的确定性工具吗?需要更新 skills 文件吗?需要一个新的数据库吗?需要新的索引吗?

这些事情现在真的会在夜里自动发生。它会写代码,提交 merge request 到 YC 的代码库,让另一个 agent 审查,然后合并、部署。于是第二天,当一个人类再来问同样的问题时,这个查询就能成功了。

对我来说,这才是关键时刻。它不只是让一个人类变得更有价值 20% 或 30%。而是 AI 自己走完了这个循环,找到了自我改进的方法。

我认为,如果你能识别出公司里哪些部分可以这样运转,并尽可能减少人类在其中的执行和监督角色,那么你就可以把 token 投入这个问题里,而公司本身会持续变好。

其他例子也很多。比如你有产品分析数据,就可以让一个 agent 分析产品数据,找出销售漏斗中摩擦最大的环节。它可以研究最佳实践,设置一个 A/B 测试,运行一周,选出表现最好的版本,然后部署上线。

这会一遍又一遍发生。你的产品就会拥有一个自我优化的产品循环。

客服也是一样。客户建议不断进来,你可以用一个 agent 来做分流。这个 agent 某种程度上像你的首席产品官和首席技术官,它要做判断:这个建议我们不想做,丢掉;但那个建议符合我们的路线图,可以今晚就完成。那就写代码、部署、上线,直接交付给客户,全程不需要人类介入。

所以,如果你能把公司每一个部分都看成一个自我改进的递归 AI 循环,它就会变成一种和「罗马军团式」层级公司完全不同的东西。

少堆人头,多烧 token:AI 原生公司会重塑组织结构

那么,如果你想这样做,它意味着什么?

第一点是:消耗 token,而不是堆人头。我们现在看到,很多公司到 Demo Day 时,人均收入已经比 18 个月前高出大约 5 倍。我认为这个趋势会继续延伸到 A 轮和 B 轮阶段。很快,你真正受限的不会是员工人数,而是 token 使用量。

现在最粗糙的做法,就是衡量每个人的 token 使用量。当然,这个指标在极端情况下很蠢,也很容易被游戏化。但方向上,我觉得它是对的。我们现在处在一个探索「到底什么是可能的」的阶段,所以每个人都应该最大限度地实验,看看这种疯狂的新智能到底能做什么。

一旦你把它做成排行榜,并且让晋升或解雇与这个指标挂钩,它当然会被刷,当然会失真。但从方向上说,搞清楚组织里谁在把 token 用到极致,谁没有,确实是判断你应该把时间花在哪些员工身上的一种方式。

我认为,中层管理结束了。至少对于这种协调问题来说,我不认为还需要中层管理,AI 应该来完成这件事。

对我来说,未来有两个重要角色。Jack Dorsey 提了三个,但我不太喜欢第三个,所以我删掉了。我认为真正重要的是两个角色:每个人都必须成为 IC,也就是个人贡献者、建设者、操盘手。并且关键在于,要有直接负责的个人。任何事情要推进,都需要一个明确具名的人负责,而不是一个委员会,也不是一群人。

我认为,公司完全可以建立在 IC 之上。中层管理真的结束了。而构建一家自我改进的公司,就是这个愿景。

顺便说一句,我觉得现在大家都还在这件事的最前沿。我也很想知道你们进展到哪里了。现在感觉所有人都还在探索边界。我不确定是否已经有人在每一个职能上都建立了真正自我改进的公司。也许我错了,你们可以证明我错了。

如果是我,我会先做什么?

第一件非常重要的事,是让整个组织对 AI 可读、可理解。这是什么意思?意思是你必须记录一切。

简单来说,现在我们所有 partner 的邮件,如果你给 YC partner 发邮件,这封邮件就会进入 YC 数据库。每一条 Slack 消息、每一条 DM、每一次 office hours,我们过去三四个月已经开始全部录音。所有发生的事情,只要被记录下来,对 AI 来说它就发生了;如果没有被记录下来,对你的智能系统来说,它就没有发生。

刚才我和一些创始人在这里聊天,我们聊了很多关于他们公司的好内容。每一次聊天我都会想,我真的应该把这段对话录下来。因为有个人刚才需要我帮他介绍一个人,现在我甚至已经记不清那个介绍对象是谁了。我当时答应了他说可以,然后又让他之后给我发邮件,因为我知道我肯定会忘,我接下来还要和 20 个人聊天。

所以,这件事可能需要靠手机、录音设备、智能眼镜,或者把每个房间都装上麦克风。总之,所有东西都需要被记录下来,这样 AI 才能读懂它。

然后,就像 Garry 说的,还需要做说话人分离和摘要整理。你不能把 10 万小时的录音直接塞进上下文窗口里。你必须把它们整理出来,聚合、压缩、提炼成重要部分,再给 AI 留下一些线索。

举个例子:你们有谁读过 YC 的用户手册?希望这个房间里每个人至少都打开过一次。没关系。那份手册大部分内容写于五到十年前,已经有点过时了。

上周末,Harsh 突然想到:既然我们过去三个月已经积累了大约 2000 小时的 office hours 录音,为什么不重新生成一版用户手册?

于是你可以给系统一组指令,先把录音整理、压缩、综合,再按照融资、招聘、联合创始人纠纷等主题分类,然后让它写一版新的用户手册。到周末结束时,他已经生成了一份 150 页的用户手册,质量明显好于现有版本。

更重要的是,现在我们可以每个月更新一次。于是我们的用户手册变成了一个自我改进的系统。每一条新的建议,都会和现有用户手册对比,要么被吸收进去,要么被丢弃。这样,用户手册就变成了一个持续更新的活的大脑,承载着我们每周给创始人的建议。

当然,它不会停留在用户手册这一层。你可以把它作为上下文输入给 AI agent。于是你突然就可以向一个超级智能 AI 提问,并获得 16 位 YC partner 的综合智慧。但前提是,这些知识必须对 AI 可读。所以你必须记录一切。

第二点其实类似:如果某件事能创造出一个可以自我改进的 artifact,并且能被 AI 读取,那就保留它;如果不能,就丢掉。

第三点是,每一个职能都应该能生成自己的软件。过去我们可能会说「仪表盘」,但现在不只是仪表盘,而是按需生成的软件。Codex 5.5 现在已经足够好,大多数简单的内部软件和仪表盘,你都可以一次性生成到相当高的质量。我周末用我们的一些内部东西试了一下,效果真的不可思议。

所以,所有内部运营团队都应该坐在这一层之上:拥有对业务的智能理解,然后自己生成仪表盘和工作流。

而且我会把这些软件视为完全可丢弃的东西。真正应该被非常珍惜地保存下来的,是数据。就像 Garry 说的,他把所有邮件都存成 Markdown,永远不丢弃任何东西。但软件本身是短暂的、临时的。你可以生成它,也可以重新生成它。

真正有价值的,是人脑里对业务的理解:这个职能是如何运转的,我们如何办一场 YC 活动,等等。至于真正用来执行活动的软件,你可以为这场活动生成一个,用完丢掉。一个月或两个月后,模型变得更聪明了,你就把旧软件扔掉,把原始指令重新给它,再生成一版新的软件。

所以我认为,有价值的是业务上下文和 skills。建立在它们之上的软件,是短暂的。

那么,在这个世界里,人类的作用是什么?

我认为,我们讨论的其实是一个「公司大脑」。我知道这个房间里有很多人正在做类似的东西。中间那一部分——你的所有数据、所有邮件、DM、技能、know-how——就是公司大脑。

人类则位于这个大脑的边缘,负责与真实世界交互。也就是说,人类是这个智能系统接触现实的地方。人类可以进入模型暂时还无法进入的场景。比如会议现场,或者一些新颖、复杂的情况。电话我本来想作为例子,但现在 AI 其实也很容易进入电话场景了。

更典型的是陌生情境、伦理判断、高风险时刻。比如一个创始人来找我们,说他正在考虑和联合创始人分开。这种真正高风险、高情绪浓度的时刻,你还是会希望有一个人类在场。

这就是人类的位置。对你们很多公司来说,销售对话也是如此。未来 20 年里,我认为销售现场仍然会需要一个人类在房间里。

所以,我认为人类会生活在公司大脑的边缘,负责把智能带到现实世界里。

我已经超时了,主持人可能快要把我拉下台了。最后我留给你们一个问题:如果你今天重新创办自己的公司,你会不会一开始就把它设计成这种形态?

你们大多数人公司还足够小,完全可以这样做。所以我觉得你们没有任何借口。而且我知道,现场也有几位正在拆掉并重建自己的公司。

那我就先讲到这里,把时间交给 Pete。谢谢大家。

[视频链接]

相关问答

Q文章中提到,未来的AI原生公司与传统公司最核心的区别是什么?

A最核心的区别在于组织形态的重新设计。传统公司是层级化的“罗马军团”式结构,依靠人来上下传递信息和命令。而未来的AI原生公司将是由一系列递归、自我改进的AI循环构成,能够感知外部变化、自动决策和执行、并根据反馈学习和修正,公司本身成为一个能够在创始人睡觉时持续优化的智能系统,而不仅仅是人员管理架构。

QTom Blomfield在演讲中认为,AI对公司的最大影响不是提高生产力,而是什么?

A他认为AI对公司的最大影响不是停留在提高员工生产力(如让工程师多写20%的代码),而是从根本上改变“公司”这个组织形态本身。关键是将散落在人脑、邮件、Slack、文档中的业务知识(公司如何运作的上下文)提取并结构化,使其对AI可读取、可调用、可迭代,从而重新构建一个由AI驱动的智能组织。

Q文章里YC内部运行的一个AI循环例子,是如何实现“让公司在睡觉时变好”的?

AYC内部在问答agent之上增加了一个监控agent。它会监控所有员工发起的查询,识别失败的查询,并自动分析失败原因:是否需要新的确定性工具、更新技能文件、新建数据库或索引等。然后,这个监控agent会自动编写代码、提交合并请求、让另一个agent进行代码审查、合并并部署。整个过程无需人工干预,使得系统能在夜间自动修复问题,第二天相同查询就能成功。

QTom Blomfield提出的“burn tokens, not headcount”具体含义是什么?

A“消耗Token,而不是堆人头”意味着在未来AI原生的创业公司中,增长的瓶颈可能不再是雇佣更多员工,而是模型Token(即AI计算与调用资源)的使用量、业务上下文的质量以及组织知识的可读性。公司的核心资产和限制因素将转向智能系统的运行效率和数据质量,而非传统的人力规模。

Q在设想的AI原生公司中,人类员工的主要角色和作用是什么?

A在AI原生公司中,人类员工主要扮演“公司大脑”与真实世界交互的边缘角色。他们的作用是处理模型目前尚无法胜任或风险极高的情境,例如:面对陌生复杂的新场景、做出关键的伦理判断、处理高情绪浓度和高风险的人际互动(如联合创始人分家谈判),以及可能在未来一段时间内仍需人类在场的深度销售对话。人类负责将智能系统的决策和知识应用到现实世界中。

你可能也喜欢

从“卖云”到“卖Token”:运营商全面加入AI战场

文章探讨了运营商在AI时代从传统“卖云”和“卖流量”向“卖Token”(词元)的战略转型。中国电信、中国移动和中国联通相继推出了面向个人、家庭和企业的Token套餐,将Token确立为继语音、短信、流量之后的第四大基础通信服务计量单位。这标志着运营商正试图将自己重塑为AI时代的“国家电网”或“总集成商”,提供集成了模型、算力、应用、统一计费和安全合规的端到端AI服务。 其转型背后有双重动因:外部面临互联网云厂商在AI云市场的份额挤压和Token套餐化竞争;内部则因传统通信业务增长放缓,亟需将增长点转向算力、模型等智能业务。为此,运营商构建了包含模型层、算力层、应用层、计费层和安全层的“五层脚手架”,聚合外部模型与自研模型,调度异构算力网络,开发行业智能体,并利用其成熟的计费系统将复杂资源打包为简单套餐。 文章认为,Token套餐的价值在于将AI能力转化为可计量、可结算、易购买的标准化服务,降低了企业使用门槛。如果运营商能成功将“AI接入”打造成电信级服务,AI有望成为像水电一样可便捷采购的生产要素。但挑战依然存在,包括模型效果、成本控制及客户长期付费意愿等。最终竞争关键不在于谁先推出套餐,而在于能否提供稳定、可信、可规模运营的AI基础设施服务。

marsbit15分钟前

从“卖云”到“卖Token”:运营商全面加入AI战场

marsbit15分钟前

DAT失败?押注HYPE的上市公司浮盈12.5亿美元

本文探讨了效仿MicroStrategy(文中以Strategy代指)加密货币财库策略的上市公司现状,重点分析了三家押注Hyperliquid原生代币HYPE的上市公司表现。 由于MicroStrategy在2026年第一季度账面净亏损125亿美元,市场对其可能出售比特币以支付股息的预期概率高达89%。与此同时,几家转型为HYPE财库的上市公司却取得了显著浮盈,总计超过12.5亿美元。 **Hyperliquid Strategies Inc.(股票代码PURR)**:由生物技术公司转型而来,是目前最大的HYPE持仓者,持有约2230万枚HYPE,浮盈约12.2亿美元。公司已完全转型为加密原生财库,并通过推出验证器节点等方式深入参与生态以获取额外收益。 **Hyperion DeFi(股票代码HYPD)**:美国首家上市的HYPE财库公司,持有约200万枚HYPE,浮盈约4940万美元。公司积极构建DeFi生态飞轮,通过质押、借贷等协议增加收入。 **Lion Group Holding(股票代码LGHL)**:一家传统金融服务公司,持有约19.4万枚HYPE,是三家持仓量最小的公司。 文章指出,相比MicroStrategy复杂的融资增持策略,HYPE财库策略更为直接:早期买入并质押,并深度参与Hyperliquid生态系统获取链上收益。这种“价格上涨+链上收益”的模式被认为在当前环境下可能更具优势。随着HYPE价格在本轮周期中表现坚挺,这些财库公司的收益有望进一步增长。

marsbit1小时前

DAT失败?押注HYPE的上市公司浮盈12.5亿美元

marsbit1小时前

交易

现货
合约
活动图片