a16z AI方向合伙人的八年创业笔记

marsbit發佈於 2026-04-26更新於 2026-04-26

文章摘要

a16z AI合伙人回顾八年生成式AI创业历程:从2018年创立Rosebud AI,在GPT尚未出现时押注“合成媒体”领域,通过CycleGAN等早期技术探索AI创意工具。在模型不成熟阶段,团队通过设计交互流程放大“将就但好用”的体验,成功推动Tokkingheads等产品实现自然增长。2023年GPT-4的突破使代码生成趋于成熟,推动文字转游戏等功能的实现。作者指出,当前AI竞争重点已从“证明能做什么”转向能力产品化与商业化,并强调创业者需在实验室技术路径外寻找创新空间。如今作者卸任CEO投身a16z,将专注于投资前沿模型栈及基础设施,支持AI领域创业者。

编者按:本文来自一位生成式 AI 早期创业者的八年复盘。在 GPT 尚未出现的 2018 年,他创立了 Rosebud AI,围绕「让创作像玩游戏一样简单」这一目标,连续推出包括 TokkingHeads 在内的多款 AI 创意工具。在模型能力尚不成熟的阶段,这些产品通过设计流程与交互,放大「将就但好用」的体验,完成了早期用户增长与产品验证。

这段经历,几乎覆盖了生成式 AI 从「合成媒体」到通用能力基础设施的完整演进周期:从 CycleGAN、StyleGAN 的实验性探索,到 GPT-4 打开代码生成与交互式创作的边界,技术进步不断重写产品逻辑与创业节奏。作者的路径也折射出一个更清晰的结构变化——当模型成为变量,真正的分水岭不再只是技术本身,而是如何围绕其构建产品、分发与商业化。

在卸任 CEO 并加入 a16tz 后,作者将转向投资前沿模型栈与相关基础设施。但比个体路径更重要的是,这八年的经验指向一个正在成形的趋势:生成式 AI 的第一阶段(证明能做什么)正在结束,接下来是更长周期的竞争,将围绕能力如何被组织、被产品化,以及最终进入真实世界展开。

以下为原文:

我已加入 a16z,担任合伙人,专注于基础设施和 AI 方向的投资。同时,在执掌 Rosebud AI 8 年后,我也将卸任 CEO 一职。

下面是我对这 8 年的一些回顾与反思。对于当下仍在一线构建的人,我怀有极大的敬意。一次模型的发布,可能吞掉你原本的产品路线图,也可能把它整体提前数年。设计、产品、工程——这些职能的形态,与 3 个月前相比都已发生变化,更不用说与 8 年前相比。技术进步的速度,让这个时代成为最令人兴奋的创业时刻,同时也最具挑战。

在 a16z,我将重点关注前沿模型栈(frontier model stack):包括模型本身,以及围绕模型构建的基础设施与开发工具。我对模型能力的快速演进感到兴奋——越来越多的进展正由 AI 本身驱动。同时,我也看好 AI 在数学与科学领域所带来的突破。此外,由于过去 8 年一直在打造 AI 创意工具,我对这一方向始终抱有特别的兴趣。

在此之前,我也以天使投资人的身份参与过一些种子轮投资,包括 @fal、@periodiclabs、@SakanaAILabs 和 @ExaAILabs。接下来,我很期待能将全部精力投入到支持那些正在构建这一技术栈的创始人身上。

2018:在 GPT 出现之前,押注生成式 AI。

在生成式 AI 领域做一家创业公司,8 年是一段相当漫长的时间。

我从 2018 年末开始,那几乎还是一个「上古时代」,当时这个领域还被称为「合成媒体(synthetic media)」。我在摆弄 CycleGAN 和 StyleGAN,它们生成的内容既奇异又迷人,让我相信:有一天,创作会像玩游戏里的建造模式一样轻盈自如(「rosebud」这个名字也正是来自 The Sims 模拟人生)。

创作在最理想的状态下应该是一种玩耍。而生成式 AI 最早的微光,让我相信,这种「像玩一样的创作体验」可以扩展到更多创作形式中。我开始畅想,生成式 AI 会如何重塑电子游戏(比如我在 2018 年基于《Myst》画面训练的那段 CycleGAN 视频)。

转眼 8 年过去,如今我们已经可以通过一句提示词生成视频、游戏甚至音乐。那个曾经想象中的未来,终于到来——而这还只是开始。

回头看,我之所以能在这么早阶段就形成如此强烈的信念,或许是因为我的人生一直处在技术与艺术的交叉点:一边是数学和深度学习的博士背景,一边是舞蹈和音乐的艺术热情。生成式 AI 的创业恰恰需要两者兼备:技术背景让我看见了正在到来的东西,艺术倾向让我迫不及待地想把它建出来。

创业的旅程总比想象中更长、更艰难。找到一件你近乎非理性地相信的事,才能最大化坚持下去的概率。

2018—2023 年:用"将就好用"打动用户

第三款 iOS 应用 Tokkingheads 界面截图。早期生成式 AI 的核心是设计简洁流程并主动拥抱产品的粗糙感

这一路走来,我们发布了大量产品,目的是磨练对前沿模型能力的直觉,并学会将其包装成能掩盖早期缺陷的魔法体验。那个阶段我领悟到:当模型输出远未完美时,你可以设计出让用户快速迭代、快速反馈的消费级体验。用户挑剔,但不脆弱——用将就好用打动他们就够了。

到第三款移动应用时,我们积累了足够的认知,让 Tokkingheads 实现了自然增长的病毒式传播,数周内用户突破 200 万。下一个关键教训随之而来:作为创始人,你必须清楚什么样的产品形态能让自己长期保持动力。Tokkingheads 本可以走向刷屏爆款的路,但我不确定那是不是把这种创作魔法发展成更完整产品的正确土壤,而那个更完整的产品,才是我真正想要的。

于是我们继续迭代。我们做过 AI 生成图库照片、NFT 配套的 AI 艺术(是的......我天真地以为作品质量才是关键,结果发现真正重要的技能是炒作投机),以及 AI 游戏素材生成工具。每一款产品都教会了我一些具体的东西:用户愿意为什么付费,模型又在以多快的速度改进。夹在这些项目之间的,还有一场全球大流行病,以及硅谷银行与第一共和银行挤兑风波——这些提醒我学会感恩。能够继续构建,本身就是一种特权。

2023 年:代码生成走向成熟

代码生成终于足够好用,时机成熟,可以为非技术创作者打造游戏工具了。GPT-4 发布之后,那个未来变得具体可感。2023 年 3 月,我向团队分享了一份备忘录,并用下面的原型拼凑出 Rosebud 文字转游戏功能的最初版本。

2023 年 3 月 23 日推文截图。我使用 GPT-4 学习 Three.js,结合 Rosebud 生成式 AI 生成天空盒,演示通过文字召唤 3D 场景的早期原型

2023 年初,作者写给团队的内部备忘录,记录代码生成能力突破后的产品判断。这封内部信的核心判断是:AI 正处于一个将决定未来数十年的关键窗口期,而接下来的两年将成为高度激烈的竞争阶段,节奏快、强度高、淘汰明确。公司将全力投入这场「冲刺」,只适合那些具备强烈内在驱动力、愿意承受高压并长期投入的人参与——因为这不仅是一段工作经历,更是一次可能改变个人职业轨迹的历史性机会。

2026 年及以后:你能打造哪些实验室不愿做的东西?

图:演示视频——作者通过提示词在浏览器端搭建 3D 城市模拟游戏

做游戏,需要同时调动创意直觉与技术能力。生成式 AI 是让游戏创作本身变成一种玩耍的关键——无论是图像、视频、世界模型还是代码方面的任何模型进步,都会被立即吸收转化。游戏的商业模式也最有可能留在前沿实验室的视野盲区之外:核心变现路径依然是玩家付费,而建立玩家侧的分发体系,对于奔着 AGI 全速冲刺的实验室来说,似乎是一条过于迂回的支线任务。对于创始人而言,选择构建什么,永远是一场在实验室关键路径之外寻找空间的持续博弈。

Rosebud 势头正旺。我们有机地积累起一批规模庞大、高度活跃的创作者社区。我会怀念在 Discord 上与创作者的闲聊,以及每天处理用户支持邮件的日子(一个愿意投诉的用户,一定是真的在乎你的产品)。下一阶段的重心是扩大玩家端的分发规模,因此现在正是将接力棒交给一直并肩作战的队友的好时机。

祝贺 @glazworks 接任 Rosebud 新任 CEO!他身上罕见地兼备机器学习天赋与产品审美。

Martin Casado(马丁·卡萨多)和 a16z 团队全程陪伴了 Rosebud 的成长。我和 Martin 有过一次关键对话,讨论 JavaScript 是否是 Rosebud 游戏的正确技术栈——选 Unity 或 Roblox 或许更热门,但 JavaScript 的代码生成改进速度要快得多,因为训练数据的可及性更高。这支团队追求真相,愿意押注能够带来更多建设者的赌注。这是走向理想未来的路径:我们必须构建,我们必须创新。

期待从桌子的另一边与大家继续共事。私信随时开放。

相關問答

Q作者在2018年创立Rosebud AI时的核心理念是什么?

A作者在2018年创立Rosebud AI时的核心理念是“让创作像玩游戏一样简单”,通过生成式AI技术降低创作门槛,让创作过程变得轻盈自如,类似于游戏中的建造模式。

QTokkingheads是如何实现早期用户增长的?

ATokkingheads通过设计简洁的用户流程和快速迭代的消费级体验,掩盖了早期模型输出的不完美,以“将就但好用”的体验打动用户,实现了自然增长的病毒式传播,数周内用户突破200万。

Q作者认为生成式AI的第一阶段竞争结束后,接下来的重点是什么?

A作者认为生成式AI的第一阶段(证明能做什么)正在结束,接下来的竞争将围绕能力如何被组织、产品化以及进入真实世界展开,重点是构建产品、分发与商业化。

Q为什么作者选择JavaScript作为Rosebud游戏的技术栈?

A作者选择JavaScript作为Rosebud游戏的技术栈,是因为尽管Unity或Roblox更热门,但JavaScript的代码生成改进速度更快,训练数据的可及性更高,这更符合快速迭代的技术需求。

Q作者在a16z将重点关注哪些投资方向?

A作者在a16z将重点关注前沿模型栈(frontier model stack),包括模型本身、围绕模型构建的基础设施与开发工具,以及AI在数学、科学和创意工具领域的突破。

你可能也喜歡

交易

現貨
合約

熱門文章

什麼是 $S$

理解 SPERO:全面概述 SPERO 簡介 隨著創新領域的不斷演變,web3 技術和加密貨幣項目的出現在塑造數字未來中扮演著關鍵角色。在這個動態領域中,SPERO(標記為 SPERO,$$s$)是一個引起關注的項目。本文旨在收集並呈現有關 SPERO 的詳細信息,以幫助愛好者和投資者理解其基礎、目標和在 web3 和加密領域內的創新。 SPERO,$$s$ 是什麼? SPERO,$$s$ 是加密空間中的一個獨特項目,旨在利用去中心化和區塊鏈技術的原則,創建一個促進參與、實用性和金融包容性的生態系統。該項目旨在以新的方式促進點對點互動,為用戶提供創新的金融解決方案和服務。 SPERO,$$s$ 的核心目標是通過提供增強用戶體驗的工具和平台來賦能個人。這包括使交易方式更加靈活、促進社區驅動的倡議,以及通過去中心化應用程序(dApps)創造金融機會的途徑。SPERO,$$s$ 的基本願景圍繞包容性展開,旨在彌合傳統金融中的差距,同時利用區塊鏈技術的優勢。 誰是 SPERO,$$s$ 的創建者? SPERO,$$s$ 的創建者身份仍然有些模糊,因為公開可用的資源對其創始人提供的詳細背景信息有限。這種缺乏透明度可能源於該項目對去中心化的承諾——這是一種許多 web3 項目所共享的精神,優先考慮集體貢獻而非個人認可。 通過將討論重心放在社區及其共同目標上,SPERO,$$s$ 體現了賦能的本質,而不特別突出某些個體。因此,理解 SPERO 的精神和使命比識別單一創建者更為重要。 誰是 SPERO,$$s$ 的投資者? SPERO,$$s$ 得到了來自風險投資家到天使投資者的多樣化投資者的支持,他們致力於促進加密領域的創新。這些投資者的關注點通常與 SPERO 的使命一致——優先考慮那些承諾社會技術進步、金融包容性和去中心化治理的項目。 這些投資者通常對不僅提供創新產品,還對區塊鏈社區及其生態系統做出積極貢獻的項目感興趣。這些投資者的支持強化了 SPERO,$$s$ 作為快速發展的加密項目領域中的一個重要競爭者。 SPERO,$$s$ 如何運作? SPERO,$$s$ 採用多面向的框架,使其與傳統的加密貨幣項目區別開來。以下是一些突顯其獨特性和創新的關鍵特徵: 去中心化治理:SPERO,$$s$ 整合了去中心化治理模型,賦予用戶積極參與決策過程的權力,關於項目的未來。這種方法促進了社區成員之間的擁有感和責任感。 代幣實用性:SPERO,$$s$ 使用其自己的加密貨幣代幣,旨在在生態系統內部提供多種功能。這些代幣使交易、獎勵和平台上提供的服務得以促進,增強了整體參與度和實用性。 分層架構:SPERO,$$s$ 的技術架構支持模塊化和可擴展性,允許在項目發展過程中無縫整合額外的功能和應用。這種適應性對於在不斷變化的加密環境中保持相關性至關重要。 社區參與:該項目強調社區驅動的倡議,採用激勵合作和反饋的機制。通過培養強大的社區,SPERO,$$s$ 能夠更好地滿足用戶需求並適應市場趨勢。 專注於包容性:通過提供低交易費用和用戶友好的界面,SPERO,$$s$ 旨在吸引多樣化的用戶群體,包括那些以前可能未曾參與加密領域的個體。這種對包容性的承諾與其通過可及性賦能的總體使命相一致。 SPERO,$$s$ 的時間線 理解一個項目的歷史提供了對其發展軌跡和里程碑的關鍵見解。以下是建議的時間線,映射 SPERO,$$s$ 演變中的重要事件: 概念化和構思階段:形成 SPERO,$$s$ 基礎的初步想法被提出,與區塊鏈行業內的去中心化和社區聚焦原則密切相關。 項目白皮書的發布:在概念階段之後,發布了一份全面的白皮書,詳細說明了 SPERO,$$s$ 的願景、目標和技術基礎設施,以吸引社區的興趣和反饋。 社區建設和早期參與:積極進行外展工作,建立早期採用者和潛在投資者的社區,促進圍繞項目目標的討論並獲得支持。 代幣生成事件:SPERO,$$s$ 進行了一次代幣生成事件(TGE),向早期支持者分發其原生代幣,並在生態系統內建立初步流動性。 首次 dApp 上線:與 SPERO,$$s$ 相關的第一個去中心化應用程序(dApp)上線,允許用戶參與平台的核心功能。 持續發展和夥伴關係:對項目產品的持續更新和增強,包括與區塊鏈領域其他參與者的戰略夥伴關係,使 SPERO,$$s$ 成為加密市場中一個具有競爭力和不斷演變的參與者。 結論 SPERO,$$s$ 是 web3 和加密貨幣潛力的見證,能夠徹底改變金融系統並賦能個人。憑藉對去中心化治理、社區參與和創新設計功能的承諾,它為更具包容性的金融環境鋪平了道路。 與任何在快速發展的加密領域中的投資一樣,潛在的投資者和用戶都被鼓勵進行徹底研究,並對 SPERO,$$s$ 的持續發展進行深思熟慮的參與。該項目展示了加密行業的創新精神,邀請人們進一步探索其無數可能性。儘管 SPERO,$$s$ 的旅程仍在展開,但其基礎原則確實可能影響我們在互聯網數字生態系統中如何與技術、金融和彼此互動的未來。

85 人學過發佈於 2024.12.17更新於 2024.12.17

什麼是 $S$

什麼是 AGENT S

Agent S:Web3中自主互動的未來 介紹 在不斷演變的Web3和加密貨幣領域,創新不斷重新定義個人如何與數字平台互動。Agent S是一個開創性的項目,承諾通過其開放的代理框架徹底改變人機互動。Agent S旨在簡化複雜任務,為人工智能(AI)提供變革性的應用,鋪平自主互動的道路。本詳細探索將深入研究該項目的複雜性、其獨特特徵以及對加密貨幣領域的影響。 什麼是Agent S? Agent S是一個突破性的開放代理框架,專門設計用來解決計算機任務自動化中的三個基本挑戰: 獲取特定領域知識:該框架智能地從各種外部知識來源和內部經驗中學習。這種雙重方法使其能夠建立豐富的特定領域知識庫,提升其在任務執行中的表現。 長期任務規劃:Agent S採用經驗增強的分層規劃,這是一種戰略方法,可以有效地分解和執行複雜任務。此特徵顯著提升了其高效和有效地管理多個子任務的能力。 處理動態、不均勻的界面:該項目引入了代理-計算機界面(ACI),這是一種創新的解決方案,增強了代理和用戶之間的互動。利用多模態大型語言模型(MLLMs),Agent S能夠無縫導航和操作各種圖形用戶界面。 通過這些開創性特徵,Agent S提供了一個強大的框架,解決了自動化人機互動中涉及的複雜性,為AI及其他領域的無數應用奠定了基礎。 誰是Agent S的創建者? 儘管Agent S的概念根本上是創新的,但有關其創建者的具體信息仍然難以捉摸。創建者目前尚不清楚,這突顯了該項目的初期階段或戰略選擇將創始成員保密。無論是否匿名,重點仍然在於框架的能力和潛力。 誰是Agent S的投資者? 由於Agent S在加密生態系統中相對較新,關於其投資者和財務支持者的詳細信息並未明確記錄。缺乏對支持該項目的投資基礎或組織的公開見解,引發了對其資金結構和發展路線圖的質疑。了解其支持背景對於評估該項目的可持續性和潛在市場影響至關重要。 Agent S如何運作? Agent S的核心是尖端技術,使其能夠在多種環境中有效運作。其運營模型圍繞幾個關鍵特徵構建: 類人計算機互動:該框架提供先進的AI規劃,力求使與計算機的互動更加直觀。通過模仿人類在任務執行中的行為,承諾提升用戶體驗。 敘事記憶:用於利用高級經驗,Agent S利用敘事記憶來跟蹤任務歷史,從而增強其決策過程。 情節記憶:此特徵為用戶提供逐步指導,使框架能夠在任務展開時提供上下文支持。 支持OpenACI:Agent S能夠在本地運行,使用戶能夠控制其互動和工作流程,與Web3的去中心化理念相一致。 與外部API的輕鬆集成:其多功能性和與各種AI平台的兼容性確保了Agent S能夠無縫融入現有技術生態系統,成為開發者和組織的理想選擇。 這些功能共同促成了Agent S在加密領域的獨特地位,因為它以最小的人類干預自動化複雜的多步任務。隨著項目的發展,其在Web3中的潛在應用可能重新定義數字互動的展開方式。 Agent S的時間線 Agent S的發展和里程碑可以用一個時間線來概括,突顯其重要事件: 2024年9月27日:Agent S的概念在一篇名為《一個像人類一樣使用計算機的開放代理框架》的綜合研究論文中推出,展示了該項目的基礎工作。 2024年10月10日:該研究論文在arXiv上公開,提供了對框架及其基於OSWorld基準的性能評估的深入探索。 2024年10月12日:發布了一個視頻演示,提供了對Agent S能力和特徵的視覺洞察,進一步吸引潛在用戶和投資者。 這些時間線上的標記不僅展示了Agent S的進展,還表明了其對透明度和社區參與的承諾。 有關Agent S的要點 隨著Agent S框架的持續演變,幾個關鍵特徵脫穎而出,強調其創新性和潛力: 創新框架:旨在提供類似人類互動的直觀計算機使用,Agent S為任務自動化帶來了新穎的方法。 自主互動:通過GUI自主與計算機互動的能力標誌著向更智能和高效的計算解決方案邁進了一步。 複雜任務自動化:憑藉其強大的方法論,能夠自動化複雜的多步任務,使過程更快且更少出錯。 持續改進:學習機制使Agent S能夠從過去的經驗中改進,不斷提升其性能和效率。 多功能性:其在OSWorld和WindowsAgentArena等不同操作環境中的適應性確保了它能夠服務於廣泛的應用。 隨著Agent S在Web3和加密領域中的定位,其增強互動能力和自動化過程的潛力標誌著AI技術的一次重大進步。通過其創新框架,Agent S展現了數字互動的未來,為各行各業的用戶承諾提供更無縫和高效的體驗。 結論 Agent S代表了AI與Web3結合的一次大膽飛躍,具有重新定義我們與技術互動方式的能力。儘管仍處於早期階段,但其應用的可能性廣泛且引人入勝。通過其全面的框架解決關鍵挑戰,Agent S旨在將自主互動帶到數字體驗的最前沿。隨著我們深入加密貨幣和去中心化的領域,像Agent S這樣的項目無疑將在塑造技術和人機協作的未來中發揮關鍵作用。

680 人學過發佈於 2025.01.14更新於 2025.01.14

什麼是 AGENT S

如何購買S

歡迎來到HTX.com!在這裡,購買Sonic (S)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買Sonic (S)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的Sonic (S)購買Sonic (S)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易Sonic (S)在HTX的現貨市場輕鬆交易Sonic (S)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

1.4k 人學過發佈於 2025.01.15更新於 2025.03.21

如何購買S

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 S (S)幣價的意見。

活动图片