Karpathy又封神，掀翻RAG，把你的笔记变成第二大脑

marsbit发布于2026-07-01更新于2026-07-01

文章摘要

前OpenAI联合创始人安德烈·卡帕西提出了一种突破性的知识管理新范式“LLM-Wiki”，旨在解决信息过载时代个人知识库沦为“赛博木乃伊”的困境。他主张将个人笔记视为“不可变源代码”，而让大语言模型扮演“编译器”角色，将其一次性编译成结构化、逻辑自洽且持续更新的个人维基百科。这一方法从根本上区别于当前主流的检索增强生成技术。RAG在每次查询时临时检索片段拼凑答案，存在无法理解全局、可能自我矛盾、知识链接易腐烂等问题。卡帕西的范式则将知识“编译”一次后持续保鲜，每次新增材料，AI会自动融合更新相关条目、修订综述、标记矛盾，使知识库始终保持鲜活与一致性。其架构核心在于三层解耦：底层是记录原始灵感的“素材层”，中层是由用户定义格式的“规则层”，顶层则是由AI全权维护、结构化的“维基层”。用户日常只需进行三项操作：投入新素材、查询编译后的知识库，或定期让AI进行知识库“体检”以排查矛盾与缺口。这实现了认知生产关系的根本转移——人类从繁琐的知识搬运、整理与维护工作中解放出来，专注于核心的输入与审阅，而AI则承担了所有“记账”类杂活。文章指出，这一构想实质上实现了计算机先驱范内瓦·布什在1945年设想的“Memex”记忆机器的愿景，其长久未能实现的核心障碍在于人工维护交叉引用与知识路径的成本过高。大语言模型的出现，近乎零成本地解决了这一维护难题。卡帕西的“LLM-Wiki”是其关于人机协作系列思考的第三块拼图，其最终目的并非替代人类，而是将人类的注意力从机械的“记账”工作中解放出来，重新聚焦于决定阅读方向与思考深层意义这两件机器无法替代的事情上。

收藏不等于拥有,高亮不等于理解。

那些凌晨两点让你心潮澎湃的深度好文,那些在Obsidian里拉出的密密麻麻的双向链接,那些在Notion里精心排版的数据库,都是躺在笔记软件里的「赛博木乃伊」。

图谱看似壮观,实则早已腐朽。

这是整个信息过载时代的系统性失败。

现Anthropic工程师、前OpenAI联合创始人、Tesla前AI总监Karpathy,看不下去了,扔下一枚炸弹。

传送门:https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f

他没有宣布新模型,没有发布新框架,他只是说:把你的笔记当成不可变源代码,让LLM做编译器。

两个月过去,这份文档已经在Obsidian、Claude、Cursor社区掀起一场静默却剧烈的迁移。

有人已经把自己的Wiki扩展到上百页、数十万字。

自动化插件开始出现。学术研究者、独立创业者、终身学习者正在集体转向一种全新的知识生产关系。

RAG的黄昏,信息搬运救不了你的思想

在LLM-WIKI出现之前,主流的解决方案是RAG(检索增强生成)。

简单说,就是给大模型配一个「翻找员」:当你提问时,它去你的笔记里搜几个片段,然后拼凑出一个答案。

听起来很美,但用过的人都知道那种「卖家秀」与「买家秀」的落差。

它只是搬运工:RAG只能处理局部,无法理解全局。

它能告诉你第5篇笔记提到了A,但它无法告诉你这500篇笔记共同指向的底层逻辑。

它会「人格分裂」:如果你半年前认为A是对的,昨天却写笔记反驳了A,RAG往往会陷入自我矛盾,吐出一堆逻辑混乱的废话。

图谱腐烂:手动维护的知识链接,就像没有自动清理功能的代码。日子久了,断头链接随处可见,检索效率呈指数级下降。

Karpathy的直觉非常犀利:搜索和检索是人类无能的表现。我们需要的是「共识」,是「结构」,是「真相」。

把知识当源代码,让LLM当编译器

Karpathy的答案,来自一个程序员每天都在做、却从没往知识上想过的动作:编译。

你写好一段源代码,不会每次运行程序都重新读一遍代码。

你把它编译成一个二进制文件,编译这一次很费劲,但之后每次运行都飞快。编译的成本,被之后成千上万次使用摊平了。

知识为什么不能这么干?

Karpathy说,把你的原始笔记当成不可修改的源代码,把LLM当成编译器,让它一次性把这堆乱七八糟的材料「编译」成一个结构化、互相链接的Wiki。

每加一篇新材料,AI就做一次融合:更新相关的条目页、修订综述、把新数据和旧结论打架的地方标出来、顺手加固或挑战已有的判断。

关键的差别在这里:知识被编译一次,然后持续保鲜,而不是每次查询临时重建。

等你来提问的时候,交叉引用早就在那了,矛盾早就被标过了,综述早就反映了你读过的一切。

你不会每次跑程序都重编译一遍源代码。那为什么每次提问,都要让AI重读一遍你的笔记?

认知生产关系的根本转移

在他的LLM-WIKI框架里,笔记不再是死文字,而是「源代码」。

大模型不再是查字典的翻译官,而是「编译器」。

这套架构极其精妙地实现了三层解耦:

1、Raw层(原始素材):这是你的灵感原矿。你随手记下的感悟、剪辑的文章、会议纪要。它是「不可变」的,保持了人类输入的原始性和不洁感。

2、Schema层(知识宪法):这是你写给AI的「军规」。比如你规定:每一个人物词条必须包含「动机、局限性、关键成就」;每一个技术栈必须说明「优缺点」。

3、Wiki层(编译成品):这是AI全权维护的区域。它根据你的Schema,把那堆乱七八糟的Raw编译成结构化、交叉链接、逻辑自洽的百科页面。

日常就三个动作:

1、Ingest(摄入):丢一篇新料进去,AI 读完、跟你过一遍要点、写摘要、横扫整个库更新相关页——一篇来源,可能牵动十几个页面。

2、Query(查询):直接问编译好的 Wiki,带引用作答。最妙的是:好答案能直接回档成新页,你的每一次探索也在复利。

3、Lint(体检):定期让 AI 像做代码审查一样自查——找矛盾、找过时论断、找没人链接的孤立页、找该补的缺口。早期就清,不让库越长越腐。

你不再是知识的搬运工,而是这个智慧帝国的架构师。

你只负责输入和最后的审阅,AI负责所有的「杂活」:整理、对齐、交叉链接、矛盾检测。

这是认知生产关系的根本转移。

这不是另一个聊天机器人。ChatGPT了解互联网,LLM-Wiki了解你——准确说,是你教给它的东西。

每个回答都带着 [wiki-links] 回到你的知识图谱。每条回复都是一条探索路径的起点,而不是终点。

迟到了80年的发明

到这儿,你可能觉得这不就是个聪明的工作流吗?

不止。

Karpathy在gist结尾,轻飘飘地点了一个名字:Vannevar Bush,和他1945年那篇《As We May Think》。

1945年,二战刚结束,这位美国科学界的大佬,幻想了一台叫「Memex」的机器:

一张机械书桌,能存下你所有的书、记录、通信,并在相关条目之间,建立起「联想路径」——文档与文档之间的连接,和文档本身一样宝贵。

听着耳熟吗?这几乎就是LLM-Wiki的逐字描述。

Bush的愿景,其实比后来的万维网更接近这个东西:私密的、亲手策展的、连接即价值的知识网络。

那为什么Memex八十年没造出来?

因为Bush卡在了一个他解决不了的问题上——谁来维护?

每一条联想路径,都得手工建立。每一个交叉引用,都得有人去连。

Bush幻想着有专门的「操作员」为你在知识里铺设小径。

可现实是,没有任何人能在大规模上坚持做这件枯燥的苦役。人类会放弃维护,因为维护的成本,永远比它带来的价值涨得更快。

Karpathy这句话,是整个范式的题眼:维护一座知识库最累的部分,从来不是阅读,是记账。

更新交叉引用,保持摘要新鲜,标注新数据和旧结论的冲突,让几十个页面之间始终一致。这种枯燥,足以劝退所有人。

而大模型,不会忘记更新某一个交叉引用,可以一口气改动15个文件。

它不会累。不会烦。不会被深夜拖垮。维护成本,被压到了近乎为零。

于是,那台卡了人类八十年的机器,突然就转起来了。

被解放的,是人类的注意力

回头看,LLM-Wiki是Karpathy关于「人机协作」的第三块拼图,也是最克制的一块。

第一块,Vibe Coding(2025年2月):接受AI写的代码,不逐行审,信模型,测结果。

第二块,Agentic Engineering(2026年1月):人类编排AI智能体,而不是自己敲代码。

第三块,LLM Knowledge Bases(2026年4月):AI管理的不再只是代码,而是知识本身。

在这套新范式里,人类被剥掉的,是收藏、整理、链接、记账这些谁都不爱干的杂活。

人类被留下的,只剩两件事:决定读什么,以及,想清楚这一切到底意味着什么。这恰恰是机器至今做不了、也最不该替你做的两件事。

这是一个工具进化到极致,最终绕了一圈,把人类的注意力还给人类自己的故事。

那张朴素到欠揍的markdown文件,没发模型,没刷榜单。

它只是安静地提醒了一句:你的大脑,本就不该用来记账。

本文来自微信公众号“新智元”,作者:ASI启示录

你可能也喜欢

Collector Crypt 如何用「循环买回」制造增长幻觉

《Collector Crypt 如何用「循环买回」制造增长幻觉》摘要文章分析指出，Collector Crypt（CC）表面上是通过链上卡包抽卡推动增长，但其核心模式依赖“循环买回”——用户购买卡包后立即以约93%的价格卖回给平台，资金得以循环，从而快速推高GMV（商品交易总额）。然而，这种增长存在幻觉。数据显示，CC的净利率已从2025年第三季度的11.2%腰斩至2026年第二季度的5.6%。GMV的增长主要来自高价位卡包（如250美元、1000美元和2500美元档位），但这些卡包为平台带来的每美元留存率反而更低。增长主要由少数高频、大额消费的钱包驱动，而非广泛用户基础扩大。同时，实体卡牌赎回消耗了大量利润。2026年5月，赎回成本消耗了该月平台预烧净收入的41.6%。而且赎回活动高度集中，6月仅75个钱包执行了赎回，其中前四大用户就占了近一半。赎回使卡牌永久离开平台库存，迫使CC以可能更高的市场成本重新采购，增加了运营压力。面对GameStop等强大竞争对手进入同一市场、评级成本上升等压力，CC的经济模型显得脆弱。其B2B合作伙伴策略目前也未能带来可持续的订阅式收入，大部分整合仍将库存和履约负担留在CC身上。结论认为，CC需要证明其能吸引更广泛的收藏者、建立更深的二级市场，并使链上所有权真正创造价值，而非仅仅依赖“循环买回”来制造GMV增长的表面繁荣。

Foresight News8分钟前

Polygon今年销毁超1.07亿枚POL——为何其价格仍在暴跌？

Polygon（POL）在2026年已销毁超过1.07亿枚POL代币，网络活动强劲，5月稳定币支付量达1.98亿笔，甚至超过Solana等网络。尽管销毁量高于新增铸造量，使供应呈净通缩，且有大额质押和鲸鱼转账显示信心，但POL价格近期仍跌破0.07161美元支撑位，目前交易于0.06948美元附近。价格疲软主要源于技术面弱势：自2024年底以来持续下跌，并进入三角整理形态，卖压显著，累计成交量差（CVD）显示已有67万POL被抛售至交易所。因此，尽管基本面改善，技术性抛售仍导致价格停滞。

ambcrypto9分钟前

ambcrypto9分钟前

灰度最新研究：Solana 的下一个增长引擎是什么？

灰度最新发布研究报告《Solana：加密金融集市》，重新评估Solana的价值逻辑。报告指出，Solana正从单纯的高性能公链演变为承载大规模经济活动的应用平台。公链竞争的核心已从比拼TPS转向比拼真实经济活动。报告重点分析了三个代表性应用：Jupiter作为DeFi流动性枢纽；Pump.fun虽具Meme属性，但验证了吸引海量用户和创造稳定收入的能力；Helium等DePIN项目则连接现实世界基础设施，拓宽应用边界。这三者共同勾勒出Solana通过金融、消费应用和实体连接实现增长的新路径。Solana基金会近期也强调将重点发展AI Agent支付、稳定币、现实世界资产（RWA）和资产代币化等方向，旨在构建长期、可持续的增长模型。机构重新关注Solana，源于其应用层商业模式逐渐成熟、支付生态完善及开发者生态保持活跃。然而，Solana仍面临价值捕获、生态可持续性及与其他公链竞争等挑战。未来，其长期价值将取决于能否持续吸引开发者和用户，并孕育出更多具有网络效应和商业价值的应用。

marsbit29分钟前

marsbit29分钟前

为了赚这笔钱，他们等了7年

多家支付和科技巨头（Visa、Stripe、万事达、Coinbase、BlackRock等）宣布组建联盟，计划推出名为“Open USD”的美元稳定币，并将储备收益分给采用该币的公司。此举直接冲击了稳定币公司Circle的商业模式，因其主要收入依赖USDC储备资产的利息，导致其股价单日大跌近20%。这让人想起2019年Facebook主导的Libra项目。当时，类似的巨头联盟试图创建全球数字货币，但因监管压力、Facebook形象问题及联盟内部分歧而失败。然而，Libra的愿景并未消失。七年间，监管框架（如美国GENIUS法案）逐渐明晰，公链等基础设施成熟，支付公司也已积累相关经验。Open USD的叙事更为收敛，聚焦于合规的美元稳定币和企业结算管道，不再像Libra那样充满宏大但敏感的全球金融变革野心。不过，联盟模式固有的行动缓慢、利益协调困难等挑战依然存在。稳定币的成功关键在于建立流动性、信任和用户习惯，而非一纸华丽的成员名单。Open USD短期内更可能在企业间支付和特定链上场景中取得进展，而非迅速取代USDC。对Circle而言，市场正在重新评估其价值：它从“稳定币时代的稀缺门票”被拉回至“众多发行方之一”的竞争现实，其依赖单一收入模型（储备利息）和外部合作伙伴分发的脆弱性因此暴露。Open USD的出现，标志着稳定币领域从早期探索进入巨头合规入场、竞争加剧的新阶段。

marsbit29分钟前

marsbit29分钟前

谷歌风雨飘摇，市值蒸发数千亿美元，Gemini Spark能救场吗？

最近，谷歌陷入内忧外患，核心人才接连流失：Transformer架构师Noam Shazeer、AlphaFold主导者John Jumper，以及Gemini预训练和编程核心贡献者Jonas Adler、Alexander Pritzel相继离职，分别投身OpenAI和Anthropic。资本市场迅速反应，Alphabet股价两天内下跌5%-6%，市值蒸发数千亿美元，反映出市场对谷歌能否留住顶尖人才的深层担忧。与此同时，谷歌产品节奏也面临挑战，备受期待的Gemini 3.5 Pro再次推迟发布。在此背景下，谷歌推出了新的AI产品Gemini Spark。与普通聊天机器人不同，Spark作为云端持续运行的智能体，能深度集成Gmail、日历、文档等谷歌Workspace套件，根据用户设定的目标自动分解任务、跨应用执行工作流，并能通过协议连接外部服务。其目标是为用户提供一个“永不停机的数字员工”。然而，其目前仅面向每月100美元的Google AI Ultra用户开放，高价策略引发争议。分析认为，谷歌手握最完善的生产力工具生态，本应是开发“AI劳动力”或智能体的天然赢家，但因大公司的谨慎和对风险的规避，反而在Agent竞赛中落后于OpenAI、Anthropic及众多创业公司。Spark的推出标志着谷歌终于放手让AI深入生产力环节，但能否借此挽回颓势、弥补人才流失的损失，并支撑其下一个十年，仍是巨大疑问。

marsbit53分钟前

marsbit53分钟前

交易

现货

Karpathy又封神，掀翻RAG，把你的笔记变成第二大脑

文章摘要

RAG的黄昏,信息搬运救不了你的思想

把知识当源代码,让LLM当编译器

认知生产关系的根本转移

迟到了80年的发明

被解放的,是人类的注意力

热门币种推荐

相关问答

你可能也喜欢

Collector Crypt 如何用「循环买回」制造增长幻觉

Polygon今年销毁超1.07亿枚POL——为何其价格仍在暴跌？

灰度最新研究：Solana 的下一个增长引擎是什么？

为了赚这笔钱，他们等了7年

谷歌风雨飘摇，市值蒸发数千亿美元，Gemini Spark能救场吗？

交易

热门文章

如何购买S

Sonic：Andre Cronje主导升级，逆势上涨的Layer1新星

成长学院：学习“ Sonic“ ，瓜分价值 1000 USDT

相关讨论

热门问答

热门分类

热门标签