Biên dịch & Tổng hợp: Shenchao TechFlow
Người dẫn chương trình: Ejaaz Ahamadeen (EJ), Josh Kale (Josh)
Tiêu đề gốc: What The Best AI Investors Are Buying Right Now
Nguồn podcast: Limitless Podcast
Ngày phát sóng: 28 tháng 5 năm 2026
Lời dẫn của biên tập viên
Tập podcast này chủ yếu thảo luận về triết lý đầu tư của Gavin Baker, người sáng lập Atreides Management, một nhà đầu tư đã rót vốn dài hạn vào Nvidia và Cerebras. Phán đoán cốt lõi của ông là, AI không phải là bong bóng, mà là một siêu chu kỳ hạ tầng được thúc đẩy bởi sự kết hợp của điện năng, wafer và sức mạnh tính toán; lợi nhuận vượt trội thực sự không nằm ở các mô hình lớn hay chatbot, mà nằm ở các khâu "người bán cuốc xẻng" như kết nối GPU, bộ nhớ, chip suy luận, quy trình sản xuất tiên tiến và cung cấp điện năng.
Gavin Baker một mặt phòng ngừa rủi ro điều chỉnh tổng thể thị trường thông qua quyền chọn bán (put) QQQ, mặt khác tập trung đầu tư vào các tài sản 'nút thắt vật lý' của AI như Astera Labs, Unity, Micron, Nvidia, Cerebras, Positron. Ông kéo cuộc tranh luận về "bong bóng AI" từ cấp độ cảm xúc trở về với các ràng buộc cung-cầu, cho rằng chỉ cần TSMC, ASML, bộ nhớ băng thông cao và lưới điện không thể nhanh chóng trở nên dư thừa, thì chi tiêu vốn (CapEx) cho AI chưa chắc đã là sự lặp lại của bong bóng Internet năm 2000.
Trích dẫn tinh túy
Bong bóng AI hay Siêu chu kỳ?
- "AI không ở trong bong bóng; ngược lại, nó đang ở trong một siêu chu kỳ."
- "Lợi nhuận lớn nhất không nằm ở SaaS, không nằm ở các chatbot như OpenAI hay Anthropic, mà nằm ở điện năng, sức mạnh tính toán và sản xuất wafer."
- "Đây không phải là bong bóng Internet, bởi vì người mua chủ yếu là những công ty thông minh nhất, mạnh nhất về dòng tiền toàn cầu, họ không mua sức mạnh tính toán bằng đòn bẩy nợ."
- "Nếu toàn bộ thị trường không thể bị cung ứng quá mức, thì rất khó để nó đột ngột vỡ tung như một bong bóng truyền thống."
Các nút thắt thực sự: Điện năng, Wafer, Token
- "Lý thuyết của Gavin rất đơn giản, chỉ nhìn vào các nút thắt ở tầng hạ tầng AI, ai có thể tăng hiệu suất trên mỗi watt, giảm chi phí token, người đó sẽ có giá trị."
- "Các phòng thí nghiệm AI ngày càng quan tâm đến một điều: mỗi watt điện cuối cùng có thể tạo ra bao nhiêu token."
- "Điện năng và wafer là hai bức tường gạch, cũng là hai ràng buộc then chốt hạn chế AI tăng tốc quá nhanh."
Chuyển từ Huấn luyện Trước sang Suy luận và Huấn luyện Sau
- "Sau khi mô hình được huấn luyện trước, không có nghĩa là nó sẽ là thiên tài suốt đời; nó vẫn cần hấp thụ thông tin mới ở giai đoạn huấn luyện sau."
- "Về bản chất, suy luận đòi hỏi một lượng lớn tính toán, đó cũng là lý do tại sao chip suy luận và hạ tầng suy luận sẽ trở thành trọng tâm của giai đoạn tiếp theo."
- "Chỉ riêng cơ hội về chi phí hoặc doanh thu từ suy luận, có thể gấp 5 đến 10 lần đầu tư vào sức mạnh tính toán cho huấn luyện trước."
Mô hình Nhỏ Chuyên Sâu, Mô hình Phía Thiết Bị và Hạ Tầng Chủ Quyền
- "Trong tương lai, bạn không nhất thiết phải tương tác với Claude mỗi ngày; thứ bạn thực sự cần có thể là một đại lý AI cá nhân hóa được huấn luyện dựa trên dữ liệu của chính mình."
- "Tốc độ triển khai hạ tầng chính là hào rào bảo vệ, tốc độ lặp lại của thế giới số, nhanh hơn rất nhiều so với tốc độ xây dựng hạ tầng vật lý."
"Ai có thể rút ngắn việc triển khai vật lý cần vài tháng, vài năm xuống còn vài tuần, người đó có thể bán được giá rất cao trong hạ tầng AI."
Cách Đầu Tư Của Gavin: Mua Vào Nút Thắt, Bán Khống Rủi Ro Thị Trường Tổng Thể
- "Ông ấy tin tưởng mạnh mẽ rằng người chiến thắng trong AI sẽ xuất hiện, nhưng điều đó không có nghĩa là ông ấy lạc quan về toàn bộ thị trường; quyền chọn bán QQQ là biện pháp phòng ngừa rủi ro giảm tổng thể của ông."
- "TSMC thực tế đang hạn chế tốc độ tăng tốc của bong bóng; chỉ cần năng lực sản xuất chip không thể mở rộng ngay lập tức, chi tiêu vốn sẽ không dễ mất kiểm soát."
- "Gavin giống như một Leopold già dặn hơn, vững vàng hơn, và có thành tích vượt qua chu kỳ hơn: thành công của người trước được tính bằng thập kỷ, trong khi người sau hiện tại được tính nhiều hơn bằng quý."
Tài sản đáng đầu tư trong siêu chu kỳ AI
EJ: Gavin Baker là một nhà đầu tư AI cực kỳ hiệu quả, nhưng hầu như công chúng không biết đến. Trong 20 năm qua, ông đã đầu tư vào một số công ty AI sau này trở nên nổi tiếng từ rất sớm, trước khi chúng trở nên phổ biến. Ông đã đầu tư sớm vào Nvidia (nhà cung cấp GPU AI và tính toán tăng tốc cốt lõi), cũng như Cerebras (công ty chip AI), và có một quan điểm rất rõ ràng: AI không phải là bong bóng, mà ngược lại, nó là một siêu chu kỳ.
Ông cho rằng, chỉ cần quan sát watt (điện năng), wafer (tấm wafer) và token (đơn vị tính toán và tạo sinh mô hình), tức là hạ tầng cơ sở của AI, có thể xác định được các nút thắt và ràng buộc then chốt. Kết luận của ông rất đơn giản, lợi nhuận lớn nhất trong AI đến từ điện năng, năng lượng và sản xuất wafer, không liên quan nhiều đến SaaS (phần mềm như một dịch vụ), cũng không liên quan nhiều đến các chatbot như Anthropic hay OpenAI. Toàn bộ ngành công nghiệp cuối cùng sẽ truyền dẫn xuống hạ nguồn đến chất bán dẫn, tức là các tài sản 'bán cuốc xẻng' hỗ trợ toàn bộ ngành AI.
Khi nhiều người nói rằng ngành AI đã là bong bóng, ông lại cho rằng đây chính xác là một cơ hội mua vào cấp thế hệ, đặc biệt là hạ tầng AI. Ông thể hiện phán đoán này trong quỹ với quy mô khoảng 4,1 tỷ USD.
Nếu bạn nghe thấy những ràng buộc mà ông đề cập, đặc biệt là hạ tầng AI, bạn sẽ thấy lý thuyết này rất quen thuộc. Chúng tôi đã nhiều lần nói về một nhà đầu tư tên là Leopold Aschenbrenner trong chương trình trước đây, ông ấy cũng đã phân bổ nhiều xung quanh các hướng tương tự. Sự khác biệt là, Leopold mới làm khoảng 3 năm, còn Gavin đã làm hơn 20 năm.
Quy mô tài sản quản lý của Leopold lớn hơn khoảng ba lần so với Gavin, nhưng biên tập viên Luke đã nhắc một câu rất hay: Bạn có thể vượt mặt Warren Buffett trong một năm, nhưng bạn có thể liên tục vượt mặt ông ấy trong vài thập kỷ không? Thành tích lịch sử của Gavin Baker cho thấy, ông có thể có góc nhìn khác về lý thuyết đầu tư này.
Những người không biết Gavin Baker có thể biết một điều, ông là người sáng lập Atreides Management (quỹ đầu tư), đã đầu tư vào Nvidia trong suốt 20 năm qua. Nếu bạn giữ Nvidia trong 20 năm mà vẫn tiếp tục làm việc, bản thân điều đó đã rất phi thường, bởi vì nó hẳn đã mang lại lợi nhuận cực kỳ ấn tượng.
Một số chiến thắng gần đây của ông bao gồm Cerebras và Astera Labs (công ty chip kết nối trung tâm dữ liệu AI). Cerebras là công ty chip AI, chương trình đề cập rằng sau IPO, định giá của nó cao đến mức kinh ngạc. Còn một số công ty bạn có thể chưa từng nghe đến, chúng tôi sẽ dõi theo danh mục và phán đoán của ông trong tập này để xem ông nghĩ cơ hội đầu tư AI thực sự nằm ở đâu.
Vậy câu hỏi trở thành, ông ấy đã đầu tư vào cái gì và tại sao? Nếu xem 13F (hồ sơ tiết lộ nắm giữ hàng quý của nhà đầu tư tổ chức Mỹ) gần đây của Atreides Management, quỹ này có AUM (Tổng tài sản quản lý) khoảng 4 tỷ USD. Khi tách ra một số vị thế nắm giữ lớn nhất, bạn sẽ thấy những công ty này đều hướng đến các nút thắt phát triển AI mà Gavin nhiều lần đề cập.
Ông có vị thế lớn trong một số công ty không hấp dẫn lắm, nhiều người thậm chí chưa từng nghe đến. Ví dụ, Astera Labs chiếm gần 9% đến 10% quỹ. Bạn có thể hiểu Astera Labs như tầng kết nối giữa các GPU. Nếu tưởng tượng một trung tâm dữ liệu như một hệ thống, GPU là động cơ, chịu trách nhiệm pre-training (huấn luyện trước), post-training (huấn luyện sau) và inference (suy luận) của mô hình. Nhưng để GPU hoạt động, chúng phải truyền một lượng lớn dữ liệu qua lại với nhau và truy cập vào các chip memory (chip bộ nhớ) lưu trữ dữ liệu.
Để làm được điều này, cần một "hệ thống đường ống". Tôi đang nói ở mức độ cao ở đây, vì tôi không giả vờ hiểu tất cả các chi tiết cấp thấp. Astera Labs giải quyết chính vấn đề này. Khi cụm AI mở rộng đến hàng trăm nghìn chip, nút thắt không còn chỉ là bản thân GPU, mà là cửa sổ truyền dữ liệu, làm thế nào để gửi dữ liệu đúng vào đúng thời điểm, truy cập dữ liệu đúng. Astera Labs xây dựng chính hệ thống đường ống như vậy.
Trước khi nghiên cứu cho tập này, tôi cũng chưa từng nghe đến Astera Labs. Nhưng tôi nhớ Cerebras cũng có tình huống tương tự. Gavin đã nói về Cerebras khoảng sáu tháng trước, và xét về quy mô thời gian của AI, sáu tháng đã là rất lâu. Sau đó nó đã IPO, chương trình đề cập định giá khoảng 600 tỷ USD, và sau IPO lại tăng thêm 40%. Điều này cho thấy Astera Labs cũng có thể là một cái tên quan trọng trong một xu hướng tương tự.
Josh: Cerebras là một khoản đầu tư rất sớm của ông. Ông đã vào Cerebras từ rất sớm trong vòng đời công ty, nghĩa là ông đã đặt cược vào lý thuyết này nhiều năm. Còn một vài công ty khác mà ông cũng đầu tư dài hạn, trong đó quan trọng nhất tất nhiên là Nvidia.
Có thể tham gia Nvidia hơn 20 năm và tiếp tục duy trì niềm tin, điều đó rất đáng nể, bởi vì nó hẳn đã mang lại lợi nhuận cực kỳ ấn tượng. Gần đây tôi đã nghe hai podcast có Gavin, khi nói về vị thế Nvidia, ông đã thể hiện rất rõ một phán đoán: ông tin rằng Nvidia có thể tiếp tục duy trì biên lợi nhuận hiện tại và duy trì nhu cầu. Điều này có nghĩa ông nghĩ Nvidia có cơ hội tiến gần đến vốn hóa thị trường 10 nghìn tỷ USD, hiện tại nó mới chỉ đi được một nửa.
Một công ty khác đáng đề cập là Micron (Công nghệ Micron, nhà sản xuất chip nhớ chính toàn cầu). Chúng ta đã nói về ngăn xếp (stack) đầu tư AI và vị trí của các công ty này trong đó ở tập trước, rất khuyến khích mọi người xem lại. Micron là một trong những memory makers (nhà sản xuất chip nhớ) lớn nhất. Chương trình đề cập một con số đáng kinh ngạc: một năm trước vốn hóa thị trường của nó chưa đến 100 tỷ USD, và tại thời điểm ghi âm đã vượt 1 nghìn tỷ USD, tăng gấp 10 lần trong một năm. Điều này cho thấy memory problem (vấn đề bộ nhớ) quan trọng như thế nào.
Còn một số công ty ít nổi bật hơn nhưng rất thú vị. EJ, tôi đặc biệt muốn đề cập với bạn một công ty: Unity Software. Những người quen thuộc với game đều biết Unity, nó là một game engine (công cụ trò chơi), nhiều trò chơi nổi tiếng được tạo ra bằng phần mềm 3D rendering (kết xuất 3D) này.
Vậy tại sao một nhà đầu tư AI lại đầu tư vào Unity, thứ "làm game điện tử" này? Câu trả lời là game engine 3D. Unity là một world model builder (công cụ xây dựng mô hình thế giới), nó có hiểu biết sâu sắc về vật lý, cách thế giới vận hành, vật liệu và ánh sáng. Khi các công ty AI muốn xây dựng AGI (Trí tuệ nhân tạo phổ quát) và humanoid robots (robot hình người), một khâu quan trọng là mô phỏng môi trường ảo và tập dữ liệu ảo để robot có thể huấn luyện trong đó. Unity tình cờ là một trong những công cụ mạnh nhất. Vì vậy, với tư cách là một world model maxi (người tin tưởng mạnh mẽ vào mô hình thế giới), bạn chắc sẽ thích ví dụ này, một công ty nổi tiếng với game engine, có con đường rõ ràng để trở thành một người chơi quan trọng trong thế giới AI.
Lý thuyết và Chiến lược Đầu Tư Của Gavin
EJ: Lý thuyết về world models (mô hình thế giới) rất đơn giản: các mô hình AI hiện tại hoặc LLM (mô hình ngôn ngữ lớn) chủ yếu hiểu thế giới thông qua văn bản và sách vở, giống như một học sinh ngồi trong thư viện, nhưng nó không có kinh nghiệm thực tế về thế giới. Điều mà mô hình thế giới muốn mở khóa chính là điều này: đưa một nhân vật trò chơi vào môi trường mô phỏng, để nó hiểu thực tại vật lý vận hành như thế nào. Ví dụ, tôi ném điện thoại xuống, hoặc đá một quả bóng, điều gì sẽ xảy ra? Bước tiếp theo là gì? Bạn nên làm gì? Mô hình thế giới giải quyết chính vấn đề này.
Hiện tại không có nhiều người chơi có thể thực hiện quy mô lớn khả năng này. Người dẫn đầu hiện tại có thể là Google, họ có các dự án mô hình như Genie 3. Chương trình cũng đề cập Google gần đây đã phát hành Gemini Omni, nhưng loại mô hình này vẫn chưa thực sự có thời khắc ChatGPT moment (khoảnh khắc đột phá) của riêng mình.
Điều tôi thích ở Gavin là danh mục của ông giống như một barbell (chiến lược đòn gánh). Một bên rất truyền thống, mọi người cần GPU, cần bộ nhớ, vì vậy ông đầu tư vào người chơi lớn nhất Micron và Nvidia. Bên kia lại rất tiên phong, ông nghĩ puck (quả bóng) sẽ đi về hướng đó, nên đầu tư vào Cerebras vì ông cho rằng suy luận sẽ rất quan trọng; lại đầu tư vào Unity vì ông nghĩ mô hình thế giới sẽ là cách huấn luyện robot và thế hệ LLM tiếp theo.
Trong danh mục của ông còn có Positron, làm inference chips (chip suy luận). Nếu nghe có vẻ giống Cerebras, đúng vậy, chúng đều xoay quanh suy luận. Gavin gần đây trong các cuộc phỏng vấn liên tục nói về một xu hướng, ngăn xếp hạ tầng của mô hình AI, đặc biệt là ngăn xếp huấn luyện, đang chuyển từ huấn luyện trước sang coi trọng hơn việc huấn luyện sau.
Nếu bạn ở trong giới AI, bạn sẽ biết sự chuyển hướng này đã xảy ra. Gavin rất tập trung vào việc này. Một mô hình vẫn cần hiểu thông tin mới, dữ liệu mới, cần cập nhật chính nó. Không thể vì nó đã hoàn thành huấn luyện trước trên một tập dữ liệu nào đó mà cho rằng nó là thiên tài suốt đời. Nó vẫn cần học thông tin mới, điều này xảy ra ở tầng huấn luyện sau, và nó đòi hỏi rất nhiều tính toán.
Thứ hai, nếu bạn cần mô hình AI thực sự suy nghĩ về vấn đề, giống như chúng ta sau khi nhận thông tin mới sẽ nghĩ, góc độ này có đứng vững không? Có một lý thuyết khác có thể giải thích không? Đây chính là reasoning (suy luận / tư duy suy luận). Suy luận cũng đòi hỏi một lượng lớn tính toán. Ước tính hiện tại là, chỉ riêng cơ hội về chi phí hoặc do thu nhập từ suy luận, có thể gấp 5 đến 10 lần đầu tư vào sức mạnh tính toán cho huấn luyện trước.
Vì vậy, các AI labs (phòng thí nghiệm AI) và chip makers (nhà sản xuất chip) đang có sự chuyển hướng lớn. Bạn đã thấy Nvidia ra mắt nhiều GPU hướng đến suy luận để hỗ trợ các ứng dụng agentic (dạng tác nhân thông minh). Gavin cũng thể hiện sự đặt cược vào suy luận thông qua một loạt khoản đầu tư.
Điểm cuối cùng tôi thấy rất thú vị, là Gavin nói về Trung Quốc. Trong cuộc đua AI, câu chuyện luôn là Trung Quốc vs Mỹ. Trung Quốc có một cấu hình rất độc đáo, đó là năng lượng tương đối dồi dào, và có khả năng mở rộng sản xuất chip. Mỹ hiện đang gặp khó khăn trong lĩnh vực này, đó cũng là lý do tại sao nhiều khâu được giao khoán cho TSMC (Taiwan Semiconductor Manufacturing Company - Nhà máy sản xuất wafer tiên tiến quan trọng nhất toàn cầu) của Đài Loan.
Giải thích của ông là, Trung Quốc có cơ hội độc đáo để tạo ra một loại hạ tầng AI hoặc chip rất khác với Mỹ, bởi vì chúng sẽ tập trung rất nhiều vào suy luận. Bạn có thể nói Gavin đang thông qua các khoản đầu tư ở Mỹ để dẫn đầu việc đặt cược vào việc xây dựng hạ tầng suy luận của Mỹ. Tôi nghĩ đây có thể là một cơ hội lớn trong tương lai.
Josh: Điều đáng chú ý là, sự đặt cược này không chỉ có xu hướng tăng. Ông còn nắm giữ một vị thế QQQ put (quyền chọn bán ETF Nasdaq 100) lớn. QQQ là ETF theo dõi Nasdaq 100, là một rổ cổ phiếu, cũng là ETF có khối lượng giao dịch lớn thứ hai tại Mỹ. Nó thể hiện rất mạnh: năm 2023 tăng 55%, năm 2024 tăng 25%, năm 2025 tăng 20%, năm 2026 đến nay đã tăng 17%.
Nói cách khác, QQQ với tư cách là quỹ chỉ số thể hiện rất tốt, mua nó rất dễ, nó là một rổ 100 cổ phiếu hàng đầu. Và Gavin đang thực hiện phòng ngừa ngược lại với nó. Ông không nói AI sẽ không thắng, mà đang nói: Ông muốn đầu tư vào những nhà sản xuất then chốt thực sự giải quyết các nút thắt, nhưng không tỏ ra quá lạc quan về tâm lý thị trường tổng thể. QQQ put là downside protection (bảo vệ rủi ro giảm): nếu toàn bộ thị trường sụp đổ theo cách bất lợi, ngay cả khi AI về dài hạn vẫn thắng, ông cũng có lớp phòng ngừa này.
Bốn hướng đầu tư đáng giá
Josh: Chúng ta có thể chia các nút thắt đầu tư quan trọng nhất mà ông nghĩ thành một vài loại. Loại đầu tiên là verticalized small language models (mô hình ngôn ngữ nhỏ chuyên sâu). Các LLM thông thường, ví dụ như chatbot Claude và ChatGPT, là generalized LLM (mô hình ngôn ngữ lớn tổng quát), chúng có hiểu biết rộng về thế giới, có thể trả lời các câu hỏi cụ thể. Nhưng việc huấn luyện mô hình xoay quanh một lĩnh vực dọc cụ thể hoặc một vấn đề cụ thể, lại là chuyện khác.
Những vấn đề cụ thể này thường tồn tại trong doanh nghiệp, đặc biệt là những doanh nghiệp đào sâu một vấn đề nào đó, hoặc các công ty đã hình thành niche (thị trường ngách) trong một phân khúc nào đó. verticalized SLMs (mô hình nhỏ chuyên sâu) giải quyết chính vấn đề này: chúng là frontier models (mô hình tiên phong), nhưng được tối ưu hóa cao, có thể chạy hiệu quả trên dữ liệu doanh nghiệp cụ thể, hoặc chạy locally run models (mô hình chạy cục bộ) trên device (thiết bị).
Chúng ta đã từng nói về on-device (trên thiết bị) hoặc locally run models (mô hình chạy cục bộ). Lý do là trong điện thoại hoặc các thiết bị khác của bạn có rất nhiều dữ liệu cá nhân hóa, bạn chưa chắc muốn giao ra ngoài, công ty cũng chưa chắc có thể truy cập. Ví dụ, medical records (hồ sơ y tế), financial details (chi tiết tài chính). Tôi thấy OpenAI đã phát hành một financial AI agent (tác nhân AI tài chính), có thể truy cập tài khoản ngân hàng của bạn, nhưng không thể thay bạn thực hiện giao dịch, bởi vì trong đó có rất nhiều personally identifiable information (thông tin định danh cá nhân), như số an sinh xã hội, chi tiết ngân hàng, v.v.
Các mô hình cục bộ hoặc SLMs có thể giải quyết loại vấn đề này. Gavin phần lớn đặt cược rằng chúng sẽ trở nên quan trọng trong tương lai. Có một công ty ông rất ủng hộ: Apple. Mặc dù không nhất thiết thể hiện sự quan tâm đầu tư rõ ràng, nhưng ông cho rằng Apple sẽ là một trong những device maker (nhà sản xuất thiết bị) chính giúp mô hình cục bộ chạy trên thiết bị.
Nếu tương lai là như vậy, có lẽ chúng ta sẽ không còn nghĩ rằng Claude phải là mô hình bạn tương tác hàng ngày. Bạn có thể cần một personalized AI agent (tác nhân AI cá nhân hóa), được huấn luyện dựa trên chính dữ liệu của bạn, đây chính là thứ mà SLM cuối cùng có thể trở thành. Phiên bản tổng quát có thể chạy trên điện thoại của bạn, và một lượng lớn doanh nghiệp cũng sẽ chạy các mô hình được tối ưu hóa cao, chuyên biệt, được huấn luyện trên proprietary data (dữ liệu độc quyền) của riêng họ, để có thể bán hàng hoặc tiếp thị sản phẩm tốt hơn.
EJ: Apple ở vị trí này quá tốt. Tôi rất mong đợi WWDC (Hội nghị Nhà phát triển Toàn cầu của Apple), nó sắp đến rồi.
Josh: Đúng vậy.
EJ: Chỉ còn vài tuần nữa là đến hội nghị nhà phát triển Apple, họ sẽ phát hành phần mềm AI mới, và cách phần mềm này tích hợp với phần cứng. Điều này sẽ rất quan trọng, chúng tôi cũng sẽ tiếp tục theo dõi, tôi rất mong đợi thảo luận về việc này.
Josh: Trụ cột thứ hai là sovereign infrastructure (hạ tầng chủ quyền). Chúng ta thường nói, tốc độ của bits (bit) nhanh hơn rất nhiều so với tốc độ của atoms (nguyên tử). Nhìn vào hạ tầng AI là thấy rõ: chất lượng mô hình gần như tăng theo cấp số nhân, trí thông minh trên mỗi watt, trí thông minh tương ứng với mỗi token, chỉ có thể đi lên.
Nhưng tốc độ triển khai vật lý không tăng với tốc độ gần như tương tự, và bản thân điều này chính là moat (hào rào bảo vệ). Phần cứng cực kỳ phức tạp, độ chính xác của bóng bán dẫn đã tiệm cận cấp độ nguyên tử; việc triển khai quy mô lớn trong một thế giới vốn đã chịu áp lực từ hạ tầng hiện có, không hề dễ dàng. Sau khi xe điện tăng tốc phổ biến, lưới điện đã chịu áp lực lớn hơn, nhiều nơi gần như đầy tải. Giờ đây AI lại mang đến energy problem (vấn đề năng lượng) và chip problem (vấn đề chip).
Gavin đặt cược mạnh mẽ vào một thực tế, hạ tầng rất khó, xây dựng cần rất nhiều ngày, nhiều tháng, thậm chí nhiều năm. Ông đặt cược vào những người có thể rút ngắn chu kỳ này xuống còn vài tuần. Vì vậy, tốc độ physical deployment (triển khai vật lý) bản thân nó đã là hào rào bảo vệ. Ông đang thu hẹp phạm vi mục tiêu, tìm kiếm những công ty có thể triển khai càng sớm càng tốt.
Ví dụ đầu tiên tôi nghĩ đến là SpaceX (công ty hàng không vũ trụ của Musk), và tốc độ họ xây dựng Colossus (cụm siêu máy tính AI lớn của xAI) và cho Anthropic thuê, tương lai cũng có thể cho các công ty khác thuê. Trụ cột hạ tầng này là một trong những điều then chốt mà Gavin quan tâm.
Nếu xem danh mục của Leopold, đây cũng là phần cốt lõi. Thực tế là: xây dựng mọi thứ rất khó, và những người có thể xây dựng ra mọi thứ, có thể bán được giá rất cao. Chương trình đề cập, nguồn thu lớn nhất của SpaceX hiện nay là cho thuê trung tâm dữ liệu, chứ không phải tên lửa. Điều này cho thấy trụ cột này quan trọng như thế nào.
EJ: Ông quan tâm đến tốc độ, nhưng cũng quan tâm đến chi phí. Ông nhắc đi nhắc lại một chỉ số: performance per watt, tức hiệu suất trên mỗi watt. Điều ông thực sự muốn nói là, các phòng thí nghiệm AI ngày càng quan tâm đến việc mỗi watt có thể tạo ra bao nhiêu token.
Nếu bạn nghĩ đến việc năm nay chỉ có khoảng năm công ty đã chi hàng tỷ, thậm chí hàng nghìn tỷ đô la cho GPU, khả năng tính toán và điện năng để vận hành các hệ thống này, bạn chắc chắn muốn bang for buck (tỷ lệ hiệu quả trên chi phí) đủ cao. Đặc biệt là khi các hyperscalers (nhà cung cấp dịch vụ đám mây siêu quy mô) mở rộng đến quy mô này, chi phí là vấn đề cốt lõi.
Lấy một giả định: Tôi hỏi Claude một câu, chi phí cho tôi câu trả lời là 2 xu; tôi hỏi ChatGPT một câu, chi phí cho tôi câu trả lời là 1 đô la. Ngay cả khi Claude chỉ có 95% trí thông minh so với ChatGPT, tôi nhiều khả năng sẽ dùng Claude. Bởi vì tôi có thể hỏi nhiều lần hơn, cuối cùng nhận được câu trả lời với chi phí thấp hơn.
Vì vậy, chi phí truy cập intelligence (trí thông minh) này rất quan trọng. Ngay trong tuần này, Microsoft và Uber đã thông báo họ thực tế đang giảm sử dụng Claude Code (công cụ AI mã hóa của Anthropic dành cho lập trình), vì ngân sách hàng năm đã bị tiêu hết trong khoảng 4 tháng.
Bạn có thể thấy điều này trong danh mục đầu tư của Gavin: Cerebras, Positron, Astera Labs. Ông xác định các nút thắt hạ tầng rất chuyên biệt, sau đó thực hiện một vụ đặt cược đơn giản: nếu công ty này giải quyết được nút thắt này, performance per watt đạt đến một mức độ nào đó, chi phí token giảm xuống một mức nào đó, thì các phòng thí nghiệm AI sẽ mua thêm GPU, thêm sản phẩm hoặc thêm những thứ này.
Vì vậy, lý thuyết của ông thực ra rất đơn giản, mặc dù công nghệ cụ thể rất phức tạp: Tôi chỉ quan tâm đến các nút thắt ở cấp độ hạ tầng AI. Nếu có thể tìm được một công ty tăng hiệu suất trên mỗi watt, làm token rẻ hơn, tôi sẽ đặt cược nó sẽ rất có giá trị trong tương lai, hoặc IPO, hoặc được mua lại với giá cao.
Josh: Trong phần này, nếu có ai muốn sao chép giao dịch của Gavin, cần biết một vài cái tên: Astera Labs, Cerebras, SiFive (công ty thiết kế chip RISC-V) và Positron. Bốn công ty này rất quan trọng trong phân khúc này.
Hướng thứ tư và cũng là cuối cùng, là sự kết hợp giữa energy (năng lượng) và space (không gian). Như chúng tôi đã nói trước đó, terrestrial grid (lưới điện mặt đất) phần lớn đang hạn chế cung cấp năng lượng, và việc xây dựng năng lượng mới cũng rất khó. Chương trình đề cập một thống kê, khoảng 40% trung tâm dữ liệu mới sẽ gặp phải phản đối rất mạnh mẽ, người dân vận động, phản đối, không muốn các trung tâm dữ liệu này đặt tại địa phương của họ.
Có hai loại giải pháp. Một loại là tạo ra out-of-the-box energy (năng lượng trong hộp), tức là năng lượng di động. Bạn có thể mang trung tâm dữ liệu đến, sử dụng một thiết bị năng lượng nhỏ để cung cấp điện. Blue Marble mà Leopold rất ủng hộ thuộc loại này.
Loại khác là orbital compute (tính toán trên quỹ đạo), đây là hướng mà Gavin hiện đang rất quan tâm. Công ty lớn nhất, cốt lõi nhất trong lĩnh vực này tất nhiên là SpaceX. Nó là công ty duy nhất có khả năng trở thành đường cao tốc lên không gian, đưa payload (tải trọng) lên quỹ đạo, đưa racks (giá máy) và trung tâm dữ liệu lên quỹ đạo thấp, và tạo ra đủ trí thông minh và điện năng để truyền về lại.
Tôi nghĩ ý nghĩa của SpaceX còn lớn hơn bản thân SpaceX. Tôi hơi bất ngờ là danh mục của Gavin không có nhiều cấu hình space stocks (cổ phiếu không gian), xét đến việc ông cho rằng đây là một ngành lớn. Có lẽ thực tế là nó còn quá sớm, và SpaceX là linchpin (điểm mấu chốt) mở khóa ngành này.
Tiếp theo cần theo dõi sát sao việc phóng Starship V3. Chúng ta vừa chứng kiến một lần phóng Starship vào tuần trước, thể hiện rất tốt. Nếu Starship không thể thực sự vận hành, sẽ không có năng lượng không gian, cũng không có racks to orbit (giá máy lên quỹ đạo). Nó là điều kiện cần, bởi vì tải trọng cần phóng rất lớn. Vì vậy SpaceX chắc chắn là công ty phải theo dõi, mặc dù sẽ có nhiều công ty cấp hai bị ảnh hưởng.
Tại sao không phải là một bong bóng Internet nữa?
Josh: Tiếp theo mọi người chắc chắn sẽ hỏi, tại sao đây không chỉ là một dot-com bubble (bong bóng Internet) nữa? Gavin đã bị hỏi câu này nhiều lần, và ông đã đưa ra câu trả lời rất mạnh mẽ, và tôi về cơ bản tin ông, lập luận của ông rất thuyết phục.
Logic của ông đại khái là: Bong bóng Internet năm 2000 được thúc đẩy bởi debt-fueled (nợ). Nhiều người đã vay một lượng tiền lớn để đầu tư vào các lý thuyết chưa được kiểm chứng và các sản phẩm không ai thực sự sử dụng hoặc quan tâm.
Nếu so sánh nó với siêu chu kỳ AI mà Gavin nói đến, chỉ riêng hai công ty OpenAI và Anthropic, năm nay dự kiến sẽ đạt 200 tỷ USD ARR (Doanh thu thường niên). Và đây không phải là tiền bịa đặt, mà là tiền đã được ký kết thông qua hợp đồng, trong đó một phần lớn, chương trình nói là 40% đến 60%, đã được các doanh nghiệp và khách hàng bán lẻ trả trước. Nói cách khác, thực sự có tiền đang lưu chuyển.
Nhìn vào sức mạnh tính toán GPU, không nhìn vào các phòng thí nghiệm mô hình, mà xem ai đang mua sản phẩm từ Nvidia. Google, Microsoft, Amazon và Meta đều đang thanh toán bằng tiền mặt dự trữ của chính họ, không vay mượn. Amazon vừa mới sử dụng đến phần cuối của dòng tiền tự do, nếu họ bắt đầu vay mượn, chúng ta có thể lo lắng. Nhưng trọng tâm hiện tại là, họ không sử dụng đòn bẩy.
Và đây là những công ty hàng đầu trong số năm công ty hàng đầu toàn cầu, ở một góc độ nào đó cũng là những công ty thông minh nhất, bởi vì vốn hóa thị trường, quy mô và vị thế của họ rõ ràng. So sánh với bong bóng Internet, khi đó có rất nhiều công ty vô danh đã huy động được rất nhiều tiền, sau đó đốt tiền một cách rất không hợp lý. Trong chu kỳ này, là những công ty thông minh nhất toàn cầu đang chi tiêu bằng tiền không có đòn bẩy.
Các báo cáo quý mà chúng ta đã nói trong chương trình vài tuần gần đây cũng cho thấy, lợi nhuận đang được tối ưu hóa xung quanh các hành động này, các mô hình vẫn đang tiến bộ, trở nên thông minh hơn. Vì vậy, luận điểm cốt lõi của Gavin là: Đây không phải là bong bóng Internet, vì nó không được thúc đẩy bởi vốn vay; đồng thời, các nút thắt chúng ta nói đến bị ràng buộc bởi physical atoms (nguyên tử vật lý).
Mua một loạt chip nhớ và GPU là một chuyện, nhưng Nvidia không thể bán quá nhiều GPU, Micron cũng không thể bán quá nhiều chip nhớ AI, vì họ không có đủ cơ sở sản xuất chip. Vì vậy, luận điểm đơn giản của ông là: Nếu bạn không thể cung ứng quá mức toàn bộ thị trường, thì nó không phải là bong bóng. Chúng ta bị hạn chế bởi không có đủ 'cuốc xẻng' để hoàn thành việc này, và ông đang đầu tư vào chính những thứ đó.
Còn một điểm rất hay: Gavin cho rằng, nếu TSMC có thể cung ứng, thì Nvidia năm nay và năm ngoái đáng lẽ có thể bán được 2 đến 3 nghìn tỷ USD GPU. Nói cách khác, TSMC là một mắt xích then chốt trong ranh giới bong bóng.
Lý do là, nếu TSMC có thể đáp ứng nhu cầu của các công ty này, cung cấp cho họ nhiều chip như vậy, thì sẽ tiêu hao một lượng vốn khổng lồ. Hiện tại nhìn vào biểu đồ, giữa CapEx (Chi tiêu vốn) và operating cash (dòng tiền hoạt động) vẫn chưa có sự chênh lệch lớn, tiền mặt mà doanh nghiệp tạo ra vẫn đủ để hỗ trợ xây dựng.
Nhưng nếu TSMC ngày mai nói với Nvidia, chúng tôi có thể tăng gấp ba năng lực sản xuất chỉ trong một đêm, Nvidia sẽ không từ chối, nó sẽ bắt đầu chi một số tiền khổng lồ để mua chip. Các công ty khác cũng sẽ buộc phải vay tiền để mua những chip này, lúc đó CapEx bubble (bong bóng chi tiêu vốn) sẽ bắt đầu lớn lên, và chênh lệch với dòng tiền hoạt động của doanh nghiệp.
Nhưng vì mỗi khâu đều có ràng buộc về cung ứng, bộ nhớ có ràng buộc, sản xuất chip có ràng buộc, năng lượng có ràng buộc, đặc biệt là ràng buộc của TSMC về chip tiên tiến, chúng ta thực tế không có cách nào để kéo tốc độ xây dựng nhanh như vậy. Do đó, TSMC đang chặn sự tăng tốc của bong bóng.
Chỉ cần năng lực sản xuất chip của TSMC vẫn còn hạn chế, chỉ cần Samsung và các nhà sản xuất chip khác không vượt qua thị phần của họ, thì tốc độ tăng trưởng vẫn tương đối bền vững. Nó trông có vẻ nhanh, nhưng vẫn còn rất nhiều nhu cầu không thể được đáp ứng, bởi vì chúng ta đơn giản là không xây dựng đủ nhanh. Chỉ cần động lực này còn tồn tại, tôi nghĩ tạm thời không có vấn đề gì.
EJ: Còn một điểm nữa, bạn không thể giả định nhu cầu giữ nguyên, bởi vì nó sẽ không. Nhu cầu liên quan đến AI đang tăng trưởng theo cấp số nhân, và tốc độ tăng trưởng vượt quá cung cấp sản xuất của những chip này.
Tôi có thể nghĩ ra hai cách để chứng minh lý thuyết này sai. Thứ nhất, ai đó một cách kỳ diệu sao chép được ASML (nhà cung cấp chính toàn cầu về máy quang khắc EUV), đột nhiên xuất hiện một loạt đối thủ cạnh tranh của ASML. Những người không hiểu về ASML có thể hiểu như thế này: nó sản xuất những cỗ máy trị giá khoảng 400 triệu USD, TSMC và tất cả các chip fab (nhà máy sản xuất wafer) chính đều cần những cỗ máy này. Chương trình nói ASML chỉ có một đội ở Na Uy sản xuất những thứ này, và chu kỳ rất dài, backlog (đơn hàng tồn đọng) đã xếp đến khoảng 5 năm.
Thứ hai, chúng ta tạo ra một loại LLM hoàn toàn khác, không cần nhiều GPU như vậy, cũng không cần nhiều bộ nhớ như vậy. Nhưng hiện tại chúng ta hoàn toàn không thấy dấu hiệu này.
Hôm nay tôi thấy một tin tức về SK Hynix (nhà cung cấp bộ nhớ băng thông cao chính toàn cầu). Nó là nhà sản xuất và cung cấp bộ nhớ số một cho GPU Nvidia, gần như là top dog (người chơi hàng đầu) trong lĩnh vực bộ nhớ AI. Hiện tại nó đang nhận được báo giá từ Google và Microsoft khoảng 50 đến 100 tỷ USD, hai công ty muốn khóa trước nguồn cung sẽ được sản xuất trong ba năm tới, để thanh toán cho thiết bị cần thiết để mở rộng sản xuất.
Điều này cho thấy các công ty lớn này khao khát bộ nhớ đến mức nào, và đây chỉ là một phân khúc phụ trong các thành phần AI. SK Hynix ngược lại nói: Tôi không muốn đảm bảo cung ứng cho các bạn, tôi sẽ trực tiếp tăng giá thôi. operating margin (biên lợi nhuận hoạt động) của nó khoảng 70%, gần như không thể tưởng tượng được trong ngành bán dẫn.
Vì vậy, Gavin all-in là có lý. Nó không giống như bong bóng, có lẽ thị trường sẽ phản ứng ngắn hạn như vậy. Hôm nay chúng tôi mở danh mục cổ phiếu trước khi ghi âm, hầu hết đều giảm, nhưng đó nhiều hơn là phản ứng reactionary (theo cảm xúc). Mục tiêu định hướng của việc này là: Chúng ta chỉ cần nhiều GPU hơn, nhiều chip bán dẫn hơn, trong khi cung ứng không đủ, nhà sản xuất cũng không đủ.
Danh mục đầu tư của Gavin
Josh: Kết luận là: điện năng và wafer. Chỉ hai thứ này thôi. Chúng là hai bức tường gạch, cũng là hai yếu tố hạn chế, ngăn chúng ta tăng tốc quá nhanh. Chỉ cần điện năng và wafer vẫn có giá trị, nhu cầu mạnh, cung hạn chế, thì phía trước vẫn còn những ngày tốt đẹp.
Nếu bạn muốn bản tóm tắt (TLDR) về danh mục của Gavin, tôi có thể đọc một số vị thế nắm giữ lớn nhất của ông. Một lần nữa nhấn mạnh, đây không phải là lời khuyên đầu tư. Đây là những gì Gavin nắm giữ, không đại diện cho những gì chúng tôi nắm giữ. Tôi không biết những cổ phiếu này sẽ tăng, giảm, hay xoay vòng tại chỗ.
Vị thế lớn nhất của ông hơi phản trực giác, là QQQ put position (vị thế quyền chọn bán ETF Nasdaq 100). Nhìn chung, ông có vẻ bearish (bi quan) về thị trường, điều này rất đáng chú ý. Thứ hai là Astera Labs, vị thế khoảng 7.4%, mã chứng khoán là ALAB. Thứ ba là Unity, tức công ty phần mềm 3D.
Phía sau còn rất nhiều: Ciena (công ty thiết bị mạng quang), Micron, Nvidia, Amazon, Lumentum (công ty viễn thông quang và thiết bị laser), Alphabet (công ty mẹ của Google), Coherent (công ty quang điện tử và vật liệu), Roblox (nền tảng trò chơi), EchoStar (công ty thông tin vệ tinh), Twilio (nền tảng truyền thông đám mây), Wayfair (thương mại điện tử nội thất). Người này đầu tư đủ thứ.
Nếu bạn quan tâm, có thể xem 13F của ông, chúng tôi sẽ để link trong phần mô tả. Nhưng đây là quan điểm của Gavin, nút thắt nằm ở điện năng và wafer. Chỉ cần những ràng buộc này còn, về cơ bản là tăng một chiều. EJ, bạn tiếp nhận thông tin này như thế nào? Bạn sẽ xử lý ra sao?
EJ: Kể từ khi 13F của Leopold được công bố, thị trường liên tục biến động. Khi ghi âm tập này tôi càng ngày càng nhận ra, Gavin giống như một Leopold già dặn hơn, thông minh hơn. Ông đã ở trong ngành này rất lâu rồi. Có lẽ ông không có AUM 13 tỷ USD, nhưng tôi cảm giác 10 năm nữa ông vẫn sẽ còn ở đây.
Nếu bạn nghe đến đây và nghĩ rằng, tôi không muốn theo dõi tiến triển AI từng phút, từng giờ, từng ngày, tôi chỉ muốn để tiền ở đó và xem nó tăng trưởng như thế nào trong vài tháng hoặc vài năm tới. Vậy thì danh mục của Gavin có thể rất đáng tham khảo. Tất nhiên, đây không phải là lời khuyên đầu tư.
Ông áp dụng một cách tiếp cận thận trọng hơn, dài hạn hơn và cũng hướng tới tương lai hơn. Nếu các xu hướng phán đoán của ông cuối cùng trở thành hiện thực, giống như việc ông đầu tư sớm vào Nvidia và Cerebras, có thể sẽ có lợi nhuận theo cấp số nhân trong vài năm tới. Nhưng tất cả đều dựa trên một quan điểm cốt lõi của ông: chúng ta không ở trong bong bóng.
Tôi tò mò không biết thính giả có đồng ý không. Rõ ràng, đa số mọi người sẽ không kỹ thuật và đào sâu vào cấp thấp như Gavin. Nhưng sau khi nghe tập này, bạn có nghĩ chúng ta đang ở trong bong bóng không? Hay không? Lý do ủng hộ và phản đối là gì? Có điều gì chúng tôi đã bỏ sót không? Josh, bạn có nghĩ hiện tại là bong bóng không trước khi chúng ta kết thúc?
Josh: Tôi cho rằng chúng ta chắc chắn đang ở trong một bong bóng. Vấn đề là, chúng ta đang ở giai đoạn nào của bong bóng, điều này vẫn có thể thảo luận. Hiện tại có vẻ giống như giai đoạn đầu hơn, vì vậy hy vọng nó tiếp tục duy trì trạng thái này. Theo cách nói của Gavin, chỉ cần TSMC tiếp tục hạn chế năng lực sản xuất chip, chúng ta vẫn ổn.
Đây là outlook (triển vọng) tổng thể. Chúng ta đã nói về Leopold, thành công của ông ấy hiện được tính bằng quý; bây giờ chúng ta nói về Gavin, thành công của ông được tính bằng vài thập kỷ. Câu trả lời của nhiều người có lẽ sẽ nằm ở giữa hai người.
Nếu bạn thích tập này, đừng quên chia sẻ với bạn bè. Và cũng cho chúng tôi biết loại tài sản nào bạn ủng hộ nhất. Có thể không phải là một lý thuyết nào đó, mà là một mã chứng khoán cụ thể đáng để chúng tôi chú ý. Tôi nghĩ điều này rất thú vị, bởi vì mọi thứ đang di chuyển nhanh chóng, dù lên hay xuống, đều có nhiều biến động, và cũng rất đáng tham gia. Hẹn gặp lại vào ngày mai, chúc buổi sáng tốt lành.







