Nguồn: The Defiant
Biên dịch: Yuliya, PANews
Lời biên tập: Tuần trước, Claude Fable 5 do Anthropic phát hành đã châm ngòi cho cuộc khủng hoảng niềm tin dữ dội nhất trong lĩnh vực AI tiên phong: các nhà nghiên cứu phát hiện, một khi mô hình nghi ngờ người dùng đang phát triển sản phẩm cạnh tranh, nó sẽ "đầu độc ngầm", lén giảm chất lượng câu trả lời, cộng thêm yêu cầu lưu giữ dữ liệu 30 ngày của mô hình này, dẫn đến việc nó bị vô hiệu hóa nội bộ tại Microsoft. Điều này đặt ra một câu hỏi mà lĩnh vực tiền mã hóa đã hỏi trong nhiều năm: có nên để bất kỳ công ty đơn lẻ nào nắm quyền kiểm soát quá nhiều AI tiên phong như vậy không?
Trước vấn đề này, người sáng lập kiêm CEO của The Defiant, Camila Russo đã mời Jake Brukhman, người sáng lập CoinFund, Jesus Rodriguez, người sáng lập Sentora và The Sequence, cùng Haseeb Qureshi, đối tác quản lý của Dragonfly, thảo luận sôi nổi về hướng đi tương lai của AI phi tập trung.
Cuộc Chiến Mô Hình Lớn, Xu Hướng Mã Nguồn Mở và Nỗi Sợ "Phong Tỏa"
Haseeb: Logic đầu tư hiện tại của chúng tôi là: trong tương lai, mọi người sẽ thấy ngày càng nhiều mô hình "không thuộc cấp độ tiên phong" xuất hiện, và chi tiêu của người dùng vào Token mô hình (chi phí điện toán) cũng sẽ ngày càng chảy về các lĩnh vực phi tiên phong này. Ai cũng biết, việc đổ tiền vào những mô hình lớn tiên phong nhất là không bền vững, và đại đa số mọi người thậm chí không cần đến trí thông minh cao như vậy.
Hiện có rất nhiều mô hình đã qua chưng cất, mã nguồn mở hoặc mở quyền trên thị trường, giá cả rất phải chăng, bạn hoàn toàn có thể phân bổ các nhiệm vụ khác nhau cho chúng. Có một câu chuyện cười trên mạng, nói rằng có người thậm chí dùng mô hình cấp độ như Mythos hay Claude Fable 5 để đổi tên một tệp – khi chúng ta ngày càng quen thuộc hơn với các mô hình này, tình huống này sẽ xảy ra ngày càng nhiều. Bạn cần suy nghĩ: giết gà cần gì phải dùng dao mổ trâu?
Tuy nhiên, cụm từ "AI phi tập trung" này quá rộng. Nếu nó chỉ đề cập đến "mọi người đang sử dụng các mô hình khác nhau do các tổ chức khác nhau phát triển" (như kiểu OpenRouter), thì điều này chẳng khác gì thế giới hiện tại của chúng ta. Nhưng nếu nó đề cập đến "sử dụng mạng phi tập trung để huấn luyện hoặc vận hành mô hình AI", thì đó là một logic khác. Chúng tôi thực sự khá bi quan về điều sau, hiện tại hoàn toàn chưa thấy lý do đáng tin cậy nào chứng minh rằng hiệu quả kinh tế và nhu cầu thị trường cho việc huấn luyện hoặc vận hành mô hình trong môi trường phi tập trung là có cơ sở.
Tất nhiên, cách thức phát hành Fable lần này thực sự đã gây ra phản ứng dữ dội. Mọi người có cảm giác sở hữu với sản phẩm tốt, một khi đã dùng, họ sẽ nghĩ "trừ khi tôi chết, còn không thì đừng lấy đi". Khi chính phủ đột ngột can thiệp và phong tỏa nó, mọi người chắc chắn cảm thấy bị tước đoạt. Nhưng đồng thời, nếu bạn còn nhớ bối cảnh ban đầu khi Mythos được phát hành, nó thật đáng sợ – trước mặt nó, tất cả phần mềm, hệ điều hành hay trình duyệt hiện có của chúng ta giống như phô mai Thụy Sĩ, toàn là lỗ hổng. Lúc đó đã không có ai nhảy ra nói "bạn nên mở nó ra cho toàn nhân loại".
Có người nói cách làm của chính phủ Mỹ ở đây rất điên rồ. Anthropic tuyên bố họ đã giải tỏa tất cả nghi ngờ của các cơ quan an ninh quốc gia trước khi phát hành Fable 5, nhưng theo tôi hiểu, các cơ quan an ninh quốc gia đã can thiệp vào việc phong tỏa Mythos từ sớm. Mythos chỉ được triển khai cho hơn ba mươi đối tác trong Project Glasswing, những đối tác này được chính phủ lựa chọn cẩn thận, chứ không phải do Anthropic chọn. Vì vậy, cách nói "Fable được phát hành mà chính phủ không biết" rõ ràng là không đứng vững. Có tin đồn rằng Andy Jassy, chủ tịch Amazon đã đến chính phủ hoặc Nhà Trắng, nói với họ mô hình có lỗ hổng jailbreak, chính phủ mới nhận ra nguy hiểm và lập tức phong tỏa Fable 5 trên toàn nước Mỹ.
Cơ chế quản trị và an ninh này rõ ràng không hoàn hảo. Mặc dù tôi đồng ý rằng những gì đang xảy ra trong phòng thí nghiệm (dù là Anthropic hay OpenAI) cực kỳ nguy hiểm và cần được xử lý thận trọng, nhưng tôi cũng tin rằng sự phân phối các mô hình mã nguồn mở và mở quyền ẩn chứa giá trị kinh tế khổng lồ, hai điều này phải phát triển song song.
*Chú thích: Project Glasswing là dự án an ninh mạng do Anthropic khởi xướng và hợp tác với nhiều công ty công nghệ, bắt đầu vào tháng 4 năm 2026.
Jesus: Không đề cập đến những chủ đề đầy cảm giác tận thế công nghệ, tôi thực sự đã nghe từ những người trong ngành an ninh mạng rằng Mythos thực sự rất đáng sợ. Sau khi nó được phát hành, tôi đã nói chuyện với một số người từ Anthropic, vấn đề rất thực tế. Nhưng tôi nghe các CEO nổi tiếng trong lĩnh vực an ninh mạng nói rằng họ mong muốn có thể tiếp cận mở mô hình này hơn, bởi việc phát hành trực tiếp nó sẽ cho tất cả các công ty an ninh này đủ thời gian chuẩn bị. Cố gắng hạn chế nó, hoặc trì hoãn phát hành ba tháng, bạn sẽ không bao giờ có đủ thời gian đệm. Nhưng quan điểm ngược lại là: nếu phát hành Mythos trực tiếp, liệu có gây ra hậu quả thảm khốc không?
Haseeb: Chúng ta đang ở trong lĩnh vực blockchain, nếu Triều Tiên có được mô hình này, bạn có thực sự nghĩ rằng điều đó sẽ không phải là thảm khốc?
Camila: Nhưng có phải có một cuộc tranh luận như thế này: nếu ai cũng có, nguy cơ sẽ giảm, vì mọi người đều có thể kiểm tra?
Haseeb: Không phải ai cũng có vũ khí hạt nhân.
Jake: Dùng vũ khí hạt nhân để so sánh không phù hợp. Lấy Mythos làm ví dụ, nó là một mô hình có thể khai thác lỗ hổng hệ thống. Chúng ta cần tính một bài toán kinh tế: tin tặc trả tiền để dùng Mythos tìm lỗ hổng, trong khi chủ sở hữu trang web cũng phải trả tiền để phòng thủ. Thị trường này có thực sự cân bằng không? Tin tặc có thực sự nghĩ rằng việc bỏ ra nhiều thời gian để khai thác một lỗ hổng trong hệ thống Linux không thể kiếm tiền được là đáng giá?
Nếu loại mô hình có thể khai thác lỗ hổng này chỉ nằm trong tay một số ít người (ví dụ: công ty lớn có thể dùng, người bình thường không thể), bạn thực tế đang tạo ra sự mất cân bằng. Một số người có thể bảo vệ tài sản của họ, trong khi những người khác chỉ có thể bị tấn công. Vì vậy, cá nhân tôi cho rằng, để mọi người tiếp cận mô hình một cách bình đẳng sẽ tốt hơn.
Đây không phải là tinh thần phản kháng kiểu cyberpunk, mà là xu hướng tất yếu của thị trường. Hôm nay bạn thấy có các mô hình tiên phong đóng (closed-source), nhưng đồng thời cũng có một loạt các mô hình mã nguồn mở (chủ yếu do các phòng thí nghiệm Trung Quốc phát triển). Mặc dù họ ở thế bất lợi về điện toán, nhưng khoảng cách giữa họ và các mô hình tiên phong trong các chỉ số đánh giá chỉ vài phần trăm. Biểu đồ từ Epoch.ai hiển thị rõ ràng rằng khoảng cách giữa mô hình mã nguồn mở và đóng đang thu hẹp nhanh chóng. Ngay cả khi Anthropic muốn làm "ông lớn" để bảo vệ mọi người, thực tế là mọi người cần những mô hình này để bảo vệ trang web và phần mềm của họ. Họ sẽ lấy được nó – dù là từ Anthropic, từ các phòng thí nghiệm châu Á mở mã nguồn, hoặc được huấn luyện trên mạng phi tập trung.
Kiểm Soát Xuất Khẩu, Quy Định và Ranh Giới Tiếp Cận Tự Do
Camila: Jake, bạn có nghĩ rằng không nên có bất kỳ "lan can" nào không? Nên mở hoàn toàn cho tất cả mọi người?
Haseeb: Để tôi bổ sung cho câu hỏi này. Bạn có nghĩ rằng khái niệm "kiểm soát xuất khẩu" về cơ bản không nên tồn tại? Bởi vì ngoài AI, bản thân mạng internet đã là một yếu tố của chiến tranh.
Jake: Tôi không có lập trường chính trị, tôi chỉ là một kỹ thuật viên, không làm việc ở Bộ Ngoại giao. Nếu chính phủ Mỹ quyết định thực hiện kiểm soát xuất khẩu, đó là việc của họ. Nhưng điều đó khác với "công nghệ có nên được chia sẻ trên toàn cầu hay không".
Giả sử Fable được huấn luyện trên một mạng phi tập trung, không có cá nhân nào nắm giữ toàn bộ quyền số (một phần quyền số ở Mỹ, một phần ở Amsterdam, một phần ở Úc). Nếu Mỹ áp đặt kiểm soát xuất khẩu đối với phần quyền số trong lãnh thổ của mình, mô hình này ở các nơi khác trên thế giới vẫn có thể hoạt động bình thường. Đây là vấn đề về cơ chế thực thi của Mỹ. Hãy nhìn Bitcoin, nó là đồng tiền độc lập, phi tập trung, không ai có thể ngăn cản. Haseeb vừa nói anh ấy không chắc thị trường có nhu cầu với AI phi tập trung không, điều này giống như nói vào năm 2011 rằng "không biết mọi người có nhu cầu với PoW (bằng chứng công việc) không". Thực tế, vì mọi người có nhu cầu về tiền tệ toàn cầu hóa, không cần xin phép, nên nhu cầu công nghệ là rất lớn. Tương tự, mọi người cũng có nhu cầu khổng lồ về AI toàn cầu hóa, không cần xin phép, Bộ Ngoại giao Mỹ có thích hay không cũng không ngăn được.
Jesus: Về phép loại suy kiểm soát xuất khẩu, nếu các bạn hạn chế mọi người truy cập Mythos, nhưng một mô hình mở quyền nào đó đột nhiên tự phát triển khả năng tấn công mạng thì sao? Hãy nhìn vào các bài kiểm tra chuẩn an ninh mạng hiện nay, DeepSeek-V4 hoặc Qwen 3.7 đều xếp hạng rất cao. Chỉ là vấn đề thời gian trước khi các mô hình này có khả năng tấn công mạng.
Giới AI thích dùng vũ khí hạt nhân để so sánh: có bốn năm sau Thế chiến II, Mỹ sở hữu vũ khí hạt nhân trong khi phần còn lại của thế giới không có. Có một lý thuyết cho rằng nếu Mỹ gây áp lực lúc đó, chủ nghĩa cộng sản có thể không bao giờ phát triển ở Đông Âu. Nhưng sau đó Liên Xô cũng phát triển được vũ khí hạt nhân. Điều làm tôi băn khoăn không phải là mở cho tất cả mọi người ngay từ đầu, mà là quyết định một cách có chọn lọc ai có thể truy cập. Nếu đây là kiểm soát xuất khẩu, tại sao không phải mọi công ty Mỹ đều có thể truy cập nó?
Haseeb: Về Fable, chúng ta cần làm rõ các chi tiết. Chính phủ yêu cầu đóng Fable đối với tất cả người không phải công dân Mỹ. Hiện tại Anthropic không có đủ cơ chế KYC (xác thực danh tính) để đảm bảo họ có thể tuân thủ điều này, và kiểm soát xuất khẩu là chế độ trách nhiệm nghiêm ngặt. Nếu mô hình rơi vào tay người không phải công dân Mỹ, bạn sẽ gặp rắc rối. Đó là lý do tại sao hiện họ chưa đủ tự tin để nói rằng có thể làm được. Hiện tại, Polymarket dự đoán, xác suất họ có thể khôi phục hoạt động cho người Mỹ vào cuối tháng 7 là 77%, và xác suất khôi phục vào khoảng đầu tháng 6 là khoảng 50%.
Rõ ràng, ý tưởng "cấm bất kỳ người nước ngoài nào sử dụng Fable 5" tự nó đã rất vô lý. Mỹ có một lượng lớn nhân viên nước ngoài có thị thực H1B, nếu trong đội lập trình của bạn có kỹ sư người Pháp, họ lại không được phép sử dụng Fable, điều đó thật phi lý. Điều này có khả năng sẽ được thay đổi qua đàm phán trước khi thực thi, nếu Anthropic có thể sửa lỗ hổng và thực hiện kiểm soát chặt chẽ hơn, có lẽ sẽ không cần phải đóng hoàn toàn với các tác nhân phi Mỹ.
Nhưng điều này khác với tình huống của Mythos. Fable đáng lẽ chỉ nên là một "mô hình lương thiện" viết code, soạn thảo email, trong khi đối mặt với Mythos, thái độ của chính phủ Mỹ là: không, thứ này chỉ dành cho người Mỹ, và "chỉ dành cho những người chúng tôi chỉ định trong danh sách". Đây không còn là kiểm soát xuất khẩu nữa, đây đơn giản là "Dự án Manhattan" phiên bản AI.
Theo tôi hiểu từ nguồn tin đáng tin cậy, chính phủ đã chủ đạo quá trình Project Glasswing, đó là lý do tại sao những người có tên trong danh sách đều là các công ty lớn như Microsoft, chứ không phải một công ty an ninh mạng ngẫu nhiên nào đó. Điều này không có gì lạ đối với một chính phủ coi nó như một vũ khí tấn công mạng cực kỳ nguy hiểm, chúng ta cũng xử lý máy bay chiến đấu, tên lửa như vậy. Đây không phải là việc Anthropic vì mục đích tiếp thị thương mại mà chỉ muốn 30 công ty sử dụng, họ muốn cả thế giới dùng sản phẩm của họ.
Camila: Trong lĩnh vực tiền mã hóa, chúng ta thấy số lượng cuộc tấn công hacker do AI tạo ra tăng mạnh, chúng ta có thể suy đoán rủi ro sẽ lớn đến mức nào nếu Mythos được áp dụng rộng rãi. Jake, bạn có nghĩ rằng trong một số trường hợp, việc hạn chế một số nhóm sử dụng các mô hình này là hợp lý không? Hay bạn vẫn kiên trì rằng chúng nên mở cho tất cả mọi người?
Jake: Như tôi đã nói, đây là hai vấn đề độc lập với nhau so với việc "công nghệ AI phi tập trung có khả thi hay không". Chính phủ tất nhiên có thể ban hành luật để quản lý, đây không phải là một lựa chọn đen trắng. Tuy nhiên, công nghệ phi tập trung, bằng cách giảm rào cản tham gia, có thể mang lại nhiều cạnh tranh hơn. Nó sử dụng phần cứng cấp hàng hóa đại chúng để giảm chi phí.
Hôm nay tôi đã nói chuyện với một nhà sáng lập, anh ấy đang thực hiện suy luận trên GPU hàng hóa đại chúng không đồng nhất, và cho rằng khi chi phí điện tăng lên, về lâu dài đây sẽ là một lựa chọn rẻ hơn cho người tiêu dùng. Tất cả tiến bộ công nghệ, cuối cùng, đều nhằm giảm chi phí và rào cản. AI có lẽ là ngành công nghiệp tập trung nhất thế giới hiện nay, nó cần được phá vỡ rào cản nhất. Chúng tôi ủng hộ AI phi tập trung là để bảo vệ quyền lựa chọn của người tiêu dùng, cuối cùng cũng là bảo vệ nền dân chủ.
Nút Cổ Chai Vật Lý và Đột Phá Thuật Toán của AI Phi Tập Trung
Camila: Nếu cuối cùng chỉ có một vài công ty tập trung kiểm soát hầu hết các mô hình AI được sử dụng trên thế giới, điều gì sẽ xảy ra? Nếu thực tế không có AI phi tập trung thành công, cái giá phải trả là gì?
Jesus: Tôi phải phản bác lại Jake. Từ góc độ kỹ thuật, việc dùng cách phi tập trung để làm một mô hình cấp độ như Mythos, chi phí chắc chắn cao hơn nhiều so với tập trung. NVIDIA có một hào nước sâu hiếm khi được nhắc đến: ngoài Google có TPU, hiện tại tất cả kiến trúc lớn đều chạy trên hàng trăm, hàng nghìn GPU của NVIDIA, AMD hoàn toàn không có dữ liệu thực chiến này.
Tôi thực ra cũng ủng hộ AI tập trung, tôi đã từng thành lập hai công ty trong lĩnh vực này. AI phi tập trung không phải là điều mới mẻ, trước đây nó chưa bao giờ tìm được sự phù hợp với thị trường sản phẩm (PMF). Trước đây là vì mô hình đủ nhỏ và đơn giản, phi tập trung không có nhiều ý nghĩa. Bây giờ chúng đủ lớn, thì phi tập trung lại trở nên rất khó khăn. Và chúng ta có khoảng cách về nhân tài, lương thưởng, vốn đầu tư. Rất nhiều hoạt động suy luận thực tế không diễn ra trên GPU tiên tiến nhất, mà là trên GPU thế hệ trước, chỉ có tiền huấn luyện mới cần H100.
Jake: Việc cung cấp GPU trong vài năm qua luôn trong tình trạng nút cổ chai, giá liên tục tăng. Vào năm 2026, một công ty khởi nghiệp thị trường trung bình thông thường muốn tìm H100 đều rất khó khăn. Việc huấn luyện quy mô lớn trong lịch sử diễn ra trong các trung tâm dữ liệu xa xỉ cần hỗ trợ điện hạt nhân – những GPU cấp công nghiệp đó có bộ nhớ 132GB, băng thông giữa các nút đạt 1 đến 3 TB/s. Nếu tôi nói với bạn rằng chúng ta có thể chuyển quá trình này sang thiết bị tiêu dùng thông thường (như GPU NVIDIA thông thường, thậm chí Macbook hoặc Mac Studio của bạn), và chạy trên mạng tiêu dùng thông thường, bạn sẽ nói tôi điên.
Nhưng khi đối mặt với nhu cầu điện toán khổng lồ như vậy, mọi người có động lực cực lớn để thay đổi cách thức huấn luyện và tối ưu hóa thuật toán. Tôi lấy một phép loại suy lượng tử: Google có hai loại chuyên gia lượng tử, những người làm phần cứng sẽ nói máy tính lượng tử trong mười năm nữa không giải quyết được vấn đề gì, còn những người làm phần mềm sẽ nói "trong 3 đến 5 năm nữa Ethereum phải cẩn thận rồi". Haseeb và Jesus nhìn vấn đề từ góc độ phần cứng, còn tôi nhìn từ góc độ của người tối ưu hóa cách sử dụng phần cứng.
Chúng ta đang đạt được tiến bộ lớn. Không chỉ nghiên cứu cho thấy huấn luyện hậu kỳ bằng học tăng cường có thể nhanh hơn 10 lần và rẻ hơn, mà Pluralis hiện đang chạy thuần túy trên RTX 4090, nó sẽ chứng minh rằng bạn có thể huấn luyện một mô hình ngôn ngữ lớn (LLM) thực sự trên thiết bị tiêu dùng thuần túy. Bởi vì một nửa TCO (tổng chi phí sở hữu) của trung tâm dữ liệu là bảo trì cơ sở vật chất và làm mát, trong khi cụm thiết bị (Swarm) không có các chi phí này, vì vậy nó sẽ trở nên rẻ hơn. Ngay cả khi tốc độ chậm hơn một chút, nhưng do chi phí thấp hơn nhiều, nó vẫn có tính khả thi về kinh tế.
Những thuật toán đầu tiên (như DiLoCo, Sparse LoCo và thuật toán của Google hai năm trước) đã giúp quy mô tham số phát triển từ 10 tỷ, 40 tỷ lên 72 tỷ. Hiện tại Macrocosmos đã đạt 100 tỷ tham số. Thế hệ thuật toán tiếp theo sẽ chia nhỏ mô hình, tôi nghĩ sử dụng các phương pháp này chúng ta sẽ đạt đến cấp độ nghìn tỷ tham số.
Haseeb: Hãy để tôi đóng vai người hoài nghi.
Đầu tiên, xây dựng một mô hình lớn có hai hạn chế: điện toán và băng thông. Quy luật vật lý không thể bị phá vỡ, nếu không đặt các thiết bị gần nhau về mặt vật lý và liên lạc thông qua kết nối băng thông cao, mà lại liên lạc qua internet công cộng và nén các cập nhật gradient, bạn chắc chắn phải trả giá rất lớn. Và các máy trong mạng phi tập trung nằm rải rác, hoàn toàn không thể tính toán chính xác "tổng chi phí sở hữu (TCO)". Lập luận này những người làm lưu trữ phi tập trung trước đây cũng đã nói: "Bây giờ tuy chậm, nhưng sau này thuật toán tối ưu hóa rồi sẽ tốt." Kết quả thế nào? Lưu trữ phi tập trung hoàn toàn không có nhu cầu, bởi vì tính ra không rẻ cũng không hiệu quả.
Quan trọng nhất là: hạn chế lớn nhất khi huấn luyện một mô hình lớn là dữ liệu. Để huấn luyện một mô hình có quy mô khoảng 8 nghìn tỷ tham số như Mythos hay Fable, bạn cần một lượng khổng lồ dữ liệu Token. OpenAI và Anthropic chi số tiền khổng lồ để tạo dữ liệu từ các nhà cung cấp, họ trả giá cao để tạo dữ liệu tổng hợp và thu thập dữ liệu người dùng từ Claude Code và Codex. Những người trong mạng phi tập trung hoàn toàn không có những dữ liệu đó.
Gác lại kinh tế học, hãy nhìn vào phía nhu cầu. Tôi nghĩ đề xuất giá trị cốt lõi của tiền mã hóa không phải là phi tập trung, phi tập trung chỉ là phương tiện, mục đích là tự chủ và chống kiểm duyệt. Đây cũng là lý do Satoshi Nakamoto thiết kế Bitcoin. Trong lĩnh vực AI, mọi người quan tâm điều gì? Thứ nhất là chi phí; thứ hai là tự sở hữu mô hình và dữ liệu không bị đưa vào tập huấn luyện; thứ ba là chống kiểm duyệt. Mọi người rất ghét chế độ kiểm duyệt của Fable 5 và cơ chế làm suy giảm hiệu suất ngầm bên trong của nó.
Hãy nhìn Venice AI, nó là tâm điểm của giới sản phẩm AI tiền mã hóa hiện nay. Nó sử dụng Near AI để tính toán bảo mật, bảo vệ quyền riêng tư và không lưu giữ dữ liệu. Nhưng mô hình được sử dụng nhiều nhất trên Venice không phải là mô hình nào được huấn luyện phi tập trung (không phải từ Pluralis, v.v.), mà là các mô hình mã nguồn mở, mở quyền thông thường do các công ty như DeepSeek hoặc GLM-5 vận hành. Điều này cho thấy, hướng phát triển của AI có thể là: mọi người muốn trải nghiệm riêng tư và chống kiểm duyệt, nhưng không nhất thiết phải thông qua cơ chế phi tập trung cấp cơ sở như Bitcoin hoặc Ethereum.
Jesus: Những người làm AI phi tập trung và tập trung thường giải quyết các vấn đề lạc hậu hai thế hệ. Một nhà nghiên cứu vài ngày trước nói với tôi, "tiền huấn luyện chưa được giải quyết hoàn toàn, nhưng đã rất nhàm chán rồi." Rất nhiều đổi mới về suy luận đến từ huấn luyện hậu kỳ, bây giờ chúng ta đang nói về đệ quy, học liên tục, v.v. AI tập trung với sự khác biệt về nhân tài và vốn đầu tư, khoảng cách thực ra ngày càng lớn. Về mô hình nhỏ và tính toán ở thiết bị cuối, nhiều khi chỉ cần lấy mô hình lớn chưng cất (như Gemma của Google) là rất tốt. Nếu bạn xây một cụm phi tập trung, vất vả huấn luyện một tháng, giữa chừng có máy tính nào đó mất kết nối khiến toàn bộ sụp đổ, tôi thậm chí không biết bạn sẽ kết thúc như thế nào.
Jake: Điểm này bạn nói sai rồi, cụm huấn luyện phi tập trung lại có khả năng chịu lỗi cực kỳ mạnh mẽ. Trong một trung tâm dữ liệu khổng lồ, nếu một GPU hỏng, bạn có thể cần phải khởi động lại huấn luyện; trong khi ở Swarm, các GPU có kích thước và hình dạng khác nhau có thể vào ra mạng bất cứ lúc nào trong khi huấn luyện đang diễn ra mà không gây ảnh hưởng tiêu cực. Bằng chứng lớn nhất là, Google gần đây đã viết trong blog rằng họ bắt đầu sử dụng các thuật toán kiểu DiLoCo trong chính trung tâm dữ liệu của mình.
Về vấn đề dữ liệu, Haseeb nói đúng, nhưng điều này không có nghĩa là người phi tập trung không có dữ liệu, còn người tập trung có dữ liệu. Trên thị trường có rất nhiều khách hàng muốn có nền kinh tế học AI tốt hơn. Ví dụ, hãng luật Kirkland & Ellis gần đây thông báo sẽ chi 500 triệu USD để mua tập dữ liệu độc quyền của riêng họ để huấn luyện, họ thậm chí sẽ tuyển kỹ sư AI nội bộ trong hãng luật. Đối với những khách hàng như họ, với ngân sách 500 triệu USD muốn huấn luyện mô hình riêng, mạng phi tập trung loại bỏ chi phí làm mát và bảo trì trung tâm dữ liệu, với tư cách là một lớp điện toán cơ sở, chi phí sẽ giảm đi rất nhiều.
Haseeb: Lý do Kirkland & Ellis làm vậy là vì họ không muốn chia sẻ dữ liệu của họ. Nếu họ đưa dữ liệu vào mạng phi tập trung, dữ liệu của họ sẽ bị lộ. Họ không làm vậy vì nghĩ mình giỏi huấn luyện mô hình, mà là muốn nội bộ hóa giá trị. Tại sao lại đưa nó cho Harvey (công cụ AI pháp lý) chứ?
Jake: Ai nói rằng huấn luyện phi tập trung nhất định phải minh bạch công khai? Hoàn toàn có thể làm thành có giấy phép riêng tư mà. Quan trọng hơn, khi quyền số của mô hình bị phân tán, không có thực thể đơn lẻ nào nắm toàn bộ quyền số, người dùng mô hình phải trả tiền cho mạng lưới. Dòng doanh thu này không còn chảy vào Sam Altman của OpenAI hay Dario của Anthropic nữa, mà chảy vào những người nắm giữ token, người mua và người tham gia huấn luyện trong mạng lưới. Điều này tạo ra một mô hình kinh doanh và dòng doanh thu cho mô hình. Các hãng luật truyền thống không nhất thiết sẽ áp dụng ngay, nhưng chắc chắn có công ty sẽ thấy đây là một cách tốt để tài trợ cho sản phẩm.
Tấn Công Mạng, Địa Chính Trị và Pháo Đài Cuối Cùng
Camila: Nếu tất cả những điều này có thể thực hiện được, AI phi tập trung mạnh như AI tập trung. Trong tình huống như mô hình Fable bị chính phủ yêu cầu đóng cửa, mạng phi tập trung có thể chống kiểm duyệt không?
Jake: Chống kiểm duyệt thực ra không phải là nhiệm vụ hàng đầu của các mạng lưới này. Nhưng nếu thực sự muốn làm vậy, bạn có thể chia nhỏ mạng nơ-ron, phân tán quyền số ở hàng chục quốc gia, khi đó sẽ không thể bị buộc đóng cửa. Nhưng tôi nhắc lại, mục tiêu cuối cùng của AI phi tập trung là giảm rào cản, phổ cập hóa sức mạnh điện toán, để nhiều người hơn có thể huấn luyện được mô hình.
Jesus: OpenAI trước đây đã đề cập "bản thân mô hình không còn là sản phẩm nữa". Trong lĩnh vực AI phi tập trung, mọi người dường như bị ám ảnh với việc xây dựng mô hình, trong khi thực tế đang tụt hậu so với công nghệ hiện có hai đến ba thế hệ. Chúng ta nên tìm kiếm giá trị trong cơ sở hạ tầng xung quanh mô hình: hộp cát (sandbox) dùng để thực thi mã và tính toán, cơ chế đánh giá (Evals), đường ống dữ liệu tổng hợp và các khả năng môi trường khác. Rất nhiều ứng dụng tài chính hiện đại có thể được xây dựng tại giao điểm của DeFi và AI, nhưng chúng ta vẫn chưa tận dụng hết.
Haseeb: Quay lại câu hỏi ban đầu, nếu AI cấp độ tiên phong thực sự được mở mã nguồn hoàn toàn, tràn lan khắp nơi, ngay cả kiểm soát xuất khẩu cũng không ngăn được, điều gì sẽ xảy ra?
Tôi nghĩ một cơn sóng thần an ninh mạng cấp độ "Covid-19" sẽ bùng phát toàn cầu. Những phần mềm không thể vá lỗi, máy chủ của các công ty nhỏ, sẽ bị phá hủy tan tành. Hãy nhìn vào dữ liệu trên chuỗi: tháng 4 năm 2026 là tháng có số vụ tấn công hacker nhiều nhất trong lịch sử tiền mã hóa, ngay sau đó tháng 5 lại phá kỷ lục mới. Mặc dù tổng số tiền bị đánh cắp chưa quá lớn, nhưng tần suất xảy ra vụ việc tăng thẳng, có nghĩa là việc cất giữ tiền trong các giao thức nhỏ nguy hiểm hơn bao giờ hết.
Nếu mọi người trên thế giới đều cầm trong tay "súng bazooka", chắc chắn sẽ dẫn đến việc một lượng lớn cơ sở hạ tầng bị phá hủy. Mặc dù sau khi trải qua đau đớn, trong vòng hai đến ba năm hệ thống của chúng ta sẽ được trang bị "giáp xe tăng", nhưng thời kỳ chuyển tiếp trong lúc đó sẽ cực kỳ khốc liệt.
Camila: Đặt một công cụ mạnh mẽ như vậy trong tay tất cả mọi người, chẳng phải tốt hơn là chỉ kiểm soát trong tay một vài công ty và chính phủ sao?
Haseeb: Trong số "mỗi người" bạn nói, có bao gồm cả Triều Tiên đấy. Bạn thực sự muốn Triều Tiên có được Mythos sao?
Camila: Vậy bạn thà để chính phủ Mỹ độc chiếm, thậm chí để họ kiểm duyệt người khác, còn hơn là để toàn nhân loại chia sẻ?
Haseeb: Nếu chỉ có thể chọn giữa "chỉ Mỹ dùng được" và "cả thế giới dùng được", tôi chọn Mỹ. Nếu bạn thực sự tin rằng AGI (trí tuệ nhân tạo tổng quát) sẽ xuất hiện, thì nó là vũ khí mạnh nhất trong lịch sử nhân loại. Từ xưa đến nay, vũ khí hủy diệt hàng loạt đều do các quốc gia có chủ quyền kiểm soát, điều này rất bình thường. Tôi không lo Trung Quốc có bom hạt nhân, họ hành động ổn định và có quy hoạch dài hạn; tôi lo là Triều Tiên, các tổ chức khủng bố và các nhóm tin tặc vô chính phủ. Giống như tôi không lo Trung Quốc có bom hạt nhân, nhưng tôi thực sự lo Triều Tiên nhấn nút.
Camila: Cuối cùng mời Jake và Jesus tổng kết. Haseeb bắn phá quá dữ dội, chúng ta cần một chút tiếp nhiên liệu cho niềm tin vào phi tập trung.
Jake: Từ góc độ nhà đầu tư, điều quan trọng là tìm ra các lĩnh vực có tỷ lệ rủi ro/lợi nhuận cực kỳ tốt. AI phi tập trung là một lĩnh vực rất thú vị. Mấy hôm trước khi ăn tối, một người bạn của chúng tôi nói: "Tiền mã hóa đang trở thành một mô hình kinh doanh lưu lượng đơn thuần, chúng ta nên làm gì?" Trong một thế giới như vậy, AI phi tập trung có thể nói là pháo đài cuối cùng trong lĩnh vực tiền mã hóa, nó là công nghệ tiên phong thực sự phát huy tác dụng. Tôi rất hào hứng với các công ty của chúng tôi làm việc trong lĩnh vực này (như Pluralis, Prime, Intel, Jensen, Bagel, Pearl, v.v.).
Jesus: AI phi tập trung chắc chắn có giá trị, nhưng tôi vẫn không lạc quan về "tiền huấn luyện" phi tập trung. Tôi nghĩ có cơ hội khổng lồ tồn tại trong cơ sở hạ tầng AI phi tập trung, công nghệ cơ sở của Crypto quá cũ kỹ rồi, cả thế giới đang dùng AI để hiện đại hóa, sự kết hợp giữa DeFi và AI chắc chắn là cơn sốt tiếp theo.






