Biên soạn: Pink Brains
Biên dịch: AididiaoJP, Foresight News
AI phi tập trung tồn tại vì AI tập trung có những điểm tắc nghẽn cấu trúc, và những điểm tắc nghẽn này không thể được giải quyết chỉ bằng vốn và mã code:
- Tài nguyên tính toán khan hiếm và đắt đỏ
- Quyền kiểm soát tập trung quá mức
- Đầu ra của mô hình không thể xác minh
- Việc thu thập dữ liệu huấn luyện ngày càng khó khăn
Tài nguyên tính toán khan hiếm và đắt đỏ
Cơ sở hạ tầng GPU dự kiến sẽ tăng từ 100 tỷ USD năm 2025 lên 770 tỷ USD vào năm 2035. GPU của trung tâm dữ liệu đã liên tục cháy hàng trong nhiều tháng. Thị trường tính toán phi tập trung dự kiến sẽ tăng từ 90 tỷ USD năm 2024 lên 220 tỷ USD vào năm 2035 (theo số liệu của Research and Markets). Con số này chỉ đúng nếu bạn tin rằng sự thiếu hụt là vấn đề cấu trúc chứ không phải chu kỳ, và chúng tôi cho rằng đó chính là vấn đề cấu trúc.
Quyền kiểm soát tập trung quá mức
ChatGPT, Gemini, Grok, Claude đều được sở hữu và vận hành bởi một vài công ty tư nhân. Các chính sách AI hiện tại giả định rằng chỉ có một số ít thực thể có khả năng tập trung khối lượng tài nguyên tính toán khổng lồ mới có thể huấn luyện được các hệ thống mạnh mẽ. Một khi phá vỡ giả định này, bức tranh về việc ai có thể xây dựng trí tuệ tiên phong sẽ thay đổi hoàn toàn.
Đầu ra không thể xác minh
Khi một mô hình đưa ra quyết định, người dùng không thể xác minh liệu mô hình chính xác có đang chạy không, tính toán có được thực hiện đúng không, dữ liệu nhạy cảm có bị rò rỉ không. Điều này có thể chấp nhận được với chatbot, nhưng hoàn toàn không thể chấp nhận được khi AI xử lý các khoản vay, chăm sóc sức khỏe, hoặc các tác nhân tự trị vận hành ví tiền thời gian thực.
Việc thu thập dữ liệu huấn luyện ngày càng khó khăn, nguyên nhân nằm ở lo ngại về quyền riêng tư và quy định
Một trình thu thập thông tin tập trung nằm trong một khu vực AWS duy nhất sẽ nhanh chóng bị giới hạn tốc độ, chặn theo địa lý, hoặc bị cung cấp bộ nhớ cache độc hại. Như a16z đã nói trong triển vọng năm 2026, quyền riêng tư đang trở thành "hào bảo vệ quan trọng nhất trong lĩnh vực tiền mã hóa".
AI cần blockchain để làm cho trí thông minh trở nên mở, có thể xác minh và có thể tiếp cận về mặt kinh tế.
Bản đồ ngăn xếp công nghệ AI phi tập trung
- Tầng Ứng dụng & Dịch vụ: Tác nhân AI có thể làm nhiều việc, nhưng trong lĩnh vực tiền mã hóa, hai trường hợp sử dụng chủ đạo hiện nay là Tài chính Tác nhân (Agentic Finance) và Thanh toán Tác nhân (Agentic Payments)
- Tầng Middleware: Các tổ chức kết nối - từ các khuôn khổ xây dựng và nhận dạng tác nhân, thị trường tác nhân, đến tầng điều phối
- Tầng Cơ sở hạ tầng: Tài nguyên cốt lõi của AI - tầng quyền riêng tư và xác minh, tính toán, suy luận, huấn luyện, dữ liệu và lưu trữ
Tầng Ứng dụng & Dịch vụ
Tài chính Tác nhân biến lời nhắc bằng ngôn ngữ tự nhiên thành hành động trên chuỗi.
Tác nhân ARMA của @gizatechxyz đã xử lý hơn 4.6 tỷ USD khối lượng giao dịch qua tác nhân trên các thị trường cho vay được chọn - chạy theo từng khối, không giám sát, trên khuôn khổ AVS của EigenLayer.
@Infinit_Labs vận hành một cụm gồm hơn 20 tác nhân chuyên nghiệp, có thể biến ý định như "kiếm 1000 đô la mỗi tháng với 1 BTC" thành các chiến lược một cú nhấp chuột trên Ethereum, Solana và Base.
@coinvestai bởi Liquid nhúng khả năng thực thi thời gian thực trực tiếp vào ChatGPT và Claude, hỗ trợ giao dịch trên 500+ thị trường thông qua Model Context Protocol.
@minara tích hợp Hyperliquid và gần đây đã tham gia Lighter. Nó chạy vòng lặp giao dịch hoàn chỉnh "phân tích → quyết định → thực thi" thông qua mô hình DMind và hơn 50 tích hợp.
@Cod3xOrg: Một mạng lưới các tác nhân AI nhẹ, có thể biến ý định thành các giao dịch trên chuỗi được xây dựng và thực thi.
@Zyfai_: Một tác nhân DeFAI tự giám sát, có thể tự động hóa và tối ưu hóa việc canh tác lợi nhuận, liên tục tái cân bằng vốn xuyên các giao thức để theo đuổi APY đã điều chỉnh rủi ro, không cần sự can thiệp của con người.
Về thị trường dự đoán, @SynthdataCo là một mạng con Bittensor, vận hành mạng lưới trí tuệ tài chính dự đoán phi tập trung. Các thợ đào cạnh tranh trong việc mô hình hóa sự không chắc chắn về giá ngắn hạn. Nó đã cung cấp dữ liệu thời gian thực cho các sản phẩm như Mode AI Quant của thị trường tiền mã hóa Kalshi.
Thanh toán Tác nhân: Máy móc thanh toán cho máy móc
Cũng như internet trở thành lớp truyền thông của nền kinh tế số, blockchain và stablecoin đang trở thành lớp thanh toán bù trừ cho thanh toán tác nhân.
Tính đến tháng 5 năm 2026, x402 đã xử lý hơn 173 triệu giao dịch trên Base và Solana, các thành viên của Quỹ x402 bao gồm Google, Visa, AWS, Circle, Anthropic, Stripe và Cloudflare. Stripe bắt đầu sử dụng nó từ tháng 2 năm 2026; AWS đã ra mắt AgentCore Payments nguyên bản.
Hoạt động của bên mua và bên bán đang gia tăng, hầu hết các giao dịch liên quan đến việc sử dụng trả phí theo nhu cầu thực tế: gọi API, dịch vụ suy luận AI, thương mại tác nhân và các khối lượng công việc tương tự. Chu kỳ cường điệu ban đầu đã nguội lạnh, nhưng lực kéo cơ bản đã bắt đầu theo kịp.
Đồng thời, Giao thức Thanh toán Máy móc (Machine Payments Protocol) của Stripe và Tempo đang xuất hiện như một tuyến thứ hai, ghi nhận hơn 411,900 giao dịch và 9600 người mua kể từ khi ra mắt.
Các mạng lưới này cùng nhau chỉ ra rằng thương mại máy-móc đang chuyển dịch theo hướng rộng hơn, nơi các tác nhân phần mềm có thể giao dịch tự chủ với tốc độ máy móc.
Tầng Middleware
Khi số lượng tác nhân tăng lên, vấn đề cốt lõi trở thành sự điều phối: các tác nhân phát hiện lẫn nhau, chứng minh danh tính và giao dịch mà không có sự tham gia của con người như thế nào.
Khoảng trống niềm tin ở đây là điểm tắc nghẽn. Quy mô ước tính của thương mại tác nhân sẽ đạt từ 1.5 nghìn tỷ đến 5 nghìn tỷ đô la vào năm 2030, nhưng việc áp dụng bị hạn chế bởi một điều - hầu hết người dùng sẵn sàng để AI nghiên cứu, nhưng rất ít người sẵn sàng để AI thực sự mua hàng.
Các hệ thống ngày nay vẫn phụ thuộc vào khóa API, và hầu như không có hệ thống nào coi tác nhân là thực thể có danh tính.
@GoKiteAI đang xây dựng một L1 chuyên biệt, biến danh tính và thanh toán thành các nguyên thủy gốc. ERC-8004 là tiêu chuẩn Ethereum, cung cấp danh tính và danh tiếng trên chuỗi di động cho các tác nhân, có thể theo dõi xuyên chuỗi.
Về mặt thị trường, @virtuals_io là hệ điều hành cho nền kinh tế tác nhân trên Base. Đến tháng 6 năm 2026, nó đã xử lý hơn 2.38 triệu nhiệm vụ tác nhân, tạo ra gần 480 triệu đô la "GDP Tác nhân".
Nhưng viên ngọc của tầng này là Bittensor. Đó là một mạng lưới các mạng con chuyên môn, mỗi mạng con là một nền kinh tế vi mô, nơi thợ đào chạy các mô hình AI, người xác thực chấm điểm đầu ra, lượng phát thải TAO chảy về những người tạo ra công việc hữu ích nhất. Có ba cơ chế khiến nó trở nên nghiêm túc về mặt kinh tế:
- Đợt giảm một nửa vào tháng 12 năm 2025 sẽ giảm lượng phát hành TAO hàng ngày từ 7200 xuống 3600, tương ứng với mức giới hạn cứng 21 triệu.
- Bản nâng cấp dTAO cung cấp cho mỗi mạng con token Alpha và nhóm AMM riêng - thị trường quyết định lượng phát thải.
- Bản nâng cấp Taoflow (ra mắt tháng 11 năm 2025) phân bổ lượng phát thải thuần túy dựa trên dòng chảy staking ròng. Một mạng con có thể giảm xuống 0 nếu nó unstake nhiều hơn stake. Về thiết kế, nó mang tính Darwin.
Mạng lưới đã vượt quá 128 mạng con hoạt động, 3 mạng con tính toán lớn nhất được báo cáo là đạt tổng doanh thu hàng năm lặp lại (ARR) 20 triệu đô la trong vòng ba tháng sau khi kiếm tiền. Chủ nghĩa Darwin chính là sản phẩm.
Các dự án khác tập trung vào việc tạo ra các blockchain AI chuyên dụng, hoặc cung cấp các công cụ, khuôn khổ và cơ chế khuyến khích cần thiết để hỗ trợ các hệ sinh thái AI thuộc sở hữu cộng đồng.
@NEARProtocol: Một lớp điều phối vô hình, kết hợp thanh toán bù trừ, danh tính, quyền riêng tư, TEE, MPC và bảo vệ PII, phục vụ các tác nhân tự chủ.
@base - "căn cứ chính" của "nền kinh tế tác nhân". Base MCP cho phép các công cụ AI như Claude, ChatGPT, Cursor thực thi các hành động trên chuỗi thông qua lời nhắc trên các nền tảng như Uniswap, Morpho, Avantis - hoán đổi, chuyển tiền, tương tác DeFi.
@SentientAGI: Hệ sinh thái GRID của nó kết nối các tác nhân, mô hình, dữ liệu và tính toán, định tuyến các truy vấn đến những người tham gia chuyên môn để cung cấp kết quả tốt nhất.
@gensynai: Thực thi ML có thể xác minh, điều phối phần cứng phân tán để huấn luyện và suy luận, đồng thời đảm bảo công việc đáng tin cậy, $AI điều phối mạng lưới.
@SaharaAI kết nối dữ liệu, mô hình, tác nhân và phần thưởng trong một hệ sinh thái AI gốc duy nhất.
Tầng Cơ sở hạ tầng
Cơ sở hạ tầng là bộ khung của AI - các nguyên thủy thô sơ về tính toán, suy luận, huấn luyện, dữ liệu và quyền riêng tư mà mọi thứ ở trên phụ thuộc vào. Đây là tầng đòi hỏi vốn nhiều nhất trong ngăn xếp AI phi tập trung.
Tính toán phi tập trung
@akashnet vận hành thị trường đấu giá ngược, nơi các nhà cung cấp đấu thầu để giành được khối lượng công việc của bạn. Trong quý 1 năm 2026, hợp đồng thuê mới tăng 27%, đạt hơn 43,500, tăng trưởng quý thứ ba liên tiếp. Dịch vụ suy luận AkashML của nó đã xử lý gần 120 tỷ token vào tháng 4, với giá rẻ hơn 60-85% so với các đám mây chính thống.
@rendernetwork công bố mức tăng trưởng sử dụng 428% so với cùng kỳ năm trước.
@ionet tổng hợp hơn 130,000 GPU từ hơn 130 quốc gia trên Solana.
@AethirCloud là một trong những dự án thực sự có doanh thu: tự báo cáo khoảng 166 triệu đô la ARR (Quý 3 năm 2025), đã cung cấp hơn 1.5 tỷ giờ tính toán.
Suy luận phân tán và có thể xác minh
Suy luận chiếm hơn 70% chi phí vận hành AI, Goldman Sachs dự kiến AI tác nhân sẽ thúc đẩy mức tiêu thụ token tăng 24 lần vào năm 2030 - 120 nghìn tỷ token mỗi tháng.
Câu trả lời phi tập trung là làm cho việc suy luận trở nên rẻ, riêng tư và có thể xác minh.
@AskVenice đã cung cấp hơn 50 tỷ token mỗi ngày cho hơn 2 triệu người dùng thông qua các mô hình riêng tư và không kiểm duyệt, hào bảo vệ của nó là các mô hình.
@OpenGradient đã xử lý hơn 2 triệu lần suy luận có thể xác minh, tạo ra hơn 500,000 chứng minh zkML.
@chutes_ai: Các nhà phát triển có thể triển khai và mở rộng quy mô các mô hình AI thông qua API đơn giản, được hỗ trợ bởi các thợ đào GPU, với chi phí có thể rẻ hơn tới 85% so với AWS. Doanh thu nền tảng được chuyển hóa thành nhu cầu token thông qua cơ chế staking tự động.
@dphnAI - Mạng lưới suy luận AI phi tập trung. Đáng chú ý, Dolphin đã phát triển các mô hình không kiểm duyệt mà Venice AI sử dụng, và dành 100% doanh thu mạng lưới để mua lại token.
Huấn luyện phi tập trung
Huấn luyện là vấn đề khó nhất, và cũng là vấn đề có tác động lớn nhất - nó quyết định liệu các mô hình tiên phong có phải được xây dựng nội bộ trong ba hoặc bốn phòng thí nghiệm doanh nghiệp hay không.
INTELLECT-1 (10 tỷ tham số) của @PrimeIntellect là lần chạy huấn luyện phân tán toàn cầu đầu tiên; INTELLECT-2 (32 tỷ tham số) là lần chạy RL phân tán đầu tiên.
@tplr_ai đã thành công trong việc huấn luyện Covenant-72B trên 70+ nút phân tán, xử lý khoảng 1.1 nghìn tỷ token, giảm chi phí truyền thông 146 lần.
@NousResearch: Mạng lưới Psyche của nó thực hiện huấn luyện phân tán chịu lỗi, Hermes 4.3 trở thành mô hình Hermes đầu tiên được huấn luyện trên cơ sở hạ tầng phi tập trung thay vì cụm tập trung.
Mạng con IOTA (SN9) của @MacrocosmosAI thực hiện huấn luyện trước LLM phi tập trung và "huấn luyện tại nhà", mạng con Data Universe (SN13) của nó xử lý lớp dữ liệu. Chuỗi thuật toán DiLoCo (giao tiếp thấp) cho phép các GPU phân tán trên toàn cầu hợp tác mà không cần mạng nội bộ siêu tốc của trung tâm dữ liệu.
Tính khả dụng dữ liệu và lưu trữ phi tập trung
Cả hai đang trở thành điểm tắc nghẽn khi quy mô khối lượng công việc AI mở rộng. Các mô hình tiên phong tiêu thụ một lượng dữ liệu mới khổng lồ, trong khi nhu cầu lưu trữ đã tăng vọt đến mức các nhà cung cấp ổ cứng chính báo cáo rằng công suất đã được bán hết trước nhiều năm.
Kinh tế học rất hấp dẫn. Lưu trữ phi tập trung có thể rẻ hơn 60-80% so với các nhà cung cấp đám mây truyền thống, các mạng lưới như @Filecoin cung cấp giá lưu trữ dưới 1 đô la mỗi tháng mỗi TB, trong khi các giải pháp thay thế tập trung vào khoảng 30 đô la.
@grass trả phí cho băng thông nhàn rỗi từ 2.5 triệu nút trên 190 quốc gia, cho phép các phòng thí nghiệm AI thu thập dữ liệu web thời gian thực.
@WalrusProtocol là đối thủ cạnh tranh mới nổi nhanh chóng do @Mysten_Labs xây dựng, dùng cho lưu trữ phi tập trung và tính khả dụng dữ liệu - sử dụng mã sửa lỗi hai chiều để lưu trữ hiệu quả các "blob" lớn, và ngày càng được định vị là lớp bộ nhớ lâu dài cho các tác nhân AI.
@eigencloud: Một nền tảng đám mây có thể xác minh được xây dựng xung quanh tính khả dụng dữ liệu, tính toán có thể xác minh và giải quyết tranh chấp. Được bảo đảm bởi ETH tái stake, lý thuyết của nó là cho phép các tác nhân AI chạy với sự đảm bảo mật mã, làm cho các hành động có thể chứng minh, kiểm toán và thực thi được.
@vana - một EVM L1, nơi các DAO Dữ liệu và Nhóm Thanh khoản Dữ liệu biến dữ liệu cá nhân thành tài sản có thể token hóa, có thể giao dịch.
@reppo và @oroagents xây dựng các tập dữ liệu chất lượng cao và đáng tin cậy cho việc huấn luyện AI thông qua các cuộc thi có tính khuyến khích.
Tầng Quyền riêng tư và Xác minh
Người dùng AI thông thường không thể xác minh liệu mô hình có xử lý dữ liệu của họ một cách riêng tư không, tính toán có được thực hiện đúng không, hay thậm chí liệu có sử dụng đúng mô hình đã tuyên bố không.
Vào năm 2026, quyền riêng tư và xác minh đang trở thành điều kiện tiên quyết đối với AI, chứ không phải là tính năng bổ sung.
@nillion - "máy tính mù", sử dụng MPC và Nil Message Compute của riêng mình để thực thi tính toán trên dữ liệu được mã hóa mà không cần giải mã. Các trường hợp sử dụng bao gồm suy luận AI riêng tư, cơ sở dữ liệu mã hóa và RAG riêng tư (cho phép AI truy vấn cơ sở kiến thức độc quyền mà không tiết lộ nó).
@Arcium: Mạng lưới tính toán bí mật phi tập trung trên Solana. Các trường hợp sử dụng bao gồm Umbra (chuyển tiền được che chắn / lợi nhuận riêng tư) và huấn luyện AI bí mật trên các tập dữ liệu nhạy cảm.
@OasisProtocol: L1 ưu tiên quyền riêng tư, sử dụng ROFL (Runtime Offchain Logic), một khuôn khổ dựa trên TEE để chạy tính toán ngoài chuỗi có thể xác minh, bảo vệ quyền riêng tư - tác nhân AI, huấn luyện mô hình hoặc oracle.
@octra: L1 ưu tiên quyền riêng tư hỗ trợ gốc FHE, sử dụng sơ đồ độc quyền HFHE (Hypergraph FHE), được thiết kế cho tính toán mã hóa song song và thông lượng.
@eigencloud: Đấu thủ nặng ký về xác minh, được xây dựng dựa trên sự bảo mật tái stake của EigenLayer. EigenAI (suy luận LLM có thể xác minh là một API tương thích với OpenAI cho các mô hình mã nguồn mở, trong đó lời nhắc và phản hồi có thể chứng minh là không bị giả mạo) và EigenCompute (thực thi ngoài chuỗi có thể xác minh cho logic tác nhân).
@PhalaNetwork. GPU đám mây mạnh mẽ nhưng không riêng tư; Phala làm cho khối lượng công việc có thể chứng minh được, thậm chí được che chắn khỏi chính Phala. Sản phẩm cốt lõi của nó, GPU TEE trên Phala Cloud, triển khai các mô hình mã nguồn mở lên phần cứng, cung cấp API tương thích với OpenAI, trong đó mỗi lần suy luận đều có chứng minh mật mã.
Hướng đi của AI phi tập trung 2026-2027
Nhu cầu AI đang tăng trưởng nhanh hơn tốc độ cơ sở hạ tầng theo kịp, các tác nhân AI đang trở thành động cơ tăng trưởng chủ đạo - đường ray trên chuỗi đã sẵn sàng.
Tính toán đang chuyển đổi thành một loại tài sản, các thị trường trên chuỗi đang trở thành lớp tài chính của nó. Các bên tham gia tổ chức đang chuyển từ thử nghiệm sang đầu tư vào cơ sở hạ tầng.
Kinh tế học token đang trở thành lợi thế cấu trúc của AI phi tập trung trong việc điều phối vốn, tính toán và dữ liệu. Cơ hội đang mở rộng từ AI sang robot, máy móc tự chủ và AI vật lý.
Kết luận
AI phi tập trung đang phát triển trong các ngăn xếp chính: cơ sở hạ tầng, middleware, ứng dụng, thể hiện qua doanh thu tính toán, nền kinh tế tác nhân tăng trưởng và huấn luyện phân tán quy mô lớn.
Nhưng lĩnh vực này vẫn còn sớm. Doanh thu thường tụt hậu so với động lực token, việc áp dụng vẫn không đồng đều, và mặc dù đầu tư vào AI nói chung tăng vọt, nhưng AI phi tập trung vẫn chỉ chiếm một phần nhỏ trong đầu tư mạo hiểm. Các mạng lưới được thúc đẩy bởi token có thể là một lợi thế mạnh mẽ, nhưng chỉ khi việc thiết kế nắm bắt giá trị là chính xác.
Tuy nhiên, sự xuất hiện của các dự án như Bittensor, NEAR, Virtuals, Base và Venice cho thấy AI phi tập trung đang tiến hóa từ một câu chuyện đầu cơ trở thành một phương thức mới để điều phối tính toán, dữ liệu, vốn và trí thông minh.











