Phân tích toàn cảnh thị trường suy luận AI, các dự án tiền mã hóa đột phá thế nào?

Foresight NewsXuất bản vào 2026-06-25Cập nhật gần nhất vào 2026-06-25

Tóm tắt

Phân tích toàn cảnh thị trường AI Inference: Các dự án Crypto có thể đột phá ra sao? Thị trường suy luận AI (inference) hiện không còn giống một thị trường dịch vụ đám mây đơn thuần, mà giống một bàn cờ "Risk" phức tạp. Các nhà cung cấp cạnh tranh trên các lãnh địa khác nhau: các nhà cung cấp dịch vụ đám mây quy mô lớn (hyperscalers) thống trị lục địa doanh nghiệp, các bộ định tuyến (router) kiểm soát tuyến đường giao dịch, còn các mạng phi tập trung chiến đấu ở biên giới mở. Trong khi đào tạo mô hình từng là trọng tâm, thì hiện tại giá trị kinh tế khổng lồ lại nằm ở khâu suy luận – quá trình mô hình tạo ra câu trả lời khi nhận được yêu cầu. Mỗi lời nhắc, vòng lặp tác nhân, hay giao dịch đều cần được thực thi ở đâu đó. Bộ định tuyến chính là nút thắt cổ chai có giá trị, quyết định luồng yêu cầu và phân phối phần thưởng. OpenRouter là một ví dụ điển hình. Một thị trường suy luận hoàn chỉnh cần có: token như đơn vị kế toán, lớp trao đổi (như OpenRouter), cung cấp dịch vụ chuyên nghiệp (Fireworks, Together...), và các mạng AI phi tập trung (Chutes, Akash, io.net...). Các nhà cung cấp truyền thống bán sự tin cậy, trải nghiệm nhà phát triển và quy trình mua sắm doanh nghiệp. Các mạng AI crypto tập trung vào nguồn cung rẻ hơn, truy cập mở, tính riêng tư, khả năng xác minh và vòng lặp khuyến khích mới. Lý do suy luận mới là thị trường AI thực sự: chất lượng mô hình nguồn mở đang được cải thiện nhanh với chi phí thấp hơn nhiều, dẫn đến cạnh tranh khốc liệt về giá token. Điề...


Tác giả: 0xSammy(Khala Research)

Biên dịch: AIdidiaoJP, Foresight News


Thị trường suy luận AI hiện tại không còn giống một thị trường dịch vụ điện toán đám mây đơn thuần, mà giống một bàn cờ "Risk". Mỗi nhà cung cấp đều đang tranh giành những vùng lãnh thổ khác nhau: các nhà cung cấp siêu đám mây lớn khống chế lục địa doanh nghiệp, các bộ định tuyến kiểm soát tuyến đường thương mại, còn các mạng phi tập trung đang cố gắng xâm chiếm biên giới mở.


Trọng tâm của chu kỳ AI trước là huấn luyện mô hình, nhưng ngày càng rõ ràng rằng, khâu suy luận mới chứa đựng giá trị kinh tế khổng lồ. Nhiều người có lẽ lần đầu nghe thấy từ "inference" (suy luận), vậy nó thực sự là gì?


Huấn luyện tạo ra mô hình AI, còn suy luận là quá trình mô hình tạo ra câu trả lời khi có người hỏi hoặc giao nhiệm vụ.


Tổng quan thị trường suy luận AI


Khâu huấn luyện chiếm nhiều tiêu đề vì nó hỗ trợ những đầu ra đáng kinh ngạc. Nhưng thực tế, suy luận hiện đang chiếm phần lớn lợi ích kinh tế — mỗi một lời nhắc, vòng lặp tác tử, tạo hình ảnh, thực thi giao dịch, gọi công cụ và chỉnh sửa mã, đều phải chạy ở đâu đó.


Bộ định tuyến là điểm nghẽn thực sự


Trong bàn cờ "Risk", lãnh thổ có giá trị nhất thường là những nút cổ chai hẹp, quyết định bước di chuyển tiếp theo của quân đội. Trong thị trường suy luận, các bộ định tuyến đóng vai trò hoàn toàn tương tự. Chúng nằm giữa nhu cầu và cung ứng, quyết định mỗi yêu cầu sẽ đi về đâu, nhà cung cấp nào được trả tiền.


Một ví dụ điển hình là OpenRouter, giao thức của họ tuần trước đã xử lý 4700 nghìn tỷ token.


Hoạt động kinh tế này hoàn toàn không có dấu hiệu chậm lại, đặc biệt khi hàng nghìn tỷ tác tử sắp đi vào hoạt động.



Vậy, một thị trường suy luận hoàn chỉnh cần những gì? Yếu tố cốt lõi bao gồm:


  • token đang trở thành đơn vị kế toán
  • OpenRouter đang nhanh chóng trở thành lớp trao đổi cốt lõi, với lượng token được sử dụng qua thị trường LLM của họ chỉ trong tuần trước đã đạt 4700 nghìn tỷ.
  • Bên cung chuyên nghiệp: Fireworks, Together, Replicate, Baseten, Groq và các nhà cung cấp siêu đám mây lớn.
  • Mạng AI mã hóa: Các dự án như Chutes, Akash, io.net, Nosana, Targon, Venice, NuNet, đang xây dựng phiên bản gốc không cần cấp phép.


Đừng coi tất cả các nhà cung cấp này đang cạnh tranh trong cùng một thị trường — chúng hoàn toàn không phải vậy.


Các nhà cung cấp truyền thống bán độ tin cậy, trải nghiệm nhà phát triển và quy trình mua sắm cấp doanh nghiệp.


Mạng AI mã hóa chú trọng cung ứng rẻ hơn, truy cập mở, quyền riêng tư, khả năng xác minh và các vòng lặp khuyến khích mới.


Sự kiện gần đây khi Anthropic cấm người dùng ngoài Mỹ sử dụng mô hình Mythos (Fable 5) của họ, khiến nhiều người nhận thức lại rủi ro của việc phụ thuộc quá mức vào một mô hình độc quyền tiên phong duy nhất.


Thú vị là, hai thế giới bắt đầu chồng lấn: quyền riêng tư, tính toán bảo mật hoặc thanh toán gốc tác tử (Venice và Targon nổi bật ở khía cạnh này).


Cách nhìn nhận thị trường sức mạnh tính toán AI


Góc nhìn tốt hơn là chia thị trường thành hai phe chính: truyền thống và mã hóa:



Bên truyền thống bán độ tin cậy, trải nghiệm nhà phát triển và mua sắm doanh nghiệp.


Mạng mã hóa chủ yếu cạnh tranh về truy cập mở, nguồn cung chi phí thấp hơn, quyền riêng tư, khả năng xác minh và cơ chế khuyến khích mới, nhằm phối hợp vốn liền mạch toàn cầu.


Tại sao suy luận mới là thị trường AI thực sự


Tầng mô hình vẫn quan trọng, nhưng chất lượng mô hình đang bị nén với tốc độ vượt kỳ vọng. Các mô hình mã nguồn mở đã đạt 90-95% chất lượng của mô hình tiên phong, nhưng chỉ với 10% chi phí (ví dụ: GLM-5.2 của Z.ai).



Các mô hình mã nguồn mở tiếp tục lặp, các phòng lab Trung Quốc liên tục hạ giá. Mô hình tiên phong vẫn duy trì được giá cao hơn, nhưng bên dưới đó, cạnh tranh định giá token đã rất khốc liệt.



Đây chính là lý do tầng định tuyến trở nên quan trọng: cùng một mô hình mã nguồn mở có thể được cung cấp bởi năm nhà cung cấp khác nhau với năm mức giá khác nhau, nhà phát triển không muốn mã hóa cứng một điểm cuối mãi mãi, họ cần bộ định tuyến.



Bộ định tuyến có thể lựa chọn dựa trên giá, độ trễ, quyền riêng tư, độ tin cậy và nhiều yếu tố khác.



Nó nằm trên tất cả các nhà cung cấp, biến bức tranh hỗn loạn thành một giao diện thống nhất sạch sẽ.


Đây chính là điều OpenRouter làm đúng, và giải thích tại sao các quỹ đầu tư mạo hiểm đã rót 113 triệu USD vào vòng tài trợ B gần đây, để nắm bắt cơ hội định tuyến này.



OpenRouter đang nhanh chóng trở thành giao diện thị trường: một chìa khóa truy cập hàng trăm mô hình xuyên nhiều nhà cung cấp. Giá trị thực sự không nằm ở danh sách mô hình, mà ở việc một yêu cầu có thể được định tuyến đến nhà cung cấp phù hợp nhất cho nhiệm vụ đó.


Điều này bắt đầu giống thị trường năng lượng: người dùng không quan tâm nhà máy điện nào phát điện, họ chỉ quan tâm đèn có sáng không, giá có hợp lý không, hệ thống có ổn định không.



Người dùng AI cũng sẽ ngày càng suy nghĩ như vậy — họ không quan tâm cụm GPU nào phục vụ token này, chỉ quan tâm phản hồi có nhanh, rẻ, riêng tư và đáng tin cậy không.


Nhà cung cấp suy luận truyền thống



Bên truyền thống đang phân hóa thành bốn loại:


i) Các nhà cung cấp siêu đám mây lớn (Hyperscalers): AWS, Google, Microsoft


Họ kiểm soát "fortified continents" (các lục địa được củng cố). Họ chiến thắng không phải vì luôn rẻ nhất, mà vì đã kiểm soát quy trình mua sắm doanh nghiệp, tuân thủ, danh tính, bảo mật và hệ thống hóa đơn. Tấn công trực diện vào vị trí này có chi phí cực cao.


Họ thắng nhờ sự tin tưởng của doanh nghiệp. Công ty lớn mua không chỉ token, mà còn là sự tuân thủ, bảo mật, thuận tiện mua sắm và có người chịu trách nhiệm khi có vấn đề.


ii) Thị trường định tuyến: OpenRouter và các cổng AI khác


Bộ định tuyến nằm trên các nhà cung cấp mô hình, gửi mỗi yêu cầu đến tùy chọn tốt nhất. Khi vị thế dẫn đầu mô hình thay đổi hàng tuần, việc mã hóa cứng một mô hình duy nhất ngày càng mong manh. AI cần bộ tổng hợp, giống như trong lĩnh vực mã hóa.


iii) Dịch vụ tối ưu hóa mô hình mã nguồn mở: Together, Fireworks, Baseten, Groq


Họ không chỉ là API rẻ, mà là các công ty hạ tầng hiệu năng tập trung vào tốc độ, xử lý hàng loạt, mở rộng, tinh chỉnh, điểm cuối tùy chỉnh và hỗ trợ sản xuất.


iv) Thị trường mô hình: Replicate và các nền tảng tương tự như Hugging Face


Suy luận không chỉ là trò chuyện. Hình ảnh, video, giọng nói, nhúng, mô hình robot, mô phỏng và tác tử đa phương thức đều cần mô hình chạy. Thị trường giúp nhu cầu mô hình dài hạn dễ tiếp cận hơn.


Nhà cung cấp suy luận AI mã hóa


Mạng phi tập trung là "lãnh thổ du kích"


Các mạng suy luận mã hóa không cố gắng chi tiêu nhiều hơn trên chiến trường chính của AWS. Họ mở ra mặt trận mới: mô hình không kiểm duyệt, cung cấp GPU rẻ hơn, suy luận riêng tư, thanh toán gốc tác tử, và khối lượng công việc không cần độ tin cậy cấp nhà cung cấp siêu đám mây.


Bên mã hóa thường bị gộp chung là "sức mạnh tính toán phi tập trung", cách nói này quá mơ hồ, có ít nhất năm hướng khác nhau:


  • Mạng suy luận không máy chủ
  • Thị trường GPU phi tập trung
  • Mạng tính toán bảo mật
  • Ứng dụng và cổng AI riêng tư
  • Tầng điều phối


Chúng không nên được phân tích ngang bằng.


i) Chutes: Suy luận gốc mã hóa


@chutes_ai được hiểu tốt nhất là nền tảng suy luận phi tập trung, chứ không chỉ đơn thuần là thị trường GPU.


Cốt lõi là: Nhà phát triển không muốn thuê GPU hay quản lý hạ tầng, họ muốn một điểm cuối hoạt động. Chutes phục vụ mô hình mã nguồn mở qua API quen thuộc, sử dụng nguồn cung GPU phi tập trung ở lớp dưới.


Câu hỏi then chốt là liệu có thể chuyển đổi lượng sử dụng hàng đầu thành nhu cầu trả phí, lặp lại (recurring) hay không. Token rẻ có ích, nhưng với điều kiện nhà phát triển tin tưởng vào thời gian hoạt động, độ trễ và độ tin cậy của nó.


Doanh thu trên mỗi nghìn tỷ token của họ tiếp tục tăng, cho thấy tiềm năng lợi nhuận / khả thi bền vững.



ii) Akash: Tầng đấu giá GPU


@akashnet là thị trường điện toán đám mây phi tập trung.


Người dùng định nghĩa sức mạnh tính toán cần thiết, nhà cung cấp đấu thầu cung ứng, khối lượng công việc chạy qua hợp đồng thuê. Nó giống thị trường sức mạnh tính toán hơn là bộ định tuyến suy luận trực tiếp.


Nó phù hợp nhất với khối lượng công việc nhạy cảm về giá, có thể chịu được biến động hạ tầng và không cần tích hợp sâu với AWS/Azure/Google Cloud. Phí có tương quan nhất định với giá token và đang có xu hướng tăng.


iii) io.net: Điện toán đám mây GPU phi tập trung


@ionet gần giống nhà cung cấp điện toán đám mây GPU phi tập trung hơn.


Điểm bán cốt lõi là truy cập vào nguồn cung GPU phân tán với chi phí thấp hơn và tốc độ cấu hình nhanh hơn, phù hợp cho các nhóm AI cần sức mạnh tính toán nhưng không muốn ký hợp đồng đám mây dài hạn hay chấp nhận định giá của nhà cung cấp siêu đám mây.


Thách thức nằm ở thực thi: xác minh phần cứng, độ tin cậy, lập lịch, hỗ trợ và hiệu suất nhất quán. Truy cập GPU thô có giá trị, nhưng tầng lợi nhuận cao hơn vẫn là định tuyến, quản lý suy luận và điều phối.


io.net nổi bật trong 30 ngày qua, với doanh thu hàng năm đạt 12,3 triệu USD.



iv) Targon: Tính toán bảo mật


@TargonCompute (được xây dựng bởi @manifoldlabs) tập trung vào tính toán bảo mật cho khối lượng công việc AI.


Vấn đề nó giải quyết rõ ràng: Nhiều người dùng không muốn chạy lời nhắc nhạy cảm, mô hình hoặc dữ liệu trên cơ sở hạ tầng được vận hành bởi bên thứ ba không xác định.


Targon cung cấp thực thi được bảo vệ thông qua môi trường thực thi đáng tin cậy, máy ảo mã hóa, chứng nhận từ xa và cơ sở hạ tầng GPU bảo mật. Nói đơn giản, nó chứng minh khối lượng công việc chạy trong môi trường an toàn và giảm thiểu những gì nhà điều hành có thể thấy.


Điều này đặc biệt liên quan đến suy luận riêng tư trong các lĩnh vực như tài chính, chăm sóc sức khỏe và AI doanh nghiệp. Tính toán bảo mật không phải phép màu, nó chuyển sự tin tưởng sang phần cứng, phần sụn và hệ thống chứng nhận.


Năm ngoái, giao thức này báo cáo doanh thu hàng năm 10,4 triệu USD và đồng tác giả một bài nghiên cứu với Intel về "sức mạnh tính toán phi tập trung trên phần cứng không đáng tin".



v) Darkbloom: Suy luận riêng tư trên Mac nhàn rỗi


Darkbloom (được xây dựng bởi @eigenlabs) đi theo một hướng khác.


Nó không phân mảnh mô hình lớn sang GPU ngẫu nhiên, mà biến các máy Mac Apple Silicon nhàn rỗi thành mạng suy luận riêng tư. Mac chạy mô hình cục bộ, yêu cầu được mã hóa và định tuyến đến nhà cung cấp đã được xác minh.


Điểm bán là quyền riêng tư và chi phí, không phải tối đa hóa hiệu suất mô hình tiên phong.


Điều này hữu ích vì "không có nút nào giữ toàn bộ mô hình" không tự động có nghĩa lời nhắc là riêng tư. Darkbloom nhắm mục tiêu rõ ràng hơn vào vấn đề quyền riêng tư, nhưng vẫn cần chứng minh quy mô cung cấp, hiệu suất và sự tin tưởng của nhà phát triển.


Hiện tại mạng đã có 300 máy, phục vụ 20 tỷ token và 1 triệu yêu cầu.



vi) Venice: Suy luận riêng tư hướng người tiêu dùng


@AskVenice ở vị trí khác với các mạng như Akash hay io.net. Nó giống ứng dụng AI riêng tư và cổng suy luận hơn, chứ không chủ yếu là thị trường GPU.


Thông lượng cổng của nó đã đạt 85 tỷ token mỗi ngày (số liệu từ @ErikVoorhees).



</p

Hầu hết người dùng muốn một sản phẩm AI tôn trọng quyền riêng tư, có thể truy cập các mô hình mạnh mẽ và không thu thập nhiều dữ liệu.


Venice đóng gói ý tưởng cơ sở hạ tầng thành trải nghiệm hướng người tiêu dùng, xoay quanh lời nhắc riêng tư, mô hình mã nguồn mở, truy cập không kiểm duyệt, chức năng API và sức mạnh tính toán được token hóa thông qua VVV và DIEM.


Thành phần DIEM đặc biệt thú vị, nó hướng đến ý tưởng rộng hơn về kinh tế tác tử: cung cấp quyền truy cập sức mạnh tính toán 1 USD mỗi ngày. Thị trường gần đây đã định giá khá tốt cho khái niệm này.


Nếu tác tử cần truy cập suy luận liên tục, thì tín dụng sức mạnh tính toán bắt đầu giống tài sản gốc tác tử, toàn bộ thị trường thứ cấp có thể xây dựng xung quanh nó.


Một tác tử có thể trực tiếp nắm giữ và sử dụng quyền sức mạnh tính toán sẽ thiết thực hơn một tác tử phụ thuộc vào con người định kỳ quẹt thẻ tín dụng.


Điều này nêu bật luận điểm AI mã hóa sâu hơn: Tác tử cuối cùng cần truy cập vốn, danh tính, bộ nhớ và sức mạnh tính toán, và hệ thống mã hóa cung cấp khuôn khổ để lập trình hóa các tài nguyên này.


Venice không cạnh tranh trực tiếp với OpenRouter về bề rộng mô hình, mà cạnh tranh về quyền riêng tư, truy cập và sức mạnh tính toán được token hóa. Đây là một phân khúc hợp lý (legitimate), nhưng câu hỏi then chốt là nhu cầu sản phẩm AI riêng tư có đủ lớn để hỗ trợ mô hình token vượt qua chu kỳ tường thuật hiện tại hay không. Đánh giá của tôi là, khi AI phổ biến, tường thuật về quyền riêng tư sẽ chỉ ngày càng mạnh mẽ.


vii) NuNet: Điều phối sức mạnh tính toán phân tán


@nunet_global thường được xếp vào các dự án sức mạnh tính toán phi tập trung, nhưng khuôn khổ hữu ích hơn là "điều phối".


Điều phối liên quan đến việc ghép nối khối lượng công việc với tài nguyên sức mạnh tính toán phù hợp nhất, và phối hợp thực thi giữa các máy, môi trường và vị trí khác nhau.



Điều này ngày càng quan trọng khi AI vượt ra ngoài cơ sở hạ tầng đám mây tập trung.


Hệ thống AI trong tương lai rất có thể sẽ chạy xuyên qua GPU đám mây, thiết bị biên, máy chủ cục bộ, robot, điện thoại, cảm biến và mạng nhà cung cấp phi tập trung.


Robot kho hàng có thể không thể chờ phản hồi API xuyên khu vực; máy bay không người lái không thể giả định luôn có kết nối hoàn hảo; robot thực địa cần thực hiện suy luận cục bộ khi mạng không đáng tin cậy.


Do đó, điều phối đang trở thành một danh mục độc lập và có ý nghĩa.


Thách thức của NuNet là liệu có thể chuyển đổi vấn đề phối hợp này thành một mạng kinh tế hoạt động (functioning) với đủ nguồn cung, nhu cầu và sự chấp nhận của nhà phát triển hay không.


viii) OpenServ: Điều phối tác tử, không chỉ là suy luận thuần túy


@openservai được hiểu tốt nhất là nền tảng hạ tầng và điều phối tác tử, chứ không phải mạng suy luận phi tập trung.


Điều này quan trọng vì tác tử là một trong những nguồn nhu cầu suy luận rõ ràng nhất trong tương lai. Chatbot thông thường có thể chỉ gọi mô hình một lần, trong khi tác tử sẽ gọi mô hình liên tục: suy luận, sử dụng công cụ, kiểm tra đầu ra, gọi mô hình khác, hành động, và sau đó lặp lại.


Điều này tạo ra nhu cầu suy luận nặng nề, đã được chú ý trong cộng đồng mã hóa.


Do đó, OpenServ liên quan đến thị trường suy luận từ phía nhu cầu chứ không phải phía cung. Nếu nền tảng này có thể trở thành nơi hữu ích để nhà phát triển xây dựng, triển khai và điều phối tác tử, nó tự nhiên sẽ trở thành tầng định tuyến suy luận cơ bản đến các nhà cung cấp khác nhau.


Câu hỏi then chốt là OpenServ có thể trở thành tầng thực thi tác tử thực sự hay chỉ là một thị trường tác tử khác đi kèm token.


Sau nhiều lần trao đổi với nhóm, tôi tin rằng khả năng của họ không dừng lại ở điều sau, khung suy luận của họ có một số hiệu suất đáng chú ý (notable) trên các điểm chuẩn, và lộ trình còn có mô hình độc quyền riêng.


Nếu OpenServ có thể kiểm soát quy trình công việc vận hành hóa tác tử, thì suy luận trở thành đầu vào của nền tảng chứ không phải sản phẩm chính.


Trong thế giới hóa tác tử, tầng có giá trị nhất sẽ là nơi tác tử dành nhiều thời gian và tài nguyên liên tục.


ix) Dolphin AI: Suy luận phi tập trung được sản phẩm dẫn dắt


@dphnAI thú vị ở chỗ nó bắt đầu từ nhu cầu mô hình chứ không phải từ thị trường GPU.


Gia đình mô hình Dolphin đã có danh tiếng về các mô hình mã nguồn mở không kiểm duyệt, điều này mang lại cho mạng lưới lý do tồn tại rõ ràng hơn.


Điều này quan trọng vì nhiều dự án suy luận phi tập trung đều theo hướng cung trước: "Chúng tôi có GPU, bây giờ ai mua?"


Dolphin thì ngược lại: bắt đầu từ tập hợp mô hình mà mọi người đã muốn dùng, sau đó xây dựng mạng suy luận phi tập trung xung quanh nhu cầu đó.


Kiến trúc của nó thường được gọi là peer-to-pool: Chủ sở hữu GPU đóng góp dung lượng vào một nhóm mô hình cụ thể, thay vì mỗi người mua thuê trực tiếp một nút cụ thể. Yêu cầu được định tuyến đến nhóm, nút khả dụng xử lý.


Đây là thiết kế tốt hơn cho nguồn cung người tiêu dùng không đáng tin cậy. Nếu ai đó đóng góp GPU chơi game nhàn rỗi, họ có thể không luôn trực tuyến, mô hình nhóm có thể hấp thụ biến động này một cách tự nhiên hơn so với thị trường cho thuê một-một.


Thú vị hơn là xác minh. Dolphin đang thúc đẩy live-weight proofs (bằng chứng trọng số thời gian thực). Nói đơn giản, nó kiểm tra xem trọng số mô hình thực tế được tải trong quá trình phục vụ có khớp với mô hình mà nút tuyên bố đang chạy hay không.


Điều này quan trọng vì gian lận là một trong những vấn đề khó nhất trong suy luận phi tập trung. Một nút có thể tuyên bố chạy mô hình đắt tiền, nhưng lại lén lút phục vụ phiên bản mô hình nhỏ hơn, rẻ hơn hoặc đã được lượng tử hóa. Nếu mạng không thể phát hiện, toàn bộ thị trường sẽ mất uy tín.


x) c0mpute: Suy luận phân tán hướng tác tử


@c0mputeAI đáng chú ý vì nó cố gắng giải quyết một trong những vấn đề khó nhất trong suy luận phi tập trung: chạy mô hình lớn trên nhiều GPU phân tán trên internet mở.


Shard engine của nó chia nhỏ mô hình trên nhiều máy, thay vì yêu cầu một máy chủ khổng lồ chứa toàn bộ mô hình. Điều này đặc biệt liên quan đến các mô hình mã nguồn mở quy mô tiên phong có thể quá lớn hoặc bị hạn chế để chạy qua đường lưu trữ thông thường.


Liên kết với @virtuals_io là góc độ phía nhu cầu then chốt. Virtuals đang xây dựng nền kinh tế tác tử, và tác tử là người dùng suy luận nặng: chúng lập kế hoạch, gọi công cụ, giao dịch, kiểm tra kết quả và lặp lại. Điều này tạo ra nhu cầu suy luận rẻ, mở và chống kiểm duyệt.


Điểm cần lưu ý (caveat) là điều này vẫn ở giai đoạn đầu. c0mpute cần chứng minh hiệu suất dưới tải thực, độ tin cậy của nút, xác minh và quyền riêng tư của lời nhắc.


Nhưng hướng đi quan trọng: Thị trường GPU bán quyền truy cập sức mạnh tính toán; c0mpute đang cố gắng phân phối chính mô hình.


Suy luận truyền thống vs mã hóa


Cả hai sẽ cùng tồn tại, mỗi bên có lợi thế riêng biệt rõ ràng và đáng hiểu.



Cần theo dõi những gì


Lượng token trả phí


Thị trường nên giảm sự chú ý đến thống kê xử lý token thô, trừ khi những token đó tạo ra doanh thu. Hoạt động ở cấp độ miễn phí và sử dụng được trợ cấp có thể tạo ra những con số đẹp, nhưng không thể chứng minh sự phù hợp thị trường sản phẩm thực sự.


Nhu cầu suy luận trả phí mới là chỉ số then chốt — nó bền vững hơn, có thể hỗ trợ tính khả thi lâu dài.


ii) Doanh thu trên mỗi GPU


Mạng sức mạnh tính toán phi tập trung chỉ bền vững khi giá trị mà GPU kiếm được trong mạng cao hơn bên ngoài. Nếu phát hành là lý do chính để nhà cung cấp tham gia, một khi khuyến khích giảm, nguồn cung sẽ biến mất. Nhà cung cấp GPU sẽ tính toán chi phí cơ hội.


iii) Tích hợp bộ định tuyến: Phân phối


Phân phối thường quan trọng hơn chính cơ sở hạ tầng.


Tích hợp OpenRouter, mã hóa tác tử, ví, điểm cuối thanh toán, công cụ nhà phát triển và ứng dụng người tiêu dùng, đều là nguồn nhu cầu tiềm năng.


Điểm cuối thanh toán là kênh mà phần mềm có thể trả tiền trực tiếp cho dịch vụ thông qua API.


iv) Xác minh


Gian lận GPU, dung lượng giả và nhà cung cấp không đáng tin cậy vẫn là rủi ro thực tế.


Mạng cần xác minh phần cứng mạnh mẽ (robust), lưu lượng mã hóa, hệ thống danh tiếng và hình phạt có ý nghĩa (meaningful) đối với hành vi xấu.


v) Đảm bảo quyền riêng tư


Suy luận riêng tư vẫn là một trong những cơ hội AI mã hóa mạnh nhất, nhưng đảm bảo phải thực sự. Tiếp thị quyền riêng tư thì dễ; thực thi an toàn, kiến trúc ưu tiên cục bộ, tối thiểu hóa dữ liệu và cơ sở hạ tầng có thể kiểm tra thì khó hơn nhiều.


vi) Nắm bắt giá trị token


Mô hình token mạnh nhất sẽ liên kết trực tiếp nhu cầu với việc sử dụng suy luận thực tế. Điều này có thể liên quan đến mua lại, hủy, yêu cầu đặt cược, quyền sức mạnh tính toán hoặc cơ chế liên kết với doanh thu.


Chỉ dựa vào tường thuật AI chung chung về lâu dài là không đủ.


Kết luận cốt lõi


Trò chơi cuối cùng là kiểm soát nhu cầu


Trong bàn cờ "Risk", chỉ sở hữu những vùng lãnh thổ rời rạc là không đủ. Bạn cần các khu vực kết nối, tuyến đường tăng viện và đường tiếp tế bền vững.


Trong thị trường suy luận cũng vậy. Người chiến thắng sẽ kiểm soát nhu cầu, định tuyến, xác minh và thanh toán; chỉ sở hữu GPU là không đủ.


Thị trường suy luận khiến AI bắt đầu giống (resemble) hệ thống tài chính:


  • Mỗi token được tạo ra đều mang theo chi phí,
  • Mỗi điểm cuối đều mang theo lợi nhuận,
  • Mỗi vòng lặp tác tử đều tạo ra nhu cầu,
  • Mỗi bộ định tuyến đều giống như nhà tạo lập thị trường,
  • Mỗi mạng GPU đều trở thành nguồn cung...


Các nhà cung cấp truyền thống hiện đang thống trị tầng trải nghiệm nhà phát triển và sự tin tưởng của doanh nghiệp.


Các mạng AI mã hóa đang khám phá một biên giới khác: cung ứng không cần cấp phép, suy luận riêng tư, sức mạnh tính toán có thể xác minh, quyền truy cập được token hóa và thanh toán gốc tác tử (không giới hạn KYC).


Trong ngắn hạn, người chiến thắng khó có thể là mạng phi tập trung nhất, mà có khả năng là mạng làm cho suy luận phi tập trung cảm giác bình thường và đáng tin cậy — thông qua điểm cuối nhanh, tài liệu mạnh mẽ, thời gian hoạt động đáng tin cậy, định giá minh bạch, nguồn cung được xác minh và nhu cầu trả phí chân thực (genuine).


Chutes vẫn là một trong những dự án đáng theo dõi chặt chẽ, vì nó gần nhất với việc chuyển đổi sức mạnh tính toán được hỗ trợ bởi Bittensor thành một thị trường suy luận hoạt động (functioning), chứ không chỉ là tường thuật GPU đơn thuần. "Darkbloom" của Eigen Labs cũng vậy.


Akash và io.net đại diện cho những kẻ thách thức phía cung, Targon đại diện cho luận điểm tính toán bảo mật, Venice đại diện cho tầng nhu cầu AI riêng tư, NuNet đại diện cho sự điều phối tương lai sức mạnh tính toán phân tán hơn.


Luận điểm rộng hơn:


"Mô hình AI có thể ngày càng trở thành hàng hóa, nhưng thị trường suy luận khó có thể tuân theo cùng một con đường."


Giá trị lớn nhất sẽ thuộc về những thực thể định tuyến công việc, xác minh công việc, thanh toán công việc và nắm bắt nhu cầu.


Đây chính là nơi cơ hội AI mã hóa tiếp theo có thể xuất hiện... ít nhất là cho đến khi AI vật lý có thể đảm đương trong xã hội.

Câu hỏi Liên quan

QThị trường AI inference đang phát triển như thế nào, và vì sao nó được ví như một bàn cờ 'Risk'?

AThị trường AI inference đã phát triển từ một thị trường dịch vụ đám mây đơn lẻ thành một bàn cờ chiến lược phức tạp, được ví như trò chơi 'Risk'. Mỗi nhà cung cấp đang tranh giành các 'lãnh thổ' khác nhau: các nhà cung cấp dịch vụ đám mây quy mô lớn (hyperscalers) kiểm soát thị trường doanh nghiệp, các bộ định tuyến (router) nắm giữ các tuyến đường giao dịch, và các mạng phi tập trung đang chiến đấu ở vùng biên mở. Sự so sánh này nhấn mạnh đến các điểm thắt cổ chai và vị trí chiến lược quyết định luồng yêu cầu và giá trị trong hệ sinh thái.

QVai trò của Router (như OpenRouter) trong thị trường AI inference là gì và tại sao chúng quan trọng?

ARouter (bộ định tuyến) như OpenRouter đóng vai trò là điểm thắt cổ chai và lớp trao đổi trung tâm trong thị trường AI inference. Chúng định tuyến từng yêu cầu (request) của người dùng đến nhà cung cấp dịch vụ inference phù hợp nhất dựa trên các yếu tố như giá cả, độ trễ, quyền riêng tư và độ tin cậy. Điều này biến một hệ sinh thái phức tạp với nhiều nhà cung cấp thành một giao diện thống nhất và sạch sẽ cho nhà phát triển. Tầm quan trọng của chúng thể hiện qua khối lượng giao dịch khổng lồ (ví dụ: 4700 nghìn tỷ token/tuần của OpenRouter) và là lý do thu hút đầu tư mạo hiểm lớn.

QSự khác biệt chính giữa các nhà cung cấp inference truyền thống và các mạng AI mã hóa (crypto AI) là gì?

ACác nhà cung cấp truyền thống (như AWS, Google Cloud) tập trung vào việc bán độ tin cậy, trải nghiệm nhà phát triển và quy trình mua sắm doanh nghiệp. Họ thắng thế nhờ sự tin tưởng của doanh nghiệp, tính tuân thủ và an ninh. Ngược lại, các mạng AI mã hóa (như Akash, io.net, Targon) cạnh tranh ở các mặt trận khác: cung cấp truy cập mở, nguồn cung GPU rẻ hơn, tính riêng tư, khả năng xác minh và các vòng lặp khuyến khích mới (như thanh toán gốc cho agent, token hóa). Họ không cố gắng đánh bại các gã khổng lồ đám mây trên sân chơi chính mà mở ra các cuộc chiến mới về quyền riêng tư và truy cập không cần cấp phép.

QDự án crypto AI nào tập trung vào 'Tính toán bảo mật' (Confidential Computing) và nó giải quyết vấn đề gì?

ADự án Targon (do Manifold Labs xây dựng) tập trung vào Tính toán bảo tàng cho khối lượng công việc AI. Nó giải quyết vấn đề về quyền riêng tư và bảo mật dữ liệu nhạy cảm khi chạy trên cơ sở hạ tầng của bên thứ ba. Targon sử dụng các môi trường thực thi đáng tin cậy (TEE), máy ảo được mã hóa và xác nhận từ xa để đảm bảo khối lượng công việc chạy trong một môi trường an toàn, giảm thiểu những gì nhà điều hành có thể nhìn thấy. Điều này đặc biệt liên quan đến các lĩnh vực như tài chính, chăm sóc sức khỏe và AI doanh nghiệp.

QTheo bài viết, các chỉ số nào là quan trọng cần theo dõi để đánh giá sự thành công của một mạng lưới inference phi tập trung?

ACác chỉ số quan trọng bao gồm: 1) Khối lượng token được trả phí (Paid token volume), phản ánh nhu cầu thực tế và sự phù hợp thị trường bền vững, thay vì chỉ số lượt sử dụng miễn phí. 2) Doanh thu trên mỗi GPU, để đảm bảo nhà cung cấp kiếm được nhiều giá trị trong mạng hơn bên ngoài. 3) Mức độ tích hợp với các router và điểm phân phối (như OpenRouter). 4) Hiệu quả của cơ chế xác minh (verification) chống gian lận. 5) Các đảm bảo thực sự về quyền riêng tư. 6) Mô hình nắm bắt giá trị của token, liên kết trực tiếp với việc sử dụng inference thực tế.

Nội dung Liên quan

Kỹ sư từ SpaceX tái cấu trúc hệ thống thực thi tài chính từ nguyên lý đầu tiên

Dự án cơ sở hạ tầng tài chính Plan Execution Lab vừa công bố hoàn thành vòng gọi vốn thiên thần do một văn phòng gia đình nổi tiếng ở Singapore dẫn đầu, định giá sau đầu tư đạt 50 triệu USD. Người sáng lập Lex Li, cựu kỹ sư SpaceX, áp dụng tư duy nguyên lý đầu tiên (First Principles Thinking) để phân tích lại thị trường tài chính. Ông cho rằng chức năng cốt lõi của thị trường là phân bổ vốn, và quá trình then chốt biến quyết định thành hành động là "thực thi". Tuy nhiên, tầng thực thi hiện nay vẫn phụ thuộc nhiều vào quy trình làm việc thủ công của con người. Trong kỷ nguyên AI và Agent, tốc độ suy giảm chiến lược ngày càng nhanh. Thách thức lớn không còn là tiếp cận thông tin, mà là thực thi liên tục và hiệu quả. Plan Execution Lab tin rằng đơn vị cạnh tranh trong tương lai không phải là chiến lược đơn lẻ, mà là mạng lưới thực thi (Execution Network) được tạo thành từ các năng lực cơ bản như quản lý rủi ro, phân bổ vốn, phối hợp thanh khoản. Công ty đang phát triển hai sản phẩm chính: 1. **PlanX**: Một giao thức thực thi tài chính (Financial Execution Protocol), nhằm mục tiêu trở thành cơ sở hạ tầng cho làn sóng di chuyển hoạt động giao dịch từ các sàn tập trung (CEX) lên chuỗi (on-chain). 2. **Xgent**: Một thời gian chạy tài chính tự chủ (Autonomous Financial Runtime), cho phép người dùng chỉ cần xác định mục tiêu và ràng buộc, hệ thống sẽ tự động xây dựng đồ thị thực thi, xác minh và thực thi chiến lược. Tầm nhìn dài hạn của nhóm là xây dựng môi trường vận hành cho kỷ nguyên tài chính tự chủ (Autonomous Finance), tương tự như vai trò của Bloomberg Terminal trong thế giới tài chính truyền thống. Cơ sở hạ tầng tương lai sẽ được xây dựng chung bởi một mạng lưới các nút thực thi, nhà cung cấp thanh khoản và đại lý tài chính tự chủ. Sức cạnh tranh cốt lõi trong tương lai sẽ nằm ở mạng lưới thực thi mạnh mẽ và linh hoạt nhất.

链捕手12 phút trước

Kỹ sư từ SpaceX tái cấu trúc hệ thống thực thi tài chính từ nguyên lý đầu tiên

链捕手12 phút trước

Cựu kỹ sư SpaceX tái cấu trúc hệ thống thực thi tài chính bằng Nguyên lý Đầu tiên

Dự án cơ sở hạ tầng tài chính Plan Execution Lab vừa hoàn thành vòng gọi vốn thiên thần do một văn phòng gia đình nổi tiếng Singapore dẫn đầu, định giá sau đầu tư đạt 50 triệu USD. Người sáng lập Lex Li, cựu kỹ sư SpaceX, áp dụng tư duy nguyên lý đầu tiên để định hình lại hệ thống thực thi tài chính. Ông cho rằng chức năng cốt lõi của thị trường là phân bổ vốn, và thực thi là quá trình biến quyết định thành hành động. Trong khi tài sản, thanh khoản và thanh toán đã chuyển lên blockchain, thì tầng thực thi vẫn phụ thuộc nhiều vào quy trình làm việc thủ công của con người. Kỷ nguyên AI Agent đang đẩy nhanh tốc độ suy giảm hiệu quả của các chiến lược. Plan Execution Lab không xây dựng sàn giao dịch hay bot giao dịch thông minh hơn, mà tập trung vào hai sản phẩm chính: 1. **PlanX:** Một giao thức thực thi tài chính, nhằm trở thành cơ sở hạ tầng hỗ trợ dòng giao dịch di chuyển từ các sàn tập trung (CEX) lên chuỗi, cung cấp khả năng thực thi, kết nối thanh khoản và quản lý rủi ro. 2. **Xgent:** Một thời gian chạy tài chính tự chủ, cho phép người dùng chỉ cần xác định mục tiêu và ràng buộc, hệ thống sẽ tự động xây dựng đồ thị thực thi, xác minh và thực thi. Tầm nhìn dài hạn là tạo ra một mạng lưới thực thi mở, nơi các nút thực thi, nhà cung cấp thanh khoản và đại lý tài chính tự chủ cùng đóng góp và hợp tác. Lex Li ví tổ hợp PlanX + Xgent như "Bloomberg Terminal cho kỷ nguyên tài chính tự chủ". Cạnh tranh trong tương lai không nằm ở chiến lược đơn lẻ, mà ở mạng lưới thực thi mạnh mẽ và có khả năng thích ứng.

marsbit13 phút trước

Cựu kỹ sư SpaceX tái cấu trúc hệ thống thực thi tài chính bằng Nguyên lý Đầu tiên

marsbit13 phút trước

Bộ Dữ Liệu Đào Tạo Doc2Repo Dài Hạn Đầu Tiên, Code Agent Không Chỉ Sửa Lỗi, Bắt Đầu Tạo Kho Lưu Trữ

Khả năng của Code Agent đang dần vượt ra ngoài việc sửa lỗi đơn lẻ, tiến tới các nhiệm vụ dài hạn cấp repository. Nghiên cứu mới từ Đại học Nhân dân Trung Quốc giới thiệu DeNovoSWE - tập dữ liệu đào tạo đầu tiên dành riêng cho việc tạo mã cấp kho lưu trữ từ đầu. Tập dữ liệu này chứa 4.818 nhiệm vụ chất lượng cao, được xây dựng thông qua cơ chế "Chia để trị" (Divide & Conquer) và "Phê bình & Sửa chữa" (Critic & Repair), nhằm giải quyết thách thức trong việc tạo toàn bộ kho mã chức năng từ một tài liệu mô tả. Phương pháp này phân tích kho mã mục tiêu thành các "năng lực" (capabilities), sau đó sử dụng một quy trình đa tác nhân để tự động tạo tài liệu nhiệm vụ rõ ràng, có cấu trúc, vừa đủ chi tiết để đánh giá nhưng không làm lộ chi tiết triển khai. Một kỹ thuật lọc theo độ khó được áp dụng để cân bằng giữa chất lượng và tính đa dạng của dữ liệu. Kết quả thử nghiệm cho thấy hiệu quả rõ rệt: Mô hình Qwen3-30B-A3B-Instruct được huấn luyện trên DeNovoSWE đã cải thiện hiệu suất trên benchmark BeyondSWE-Doc2Repo từ 5.8% lên 47.2% và trên NL2RepoBench từ 4.3% lên 23.0%. Điều này khẳng định nhu cầu về dữ liệu được thiết kế đặc biệt cho các tác vụ dài hạn, thay vì chỉ dựa vào dữ liệu sửa lỗi thông thường. DeNovoSWE đánh dấu một bước tiến quan trọng, cung cấp môi trường đào tạo có hệ thống để phát triển các Code Agent thực sự có khả năng hiểu yêu cầu, lập kế hoạch kiến trúc và tạo ra toàn bộ kho phần mềm có thể thực thi.

marsbit30 phút trước

Bộ Dữ Liệu Đào Tạo Doc2Repo Dài Hạn Đầu Tiên, Code Agent Không Chỉ Sửa Lỗi, Bắt Đầu Tạo Kho Lưu Trữ

marsbit30 phút trước

Ngay cả CZ cũng khen Hyperliquid 'tuyệt vời', nhưng hào nước bảo vệ lớn nhất của nó, có lẽ cũng là rủi ro lớn nhất

Tác giả Liam 'Akiba' Wright trên Cryptoslate thảo luận về những đánh giá của cựu CEO Binance, CZ, đối với nền tảng giao dịch phái sinh phi tập trung Hyperliquid. Trong một podcast, CZ khen ngợi sản phẩm của Hyperliquid là "tuyệt vời" nhưng đồng thời chỉ ra rằng Binance không thể và sẽ không cạnh tranh trong phân khúc "không KYC + tường thuật phi tập trung" mà Hyperliquid đang hoạt động, do những rủi ro pháp lý và tuân thủ đi kèm. Bài viết phân tích rằng lợi thế cạnh tranh chính (hay "hào rào bảo vệ") của Hyperliquid nằm ở khả năng cung cấp trải nghiệm giao dịch hợp đồng tương lai vĩnh cửu mà không yêu cầu xác minh danh tính (KYC) nghiêm ngặt, khác biệt với các sàn giao dịch tập trung tuân thủ. Tuy nhiên, chính đặc điểm này cũng là rủi ro lớn nhất của họ. Cơ quan quản lý, như FCA của Anh (đã đưa ra cảnh báo về Hyperliquid), ngày càng chú ý và có thể xem xét mô hình này dưới góc độ một nhà cung cấp dịch vụ tài chính cần được cấp phép. Bài viết chỉ ra rằng trong khi các thị trường được quản lý chặt chẽ (như CME, Cboe) đang phát triển các sản phẩm tương tự như hợp đồng vĩnh cửu, thì lợi thế còn lại của Hyperliquid sẽ ngày càng thu hẹp vào yếu tố "truy cập mở" – yếu tố dễ bị áp lực pháp lý nhất. Nhận xét của CZ nhấn mạnh sự đánh đổi then chốt: Hyperliquid có một vị trí độc đáo vì Binance không thể sao chép mô hình của họ, nhưng thành công lâu dài phụ thuộc vào việc liệu "hào rào bảo vệ" đó có thể chịu được áp lực ngày càng tăng từ các nhà quản lý hay không.

marsbit48 phút trước

Ngay cả CZ cũng khen Hyperliquid 'tuyệt vời', nhưng hào nước bảo vệ lớn nhất của nó, có lẽ cũng là rủi ro lớn nhất

marsbit48 phút trước

Một cuộc chiến bảo vệ mệnh giá khó khăn: STRC ngày càng xa rời mốc 100 USD

STRC, cổ phiếu trả cổ tức của công ty nắm giữ Bitcoin Strategy (trước là MicroStrategy) do Michael Saylor lãnh đạo, đang giao dịch ở mức 80.84 USD, thấp hơn nhiều so với mệnh giá mục tiêu 100 USD mà công ty công bố. Với ngày chốt danh sách cổ tức chỉ còn một tuần, áp lực đưa giá trở lại 100 USD là rất lớn. Tình hình càng nghiêm trọng khi giá trung bình theo khối lượng (VWAP) trong tháng 6 của STRC là 94.09 USD, vượt qua ngưỡng 95 USD. Theo quy tắc nội bộ, điều này buộc Strategy phải tăng cổ tức lên ít nhất 0.5% cho kỳ tiếp theo, gấp đôi mức tăng thông thường 0.25%, đưa tỷ suất cổ tức hàng năm lên khoảng 12%. Tuy nhiên, cổ tức cao không đảm bảo giá sẽ phục hồi. Cổ tức được trả trong 24 kỳ nửa tháng và có thể bị công ty điều chỉnh hoặc ngừng bất cứ lúc nào. Đầu tư vào STRC chủ yếu dựa trên kỳ vọng và không có sự đảm bảo nào. Bài viết nêu ra bốn công cụ khác Strategy có thể sử dụng để hỗ trợ giá: mua lại cổ phiếu trên thị trường mở, tạm dừng phát hành cổ phiếu mới ở mức trên 100 USD, tích lũy tiền mặt bằng cách bán cổ phiếu phổ thông MSTR, hoặc công bố các phúc lợi đặc biệt cho cổ đông STRC. Tuy nhiên, khả năng thực hiện và hiệu quả của các biện pháp này đều bị hạn chế. Lịch sử cho thấy STRC từng trở lại mức 100 USD nhờ việc công ty tăng cổ tức và tạm dừng phát hành cổ phiếu mới. Câu hỏi đặt ra là Strategy sẵn sàng trả giá bao nhiêu để thu hút dòng tiền và lặp lại thành công đó.

Foresight News1 giờ trước

Một cuộc chiến bảo vệ mệnh giá khó khăn: STRC ngày càng xa rời mốc 100 USD

Foresight News1 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片