Tóm tắt cốt lõi: Việc đào tạo các mô hình lớn đòi hỏi phải xây dựng hoặc nâng cấp các trung tâm dữ liệu. Nhưng cơ sở hạ tầng tập trung hiện nay đang phải đối mặt với giới hạn vật lý cứng. Để nâng cao năng lực cơ sở hạ tầng, AI được sử dụng để tạo ra quy mô và sản lượng thông minh lớn hơn. Tuy nhiên, việc kiểm soát sức mạnh tính toán đang trở thành một nút quyền lực then chốt trong ngành công nghiệp AI. Vào thời điểm này, Gonka ra đời. Giao thức Gonka là một mạng lưới toàn cầu không cần cấp phép, bất kỳ ai cũng có thể tham gia, yêu cầu được định tuyến một cách lập trình giữa những người tham gia phân tán. Trong cuộc trò chuyện độc quyền với Analytics Insight, Anastasia Matveeva, Đồng sáng lập kiêm Giám đốc sản phẩm cấp cao của Gonka, đã thảo luận về cách họ đổi mới trong phương thức tiếp cận sức mạnh tính toán để xây dựng một hệ sinh thái AI kiểm soát được và an toàn hơn.
Hỏi: Cuộc thảo luận của công chúng về AI thường tập trung vào vấn đề tập trung hóa mô hình, nhưng lại ít chú ý đến sự tập trung hóa sức mạnh tính toán. Tại sao việc kiểm soát sức mạnh tính toán lại đang trở thành một nút quyền lực then chốt trong ngành công nghiệp AI? Sự tập trung này có thể mang lại những rủi ro nào cho đổi mới và toàn bộ thị trường?
Trả lời: Các cuộc thảo luận công chúng thường tập trung vào mô hình vì mô hình là thứ có thể nhìn thấy được. Nhưng cốt lõi quyền lực thực sự nằm ở tầng sâu hơn - sức mạnh tính toán, đây là lớp nền tảng quyết định ai có thể xây dựng, triển khai và mở rộng các hệ thống AI.
Việc kiểm soát sức mạnh tính toán trở nên quan trọng vì lý do kinh tế và vật lý. Nút thắt cổ chai chính của AI hiện đại không còn là thuật toán nữa, mà là khả năng tiếp cận GPU, điện năng và dung lượng trung tâm dữ liệu.
Việc đào tạo các mô hình lớn ngày càng đòi hỏi phải xây dựng hoặc nâng cấp các trung tâm dữ liệu. Tuy nhiên, cơ sở hạ tầng tập trung đang gặp phải các giới hạn vật lý: mật độ năng lượng, các ràng buộc về tản nhiệt và khả năng cung cấp điện tối đa tại một địa điểm duy nhất. Ngành công nghiệp đang thử nghiệm các giải pháp cực đoan - thiết kế lại chip, hệ thống làm mát và các nguồn năng lượng mới.
Sự tập trung này mang lại những hậu quả mang tính hệ thống.
Đầu tiên, nó thiết lập các rào cản đổi mới có cấu trúc. Việc tiếp cận sức mạnh tính toán trở thành đặc quyền của cơ sở hạ tầng, chứ không phải là cạnh tranh dựa trên năng lực. Các nhóm nhỏ, nhà nghiên cứu độc lập và thậm chí toàn bộ khu vực bị loại trừ bởi giá cả, không gian thử nghiệm thu hẹp, đổi mới trở nên bảo thủ.
Thứ hai, sự tập trung hóa sức mạnh tính toán củng cố mô hình "trích lợi tức". AI có tiềm năng tạo ra "sự dồi dào" - bản chất thông minh có thể được sao chép - nhưng khi cơ sở hạ tầng cơ bản khan hiếm và bị kiểm soát, sự dồi dào này bị kìm hãm một cách nhân tạo. Thị trường chuyển hướng sang mô hình đăng ký, hiệu ứng khóa và quyền định giá, thay vì giảm chi phí và khả năng tiếp cận rộng rãi.
Thứ ba, nó mang lại sự dễ tổn thương mang tính hệ thống. Khi sức mạnh tính toán tiên tiến tập trung ở một số ít nhà vận hành và địa điểm, các xáo trộn về mặt quy định, chính trị hoặc vật lý sẽ ảnh hưởng đến toàn bộ hệ sinh thái AI. Sự phụ thuộc trở thành có cấu trúc, chứ không phải là tùy chọn.
Quan trọng hơn, sức mạnh tính toán không trung lập. Ai kiểm soát sức mạnh tính toán, người đó sẽ ngầm quyết định điều gì là khả thi, được cho phép và bền vững về mặt kinh tế. Khi sự kiểm soát đó được tập trung hóa, quản trị AI sẽ được hình thành theo mặc định, thay vì được thiết kế.
Rủi ro không chỉ là độc quyền, mà là sự bóp méo quỹ đạo phát triển AI về lâu dài: ít người xây dựng hơn, tính đa dạng ứng dụng thấp hơn, đổi mới phần cứng chậm hơn và cơ sở hạ tầng không thể theo kịp tham vọng của các mô hình thế hệ tiếp theo.
Do đó, sức mạnh tính toán phải được coi là cơ sở hạ tầng nền tảng - một kiến trúc có thể mở rộng về mặt kinh tế và vật lý, rất quan trọng đối với tương lai của AI.
Hỏi: Nhiều nền tảng sức mạnh tính toán AI - dù tập trung hay phi tập trung - đều tuyên bố là hiệu quả. Khi đánh giá hiệu quả của hệ thống sức mạnh tính toán AI, các chỉ số thực sự quan trọng là gì? Các mô hình này thường gặp phải những hạn chế thực tế ở những khía cạnh nào?
Trả lời: Hiệu quả tính toán thường được sử dụng như một khái niệm tiếp thị. Trên thực tế, chỉ có một số ít chỉ số cụ thể thực sự quan trọng, bao gồm hiệu suất phía người dùng, hiệu quả vận hành của nhà cung cấp và cấu trúc khuyến khích chi phối cả hai.
Đối với người dùng, hiệu quả có nghĩa là tốc độ và minh bạch về chi phí.
Tốc độ đề cập đến độ trễ dưới nhu cầu thực tế. Các trung tâm tập trung thường có lợi thế nhờ đồng vị trí vật lý. Nhưng nếu blockchain chỉ đóng vai trò là lớp bảo mật và không tham gia vào đường dẫn thực thi thời gian thực, kiến trúc phi tập trung cũng có thể đạt được hiệu suất tương tự. Miễn là các yêu cầu được xử lý ngoài chuỗi, bản thân giao thức sẽ không làm tăng độ trễ.
Minh bạch về chi phí cũng rất quan trọng. Mặc dù "chi phí mỗi token" là KPI phổ biến, nhưng tính toàn vẹn của mô hình thường thiếu minh bạch. Trong môi trường tập trung, sản phẩm có thể là hộp đen. Vào giờ cao điểm, nhà cung cấp có thể điều chỉnh cấu hình mô hình để duy trì lợi nhuận, những thay đổi này thường không nhìn thấy được nhưng có thể ảnh hưởng đến chất lượng đầu ra. Hiệu quả thực sự yêu cầu định giá phản ánh độ chính xác tính toán nhất quán.
Đối với nhà cung cấp, hiệu quả là sự cân bằng giữa mức độ sử dụng GPU và tính linh hoạt.
Các nhà khai thác tập trung hoạt động xuất sắc về mặt sử dụng, GPU trong môi trường đồng vị trí có thể chạy gần hết công suất, nhưng thiếu tính linh hoạt, phải chịu chi phí nhàn rỗi trong thời gian nhu cầu thấp.
Các mạng phi tập trung hy sinh mức độ sử dụng ở một mức độ nào đó để đổi lấy tính linh hoạt, nhưng phải giảm thiểu chi phí đồng thuận và xác minh, cho phép sức mạnh tính toán có thể được phân bổ lại giữa các khối lượng công việc khác nhau theo nhu cầu.
Quan trọng nhất là thiết kế khuyến khích.
Khi phần thưởng được liên kết với khối lượng công việc AI nhanh hơn, rẻ hơn, có thể xác minh được, việc tối ưu hóa trở thành có cấu trúc. Người tham gia được khuyến khích nâng cao hiệu quả phần cứng, giảm độ trễ, thử nghiệm chip chuyên dụng.
Ngược lại, nếu phần thưởng hoặc trọng số quản trị chủ yếu liên quan đến nắm giữ vốn, hướng tối ưu hóa sẽ lệch khỏi hiệu suất cơ sở hạ tầng, sự kém hiệu quả sẽ bị củng cố.
Trong Gonka, hiệu quả được nhúng ở lớp giao thức: gần 100% sức mạnh tính toán được sử dụng cho khối lượng công việc AI thực (chủ yếu là suy luận). Phần thưởng và trọng số quản trị dựa trên đóng góp sức mạnh tính toán được đo lường, chứ không phải nắm giữ vốn.
Hiệu quả thực sự chỉ xuất hiện khi phần lớn sức mạnh tính toán được sử dụng cho các nhiệm vụ thực, khuyến khích thưởng cho đóng góp đã được xác minh, chi phí nội bộ không tăng mất kiểm soát theo quy mô mạng.
Hỏi: Các mạng sức mạnh tính toán AI phi tập trung có khả năng sử dụng phần lớn sức mạnh tính toán cho khối lượng công việc AI thực, thay vì bảo trì chính mạng lưới đó không? Các lựa chọn kiến trúc then chốt là gì?
Trả lời: Điều này là có thể - nhưng với điều kiện coi chi phí là ràng buộc kiến trúc cốt lõi, chứ không phải là sản phẩm phụ tất yếu của phi tập trung hóa.
Hầu hết các mạng sức mạnh tính toán phi tập trung sử dụng nhiều tài nguyên để duy trì sự đồng thuận và bảo mật, thay vì khối lượng công việc AI. Điều này là do công việc sản xuất và cơ chế bảo mật bị tách rời, dẫn đến tính toán trùng lặp.
Để phần lớn sức mạnh tính toán được sử dụng cho các nhiệm vụ AI thực, cần một số nguyên tắc chính:
Thứ nhất, cơ chế bảo mật và đo lường phải có "giới hạn thời gian", không phải chạy liên tục. Cơ chế chứng minh nên tập trung vào các chu kỳ ngắn, rõ ràng, thay vì liên tục tiêu tốn tài nguyên. Trong Gonka, điều này được thực hiện thông qua Sprint (chu kỳ có cấu trúc, giới hạn thời gian). Ngoài chu kỳ, tài nguyên phần cứng có thể được sử dụng cho khối lượng công việc AI thực.
Thứ hai, giảm sự trùng lặp thông qua xác minh chọn lọc và động dựa trên uy tín, thay vì xác minh sao chép hoàn toàn cho mỗi tác vụ. Công việc của người tham gia mới có thể được xác minh 100%; khi uy tín được thiết lập, tỷ lệ xác minh có thể giảm xuống khoảng 1%. Tổng thể, sức mạnh tính toán dành cho xác minh có thể được kiểm soát dưới khoảng 10%, đồng thời duy trì bảo mật.
Những người tham gia cố gắng gian lận sẽ không nhận được phần thưởng, do đó, gian lận trở nên không hợp lý về mặt kinh tế.
Thứ ba, phần thưởng và trọng số quản trị phải được liên kết với đóng góp sức mạnh tính toán đã được xác minh, chứ không phải nắm giữ vốn.
Khi sự đồng thuận được tối giản, xác minh thích ứng, khuyến khích phù hợp với tính toán sản xuất, thì sức mạnh tính toán phi tập trung mới có thể thực sự phục vụ khối lượng công việc thực tế.
Hỏi: Các mạng sức mạnh tính toán AI phi tập trung thường nhấn mạnh sự tham gia mở, nhưng yêu cầu về cơ sở hạ tầng có thể tạo ra rào cản gia nhập cao. Làm thế nào một hệ thống như vậy có thể mở rộng quy mô, đồng thời vẫn duy trì khả năng tiếp cận đối với những người tham gia có trình độ sức mạnh tính toán rất khác nhau?
Trả lời: Mặc dù các mạng phi tập trung nhằm mục đích giảm rào cản gia nhập đối với cơ sở hạ tầng AI, nhưng sự tồn tại lâu dài cũng đòi hỏi phải cạnh tranh với các nhà cung cấp tập trung và đáp ứng nhu cầu của thế giới thực. Các ràng buộc về phần cứng cuối cùng quy về một yêu cầu cốt lõi: khả năng chạy các mô hình thực sự có nhu cầu thị trường.
Để đạt được quy mô trong khi vẫn duy trì khả năng tiếp cận, có một số nguyên tắc quan trọng.
Đầu tiên, là khả năng tiếp cận cơ sở hạ tầng không cần cấp phép. Bất kỳ chủ sở hữu GPU nào - dù là người vận hành thiết bị đơn lẻ hay trung tâm dữ liệu lớn - đều phải có khả năng tham gia mạng mà không cần quy trình phê duyệt hoặc cơ chế kiểm soát tập trung. Điều này loại bỏ các rào cản gia nhập có cấu trúc.
Thứ hai, là phần thưởng và ảnh hưởng tỷ lệ dựa trên sức mạnh tính toán đã được xác minh. Trong một mô hình dựa trên trọng số sức mạnh tính toán, đóng góp tính toán cao hơn tự nhiên sẽ mang lại tỷ lệ nhiệm vụ, tỷ lệ phần thưởng và trọng số quản trị nhiều hơn. Điều này không làm cho những người tham gia nhỏ hoàn toàn bình đẳng với những người tham gia lớn - và cũng không nên như vậy. Điểm mấu chốt là quy tắc thống nhất: ảnh hưởng được xác định bởi đóng góp tính toán thực tế, không phải bởi vốn, cơ chế ủy quyền hoặc đòn bẩy tài chính.
Thứ ba, là vai trò của các nhóm sức mạnh tính toán (Pools). Trong các hệ thống có yêu cầu cơ sở hạ tầng thực tế, việc tổng hợp tài nguyên sẽ xuất hiện một cách tự nhiên. Các nhóm sức mạnh tính toán cho phép những người tham gia nhỏ hơn hợp nhất tài nguyên, giảm biến động và tham gia vào khối lượng công việc quy mô lớn hơn.
Tuy nhiên, kiến trúc phải tránh trao lợi thế cấu trúc cho các nhóm sức mạnh tính toán lớn, hoặc khuyến khích sự tập trung ảnh hưởng quá mức. Các nhóm sức mạnh tính toán nên tồn tại như một công cụ phối hợp, chứ không phải là một cơ chế tái tập trung hóa.
Cuối cùng, việc mở rộng quy mô của mạng sức mạnh tính toán AI phi tập trung không nên có nghĩa là tăng rào cản gia nhập. Nó phải có nghĩa là tăng tổng công suất tính toán trong khi vẫn duy trì các quy tắc tham gia trung lập, minh bạch và nhất quán, đồng thời duy trì giá trị kinh tế thực mà mạng tạo ra cho người dùng. Khả năng tiếp cận mở, cơ chế kinh tế tỷ lệ và mức độ tập trung được kiểm soát, quyết định một hệ thống có còn phi tập trung hay không khi nó phát triển.
Hỏi: Tại sao tại thời điểm hiện tại, vấn đề về sức mạnh tính toán AI phi tập trung trở nên đặc biệt cấp bách? Nếu vấn đề này không được giải quyết trong vài năm tới, bạn nghĩ hậu quả lâu dài cho ngành sẽ là gì?
Trả lời: Sự cấp bách này phản ánh việc AI đang chuyển từ giai đoạn thử nghiệm sang giai đoạn cơ sở hạ tầng.
Như đã nói, sức mạnh tính toán đã trở thành nút thắt cổ chai vật lý. Khả năng mở rộng ngày càng không chỉ bị ràng buộc bởi vốn, mà còn bởi năng lượng, mật độ công suất và các hạn chế của trung tâm dữ liệu. Đồng thời, việc tiếp cận GPU tiên tiến và cơ sở hạ tầng siêu quy mô bị ảnh hưởng bởi hợp đồng dài hạn, sự tập trung hóa doanh nghiệp và các ưu tiên chiến lược quốc gia.
Sự kết hợp này làm sâu sắc thêm sự bất đối xứng cấu trúc. Các chủ thể kiểm soát cơ sở hạ tầng quy mô lớn tiếp tục củng cố lợi thế của họ, trong khi rào cản gia nhập đối với các nhóm nhỏ và khu vực mới nổi tiếp tục tăng lên. Rủi ro không chỉ là sự tập trung hóa thị trường, mà còn là sự mở rộng khoảng cách sức mạnh tính toán toàn cầu.
Nếu xu hướng này tiếp tục, đổi mới sẽ phụ thuộc nhiều hơn vào khả năng tiếp cận cơ sở hạ tầng, chứ không phải bản thân ý tưởng. Thị trường AI có thể củng cố thành một mô hình dựa trên tiền thuê, trong đó trí thông minh được truy cập theo các điều kiện do một số ít nhà cung cấp thống trị đặt ra.
Do đó, sức mạnh tính toán phi tập trung không phải là một cuộc tranh luận ý thức hệ. Nó là một phản ứng đối với các ràng buộc cấu trúc có thể nhìn thấy - và cũng là một lựa chọn sẽ định hình kiến trúc lâu dài của ngành công nghiệp AI.
Hỏi: Các đại lý AI (AI agents) ngày càng tự đặt trước tài nguyên GPU. Kiến trúc của Gonka hỗ trợ tích hợp liền mạch như thế nào để hiện thực hóa nền kinh tế sức mạnh tính toán AI tự điều chỉnh?
Trả lời: Sự trỗi dậy của AI dạng đại lý có nghĩa là các hệ thống ngày càng đưa ra quyết định tự chủ - bao gồm cả việc thu thập tài nguyên tính toán. Trong mô hình này, sức mạnh tính toán trở thành tài sản cốt lõi trong các tương tác kinh tế giữa các đại lý.
Một hệ sinh thái như vậy cần khả năng tiếp cận theo chương trình, cơ chế kinh tế minh bạch và độ tin cậy.
Đầu tiên, tích hợp phải liền mạch. Gonka cung cấp API tương thích OpenAI, cho phép hầu hết các đại lý AI kết nối mà không cần thay đổi kiến trúc hoặc quy trình làm việc của họ.
Thứ hai, nền kinh tế sức mạnh tính toán phải minh bạch và được hệ thống điều khiển. Định giá được điều chỉnh động theo tải mạng, thay vì được cố định bằng hợp đồng. Trong giai đoạn đầu của mạng, chi phí suy luận được thiết kế thấp hơn đáng kể so với nhà cung cấp tập trung, vì người tham gia không chỉ được bồi thường thông qua phí người dùng, mà còn thông qua phần thưởng từ cơ chế phát hành tương tự Bitcoin, phần thưởng này tỷ lệ thuận với công suất tính toán khả dụng.
Cấu trúc này cho phép các đại lý AI hoạt động trong ngân sách có thể thực thi khối lượng công việc một cách hiệu quả. Khi mạng phát triển, các tham số định giá vẫn sẽ chấp nhận quản trị cộng đồng.
Thứ ba, độ tin cậy được củng cố ở cấp độ giao thức. Trong môi trường tập trung, độ tin cậy đến từ chứng nhận và thỏa thuận cấp độ dịch vụ. Trong cơ sở hạ tầng phi tập trung, độ tin cậy được hỗ trợ thông qua mã nguồn mở, kiểm toán của bên thứ ba và bằng chứng hoàn thành tính toán có thể đo lường trên chuỗi cùng với bằng chứng hiệu suất mạng.
Các yếu tố này cùng nhau cho phép các đại lý AI yêu cầu sức mạnh tính toán và phân bổ ngân sách trong một khuôn khổ minh bạch. Bằng cách này, Gonka cung cấp nền tảng cơ sở hạ tầng cho nền kinh tế sức mạnh tính toán AI tự điều chỉnh, cho phép các đại lý không chỉ thực thi nhiệm vụ mà còn tối ưu hóa động các tài nguyên mà chúng phụ thuộc vào.
Hỏi: Sự không chắc chắn về quy định xung quanh công nghệ phi tập trung đang gia tăng. Gonka chủ động ứng phó với các vấn đề tuân thủ chủ quyền dữ liệu và quản trị AI như thế nào trong một thị trường toàn cầu bị phân mảnh?
Trả lời: Trong bối cảnh sức mạnh tính toán phi tập trung, thách thức chính nằm ở việc cân bằng giữa tính mở của mạng và các yêu cầu pháp lý đa dạng và không ngừng phát triển.
Gonka là một mạng lưới toàn cầu không cần cấp phép - bất kỳ ai cũng có thể tham gia, các yêu cầu được định tuyến một cách lập trình giữa những người tham gia phân tán. Ở giai đoạn hiện tại, người dùng không thể kiểm soát một cách xác định vị trí địa lý nơi yêu cầu của họ được xử lý. Đối với các trường hợp sử dụng có yêu cầu nghiêm ngặt về lưu trú dữ liệu hoặc xử lý theo khu vực, điều này hiện có thể là một hạn chế.
Tuy nhiên, từ góc độ quyền riêng tư, kiến trúc này làm giảm sự tập trung hóa dữ liệu. Mỗi yêu cầu được xử lý bởi những người tham gia được chọn ngẫu nhiên và được định tuyến độc lập, do đó ngăn chặn việc tích lũy lịch sử người dùng đầy đủ. Cho đến nay, mô hình này đã bao phủ hầu hết các trường hợp sử dụng thực tế, đồng thời cho phép mạng mở rộng quy mô.
Khi mạng phát triển và nhu cầu thị trường trở nên rõ ràng hơn, cơ chế quản trị cho phép người tham gia đề xuất và bỏ phiếu cho các thay đổi kiến trúc để hỗ trợ các yêu cầu quy định cụ thể. Những thay đổi này có thể bao gồm: các mạng con chuyên dụng với các tiêu chí tham gia bổ sung, các ràng buộc hoạt động ở khu vực pháp lý cụ thể, hoặc các đảm bảo cấp phần cứng cho khối lượng công việc doanh nghiệp, chẳng hạn như Môi trường thực thi đáng tin cậy (TEE).
Phi tập trung hóa không loại bỏ nghĩa vụ tuân thủ. Nó cung cấp sự linh hoạt về kiến trúc. Thiết kế của Gonka cho phép mạng phát triển theo nhu cầu quy định và thị trường, thay vì bị khóa trong một mô hình tuân thủ duy nhất ngay từ đầu.







