# Bài viết Liên quan Suy luận

Trung tâm Tin tức HTX cung cấp những bài viết mới nhất và phân tích chuyên sâu về "Suy luận", bao gồm xu hướng thị trường, cập nhật dự án, phát triển công nghệ và chính sách quản lý trong ngành tiền kỹ thuật số.

Thách Thức Về Sức Mạnh Tính Toán Trong Cuộc Chơi AI Giữa Trung Quốc Và Mỹ

Dưới bàn cờ AI Mỹ-Trung, sức mạnh tính toán (computing power) là vấn đề cấp thiết. Trong khi các công ty Mỹ như Meta, Google, Microsoft và Amazon đang đầu tư hàng nghìn tỷ USD để xây dựng cơ sở hạ tầng AI khổng lồ với hàng triệu GPU cao cấp (như H100 của NVIDIA), thì Trung Quốc lại đối mặt với tình trạng thiếu hụt nghiêm trọng chip đào tạo AI tiên tiến do các lệnh trừng phạt. Sự chênh lệch về nền tảng tính toán là rất lớn: Mỹ có quy mô tính toán gấp đôi Trung Quốc và kiểm soát hơn 70% GPU cao cấp toàn cầu. Điều này cho phép các công ty Mỹ như xAI của Elon Musk hay Anthropic đào tạo nhiều mô hình tham số nghìn tỷ một cách nhanh chóng, trong khi mô hình mạnh nhất của Trung Quốc, DeepSeek V4 Pro (1.6 nghìn tỷ tham số), vẫn đang cố gắng bắt kịp các mô hình 10 nghìn tỷ tham số của Mỹ. Các chuyên gia ước tính Mỹ đang dẫn trước khoảng 8-15 tháng. Ngành công nghiệp chip AI Trung Quốc, với các công ty như Huawei, Biren, Moore Threads, đang phát triển mạnh mẽ nhờ chính sách thay thế nhập khẩu. Tuy nhiên, họ chủ yếu tập trung vào thị trường chip suy luận (inference) ít đòi hỏi hơn, trong khi vẫn gặp khó khăn ở phân khúc chip đào tạo (training) cao cấp. Khoảng cách về hiệu năng tuyệt đối và đặc biệt là hệ sinh thái phần mềm (như CUDA của NVIDIA) vẫn là những rào cản lớn. Dù vậy, đã có những tiến bộ ban đầu. Một số mô hình AI đã được đào tạo thành công trên nền tảng phần cứng trong nước (như chip Ascend của Huawei), chứng minh tính khả thi. Con đường phía trước đòi hỏi sự kiên nhẫn, đầu tư dài hạn và sự hợp tác chặt chẽ trong toàn bộ chuỗi công nghiệp. Với thị trường nội địa rộng lớn, nguồn nhân lực và vốn dồi dào, ngành công nghiệp chip AI Trung Quốc đang dần thu hẹp khoảng cách trong cuộc đua công nghệ mang tính quyết định này.

marsbit8 giờ trước

Thách Thức Về Sức Mạnh Tính Toán Trong Cuộc Chơi AI Giữa Trung Quốc Và Mỹ

marsbit8 giờ trước

Mac nhàn rỗi cũng có thể kiếm tiền? Tìm hiểu mạng lưới suy luận AI phi tập trung Darkbloom do Eigen Labs ra mắt

Eigen Labs đã ra mắt Darkbloom, một mạng suy luận AI phi tập trung tận dụng sức mạnh xử lý nhàn rỗi từ máy Mac cá nhân. Mạng lưới bao gồm ba thành phần: người dùng gửi yêu cầu, trình điều phối định tuyến và nhà cung cấp (chủ sở hữu Mac) chạy mô hình. Darkbloom nhấn mạnh quyền riêng tư có thể xác minh thông qua kiến trúc phần cứng bảo mật của Apple, đảm bảo nhà cung cấp không thể xem nội dung yêu cầu. Về mô hình kinh tế, Darkbloom khác biệt khi không phát hành token mà để nhà cung cấp giữ 100% doanh thu từ suy luận, với mức giá mục tiêu chỉ bằng khoảng 50% so với các nhà tổng hợp API truyền thống. Tuy nhiên, thu nhập hiện tại còn khá khiêm tốn, với nhà cung cấp hàng đầu kiếm được chưa đến 6 USD/ngày. Dự án đang trong giai đoạn alpha công khai, hỗ trợ các mô hình như Gemma 4 và GPT-OSS, và kỳ vọng thu nhập sẽ cải thiện khi mở rộng hỗ trợ các mô hình ngôn ngữ lớn và thu hút nhiều người dùng thực tế hơn. Để tham gia, người dùng cần một máy Mac chip Apple Silicon chạy macOS 14 trở lên, cài đặt phần mềm nhà cung cấp Darkbloom và giữ máy trực tuyến ổn định.

marsbit11 giờ trước

Mac nhàn rỗi cũng có thể kiếm tiền? Tìm hiểu mạng lưới suy luận AI phi tập trung Darkbloom do Eigen Labs ra mắt

marsbit11 giờ trước

Phía sau bảng điểm AI, ẩn giấu một 'người ra đề' gốc Hoa

Mỗi khi một mô hình AI tiên tiến ra mắt, giới công nghệ lại dõi theo những “bảng điểm” quen thuộc như MMLU-Pro, MMMU hay MMMU-Pro. Đây là các tiêu chuẩn đánh giá quan trọng giúp so sánh năng lực của các mô hình lớn như GPT, Claude hay Gemini. Tuy nhiên, ít người biết rằng đằng sau những bộ đề thi này là một nhà nghiên cứu người Hoa: Chen Wenhu (Trần Văn Hổ), trợ lý giáo sư tại Đại học Waterloo, Canada. Ông cùng phòng thí nghiệm TIGERLab (còn gọi là Hổ Đầu Bang) đã tạo ra MMLU-Pro vào năm 2024 để giải quyết vấn đề “mất chuẩn” của bộ đánh giá MMLU cũ, khi nhiều mô hình tiên tiến đạt điểm gần tuyệt đối, khó phân biệt được sự khác biệt thực sự. MMLU-Pro với hơn 12.000 câu hỏi, mở rộng lựa chọn và tăng cường các câu đòi hỏi suy luận, đã giúp kéo giãn khoảng cách điểm số và đánh giá ổn định hơn. Trước đó, nhóm của Chen Wenhu cũng phát triển MMMU - bộ đánh giá đa phương thức (multimodal) yêu cầu mô hình kết hợp hiểu biết hình ảnh, biểu đồ với kiến thức chuyên môn để trả lời câu hỏi. Ngay cả các mô hình mạnh nhất thời điểm đó như GPT-4V cũng chỉ đạt độ chính xác khoảng 56%. Phiên bản MMMU-Pro sau này được thiết kế để đảm bảo mô hình không thể “bỏ qua” thông tin hình ảnh mà chỉ dựa vào văn bản để đoán đáp án. Nghiên cứu của Chen Wenhu tập trung vào việc hiểu thông tin phức tạp, hỏi đáp tri thức và suy luận. Ông từng làm việc tại Google Research và DeepMind, tham gia vào dự án Gemini, trước khi gia nhập Đại học Waterloo và thành lập TIGERLab. Phòng thí nghiệm không chỉ tạo ra các bộ đánh giá mà còn nghiên cứu phát triển mô hình, chẳng hạn trong lĩnh vực xử lý video. Hiện tại, Chen Wenhu làm việc tại Phòng thí nghiệm Siêu trí tuệ (Super Intelligent Lab) của Meta, tiếp tục tập trung vào dữ liệu huấn luyện và đánh giá đa phương thức. Công việc của ông và nhiều nhà nghiên cứu người Hoa khác đang đóng góp quan trọng vào sự phát triển chung của ngành AI, dù có thể không nằm dưới ánh đèn sân khấu.

marsbit2 ngày trước 03:53

Phía sau bảng điểm AI, ẩn giấu một 'người ra đề' gốc Hoa

marsbit2 ngày trước 03:53

CPU trở lại bàn đàm phán, một vở kịch "thăng tiến" trị giá 1700 tỷ USD bắt đầu

CPU đang trở lại trung tâm sân khấu trong kỷ nguyên AI, dẫn dắt một cơ hội thị trường trị giá 1700 tỷ USD vào năm 2030. Việc chuyển dịch từ huấn luyện sang suy luận (inference) và AI Agent đã làm thay đổi hoàn toàn vai trò của CPU. Trong các tác vụ Agent phức tạp, CPU hiện đảm nhận hơn 70% khối lượng công việc, xử lý luồng điều khiển, gọi công cụ và quản lý bộ nhớ (KV Cache). Tỷ lệ phối hợp GPU:CPU đang thu hẹp từ 1:8 xuống khoảng 1:4, thậm chí 1:1 trong một số trường hợp. Nhu cầu này dẫn đến việc thiếu hụt nguồn cung và lần tăng giá đầu tiên sau hơn một thập kỷ cho server CPU của Intel và AMD, với mức tăng 10-15%. Thị trường CPU server dự kiến tăng từ khoảng 300 tỷ USD năm 2025 lên 1700 tỷ USD vào năm 2030, được thúc đẩy bởi ba phân khúc: điện toán đám mây truyền thống, CPU head-node cho cụm AI và CPU node độc lập cho Agent – một thị trường hoàn toàn mới. NVIDIA cũng đã tham gia cuộc chơi với CPU Vera dựa trên kiến trúc ARM, nhấn mạnh tầm quan trọng chiến lược của CPU. Tại Trung Quốc, các công ty như Hygon (Hải Quang) và Huawei đang nắm bắt cơ hội từ làn sóng nhu cầu này và chương trình thay thế nhập khẩu (xinchuang), với hệ sinh thái phần mềm đang trưởng thành nhanh chóng.

marsbit06/19 13:47

CPU trở lại bàn đàm phán, một vở kịch "thăng tiến" trị giá 1700 tỷ USD bắt đầu

marsbit06/19 13:47

Phía sau bảng điểm AI, ẩn giấu một "người ra đề" người Hoa

Bài viết này giới thiệu Giáo sư Văn Hổ Trần (Chen Wenhu), một nhà khoa học máy tính người Hoa hiện công tác tại Đại học Waterloo, Canada, và là người đứng sau các bộ đánh giá tiêu chuẩn quan trọng trong ngành AI như MMLU-Pro, MMMU và MMMU-Pro. Khi các mô hình AI tiên tiến như GPT-4, Claude hay Gemini đạt điểm số gần tuyệt đối trên các bài kiểm tra cũ như MMLU, cộng đồng cần một thước đo mới để phân biệt khả năng thực sự. Năm 2024, nhóm của Giáo sư Văn Hổ Trần tại Phòng thí nghiệm TIGER (còn gọi là Hổ Đầu Bang) đã phát triển MMLU-Pro. Bộ dữ liệu mới này với hơn 12.000 câu hỏi đã mở rộng lựa chọn, tăng cường các câu hỏi suy luận và loại bỏ những câu đơn giản, giúp giảm đáng kể điểm số của các mô hình và đánh giá ổn định hơn. Ông cũng là tác giả chính của MMMU - bộ tiêu chuẩn đánh giá đa phương thức (multimodal) đầu tiên yêu cầu mô hình kết hợp hiểu biết hình ảnh phức tạp (biểu đồ, bản đồ, công thức) với kiến thức chuyên ngành để trả lời câu hỏi. Phiên bản nâng cấp MMMU-Pro sau đó được tạo ra để đảm bảo mô hình thực sự xử lý thông tin thị giác chứ không chỉ dựa vào văn bản. Bài viết cho thấy công việc của Giáo sư Văn Hổ Trần bắt nguồn từ hướng nghiên cứu lâu dài về hiểu thông tin phức tạp và trả lời câu hỏi dựa trên tri thức. Kinh nghiệm thực tế của ông từ khi tham gia phát triển mô hình Gemini tại Google DeepMind và hiện tại là tại Phòng thí nghiệm Siêu Trí tuệ của Meta, cùng với việc phòng thí nghiệm của ông cũng tự phát triển các mô hình (như UniVideo, Vamba), đã giúp ông thiết kế ra những bài đánh giá sát thực tế, phát hiện đúng điểm mạnh yếu của mô hình. Tác giả kết luận rằng trong khi sự chú ý của ngành AI thường đổ dồn vào các nhà sáng lập hay lãnh đạo nổi tiếng, thì sự đóng góp của các nhà nghiên cứu như Giáo sư Văn Hổ Trần trong việc xây dựng "ngôn ngữ chung" để đánh giá tiến bộ AI là vô cùng quan trọng.

marsbit06/19 09:20

Phía sau bảng điểm AI, ẩn giấu một "người ra đề" người Hoa

marsbit06/19 09:20

BitTorrent Ra Mắt BTTInferGrid: Lớp Hạ Tầng Phân Tán Cho Suy Luận AI Có Khả Năng Mở Rộng

BitTorrent đã ra mắt BTTInferGrid, một mạng lưới điện toán GPU phi tập trung được xây dựng chuyên biệt cho suy luận AI. Nền tảng này kết nối nguồn cung GPU nhàn rỗi toàn cầu với nhu cầu ngày càng tăng về công việc AI, cung cấp cơ sở hạ tầng máy tính mở, có thể xác minh và thanh toán theo nhu cầu. BTTInferGrid giải quyết những hạn chế của các nhà cung cấp đám mây tập trung, như độ trễ cao và mô hình giá cứng nhắc, đồng thời tối ưu hóa việc phân bổ tài nguyên phần cứng nhàn rỗi. Với kiến trúc DePIN, nó tạo ra một thị trường hai chiều: nhà cung cấp tài nguyên có thể kiếm lợi nhuận từ GPU nhàn rỗi, trong khi các nhà phát triển AI toàn cầu có thể truy cập các dịch vụ suy luận theo yêu cầu với chi phí hiệu quả. Nền tảng nhấn mạnh ba đột phá: truy cập không cần cấp phép để tổng hợp GPU nhanh chóng, chất lượng dịch vụ có thể xác minh thông qua kiến trúc blockchain và nền kinh tế bền vững dựa trên nhu cầu thực tế. Lộ trình phát triển từ năm 2026 bao gồm khởi động mạng, đa dạng hóa hệ sinh thái và trở thành một lớp cơ sở hạ tầng AI cốt lõi cho Web3. Được xây dựng dựa trên nền tảng đã được chứng minh của BitTorrent và BitTorrent File System (BTFS), BTTInferGrid hướng tới mục tiêu biến sức mạnh điện toán AI khan hiếm thành một cơ sở hạ tầng phi tập trung, dễ tiếp cận.

TheNewsCrypto06/18 07:35

BitTorrent Ra Mắt BTTInferGrid: Lớp Hạ Tầng Phân Tán Cho Suy Luận AI Có Khả Năng Mở Rộng

TheNewsCrypto06/18 07:35

Mô hình nhỏ 3B, điểm lập trình sánh ngang Opus 4.5, mô hình bí ẩn gây xôn xao, hóa ra là sản phẩm trong nước

Trong những ngày gần đây, mô hình nhỏ VibeThinker-3B (3 tỷ tham số) từ đội ngũ Weibo (Trung Quốc) đã gây chú ý trên mạng X nhờ khả năng lập trình và suy luận có thể kiểm chứng, được cho là ngang bằng với các mô hình tiên tiến lớn hơn nhiều như GPT-5, Claude Opus 4.5 hay Gemini 3 Pro. Mô hình này được xây dựng dựa trên Qwen2.5-Coder-3B và trải qua quy trình đào tạo nâng cao "Spectrum-to-Signal", bao gồm tinh chỉnh có giám sát hai giai đoạn theo lộ trình, học tăng cường đa lĩnh vực, tự chưng cất ngoại tuyến và học tăng cường theo chỉ dẫn (Instruct RL). Nó cũng giới thiệu chiến lược đánh giá độ tin cậy theo tuyên bố (Claim-Level Reliability - CLR) để nâng cao hiệu suất trong các bài kiểm tra. Kết quả ấn tượng: AIME26: 94.3 (97.1 với CLR), HMMT25: 89.3 (95.4 với CLR), tỷ lệ Pass@1 trên LiveCodeBench v6 là 80.2%, và tỷ lệ giải đúng các bài LeetCode mới nhất đạt 96.1%. Báo cáo kỹ thuật đưa ra "giả thuyết nén tham số": khả năng suy luận có thể kiểm chứng (như toán học, lập trình) có thể được nén hiệu quả vào mô hình nhỏ với phản hồi đáng tin cậy, trong khi kiến thức thực tế tổng quát và đối thoại mở lại phụ thuộc nhiều hơn vào quy mô tham số lớn. Mục tiêu không phải là thay thế mô hình lớn, mà là thăm dò giới hạn của mô hình nhỏ trong các lĩnh vực cụ thể, mở ra hướng nghiên cứu mới bổ sung cho mô hình truyền thống. Mô hình có sẵn trên HuggingFace và arXiv, nhưng cần lưu ý nó được thiết kế cho các nhiệm vụ suy luận có thể xác minh, không phải cho kiến thức tổng quát hay đối thoại mở.

marsbit06/18 00:25

Mô hình nhỏ 3B, điểm lập trình sánh ngang Opus 4.5, mô hình bí ẩn gây xôn xao, hóa ra là sản phẩm trong nước

marsbit06/18 00:25

Báo cáo của Bernstein: Agentic AI sẽ biến CPU từ vai phụ thành vai chính, lạc quan về Hải Quang Thông Tin

Phân tích của Bernstein: Agentic AI sẽ biến CPU từ vai phụ thành vai chính, lạc quan với Hygon Phân tích từ Bernstein chỉ ra rằng sự phát triển của AI dạng tác nhân (agentic AI) sẽ đảo ngược vai trò của CPU trong trung tâm dữ liệu. Trong khi GPU vẫn xử lý tính toán nặng, agentic AI yêu cầu các chu trình phức tạp như truy xuất, lập kế hoạch, gọi công cụ và suy luận, nơi CPU đóng vai trò then chốt trong điều phối, quản lý bộ nhớ và tránh thời gian chết của GPU. Điều này sẽ làm tăng đáng kể tỷ lệ và tầm quan trọng của CPU. Dự báo đến năm 2030, tỷ lệ GPU:CPU trong cụm suy luận AI sẽ về mức 1:1, so với 8:1 năm 2025. CPU sẽ chiếm tới 50% khối lượng tính toán trong các tác vụ agentic AI. Tổng thị trường có thể tiếp cận (TAM) cho CPU máy chủ dự kiến tăng lên 2230 tỷ USD vào năm 2030, cao hơn nhiều so với mức 370 tỷ USD năm 2025. Arm được xác định là người hưởng lợi chính nhờ kiến trúc hiệu quả năng lượng, cùng kế hoạch tự sản xuất chip. Các công ty như AMD và Intel cũng được hưởng lợi từ nhu cầu gia tăng. Riêng tại Trung Quốc, Bernstein đánh giá cao Hygon (Hải Quang), dự báo công ty này sẽ mở rộng thị phần nhờ nhu cầu CPU x86 mạnh mẽ. Báo cáo cũng lưu ý rủi ro về khả năng đáp ứng năng lực sản xuất bán dẫn và sự phụ thuộc vào các dự báo nhu cầu AI rất lạc quan.

marsbit06/17 09:48

Báo cáo của Bernstein: Agentic AI sẽ biến CPU từ vai phụ thành vai chính, lạc quan về Hải Quang Thông Tin

marsbit06/17 09:48

Khoản phí đăng ký bạn trả cho Claude, các công ty module quang có thể nhận được bao nhiêu?

Bản tóm tắt: Một bức tranh ước tính phân bổ 20 USD phí đăng ký Claude Pro hàng tháng của Mỹ cho công ty mô hình, điện toán đám mây, khấu hao GPU, điện năng và chuỗi cung ứng đang khiến các nhà đầu tư thảo luận lại về cách định giá doanh thu ứng dụng AI. Khác với SaaS truyền thống có chi phí biên gần bằng 0, mỗi lần người dùng gọi mô hình AI (suy luận) đều tiêu tốn tài nguyên tính toán, tạo ra mâu thuẫn giữa thuê bao cố định và chi phí biến đổi. Hiện tại, sự tăng trưởng về mức độ sử dụng AI chủ yếu chảy về cơ sở hạ tầng (GPU, HBM, điện, trung tâm dữ liệu), nơi có doanh thu xác định hơn và được định giá cao. Các công ty mô hình cần chứng minh họ có thể cải thiện hiệu quả đủ nhanh (thông qua tối ưu hóa mô hình, bộ nhớ đệm, chip tự nghiên cứu...) để giảm chi phí suy luận trên mỗi đơn vị, vượt qua sự gia tăng về mức độ sử dụng và độ phức tạp tác vụ, từ đó khôi phục cấu trúc lợi nhuận cao như phần mềm. Giá trị của bức tranh này là cảnh báo định giá: nhà đầu tư cần thận trọng với giả định "doanh thu ứng dụng AI bằng doanh thu SaaS", và tập trung vào dữ liệu về tỷ suất lợi nhuận gộp được gia quyền theo mức độ sử dụng thay vì chỉ số người đăng ký.

marsbit06/17 03:45

Khoản phí đăng ký bạn trả cho Claude, các công ty module quang có thể nhận được bao nhiêu?

marsbit06/17 03:45

AMD Ra Mắt Máy Chủ AI Cỡ Nhỏ, Nhắm Thẳng NVIDIA DGX Spark

Tháng 6/2026, AMD đã công bố máy chủ AI nhỏ gọn Ryzen AI Halo, đối đầu trực tiếp với DGX Spark của NVIDIA. Cả hai đều có bộ nhớ thống nhất 128GB, kích thước nhỏ và hướng đến nhà phát triển AI tại chỗ, nhưng con đường tiếp cận khác biệt. Ryzen AI Halo dựa trên kiến trúc x86, chạy Windows/Ubuntu, sử dụng APU Ryzen AI Max+ 395 tích hợp CPU, GPU RDNA 3.5 và NPU. Nó là một máy tính để bàn đa dụng với giá dự kiến thấp hơn (từ $2,949). DGX Spark của NVIDIA sử dụng kiến trúc ARM+GPU Blackwell chuyên biệt, chạy hệ điều hành DGX OS tùy chỉnh và được tối ưu hóa sâu cho pipeline AI với card mạng cao tốc ConnectX-7, giá khởi điểm $3,999. Về hiệu năng inference đơn lẻ, chúng ngang nhau, nhưng DGX Spark có lợi thế trong xử lý prompt và các tác vụ song song nhờ phần mềm tối ưu và hỗ trợ tính toán độ chính xác thấp. Bài viết nêu bật nỗ lực của AMD trong việc xây dựng hệ sinh thái mở thay thế thông qua ROCm (hiện đã hỗ trợ tốt các framework chính), cùng các chiến lược dài hạn như ký hợp đồng cung cấp GPU lượng lớn với OpenAI và Meta, và mua lại ZT Systems để tăng cường khả năng thiết kế hệ thống. Tuy nhiên, NVIDIA vẫn duy trì lợi thế lớn với hệ sinh thái CUDA trưởng thành 17 năm, các công cụ doanh nghiệp tích hợp (như AI Enterprise), và khả năng mở rộng cụm máy dễ dàng. Tóm lại, AMD không cố gắng đánh bại toàn diện "pháo đài" phần mềm-phần cứng của NVIDIA, mà định vị mình như một lựa chọn thay thế khả thi, tiết kiệm chi phí và linh hoạt hơn cho những nhà phát triển nhạy cảm về giá hoặc muốn tránh bị khóa vào một nhà cung cấp duy nhất. Ryzen AI Halo là hiện thân của chiến lược đó trên máy tính để bàn.

marsbit06/16 09:16

AMD Ra Mắt Máy Chủ AI Cỡ Nhỏ, Nhắm Thẳng NVIDIA DGX Spark