AMD Ra Mắt Máy Chủ AI Cỡ Nhỏ, Nhắm Thẳng NVIDIA DGX Spark

marsbitXuất bản vào 2026-06-16Cập nhật gần nhất vào 2026-06-16

Tóm tắt

Tháng 6/2026, AMD đã công bố máy chủ AI nhỏ gọn Ryzen AI Halo, đối đầu trực tiếp với DGX Spark của NVIDIA. Cả hai đều có bộ nhớ thống nhất 128GB, kích thước nhỏ và hướng đến nhà phát triển AI tại chỗ, nhưng con đường tiếp cận khác biệt. Ryzen AI Halo dựa trên kiến trúc x86, chạy Windows/Ubuntu, sử dụng APU Ryzen AI Max+ 395 tích hợp CPU, GPU RDNA 3.5 và NPU. Nó là một máy tính để bàn đa dụng với giá dự kiến thấp hơn (từ $2,949). DGX Spark của NVIDIA sử dụng kiến trúc ARM+GPU Blackwell chuyên biệt, chạy hệ điều hành DGX OS tùy chỉnh và được tối ưu hóa sâu cho pipeline AI với card mạng cao tốc ConnectX-7, giá khởi điểm $3,999. Về hiệu năng inference đơn lẻ, chúng ngang nhau, nhưng DGX Spark có lợi thế trong xử lý prompt và các tác vụ song song nhờ phần mềm tối ưu và hỗ trợ tính toán độ chính xác thấp. Bài viết nêu bật nỗ lực của AMD trong việc xây dựng hệ sinh thái mở thay thế thông qua ROCm (hiện đã hỗ trợ tốt các framework chính), cùng các chiến lược dài hạn như ký hợp đồng cung cấp GPU lượng lớn với OpenAI và Meta, và mua lại ZT Systems để tăng cường khả năng thiết kế hệ thống. Tuy nhiên, NVIDIA vẫn duy trì lợi thế lớn với hệ sinh thái CUDA trưởng thành 17 năm, các công cụ doanh nghiệp tích hợp (như AI Enterprise), và khả năng mở rộng cụm máy dễ dàng. Tóm lại, AMD không cố gắng đánh bại toàn diện "pháo đài" phần mềm-phần cứng của NVIDIA, mà định vị mình như một lựa chọn thay thế khả thi, tiết kiệm chi phí và linh hoạt hơn cho những nhà phát triển nhạy cảm về giá hoặc muốn...

Tháng 6 năm 2026, AMD tại AI DevDay ở San Francisco đã xác nhận kế hoạch vận chuyển một thiết bị mới. Cỗ máy này có kích thước tương đương Mac mini của Apple, được trang bị 128GB bộ nhớ thống nhất, và được định vị chính thức là nền tảng phát triển AI tại chỗ. Chỉ vài tháng trước đó, DGX Spark của NVIDIA đã xuất hiện trên bàn làm việc của các nhà phát triển, cũng là một hộp kim loại nhỏ bằng bàn tay, cũng với 128GB bộ nhớ thống nhất, và cũng tuyên bố có thể chạy mô hình lớn 200 tỷ tham số ngay tại máy.

Nền tảng nhà phát triển AMD Ryzen AI Halo, trang bị bộ xử lý Ryzen AI Max+ 395

Báo cáo thực tế từ Tom's Hardware dựa trên HP Z2 Mini G1a đưa ra mức giá tham khảo cho phe AMD: từ $2,949 đến $3,999. Trang web chính thức của NVIDIA hiển thị DGX Spark có giá khởi điểm $3,999, một số phiên bản OEM đã có thảo luận về việc tăng lên $4,679 vào tháng 2/2026. Về giá cả, AMD áp đảo hơn một chút, nhưng đó chỉ là trên bề mặt.

Cùng 128GB, hai con đường khác nhau

Lõi của AMD Ryzen AI Halo là một bộ xử lý Ryzen AI Max+ 395, với 16 nhân Zen 5, 40 đơn vị tính toán GPU kiến trúc RDNA 3.5, cùng một NPU XDNA 2 có hiệu suất 50 TOPS đi kèm. Tài liệu phần cứng chính thức của NVIDIA mô tả DGX Spark theo một logic khác: GB10 Grace Blackwell Superchip, CPU ARM 20 nhân kết hợp GPU kiến trúc Blackwell, không có NPU, nhưng được nhồi thêm một card mạng ConnectX-7 200Gbps. Thiết bị của AMD cung cấp cổng mạng 2.5GbE và WiFi 7; bên phía NVIDIA là 10GbE cộng WiFi 7, cộng thêm chiếc card mạng tốc độ cao đắt tiền đó.

Thông số bộ nhớ có vẻ gần giống nhau. Cả hai đều là LPDDR5x 128GB. Trang sản phẩm của AMD ghi băng thông bộ nhớ là 256 GB/s, trong khi NVIDIA đưa ra con số 273 GB/s. Chênh lệch chưa đến 7%, hầu như không thể cảm nhận được trong hầu hết các tác vụ suy luận.

Lựa chọn hệ điều hành làm lộ ra sự phân kỳ căn bản hơn giữa hai bên. AMD Ryzen AI Halo được cài sẵn Windows 11 Pro, có thể chọn Ubuntu 24.04. Khởi động vào màn hình desktop PC tiêu chuẩn, có cổng Thunderbolt, hỗ trợ đầy đủ thiết bị ngoại vi thông dụng. DGX Spark chạy DGX OS, tùy chỉnh dựa trên Ubuntu, việc đầu tiên sau khi khởi động là cấu hình môi trường CUDA và chuỗi công cụ container của NVIDIA.

The Register đã thực hiện một so sánh thử nghiệm chi tiết vào tháng 12/2025. Kết luận là: trong suy luận mô hình ngôn ngữ lớn đơn lô, tốc độ sinh token của hai máy rất gần nhau. Nhưng ở giai đoạn xử lý prompt, DGX Spark nhanh hơn từ 2 đến 3 lần. Sự chênh lệch này đến từ việc kiến trúc Blackwell hỗ trợ tính toán độ chính xác thấp, cùng với hàng năm tối ưu hóa đường dẫn mã cho pipeline suy luận của NVIDIA. Đánh giá từ ServeTheHome chỉ ra một khía cạnh khác: Card mạng ConnectX-7 của DGX Spark có giá bán lẻ riêng lẻ vượt quá $900, giá trị tiềm năng của nó trong các kịch bản cụm nhiều máy vượt xa phạm vi suy luận đơn máy.

Theo thử nghiệm thực tế của các phương tiện truyền thông như Tom's Hardware, kích thước Ryzen AI Halo là cao 85mm, rộng 168mm, sâu 200mm, nặng 2.3 kg, gần với thể trạng của một trạm làm việc mini truyền thống hơn. Tài liệu chính thức của NVIDIA cho thấy DGX Spark có kích thước 150mm mỗi cạnh, dày 50.5mm, nặng 1.2 kg. Một cái giống như hộp đĩa cứng xếp chồng, một cái giống như bộ định tuyến.

Thanh tiến trình của ROCm, không còn chỉ là "dùng được là được"

Tài liệu phát hành chính thức của AMD cho thấy ROCm 7.2 ra mắt vào tháng 1/2026, phiên bản 7.2.4 sau đó đã được tối ưu hóa riêng cho tính ổn định và hiệu suất của khối lượng công việc suy luận AI. Phoronix đã có bài báo chi tiết vào ngày phát hành.

Đối với các nhà phát triển trong môi trường Linux, quy trình cài đặt ROCm hiện nay đã được đơn giản hóa nhiều so với hai năm trước. Tháng 3/2026, tác giả blog kỹ thuật Kunal Ganglani trong một hướng dẫn sử dụng ROCm chi tiết đã viết rằng, anh ấy chỉ mất khoảng 30 phút để hoàn thành toàn bộ quy trình từ cấu hình hệ thống đến chạy mô hình PyTorch trên RX 7900 XTX, "trong khi vào năm 2024, làm việc tương tự cần vất vả cả nửa ngày". Blog của anh ấy xác nhận ROCm hiện hỗ trợ bốn framework học sâu chính là PyTorch, TensorFlow, JAX, DGL, các engine suy luận như vLLM, Ollama, llama.cpp đều có backend ROCm khả dụng.

Nhưng những tiến bộ này không thể ngăn cản được quán tính của CUDA. Ngăn xếp phần mềm của NVIDIA đã tích lũy 17 năm, số lượng câu hỏi và trả lời liên quan đến CUDA trên Stack Overflow gấp hàng chục lần ROCm. Các phiên bản mới của các thư viện tiên phong như FlashAttention, xFormers thường ra phiên bản CUDA trước, phiên bản chuyển thể ROCm phải chờ vài tuần đến vài tháng. Bất kỳ kernel CUDA tùy chỉnh nào vượt ra ngoài phạm vi API tiêu chuẩn của PyTorch đều cần điều chỉnh thủ công trên nền tảng AMD. Ma trận tương thích chính thức của AMD liệt kê các kết hợp framework và GPU đã được xác minh, nhưng "được xác minh" và "có đủ bài thảo luận cộng đồng để tìm kiếm khi gặp vấn đề" là hai chuyện khác nhau.

Trên mục r/LocalLLaMA của Reddit, các bài thảo luận về việc nên chọn thiết bị nào đã không ngừng từ cuối năm 2025. Một bản tóm tắt thường được trích dẫn nhất đến từ phần kết của blog Ganglani: "Nếu bạn cần mọi thứ hoạt động hoàn hảo ngay từ ngày đầu tiên, hãy mua NVIDIA. Nếu bạn sẵn lòng dành một buổi chiều để giải quyết vấn đề và tiết kiệm $800, ROCm đã sẵn sàng."

AMD dường như rõ điều này. Một năm qua, hành động của công ty này không phải là sao chép mặt trận hào bảo vệ của NVIDIA, mà là xây dựng một lò riêng bên ngoài hào đó.

Tháng 8/2024, AMD thông báo mua lại ZT Systems với giá $49 tỷ. Wall Street Journal xác nhận giao dịch hoàn tất vào tháng 3/2025. Công việc kinh doanh của ZT Systems là giúp các khách hàng trung tâm dữ liệu siêu lớn thiết kế và lắp ráp hệ thống máy chủ AI cấp độ cả giá, khách hàng bao gồm các gã khổng lồ như Microsoft, Meta - những công ty mua hàng chục nghìn GPU mỗi năm. AMD có được là khả năng thiết kế hệ thống từ một GPU đơn lẻ đến cả giá.

Nhưng AMD nhanh chóng đưa ra một quyết định có vẻ mâu thuẫn. Tháng 5/2025, theo thông báo chính thức của Sanmina, AMD đã tách hoạt động sản xuất trung tâm dữ liệu của ZT Systems cho nhà cung cấp dịch vụ sản xuất điện tử này, chỉ giữ lại đội ngũ thiết kế cho mình. Logic rất rõ ràng: AMD không muốn trở thành đối thủ cạnh tranh của chính các khách hàng OEM của mình. Nếu AMD tự sản xuất máy chủ AI, các nhà sản xuất máy chủ bán card đồ họa AMD sẽ ngay lập tức cảnh giác. Giữ lại khả năng thiết kế, gia công sản xuất bên ngoài, động thái này cân bằng giữa việc bổ sung năng lực và quan hệ sinh thái.

Hai việc quan trọng hơn xảy ra trong nửa năm sau đó.

Tháng 10/2025, thông cáo báo chí chính thức của AMD thông báo hợp tác chiến lược với OpenAI, triển khai 6GW GPU AMD Instinct. Lô đầu tiên 1GW dự kiến xuất xưởng vào nửa cuối năm 2026. Trong thỏa thuận này ẩn chứa một điều khoản: OpenAI có thể chọn mua tối đa 10% cổ phần của AMD. Reuters và CNBC trong báo cáo cùng ngày đều nhấn mạnh chi tiết này. Cung cấp cho OpenAI sẽ là thế hệ GPU Instinct tiếp theo, AMD chưa công bố model cụ thể.

Tháng 2/2026, AMD lại phát hành thông cáo báo chí chính thức, thông báo hợp tác mở rộng với Meta, cũng triển khai 6GW GPU. Lần này con chip là phiên bản MI450 tùy chỉnh của Meta, kế hoạch bắt đầu xuất xưởng vào nửa cuối năm 2026. Báo cáo của CNBC trong ngày chỉ ra một chi tiết: ngay trước khi hợp tác này được công bố vài ngày, Meta cũng thông báo thỏa thuận mở rộng mua chip AI với NVIDIA.

Việc Meta cùng ký đơn đặt hàng dài hạn với cả hai bên, bản thân điều này đã có sức thuyết phục hơn bất kỳ so sánh kỹ thuật nào. Đối với các doanh nghiệp đầu tư hàng chục tỷ đô la hàng năm vào cơ sở hạ tầng AI, việc đặt tất cả trứng vào một giỏ là rủi ro không thể chấp nhận được. AMD không cần hiệu suất vượt trội toàn diện so với NVIDIA, chỉ cần cung cấp một lựa chọn khả dụng bên ngoài NVIDIA, là có thể cắt được đơn hàng dưới logic "hai nhà cung cấp". Quy mô của hai hợp đồng 6GW ám chỉ rằng, ít nhất OpenAI và Meta đã đưa AMD vào danh sách đơn hàng đó.

Ứng phó đồng thời của NVIDIA, là một loạt đòn kết hợp

Cùng thời điểm, NVIDIA tung ra một loạt đòn kết hợp trên thị trường doanh nghiệp. DGX Spark được định vị là thiết bị bàn làm việc cho nhà phát triển, nhưng card mạng ConnectX-7 của nó quyết định nó không phải là một trạm làm việc cô lập. Đánh giá từ ServeTheHome phân tích chi tiết giá trị của card mạng này trong việc kiểm chứng nguyên mẫu và gỡ lỗi huấn luyện phân tán, kết luận là mặc dù chậm hơn nhiều so với NVLink cấp trung tâm dữ liệu, nhưng đối với các kịch bản cụm quy mô nhỏ đã đủ dùng. Thiết kế này gắn chặt DGX Spark vào dòng sản phẩm doanh nghiệp lớn hơn của NVIDIA: nhà phát triển dùng Spark làm nguyên mẫu, sau đó di chuyển mã lên DGX Station hoặc instance DGX trên đám mây, cuối cùng triển khai lên các cụm máy chủ trang bị H200 hoặc B200. Một chuỗi công cụ nhất quán từ phần cứng đến phần mềm, từ bàn làm việc đến trung tâm dữ liệu, được hàn chặt vào CUDA.

NVIDIA đồng thời cũng ra mắt bộ phần mềm đăng ký AI Enterprise, đóng gói các công cụ như TensorRT, RAPIDS, máy chủ suy luận Triton, tính phí theo nút. Trang sản phẩm chính thức của NVIDIA liệt kê danh sách đầy đủ các công cụ mà AI Enterprise bao gồm. Đây không phải là bán phần cứng, mà là sau khi các nhà phát triển đã quen với CUDA, biến việc triển khai và vận hành cấp doanh nghiệp thành một công việc phải trả phí liên tục.

So sánh con đường của hai bên, sự phân kỳ đã đủ rõ ràng.

NVIDIA xây dựng một vòng khép kín toàn ngăn xếp từ chip đến hệ thống, phần mềm đến dịch vụ đám mây. Nhà phát triển bước vào vòng khép kín này ngay ngày đầu tiên có thể sử dụng các công cụ đã được tối ưu hóa, cái giá phải trả là bị ràng buộc vào hệ sinh thái của một nhà cung cấp. AMD đi theo một con đường thay thế mở: sử dụng kiến trúc x86 tiêu chuẩn ngành, hỗ trợ hệ thống kép Windows và Linux, biến ROCm thành ngăn xếp mã nguồn mở tương thích với các framework chủ đạo, dùng giá thấp hơn để tranh giành những khách hàng nhạy cảm về chi phí hoặc đã quyết định phân tán rủi ro nhà cung cấp.

Bản thân sản phẩm Ryzen AI Halo là biểu đạt phần cứng tối giản nhất của con đường này. Nó không có card mạng tùy chỉnh, không có hệ điều hành chuyên dụng, không có đơn vị tăng tốc huấn luyện độ chính xác thấp. Nó là một PC thông dụng, tình cờ được nhồi một bộ nhớ thống nhất đủ để chạy mô hình 200B tham số và một bộ GPU khá ổn. Bạn có thể dùng nó chạy suy luận mô hình lớn, cũng có thể tắt terminal để mở Photoshop. Giá $2,949 của HP Z2 Mini G1a mà Tom's Hardware trích dẫn trong báo cáo, thấp hơn nhiều so với mức khởi điểm $3,999 của DGX Spark, nếu đổi sang phiên bản OEM khác, chênh lệch giá có thể lên đến hơn $1,000.

Nhưng mặt trái của tính linh hoạt này là sự thỏa hiệp. Dữ liệu thử nghiệm thực tế của The Register đã cho thấy, một khi rời khỏi kịch bản suy luận đơn lô bước vào các kịch bản cần tính toán song song lớn, ưu thế độ chính xác thấp của kiến trúc Blackwell và ngăn xếp phần mềm được tối ưu hóa qua nhiều năm sẽ nhanh chóng tạo ra khoảng cách. Nếu bạn cần một hộp để bàn có thể chạy Stable Diffusion tạo ảnh, hệ sinh thái CUDA của NVIDIA có cả một bộ công cụ cài là chạy. Kiến trúc RDNA 3.5 của AMD không hỗ trợ định dạng độ chính xác thấp FP4 và FP8, bị thiệt về hiệu suất trên các khối lượng công việc tạo ảnh, điều này do thiết kế kiến trúc RDNA quyết định, không phải cập nhật driver có thể giải quyết.

Vận mệnh của chiếc hộp, không nằm trong chiếc hộp

Thu hẹp dòng thời gian lại, các động thái của AMD trong năm qua tạo thành một con đường khá rõ ràng.

Ở cấp độ phần cứng, Instinct MI300 và MI325X sản xuất hàng loạt, MI350 và MI450 tiến triển theo lộ trình, Ryzen AI Max+ 395 từ chip laptop biến thành APU desktop nhồi vào nền tảng phát triển. Ở cấp độ hệ thống, thông qua việc mua lại ZT Systems có được khả năng thiết kế cấp giá, sau đó tách sản xuất giữ lại nghiên cứu phát triển. Ở cấp độ khách hàng, dùng hai hợp đồng dài hạn cấp 6GW để buộc chặt hai người tiêu dùng sức mạnh tính toán AI lớn nhất toàn cầu, nhân tiện kéo OpenAI vào danh sách cổ đông. Ở cấp độ phần mềm, ROCm lặp với tốc độ khoảng mỗi quý một phiên bản, đuổi kịp sự hỗ trợ của các framework chủ đạo, nhưng việc chuyển thể các thư viện tiên phong và tích lũy cộng đồng vẫn cần thời gian.

Mỗi bước không hề đơn lẻ. Việc mua lại ZT Systems là để có khả năng thiết kế loại cụm AI siêu lớn mà OpenAI và Meta cần, chứ không chỉ bán GPU cho các nhà sản xuất máy chủ. Việc lặp nhanh ROCm là để khách hàng ký hợp đồng 6GW có ngăn xếp phần mềm khả dụng khi triển khai, chứ không giao hàng máy trần. Việc ra mắt Ryzen AI Halo là để mở rộng cùng hệ sinh thái ROCm đó đến đầu cuối desktop, cho phép nhà phát triển dùng một máy $3,000 để gỡ lỗi cục bộ, sau đó triển khai mô hình lên cụm MI450 trên đám mây.

Nhưng điều này không có nghĩa AMD đã đuổi kịp NVIDIA. Hai hợp đồng 6GW là cam kết triển khai trong tương lai, dung lượng năng lượng tính bằng gigawatt phản ánh quy mô quy hoạch cơ sở hạ tầng, không phải số lượng chip đã xuất xưởng. Thông số cụ thể của MI450 đến nay vẫn chưa được công khai, hiệu suất thực tế của chip, tỷ lệ sản phẩm tốt, độ ổn định sau khi triển khai quy mô lớn đều là ẩn số. ROCm trên các framework chủ đạo đã đạt được trạng thái "dùng được", nhưng trạng thái "cộng đồng có thể giúp bạn khi gặp vấn đề" vẫn cần tích lũy lâu hơn. Và sự tích lũy 17 năm của CUDA không thể được tiêu hóa chỉ bằng vài quý lặp nhanh.

Hào bảo vệ của NVIDIA cũng không chỉ nằm ở phần mềm. Card mạng ConnectX-7 của DGX Spark ám chỉ một chiều kích cạnh tranh khác: khi AMD dùng tỷ lệ chi phí/hiệu suất và tính mở để tranh giành nhà phát triển, NVIDIA dùng khả năng mở rộng cụm để khóa chặt các nhóm cần thực hiện huấn luyện phân tán và pipeline suy luận lớn. Mua một DGX Spark là $3,999, mua hai cái cộng với dây mạng là có thể chạy nguyên mẫu phân tán. Trong kịch bản này, ưu thế ngang bằng trong suy luận đơn máy của ROCm bị triệt tiêu.

Sự phân kỳ của hai công ty trong AI, cuối cùng khi rơi vào chiếc hộp nhỏ bằng bàn tay này, biến thành một lựa chọn cụ thể. Bạn mở hộp của AMD, nhận được một môi trường PC quen thuộc, dùng hầu như cùng các lệnh cài đặt PyTorch, tải mô hình, bắt đầu suy luận, quá trình suôn sẻ, cho đến khi bạn cần dùng một thư viện chỉ có backend CUDA. Bạn mở hộp của NVIDIA, nhận được một môi trường chuyên dụng được tối ưu hóa từ phần cứng, driver đến chuỗi công cụ container, khởi động xong mọi thứ đều trong dự kiến, chỉ có điều hóa đơn nhiều hơn hơn một nghìn đô la, và chi phí di chuyển khi đổi nhà cung cấp sau này đã bị khóa chặt trước.

AMD không thách thức trực tiếp đế chế toàn ngăn xếp của NVIDIA. Họ chọn một con đường thực tế hơn: khi khả năng định giá và giao hàng chuỗi cung ứng của NVIDIA không thể đáp ứng nhu cầu của tất cả khách hàng, hãy trở thành một lựa chọn thay thế đủ dùng. Hai hợp đồng 6GW là bằng chứng thuyết phục nhất cho chiến lược này cho đến nay. Ryzen AI Halo là sự mở rộng của chiến lược này ở đầu cuối desktop, không phải theo phong trào làm hộp AI nhỏ, mà là đi thêm một bước dọc theo đường thẳng "dùng hệ sinh thái mở và ưu thế chi phí để tranh giành các nhà phát triển không muốn bị khóa chặt".

Câu hỏi Liên quan

QSự khác biệt chính giữa AMD Ryzen AI Halo và NVIDIA DGX Spark về thiết kế và định vị là gì?

AAMD Ryzen AI Halo có kích thước giống máy trạm mini truyền thống, chạy hệ điều hành tiêu chuẩn Windows/Linux, là một máy tính đa dụng tối ưu cho phát triển AI cục bộ. Ngược lại, NVIDIA DGX Spark nhỏ gọn hơn, chạy hệ điều hành DGX OS chuyên biệt, được tích hợp sẵn card mạng tốc độ cao ConnectX-7, hướng tới việc trở thành một phần của hệ sinh thái khép kín từ máy bàn đến trung tâm dữ liệu của NVIDIA.

QTại sao AMD lại có thể cạnh tranh với NVIDIA trong thị trường AI mặc dù có sự chênh lệch lớn về hệ sinh thái phần mềm?

AAMD không cố gắng đánh bại toàn bộ hệ sinh thái của NVIDIA. Họ theo đuổi chiến lược trở thành lựa chọn thay thế đủ tốt thông qua: 1) Ưu thế về giá cả, 2) Kiến trúc mở dựa trên x86 và Windows/Linux, 3) Cải thiện nhanh chóng nền tảng phần mềm ROCm, và 4) Đặc biệt, việc ký kết các hợp đồng lớn dài hạn (ví dụ: 6GW với OpenAI và Meta) dựa trên chiến lược 'đa nhà cung cấp' của các khách hàng lớn để giảm thiểu rủi ro phụ thuộc vào một nhà cung cấp duy nhất.

QViệc AMD mua lại ZT Systems và sau đó lại tách bộ phận sản xuất có ý nghĩa chiến lược gì?

AAMD mua lại ZT Systems để có được khả năng thiết kế hệ thống máy chủ AI cấp rack hoàn chỉnh, phục vụ các khách hàng siêu lớn. Việc tách bộ phận sản xuất cho Sanmina giúp AMD tập trung vào thiết kế mà không trở thành đối thủ cạnh tranh trực tiếp với các đối tác OEM (nhà sản xuất máy chủ) vốn đang bán sản phẩm sử dụng GPU của AMD, từ đó duy trì mối quan hệ sinh thái lành mạnh.

QSự khác biệt trong triết lý phần mềm giữa ROCm (AMD) và CUDA (NVIDIA) được thể hiện như thế nào và ưu/nhược điểm là gì?

ANền tảng ROCm của AMD là một nền tảng phần mềm nguồn mở, cố gắng tương thích với các framework phổ biến như PyTorch, TensorFlow. Nó cung cấp sự linh hoạt và tránh bị khóa chặt nhà cung cấp, đồng thời cải thiện nhanh chóng. Tuy nhiên, nó thiếu sự hỗ trợ cộng đồng sâu rộng, các thư viện tiên tiến thường ra mắt chậm hơn, và việc gỡ lỗi phức tạp hơn. Trong khi đó, CUDA của NVIDIA là một hệ sinh thái khép kín, được tối ưu hóa cao, đầy đủ công cụ và được hỗ trợ cộng đồng mạnh mẽ, nhưng lại ràng buộc người dùng vào nền tảng của NVIDIA.

QTấm thẻ mạng ConnectX-7 trên DGX Spark đại diện cho chiến lược cạnh tranh sâu hơn nào của NVIDIA so với AMD?

ACard mạng ConnectX-7 tốc độ cao thể hiện chiến lược của NVIDIA nhằm mở rộng lợi thế vượt ra ngoài hiệu suất đơn lẻ của máy. Nó biến DGX Spark từ một thiết bị phát triển độc lập thành một nút có thể dễ dàng kết nối thành một cụm nhỏ để thử nghiệm nguyên mẫu phân tán hoặc suy luận quy mô lớn. Điều này củng cố giá trị của hệ sinh thái khép kín từ máy bàn đến trung tâm dữ liệu của NVIDIA, một lĩnh vực mà giải pháp hướng đến máy tính đa dụng của AMD (với cổng mạng tiêu chuẩn) chưa thể cạnh tranh trực tiếp.

Nội dung Liên quan

Cảnh báo mới nhất từ Dalio: Đừng để AI làm mờ mắt, lợi nhuận thực tế của thị trường chứng khoán Mỹ trong 5-10 năm tới có thể đạt -5% đến -10%

Tác giả Ray Dalio, người sáng lập Bridgewater, cảnh báo về một thị trường chứng khoán Mỹ đang bị chi phối bởi một nhóm nhỏ các công ty công nghệ AI. Ông nhấn mạnh rằng sự tập trung này tạo ra rủi ro cao, một thực tế không thể tranh cãi. Dalio so sánh tình huống hiện tại với các giai đoạn bong bóng công nghệ trong lịch sử, nơi sự phấn khích về công nghệ mới thường dẫn đến biến động mạnh và nhiều công ty tiên phong thất bại. Ông chỉ ra các rủi ro như cạnh tranh toàn cầu (đặc biệt từ Trung Quốc), các yếu tố địa chính trị, thay đổi chính sách thuế và sự không chắc chắn vốn có của bản thân công nghệ mới. Thay vì đặt cược lớn, tập trung vào AI, Dalio ủng hộ mạnh mẽ chiến lược **đa dạng hóa**. Ông trình bày "Chén Thánh đầu tư" của mình: một danh mục gồm khoảng 15 khoản đầu tư tốt, không tương quan và cân bằng rủi ro. Về mặt toán học, điều này mang lại tỷ lệ lợi nhuận/rủi ro vượt trội so với một vị thế tập trung. Về triển vọng, Dalio đưa ra quan điểm (ông thừa nhận có thể sai) rằng lợi nhuận thực tế kỳ vọng cho cổ phiếu Mỹ trong 5-10 năm tới là rất thấp, ở mức khoảng -5% đến -10%, dựa trên các chỉ số định giá và bong bóng của ông. Thông điệp cốt lõi: Đừng để sự phấn khích với tiềm năng của AI làm lu mờ sự thận trọng. Trong một môi trường đầy rủi ro và không chắc chắn, chiến lược khôn ngoan là nhận biết những gì mình không biết và đa dạng hóa mạnh mẽ thay vì tập trung cửa cược vào một lĩnh vực duy nhất.

marsbit17 phút trước

Cảnh báo mới nhất từ Dalio: Đừng để AI làm mờ mắt, lợi nhuận thực tế của thị trường chứng khoán Mỹ trong 5-10 năm tới có thể đạt -5% đến -10%

marsbit17 phút trước

Rain định giá gần 20 tỷ USD: Cuộc chiến U-Card, đã đánh tới hệ thống phần thưởng

Rain, công ty cơ sở hạ tầng thanh toán stablecoin hiện định giá gần 20 tỷ USD, vừa công bố chương trình thưởng Rain Rewards, đánh dấu bước tiến trong cuộc cạnh tranh "thẻ U". Thay vì chỉ phát hành thẻ, Rain tích hợp sẵn hệ thống điểm thưởng và lòng trung thành vào nền tảng cơ sở của mình, cho phép đối tác (doanh nghiệp, ngân hàng, fintech) dễ dàng tạo chương trình riêng để gia tăng tần suất sử dụng thẻ của khách hàng. Bài viết giải thích Rain hoạt động như một "hậu trường" thanh toán, cung cấp cho doanh nghiệp một bộ công cụ hoàn chỉnh để phát hành ví và thẻ (Visa/Mastercard) dùng stablecoin, kết nối tài sản trên chuỗi với mạng lưới thanh toán truyền thống. Gần đây, Rain còn giới thiệu Agent Control Layer, cho phép kiểm soát chi tiêu tự động của AI Agent, mở rộng tầm nhìn từ thẻ vật lý sang hệ điều hành thanh toán có thể lập trình. Với 3 vòng gọi vốn thành công trong 10 tháng (tổng cộng hơn 338 triệu USD), Rain phản ánh xu hướng định giá lại cơ sở hạ tầng stablecoin. Chiến lược của họ là chiếm lĩnh điểm vào thanh toán, biến dòng tiền trên chuỗi thành những giao dịch hàng ngày một cách liền mạch.

Foresight News21 phút trước

Rain định giá gần 20 tỷ USD: Cuộc chiến U-Card, đã đánh tới hệ thống phần thưởng

Foresight News21 phút trước

Tín hiệu đáy lịch sử tái xuất? Messari từng định giá 3 tỷ USD bị bán tháo với 10 triệu USD

Tín hiệu đáy lịch sử tái xuất hiện? Messari từng định giá 300 triệu USD giờ chỉ bán được hơn 10 triệu. Nền tảng dữ liệu hàng đầu ngành crypto này, cùng nhiều công ty khác như DappRadar, Parsec, CoinDesk đang đóng cửa, bán rẻ hoặc cắt giảm nhân sự. Nguyên nhân đến từ sự xói mòn mô hình kinh doanh do AI và sự rút lui của vốn đầu tư mạo hiểm (VC). VC đang dồn tiền vào AI, khiến đầu tư vào crypto lao dốc hơn 80% trong 6 tháng. Các quỹ crypto cũ hoạt động khó khăn, quỹ mới khó gọi vốn. Nhiều nhân vật chủ chốt như Kyle Samani (Multicoin) cũng rời bỏ lĩnh vực này. Tuy nhiên, đây có thể là tín hiệu tích cực. Bitcoin đã giảm gần 50% từ đỉnh, chỉ số Sợ hãi & Tham lam xuống mức cực thấp, nhà đầu tư dài hạn nắm giữ gần 80% nguồn cung. Lịch sử cho thấy, khi những tín hiệu bi quan này đồng thời xuất hiện (như năm 2018, 2020), thường đánh dấu đáy của chu kỳ và mở ra đợt tăng trưởng mới. Một số quỹ như Dragonfly vẫn lạc quan, tiếp tục gọi vốn và đầu tư, trong khi Blockworks mua lại Messari để củng cố ngành. Sự sụp đổ của những gã khổng lồ một thời có thể là dấu hiệu cho một khởi đầu mới.

marsbit1 giờ trước

Tín hiệu đáy lịch sử tái xuất? Messari từng định giá 3 tỷ USD bị bán tháo với 10 triệu USD

marsbit1 giờ trước

Khối lượng xuất xưởng TPU của Google được điều chỉnh tăng 50%

Gần đây, giới AI tính toán đã chứng kiến một sự điều chỉnh kỳ vọng quan trọng. Nhiều tổ chức nước ngoài âm thầm nâng dự báo sản lượng xuất xưởng cho TPU của Google, trực tiếp thay đổi quan điểm bảo thủ trước đó của thị trường về nhu cầu phần cứng tính toán năm 2027. Dự báo ngành từ mức dưới 10 triệu chip TPU đã được điều chỉnh lên khoảng 15 triệu chip, tương ứng mức tăng mới 50%. Việc sản lượng TPU tăng mạnh sẽ lan tỏa đến toàn bộ chuỗi cung ứng, mang lại lợi ích đồng thời cho các lĩnh vực then chốt như động cơ quang NPO, mô-đun quang 1.6T, chuyển mạch quang OCS, nguồn server, cáp quang & MPO, và đặc biệt là làm mát bằng chất lỏng (liquid cooling). Trong đó, làm mát bằng chất lỏng là hướng thay đổi lớn nhất và được kỳ vọng mang lại lợi nhuận vượt trội. Công suất chip TPU thế hệ mới tăng cao khiến giải pháp tản nhiệt truyền thống không đáp ứng được, thúc đẩy việc áp dụng rộng rãi giải pháp làm mát bằng chất lỏng. Dự kiến năm 2026 sẽ là năm bùng nổ thực sự cho lĩnh vực này tại Google. Cửa sổ cạnh tranh cũng được định hình lại khi các nhà sản xuất nước ngoài gặp khó khăn về công nghệ và năng lực giao hàng, tạo cơ hội lớn cho các nhà sản xuất trong nước với ưu thế về tốc độ lặp, ổn định giao hàng và đủ công suất. Lĩnh vực cáp quang cũng có logic mới, chuyển từ sản phẩm chu kỳ sang nguồn tài nguyên chiến lược quan trọng cho các cụm tính toán AIDC. Nhu cầu bùng nổ từ việc xây dựng trung tâm dữ liệu AI vượt xa năng lực sản xuất trong ngắn hạn, dẫn đến tình trạng thiếu hụt. Các nhà sản xuất trong nước đang tận dụng lợi thế về năng lực và chi phí để chiếm thị phần lớn. Các mảng phụ trợ khác như động cơ quang NPO (tỷ lệ 1:1 với TPU), mô-đun quang 1.6T, chuyển mạch quang OCS và nguồn server cũng đều được hưởng lợi từ làn sóng này. Trọng tâm đầu tư trong chuỗi cung ứng AI đang dần chuyển từ "cạnh tranh sức mạnh chip" sang "sự tăng trưởng ổn định của cơ sở hạ tầng hỗ trợ tính toán". Việc điều chỉnh tăng mạnh dự báo cung ứng TPU của Google giúp củng cố tính chắc chắn về hiệu suất cho toàn bộ ngành trong 2-3 năm tới.

marsbit1 giờ trước

Khối lượng xuất xưởng TPU của Google được điều chỉnh tăng 50%

marsbit1 giờ trước

Cơn sốt tiền điện tử qua đi, Phố Wall thực sự muốn gì?

Tác giả: Bạch Thoại Khu Công Nghệ Sau cơn sốt tiền điện tử, Phố Wall không còn theo đuổi các câu chuyện đầu cơ hay tư tưởng "phi tập trung". Thay vào đó, họ đang kiên trì xây dựng một hệ thống tài chính tuân thủ, có thể kiểm soát và tạo ra thu nhập trên nền tảng sổ cái phân tán. Các ví dụ điển hình bao gồm: 1. **Chứng khoán hóa tài sản truyền thống:** Quỹ BUIDL của BlackRock (quản lý 25-28 tỷ USD) đầu tư vào trái phiếu kho bạc ngắn hạn và hoạt động trên blockchain, cung cấp tài sản thế chấp an toàn. Securitize, với định giá 12,5 tỷ USD, chuẩn bị niêm yết trên NYSE và hợp tác xây dựng hệ thống thanh toán chứng khoán hoạt động 24/7 trên chuỗi. 2. **Tạo thu nhập từ Bitcoin:** BlackRock sắp ra mắt ETF BITA, sử dụng chiến lược bán quyền chọn mua có bảo hiểm trên danh mục nắm giữ Bitcoin để tạo ra dòng thu nhập (cổ tức) ổn định cho nhà đầu tư, biến Bitcoin thành tài sản sinh lời. 3. **Ổn định tiền tệ như công cụ thanh toán:** Các stablecoin tuân thủ (như USDC) đang được Stripe và Mastercard tích hợp để xử lý thanh toán xuyên biên giới tức thì với chi phí thấp. SWIFT cũng công bố kế hoạch phát triển sổ cái phân tán để giải quyết tình trạng kẹt vốn trong thanh toán toàn cầu. Đạo luật GENIUS 2025 định hình stablecoin là công cụ thanh toán thuần túy (không trả cổ tức) và tăng cường kiểm soát tuân thủ. Tóm lại, Phố Wall đang sử dụng công nghệ blockchain để tái tạo và nâng cấp các sản phẩm tài chính truyền thống (quỹ trái phiếu, quyền chọn, mạng lưới thanh toán), gắn chúng với uy tín của đồng USD và hệ thống quy định hiện có, nhằm xây dựng các kênh dẫn vốn hiệu quả và có lợi nhuận.

marsbit2 giờ trước