Tác giả gốc: Lý Hải Luân, Tô Dương
Biên tập gốc: Từ Thanh Dương
Nguồn gốc: Tencent Technology
Ngày 1 tháng 6 năm 2026, trong hội nghị NVIDIA GTC Taipei diễn ra trong khuôn khổ COMPUTEX 2026, nhà sáng lập kiêm CEO NVIDIA, Jensen Huang, đã có bài phát biểu chính.
Chỉ mới ba tháng kể từ GTC lần trước.
Lúc đó, NVIDIA đã công bố "combo chip" Vera Rubin, bao gồm: CPU Vera, GPU Rubin, LPU Groq 3, ConnectX-9, DPU BlueField-4, switch Spectrum-6 - sáu con chip tạo thành một siêu máy tính AI cấp rack, đồng thời tuyên bố số lượng GPU cần thiết để huấn luyện mô hình MoE lớn giảm xuống còn một phần tư, thông lượng suy luận tăng gấp 10 lần mỗi watt, và chi phí mỗi token giảm xuống còn một phần mười.
Khác với việc trước đây nhấn mạnh các giải pháp cấp hệ thống như "combo chip" hay "combo sức mạnh tính toán", tại COMPUTEX ba tháng sau, Jensen Huang hướng sự chú ý vào mục tiêu mà những cơ sở hạ tầng này sẽ phục vụ - Agent.
Jensen Huang tiết lộ trong bài phát biểu: Nền tảng Vera Rubin chính thức đi vào sản xuất hàng loạt, CPU Vera bắt đầu giao hàng toàn cầu, DGX Station lần đầu tiên xuất hiện dưới dạng Windows trên bàn làm việc doanh nghiệp, Cosmos 3 tái cấu trúc khung nhận thức cho AI vật lý, DSX trở thành hệ điều hành vận hành cho nhà máy AI. NVIDIA cũng hợp tác với Unitree ra mắt H2 Plus - thiết kế tham chiếu robot hình người đầu tiên dựa trên nền tảng Isaac GR00T, mở rộng biên giới của Agent từ thế giới số sang hình thái vật lý.
NVIDIA đang tổ chức lại toàn bộ hệ thống kỹ thuật hoàn chỉnh từ chip, trung tâm dữ liệu, mô hình, phần mềm đến nền tảng robot xoay quanh hệ sinh thái Agent.
Jensen Huang nói: "Thời đại của Agent AI và trí tuệ nhân tạo thực dụng đã đến. Bây giờ token (còn gọi là 'từ nguyên') là đơn vị lợi nhuận, AI là 'máy tạo' GDP, số lượng kỹ sư phần mềm đang tăng lên. Mọi người nói AI làm giảm việc làm, điều đó hoàn toàn vô lý, thực tế có nhiều kỹ sư phần mềm hơn đang được tuyển dụng".
Cùng một nhà máy AI, xử lý gấp 10 lần tác vụ Agent
Nền tảng Vera Rubin đã đi vào sản xuất toàn diện.
Khác với việc trước đây chủ yếu hướng đến huấn luyện và suy luận mô hình lớn, Vera Rubin ngay từ khi thiết kế đã coi Agent là khối lượng công việc trọng tâm.
Jensen Huang cho biết trong bài phát biểu, một tác vụ Agent thường không chỉ là một lần suy luận mô hình, mà bao gồm nhiều khâu như suy luận, tìm kiếm, gọi công cụ, thực thi mã và xác minh kết quả, đằng sau có thể liên quan đến hàng nghìn bước. Trung tâm dữ liệu trong tương lai cần xử lý không chỉ là yêu cầu của một mô hình đơn lẻ, mà nhiều hơn là lượng lớn các tác vụ Agent chạy liên tục và hợp tác với nhau.
Nền tảng này được định nghĩa là một siêu máy tính AI cấp đơn vị tính toán khổng lồ, thống nhất, được xây dựng chuyên biệt để xử lý khối lượng công việc của các tác nhân thông minh từ suy luận, truy xuất đến sử dụng công cụ. Trong các trung tâm dữ liệu siêu lớn có quy mô tương tự, sử dụng nền tảng Vera Rubin mới để chạy các tác vụ của tác nhân AI tự chủ, hiệu quả xử lý cao gấp 10 lần so với nền tảng Grace Blackwell thế hệ trước.
Ngoài bản thân nền tảng tính toán, mạng lưới cũng trở thành trọng tâm nâng cấp của Vera Rubin.
class="ql-align-justify">Trước đây trong trung tâm dữ liệu, việc truyền dữ liệu giữa các GPU chủ yếu phụ thuộc vào kiến trúc mô-đun quang và switch truyền thống, nhưng khi quy mô cụm tiếp tục mở rộng, mức tiêu thụ điện năng, tản nhiệt và độ phức tạp triển khai sẽ tăng nhanh. Để giải quyết vấn đề này, NVIDIA đã giới thiệu hệ thống mạng Spectrum-X Ethernet Photonics trong nền tảng Vera Rubin.Đây là lần đầu tiên NVIDIA đưa công nghệ quang học đóng gói chung (CPO) vào mạng trung tâm dữ liệu AI trên quy mô lớn.
Nói một cách đơn giản, giải pháp truyền thống cần cắm mô-đun quang bên ngoài switch, trong khi CPO tích hợp trực tiếp các thiết bị quang vào bên trong switch, từ đó giảm tiêu thụ năng lượng và tổn thất tín hiệu.
Ngoài ra, an ninh cũng là khả năng cốt lõi được nhấn mạnh trọng tâm trong nền tảng Vera Rubin lần này.
Vì vậy, NVIDIA đã mở rộng khả năng tính toán bảo mật (Confidential Computing) ra toàn bộ nền tảng Vera Rubin. Thông qua môi trường thực thi đáng tin cậy, xác minh cấp phần cứng và cơ chế mã hóa end-to-end, doanh nghiệp có thể đạt được mức độ bảo vệ an ninh cao hơn khi xử lý dữ liệu riêng tư, thông tin nhạy cảm ngành và các mô hình quan trọng.
Jensen Huang tiết lộ, Vera Rubin đã bước vào giai đoạn sản xuất hàng loạt. Là hệ thống cấp rack MGX thế hệ thứ ba, phía sau nó liên quan đến hơn 150 đối tác, hơn 350 nhà máy và hệ thống chuỗi cung ứng bao phủ hơn 30 quốc gia và khu vực. Theo kế hoạch công bố của NVIDIA, Vera Rubin sẽ chính thức xuất xưởng vào mùa thu năm nay.
Bộ xử lý "sinh ra dành cho Agent"
NVIDIA đã giới thiệu bộ xử lý mới Vera được thiết kế dành riêng cho kỷ nguyên tác nhân thông minh, và đã đi vào sản xuất toàn diện.
Jensen Huang chỉ ra rằng, sự tiến bộ của hệ thống bộ nhớ sẽ thúc đẩy việc đổi mới và hiện đại hóa hệ thống lưu trữ. Cho đến nay, tất cả CPU đều được tạo ra cho con người, còn Vera là CPU được thiết kế cho thời đại AI, dành cho tác nhân thông minh.
Là người kế nhiệm của Grace, Vera sử dụng kiến trúc lõi CPU "Olympus" do NVIDIA tự thiết kế, số lượng lõi tăng từ 72 lên 88, và nâng cao đáng kể khả năng xử lý bộ nhớ và dữ liệu. Theo giới thiệu của NVIDIA, trong các bài kiểm tra khối lượng công việc liên quan đến Agent, tốc độ thực thi tác vụ của Vera đạt gấp 1,8 lần so với CPU máy chủ x86 cùng thời kỳ.
So với việc chỉ đơn thuần nâng cao hiệu suất, thay đổi quan trọng hơn nằm ở mối quan hệ giữa Vera và GPU Rubin: Vera kết nối với GPU Rubin thông qua NVLink-C2C thế hệ thứ hai, băng thông liên kết đạt 1.8TB/s, chi phí truyền dữ liệu giữa CPU và GPU trong quá trình chạy Agent được giảm thiểu hơn nữa.
Jensen Huang cho biết, Vera Rubin sử dụng HBM (Bộ nhớ băng thông cao) của Micron, SK Hynix và Samsung, quy mô chuỗi cung ứng gấp "hai lần" so với Blackwell thế hệ trước. Tuy nhiên, triển khai một rack Blackwell lớn cần hai giờ, trong khi thời gian của Vera Rubin được nén xuống mức 5 phút.
Đưa nhà máy AI từ "xây dựng" sang "vận hành"
DSX mà NVIDIA lần này giới thiệu có thể hiểu là một bộ "công cụ xây dựng và vận hành nhà máy AI".
Trước đây khi xây dựng trung tâm dữ liệu AI, khách hàng cần xem xét riêng rẽ máy chủ, mạng, điện, làm mát, thiết kế phòng máy và hệ thống vận hành, nhiều khâu phụ thuộc vào sự phối hợp của các nhà cung cấp khác nhau. Điều DSX muốn làm là đặt các khâu vốn phân tán này vào cùng một khuôn khổ, để khách hàng từ thiết kế, mô phỏng, xây dựng đến vận hành đều có một giải pháp tiêu chuẩn để tham khảo và xác minh.
Jensen Huang phát biểu tại hiện trường sự kiện: NVIDIA không chỉ bán chip, mà còn cung cấp cho những người xây dựng cơ sở hạ tầng một bản thiết kế hoàn chỉnh cho nhà máy AI.
Khả năng bổ sung quan trọng nhất của DSX lần này chủ yếu có hai điểm.
Thứ nhất là DSX MaxLPS. Nó giải quyết vấn đề thực tế nhất của nhà máy AI: với ngân sách điện cố định, làm thế nào để đặt nhiều GPU hơn, chạy nhiều Token hơn.
Theo NVIDIA, MaxLPS kết hợp làm mát bằng chất lỏng và tối ưu hóa tiêu thụ điện trong rack, có thể cho phép nhà điều hành chạy nhiều hơn tối đa 40% GPU mà không ảnh hưởng đáng kể đến hiệu suất.
Thứ hai là DSX OS. Nó tương đương với phần mềm vận hành của nhà máy AI, chịu trách nhiệm quản lý vòng đời, lập lịch thông minh, giám sát tình trạng, khôi phục sự cố, quản lý nhiều người thuê, v.v... Nói một cách đơn giản, nếu nhà máy AI là một nhà máy phức tạp, thì DSX OS chịu trách nhiệm để nhà máy đó vận hành ổn định liên tục.
Trong ma trận sản phẩm của DSX, Reference Design cung cấp thiết kế tham chiếu cho nhà máy AI, cho khách hàng biết phòng máy, rack, mạng, hệ thống điện và làm mát nên được xây dựng như thế nào; DSX Sim chịu trách nhiệm mô phỏng, cho phép khách hàng xác minh tính khả thi của thiết kế trước khi xây dựng; DSX Flex kết nối nhà máy AI với lưới điện, cho phép trung tâm dữ liệu điều chỉnh tác vụ dựa trên tín hiệu giá điện, tải và phản ứng nhu cầu; DSX Exchange thì chịu trách nhiệm kết nối dữ liệu giữa hệ thống IT, hệ thống vận hành, hệ thống năng lượng và làm mát.
Về mặt hệ sinh thái, các đối tác đám mây như CoreWeave, Crusoe, Lambda đang triển khai DSX Sim, MaxLPS và DSX OS để giảm thiểu rủi ro và nâng cao tỷ lệ sử dụng GPU. Các nhà sản xuất như Dell, HPE, Lenovo, Supermicro cùng với Asus, Foxconn, Gigabyte, QCT đang xây dựng các hệ thống hỗ trợ DSX.
Hợp tác với Windows và ARM
Trong bài phát biểu trực tiếp, Jensen Huang chính thức công bố sự xuất hiện của trạm làm việc "DGX Station for Windows", được NVIDIA định nghĩa là siêu máy tính AI cấp bàn làm việc dành cho hệ sinh thái Windows.
Về phần cứng, nó được trang bị GB300 Grace Blackwell Ultra Desktop Superchip, kết nối GPU Blackwell Ultra với CPU Grace 72 lõi thông qua NVLink-C2C, cung cấp tối đa 748GB bộ nhớ thống nhất và hiệu suất 20 PFLOPS FP4, đồng thời được trang bị khả năng mạng lên đến 800Gb/s.
Trọng tâm của sản phẩm này nằm ở sự thay đổi trong cách triển khai Agent.
NVIDIA hy vọng doanh nghiệp có thể chạy nhiều Agent trong môi trường Windows cục bộ, an toàn, có thể quản lý và đưa chúng vào các quy trình công việc như thiết kế, kỹ thuật, khoa học dữ liệu, suy luận và Physical AI. OpenShell được ra mắt đồng thời chịu trách nhiệm an ninh chạy Agent, thông qua sandbox cách ly và kiểm soát chính sách cấp hệ thống, hạn chế Agent thao tác vượt quyền hoặc làm rò rỉ thông tin xác thực, dữ liệu riêng tư.
Ngoài sản phẩm hướng đến bàn làm việc doanh nghiệp, Jensen Huang còn giới thiệu một SoC cấp hệ thống - RTX Spark SoC, tích hợp CPU N1X và GPU Blackwell vào một con chip, với kiến trúc bộ nhớ thống nhất, dành riêng cho máy tính xách tay mỏng nhẹ và máy tính để bàn nhỏ.
Trong đó, N1X là bộ xử lý PC đầu tiên do NVIDIA và Microsoft cùng tạo ra, dựa trên kiến trúc Arm, do MediaTek thiết kế tùy chỉnh, được sản xuất bằng quy trình 3 nanomet của TSMC. Sẽ được trang bị đầu tiên vào mùa thu này trên máy tính xách tay của Microsoft, Dell, HP, Asus, Lenovo và MSI, với hơn 30 kiểu máy đầu tiên, tập trung vào máy tính xách tay mỏng nhẹ cao cấp.
Đây là "siêu chip" mà NVIDIA chuẩn bị cho thời đại AI PC, Jensen Huang coi nó là một sự tái cấu trúc quan trọng về hình thái PC.
"Hai bộ não" của Agent
Tại sự kiện ra mắt lần này, NVIDIA công bố tiến triển mới nhất của hai dòng sản phẩm mô hình cốt lõi, tương ứng với hai kịch bản của Agent: một chạy trong hệ thống doanh nghiệp, một chạy trong thế giới vật lý.
NVIDIA đã phát hành mô hình Nemotron 3 Ultra với 550 tỷ tham số hỗn hợp chuyên gia, có thể cung cấp khả năng thông minh đỉnh cao cho các tác nhân thông minh lâu dài trong quy trình phát triển mã, nghiên cứu khoa học và kinh doanh doanh nghiệp. So với các mô hình tiên phong mã nguồn mở hàng đầu cùng cấp, tốc độ suy luận của mô hình này tăng cao nhất gấp 5 lần, chi phí sử dụng giảm cao nhất 30%, giúp tác nhân thông minh hoàn thành các nhiệm vụ hiệu quả hơn và chi phí thấp hơn.
Xoay quanh mô hình mở Nemotron, NVIDIA đã phát hành một loạt phần mềm, mô hình mã nguồn mở và tiến triển hợp tác, với mục tiêu để doanh nghiệp trong các kịch bản như thiết kế kỹ thuật, y tế sức khỏe, phát triển phần mềm và vận hành kinh doanh, xây dựng được "đồng nghiệp số" có thể hỗ trợ nhân viên làm việc.
Trong bộ tổ hợp này, Nemotron cung cấp khả năng mô hình cơ bản, NemoClaw chịu trách nhiệm tổ chức mô hình thành Agent, OpenShell chịu trách nhiệm an ninh thời gian chạy, Agent Toolkit thì biến các thư viện phần mềm của NVIDIA như CUDA-X thành công cụ mà Agent có thể trực tiếp gọi. Agent có thể sử dụng công cụ, gọi dữ liệu, thực thi nhiệm vụ trong môi trường được kiểm soát và kết nối với hệ thống hiện có của doanh nghiệp.
Jensen Huang cho biết, các công ty phần mềm toàn cầu đang đưa AI Agent vào hệ thống công việc thực tế, để chúng giúp nhân viên hoàn thành nhiệm vụ phức tạp nhanh hơn. NemoClaw cung cấp các thành phần mở cần thiết để xây dựng Agent chạy lâu dài, bao gồm khả năng điều phối, ngữ cảnh, trí nhớ, gọi công cụ và kiểm soát an ninh.
Trước đây doanh nghiệp thảo luận về AI, chủ yếu quan tâm mô hình có thể trả lời những gì; bây giờ NVIDIA muốn giải quyết vấn đề: Agent làm thế nào để kết nối một cách an toàn với công cụ, dữ liệu và quy trình nghiệp vụ, và tiếp tục chạy liên tục trong công việc thực tế.
Và còn có Cosmos 3, được chính thức phát hành với tư cách là thế hệ thứ ba của dòng Cosmos, cũng là một lần tái cấu trúc ở cấp độ kiến trúc.
Cosmos 3 là một mô hình cơ sở thế giới hướng đến AI vật lý, cung cấp khả năng cơ bản "hiểu thế giới vật lý, dự đoán điều gì sẽ xảy ra, quyết định làm thế nào".
So với Cosmos trước đây, các phiên bản đầu chủ yếu hướng đến nhà phát triển robot và lái xe tự động, làm về tạo video và mô phỏng thế giới vật lý, về bản chất là một khung tạo tương đối đơn phương thức. Cosmos 3 thay đổi một kiến trúc - Transformer hỗn hợp, lần đầu tiên thống nhất ba việc: suy luận thị giác, tạo thế giới và dự đoán hành động vào một hệ thống.
Nó có thể hiểu và tạo văn bản, hình ảnh, video, âm thanh môi trường và hành động một cách nguyên bản, đạt đến trình độ dẫn đầu về độ chính xác vật lý, là mô hình toàn năng hoàn toàn mở đầu tiên trên toàn cầu. NVIDIA cho biết, nó có khả năng nén chu kỳ huấn luyện và đánh giá AI vật lý từ vài tháng trước đây xuống còn vài ngày.
Jensen Huang dự đoán, nhờ những đột phá trong ngôn ngữ suy luận đa phương thức, thị giác và mô hình thế giới, vụ nổ lớn của AI vật lý sắp xảy ra.
Dòng mô hình toàn năng tiên phong mở Cosmos 3 cung cấp cho nhà phát triển khả năng nhảy vọt thế hệ, để xây dựng robot, xe tự lái và AI thị giác có thể cảm nhận, suy luận, lập kế hoạch và hành động trong thế giới vật lý.
Hạ thấp ngưỡng Physical AI
NVIDIA hợp tác với Unitree ra mắt H2 Plus - một robot hình người mẫu dành cho nghiên cứu và nhà phát triển.
"Mẫu" có nghĩa là: Unitree chịu trách nhiệm về thân robot, NVIDIA chịu trách nhiệm về phần mềm và nền tảng tính toán, hai bên tích hợp sẵn phần cứng và phần mềm, nhóm phát triển nhận được là có thể bắt đầu làm phát triển kỹ năng ngay, không cần tự mất thời gian giải quyết vấn đề kết nối tầng cơ sở. Nó cũng là robot hình người mở đầu tiên trên toàn cầu được xây dựng dựa trên nền tảng phát triển NVIDIA Isaac GR00T.
Robot mẫu này nhắm vào một điểm đau tồn tại lâu dài trong phát triển robot hình người: tích hợp phần cứng, thu thập dữ liệu, mô phỏng, huấn luyện, đánh giá, triển khai, mỗi khâu hoạt động riêng rẽ, toàn bộ quy trình phân mảnh cao độ.
NVIDIA cho biết, nhóm nghiên cứu nhận được một thân robot, thường phải dành nhiều thời gian để ghép nối ở tầng cơ sở, việc phát triển kỹ năng thực sự ngược lại bị trì hoãn nhiều lần. Điều H2 Plus cố gắng làm là thông suốt con đường này, để nhóm nghiên cứu bỏ qua tích hợp tầng cơ sở, đi thẳng vào phát triển kỹ năng và xác minh kịch bản thực tế.
Theo quan điểm của Jensen Huang, robot hình người sẽ mang AI vật lý đến ngành công nghiệp lớn nhất thế giới, mở ra cơ hội kinh tế hàng nghìn tỷ USD, và H2 Plus chính là điểm khởi đầu để đẩy nghiên cứu tiên phong vào các kịch bản thực tế như nhà máy, kho, hệ thống hậu cần.
Ngoài ra, NVIDIA còn tuyên bố chính thức mở nguồn một bộ công cụ Skills (kỹ năng) AI vật lý, bao phủ các kịch bản cốt lõi như robot, lái xe tự động, AI thị giác và song sinh kỹ thuật số công nghiệp.
"Kỹ năng" được hiểu là NVIDIA đã tiêu chuẩn hóa cách sử dụng các nền tảng như Cosmos, Omniverse, Isaac, Metropolis của mình, viết thành các lệnh thao tác mà tác nhân thông minh có thể đọc hiểu và thực thi trực tiếp, những lệnh này được đóng gói và mở nguồn ra, chính là bộ công cụ được phát hành lần này.
Tác nhân thông minh nhận một nhiệm vụ, ví dụ tạo ra một loạt dữ liệu huấn luyện phát hiện khuyết tật, nó biết nên gọi mô hình nào, xuất định dạng gì, xác minh kết quả ra sao, toàn bộ quá trình chạy tự động, không cần con người thao tác từng bước từng khâu.
Nâng cấp lưu trữ AI: Từ "chạy nhanh" đến "quản lý được"
Tại GTC San Jose vào tháng 3, NVIDIA đã phát hành Vera BlueField-4 STX, lúc đó Jensen Huang nhấn mạnh về "kiến trúc lưu trữ nguyên bản AI", điểm bán cốt lõi là cung cấp hỗ trợ lưu trữ KV Cache hiệu suất cao cho việc suy luận ngữ cảnh dài của tác nhân thông minh.
Bây giờ, NVIDIA tuyên bố bổ sung thêm một bộ khả năng an ninh trên cơ sở STX, trọng tâm chuyển từ "hiệu suất lưu trữ" sang "an ninh lưu trữ".
Logic và suy nghĩ cốt lõi ở đây, là vì bối cảnh là cách sử dụng AI của doanh nghiệp đang thay đổi. Hiện nay nhiều doanh nghiệp đều tích cực triển khai tác nhân thông minh, khi Agent kết nối với hệ thống doanh nghiệp, liên tục đọc ghi, chia sẻ thông tin xuyên hệ thống trong tình trạng không có sự giám sát trực tiếp của con người - ai đang truy cập dữ liệu gì, có vượt quyền không, có rò rỉ không, đây đều là những vấn đề đau đầu của doanh nghiệp.
Giải pháp của NVIDIA là, trên cơ sở lưu trữ gia tốc thêm một lớp khả năng an ninh - dựa vào một bộ phần mềm an ninh NVIDIA DOCA thống nhất, cùng với việc thực thi chính sách cứng trực tiếp trong chip BlueField-4, nền tảng dựa trên STX có thể kiểm tra và kiểm soát tương tác giữa đại lý, dữ liệu và trí nhớ ngữ cảnh theo thời gian thực, giúp doanh nghiệp thực hiện chính sách liên tục trên đường dẫn dữ liệu AI.
Jensen Huang giải thích: "Tác nhân thông minh biến dữ liệu doanh nghiệp thành một hệ thống sống, hoạt động theo thời gian thực, và hệ thống này phải được bảo vệ ở mọi nơi dữ liệu di chuyển, mọi nơi lưu trữ ngữ cảnh, mọi nơi tác nhân thông minh hành động. Điều Vera BlueField-4 STX muốn làm là, với thiết kế an ninh bẩm sinh, thực thi sự tin cậy ở tốc độ AI ngay trong chip".
Quan hệ "là nhà cung cấp của nhau" với TSMC
Trong hội nghị lần này, một điểm rất thú vị là sự hợp tác giữa NVIDIA và TSMC - hiện tại, TSMC đang sử dụng công nghệ NVIDIA để nâng cao thời gian luân chuyển, hiệu suất năng lượng, sản lượng và năng suất vận hành của các nhà máy wafer tiên tiến.
Mối quan hệ giữa TSMC và NVIDIA, ba mươi năm qua chỉ có một hình thái: TSMC giúp NVIDIA sản xuất chip. Nhưng bây giờ, vai trò đã thay đổi tinh tế, NVIDIA bắt đầu giúp TSMC "quản lý nhà máy".
Jensen Huang cho biết: "NVIDIA và TSMC đã hợp tác gần ba mươi năm, không ngừng thúc đẩy giới hạn của tính toán. TSMC đang đưa AI và tính toán gia tốc của NVIDIA vào bên trong nhà máy wafer, thông qua mô phỏng, tối ưu hóa và AI để ứng phó với các thách thức thiết kế và sản xuất phức tạp nhất toàn cầu, nhằm nâng cao tốc độ, hiệu quả và sản lượng của thế hệ chip tiếp theo."
Mối quan hệ của hai bên, từ quan hệ một chiều bên A - bên B, trở thành phụ thuộc lẫn nhau hai chiều.
Lời kết
Nhìn lại sự kiện ra mắt này, NVIDIA đang xoay quanh "Agent" để ghép nên bản thiết kế mới.
CPU Vera lập lịch tác vụ cho Agent, Vera Rubin cung cấp sức mạnh tính toán cho Agent, BlueField-4 STX bảo vệ an ninh dữ liệu cho Agent, Cosmos 3 giúp Agent hiểu thế giới vật lý, Nemotron+NemoClaw+OpenShell giúp Agent có thể được tổ chức, được gọi, bị ràng buộc, DGX Station for Windows đưa Agent vào bàn làm việc của nhân viên doanh nghiệp, H2 Plus giúp Agent có thân thể, DSX và Skills giúp tất cả những điều này có thể được sản xuất hàng loạt, triển khai hàng loạt.
Từ góc độ này, Jensen Huang đang cố gắng mô tả một thời đại tính toán mới. Điều này cũng tương đồng với lời ông đề cập ở phần mở đầu "Thời đại của Agent AI và trí tuệ nhân tạo thực dụng đã đến".
Rốt cuộc, điều Jensen Huang lần này muốn nói chỉ là một việc: khi Agent trở thành cơ sở hạ tầng AI, mỗi tầng đều có thể có NVIDIA.












