Được biết, vào ngày 3 tháng 6, Arm CEO Rene Haas đã có bài phát biểu chính tại Computex 2026, công bố ByteDance và Oracle đã áp dụng chip CPU tự nghiên cứu của Arm cho trung tâm dữ liệu là Arm AGI.
Tháng trước, Arm đã tăng gấp đôi dự báo nhu cầu đối với CPU Arm AGI, dự kiến trong năm tài chính 2027 và 2028 sẽ đạt 20 tỷ USD (khoảng 135 tỷ nhân dân tệ), đồng thời dự kiến sản phẩm này sẽ tạo ra doanh thu hàng năm 150 tỷ USD (khoảng 1.016 tỷ nhân dân tệ) trong khoảng năm năm.
Rene Haas trong cuộc phỏng vấn với truyền thông nước ngoài hôm qua cho biết, Mỹ ngăn cản xuất khẩu CPU AI sang Trung Quốc là "gần như không thể", vì CPU AI được ứng dụng rộng rãi, khó xác định CPU nào là dành riêng cho AI, khó đặt ra ngưỡng hiệu suất cụ thể và hạn chế băng thông bộ nhớ như đối với chip AI.
Thứ Hai tuần này, NVIDIA đã ra mắt siêu chip RTX Spark và CPU trung tâm dữ liệu Vera dựa trên kiến trúc Arm, tối cùng ngày, cổ phiếu Arm tăng liên tục, tính đến khi thị trường đóng cửa thứ Ba, tăng 16%. Tính đến nay trong năm, cổ phiếu Arm đã tăng tích lũy 263%.
Người sáng lập và CEO của NVIDIA, ông Hoàng Nhân Huân, cũng đến tham dự bài phát biểu của Rene Haas hôm thứ Ba, vừa lên sân khấu đã trêu đùa: "Hãy nhìn cổ phiếu của anh ấy, mỗi lần tôi ra mắt sản phẩm, cổ phiếu của anh ấy lại tăng, còn của tôi thì chẳng có gì xảy ra."
Rene Haas đã đáp lại một cách khôn ngoan: "Anh từng là cổ đông, sau đó anh đã bán cổ phần."
Ông Hoàng Nhân Huân lập tức tiếp lời: "Đúng vậy, đúng vậy, ôi, tôi cần tiền mặt."
Hai người có vẻ là người quen lâu năm, nói chuyện sôi nổi trong 15 phút, thỉnh thoảng lại có những tiểu phẩm ứng biến, những câu đùa và đối đáp khiến cả hội trường bật cười liên tục, bản thân họ cũng thường cười lớn đến mộp lộ cả hàm răng.
Đây thực sự là cuộc đối thoại sôi động nhất trong giới công nghệ mà tôi từng xem gần đây.
Ví dụ, sau khi khen ngợi CPU Arm một tràng, ông Hoàng Nhân Huân kết luận: "Từ khóa là 'Arm hoàn hảo'."
Rene Haas tiếp lời: "Một từ khóa khác là 'Cảm ơn'."
Ông Hoàng Nhân Huân lập tức nói bằng tiếng Trung: "Đâu có, đâu có, đừng khách sáo."
Sau đó Rene Haas trêu: "Bây giờ cuộc thi này không công bằng rồi." (Ý nói ông Hoàng nói tiếng Trung là không công bằng)
Tiếp theo ông Hoàng Nhân Huân lại bổ sung một câu chu đáo: "You're welcome."
Ông Hoàng Nhân Huân còn trêu rằng "Một trong những lợi thế tuyệt vời nhất của Arm là không phải lo lắng về vấn đề chuỗi cung ứng", chuỗi cung ứng IP là điện tử, có thể dùng bao nhiêu điện tử tùy thích.
"Vì vậy tôi yêu mô hình kinh doanh của nó," ông Hoàng Nhân Huân bắt đầu nhớ lại quá khứ, "Các bạn biết đấy, tôi đã thử rồi, tôi từng cố gắng trở thành Arm, tôi và Rene từng làm việc cùng nhau, sau đó chúng tôi lại cố gắng hợp tác một lần nữa, nhưng điều đó cũng chẳng có gì to tát, tôi vẫn rất buồn."
Rene Haas nói: "Nếu hai công ty hợp nhất, chúng ta sẽ trở thành công ty lớn nhất thế giới."
"Tôi thích điều này," ông Hoàng Nhân Huân cười lớn, "Đây thực sự là một ý tưởng hay."
Có vẻ cả hai đều tiếc nuối vì NVIDIA không mua được Arm.
Cuối cùng đến phần tặng quà, Rene Haas chơi trò "hồi tưởng", tặng ông Hoàng Nhân Huân một chiếc máy tính xách tay Microsoft Surface RT trang bị chip NVIDIA Tegra 3, còn bắt chước chữ ký của ông Hoàng Nhân Huân ký tên mình lên đó.
NVIDIA Tegra 3, chính là bộ xử lý bốn nhân di động Arm đầu tiên trên thế giới do NVIDIA giới thiệu vài năm trước.
Ông Hoàng Nhân Huân chỉ vào bức ảnh trên màn hình lớn tự khen: "Điều gì đã xảy ra khi chúng ta còn trẻ? Tôi phải nói, tôi cảm thấy tôi trông trẻ hơn. Các bạn đồng ý không? Tôi nghĩ mình giữ gìn khá tốt."
Rene Haas cười đến mờ mịt.
Sau đó ông Hoàng Nhân Huân giật lấy món quà, giọng điệu cao lên: "Cái này cho tôi à? Nếu tôi ký tên, rồi trả lại cho anh, nó sẽ là một bảo vật."
Rene Haas nói: "Không, anh ký xong trả lại cho tôi, ở đây có hợp đồng, có hóa đơn, chúng ta không thể làm như vậy. Chúng tôi biết trò chơi đó."
Quay lại chủ đề nghiêm túc của ngành công nghiệp, trong bài phát biểu này, Rene Haas đã hỏi ông Hoàng Nhân Huân vài câu hỏi then chốt:
1. Tại sao lại làm RTX Spark?
2. Cân nhắc thế nào giữa tác nhân thông minh chạy cục bộ và tác nhân thông minh chạy trên đám mây?
3. Tác nhân thông minh có thực sự có thể làm việc độc lập, thoát khỏi hệ điều hành cơ bản không?
4. Ông Hoàng Nhân Huân nghĩ gì về các yếu tố hạn chế tăng trưởng trong vài năm tới?
Ông Hoàng Nhân Huân còn "vẽ bánh" cho sự phát triển thị trường: Hiện nay ngành công nghiệp máy tính bị giới hạn bởi số người sử dụng máy tính, khi có tác nhân thông minh có thể tự chủ sử dụng máy tính, chúng ta sẽ không còn là một tỷ người sử dụng máy tính nữa, mà sẽ là hàng chục tỷ, thậm chí có thể nhiều hơn cả số lượng tác nhân thông minh, robot và ô tô tự lái sử dụng máy tính.
Vì vậy vấn đề là, quy mô sản phẩm máy tính cuối cùng có thể lớn đến mức nào?
"Tôi cảm thấy, đến bây giờ, kết cục đã được định đoạt, ngành công nghiệp hàng nghìn tỷ đô la này có thể lớn gấp mười lần, chúng ta đang trên đường tiến lên." Ông Hoàng Nhân Huân nói.
Rene Haas cũng chia sẻ những tiến triển mới nhất và kế hoạch tiếp theo của Arm trong lĩnh vực PC tác nhân thông minh và CPU trung tâm dữ liệu.
Ông cũng nhân tiện đề cập đến cuộc trò chuyện tuần này với Chủ tịch kiêm Tổng giám đốc TSMC Wei Zhejia, Phó chủ tịch cấp cao kiêm COO Zhang Xiaoqiang, họ nói chưa từng thấy chu kỳ ngành bán dẫn nào thịnh vượng liên tục bốn năm như vậy.
01. Lớp học nhỏ của ông Hoàng Nhân Huân: Thiết kế PC tác nhân thông minh như thế nào?
Ông Hoàng Nhân Huân đã lần lượt giải đáp vài câu hỏi then chốt mà Rene Haas đặt ra, những quan điểm này rất có tính tham khảo đối với sự phát triển AI PC tiếp theo và tư duy thiết kế chip.
1. Tại sao làm sản phẩm RTX Spark này?
PC và hệ điều hành đã tồn tại 40 năm, lập trình thủ công sẽ được thay thế bằng ứng dụng tác nhân thông minh, những tác nhân thông minh này sẽ sử dụng các công cụ trong PC. Vậy trong tương lai, làm thế nào để tái cấu trúc kiến trúc, thay đổi hệ điều hành, tái phát minh máy tính?
NVIDIA nhận ra hệ thống tác nhân thông minh cần CPU xuất sắc, đó là lý do chọn Arm.
Siêu chip RTX Spark trang bị CPU 20 nhân, có hiệu suất đơn luồng xuất sắc, bộ nhớ cần lưu trữ nhiều tham số.
Vì vậy, NVIDIA đã tạo ra một định dạng dữ liệu mới tên là NVFP4, để nén ngôn ngữ khổng lồ, xây dựng nhiều mô hình nhất có thể, và tích hợp AI rất thông minh vào bộ nhớ hệ thống.
NVIDIA còn hy vọng kết hợp CUDA dùng để tăng tốc tính toán và CUDA Tile, tích hợp xử lý lõi tensor vào một bộ xử lý.
2. Cân nhắc thế nào giữa tác nhân thông minh chạy cục bộ và tác nhân thông minh chạy trên đám mây?
Những PC Arm này sẽ trở thành các tác nhân thông minh luôn chạy tự chủ.
Hôm nay, nếu bạn để quên máy tính xách tay ở nhà hoặc khách sạn, bạn không thể dùng nó được.
Nhưng trong tương lai, bạn chỉ cần cầm điện thoại lên, là có thể nói chuyện từ xa với PC, chỉ huy tác nhân thông minh làm việc.
Ông Hoàng Nhân Huân nói: "Bản chất của thiết bị tính toán cá nhân là, bạn có thể làm bất cứ điều gì với thiết bị này, mà không tốn thời gian."
Cần dùng một số API đám mây, thì gọi API đám mây. Bất cứ điều gì có thể làm cục bộ, thì hoàn thành trên máy tính.
3. Khi chạy tác nhân thông minh, hệ điều hành có quan trọng không? Nếu coi tác nhân thông minh là hệ điều hành, nó có thực sự có thể hoàn thành công việc độc lập, và không quá phụ thuộc vào hệ điều hành cơ bản?
Tầm quan trọng của hệ điều hành không hề giảm, thậm chí có thể quan trọng hơn trước.
Đây cũng là điểm tranh cãi thường được nói đến khi AI xuất hiện - "phần mềm đã chết", ông Hoàng Nhân Huân cho rằng không có gì vô lý hơn điều này.
Con người có thể chỉ biết một hai mươi phần trăm chức năng của nhiều công cụ.
Nhưng bây giờ, bạn có thể nói cho tác nhân thông minh biết bạn muốn gì.
Tác nhân thông minh rất rõ cách sử dụng những công cụ này, vì chúng đã đọc tệp Skills, Skills về cơ bản là đọc sách hướng dẫn sử dụng công cụ đó, vì vậy bây giờ nó sẽ sử dụng MCP hoặc CLI được kết nối với công cụ này, mở khóa tất cả các công cụ này, đáp ứng nhu cầu của bạn.
Những công cụ này sẽ có giá trị hơn bao giờ hết, chúng chạy trên hệ điều hành, vì vậy chúng ta cần hệ thống Windows, chúng ta sẽ cần những API và công cụ này trong một thời gian dài.
4. Trong vài năm tới, yếu tố hạn chế tăng trưởng là gì?
"Chúng tôi gần như thấy hạn chế ở mọi khía cạnh." Ông Hoàng Nhân Huân nói, NVIDIA đã lên kế hoạch trước, làm tốt kế hoạch chuỗi cung ứng, năm nay tăng trưởng so với cùng kỳ gần 100%, năm sau sẽ đạt được tăng trưởng rất mạnh mẽ, chuỗi cung ứng có thể hỗ trợ tăng trưởng của NVIDIA.
Nhưng nhu cầu thực tế cao hơn.
Ông Hoàng Nhân Huân nói, mô hình ứng dụng tính toán mới thực sự cần một kiến trúc mới, hiện nay một đột phá lớn là tác nhân thông minh có thể sản xuất AI thực dụng, đó là lý do tại sao sự tăng trưởng của mọi người đều không thể tin được như vậy.
Khi AI trở nên thực dụng, token được tạo ra có thể mang lại lợi nhuận. Khi việc tạo token có lãi, ai cũng muốn tạo ra gấp nghìn tỷ lần token.
Bây giờ AI không chỉ là chatbot biết trả lời câu hỏi, nó có thể suy nghĩ, sử dụng công cụ, đọc, tiếp tục suy nghĩ, lập kế hoạch, thử nghiệm, số lượng token cần tạo ra tăng mạnh, khả năng sinh lời của token đang thúc đẩy nhu cầu sức mạnh tính toán, tạo ra hiệu ứng cộng dồn.
02. Chip PC Arm: Apple, Google, Qualcomm đều nói tốt, hợp tác chặt chẽ với NVIDIA, MediaTek
Trong lĩnh vực PC, Google, Apple, NVIDIA, Qualcomm, v.v. đều đã nghiên cứu chip PC dựa trên kiến trúc Arm, Arm đã hợp tác với Apple, Google, Microsoft, v.v. vài thập kỷ.
Rene Haas nói, Arm rất vinh dự hợp tác với NVIDIA phát triển siêu chip RTX Spark dựa trên kiến trúc Arm. CPU tùy chỉnh Grace của chip này có 20 lõi, mỗi lõi đều dựa trên kiến trúc Arm.
"Tôi tin đây là CPU có số lõi nhiều nhất trong máy tính xách tay trên thị trường hiện nay." Rene Haas nói, khi bạn kết hợp nó với GPU Blackwell, chip này có hiệu suất AI FP4 đạt 1 PFLOPS, dung lượng bộ nhớ thống nhất 128GB, hỗ trợ hoàn toàn nguyên bản hệ thống Windows nền tảng Arm.
Vai trò của Arm trong đó là hợp tác chặt chẽ với NVIDIA và MediaTek, sử dụng chiến lược hệ thống con tính toán (CSS) của Arm.
Hệ thống con tính toán kết hợp tất cả các thành phần cần thiết để xây dựng SoC tùy chỉnh (CPU, GPU, IP hệ thống, bộ điều khiển bộ nhớ), xây dựng hệ thống giải pháp đầu cuối hoàn chỉnh.
Arm đã hợp tác với MediaTek hoàn thành công việc này, MediaTek có thể cung cấp giải pháp hoàn chỉnh.
Rene Haas cũng trình bày lộ trình Arm CSS dành cho PC tác nhân thông minh, thế hệ tiếp theo sẽ tối ưu hóa lõi CPU tùy chỉnh thiết kế riêng cho PC.
03. CPU tác nhân thông minh tự nghiên cứu của Arm: OpenAI, ByteDance đều là đối tác
Rene Haas nói, hơn 25 tỷ chip Arm được sản xuất tại Đài Loan, Trung Quốc, CPU tự nghiên cứu đầu tiên của Arm ra mắt vào tháng 3 năm nay là Arm AGI do TSMC tại Đài Loan, Trung Quốc sản xuất.
CPU Arm AGI được thiết kế đặc biệt cho cơ sở hạ tầng tác nhân thông minh AI, sử dụng quy trình công nghệ 3nm của TSMC, thiết kế Chiplet kép, mỗi CPU tích hợp 136 lõi hiệu suất cao Arm Neoverse V3, trang bị bộ nhớ đệm L2 2MB, hỗ trợ tần số chính 3.7GHz, cung cấp băng thông bộ nhớ mỗi lõi 6GB/s, độ trễ bộ nhớ dưới 100ns, sử dụng giao diện PCIe Gen 6 96 kênh, hỗ trợ giao thức CXL 3, TDP đạt 300W.
Đối tác CPU Arm AGI bao gồm OpenAI, Meta, Cerebras, SAP, SK telecom, Rebellions, v.v. Rene Haas công bố, nhu cầu thị trường đối với chip này mạnh mẽ hơn so với khi mới ra mắt, Oracle và ByteDance cũng đã gia nhập đại gia đình này, chứng minh CPU Arm AGI có thể giải quyết vấn đề thực tế.
Tất nhiên, không phải tất cả doanh nghiệp đều muốn mua CPU Arm AGI. Đối với doanh nghiệp có hứng thú tự nghiên cứu chip, Arm cung cấp nhiều loại IP và hệ thống con tính toán (CSS), nỗ lực cung cấp cho khách hàng bất kỳ giải pháp nào họ mong muốn thấy thành công.
Tại trung tâm dữ liệu, CPU Axion được kết nối với chip AI mới nhất của Google là TPU 8t và TPU 8i, chính là một chip sử dụng công nghệ Arm Neoverse, trong điều kiện hiệu suất không đổi, công suất có thể giảm 60% so với CPU x86.
CPU tự nghiên cứu Graviton của Amazon cũng đang sử dụng kiến trúc Arm. CEO Amazon Andy Jassy từng tiết lộ: "Hai khách hàng lớn hỏi liệu có thể mua toàn bộ phiên bản Graviton năm 2026 của chúng tôi không."
NVIDIA cũng vừa ra mắt CPU Vera thế hệ mới dựa trên Arm trong tuần này.
Arm dự định biến CPU tự nghiên cứu thành một sự nghiệp lâu dài, và trưng bày lộ trình ba năm.
CPU Arm AGI thế hệ thứ hai đang trong quá trình nghiên cứu, so với thế hệ trước có nhiều lõi hơn, hiệu suất năng lượng cao hơn và hiệu suất tốt hơn.
CPU Arm AGI thế hệ thứ ba cũng sắp ra đời.
Tất cả đều dựa trên hệ thống con tính toán mà Arm dự định giao hàng cùng với chip.
04. Kết luận: Sau khi tác nhân thông minh bùng nổ, ánh đèn sân khấu cuộc đua sức mạnh tính toán chiếu vào CPU
Các bài phát biểu tuần này của các chủ tịch tập đoàn chip lớn như ông Hoàng Nhân Huân, Chen Liwu, Rene Haas, v.v. phản ánh một số xu hướng chung của ngành CPU - tác nhân thông minh thay đổi logic tính toán, mở ra cánh cửa cơ hội thị trường hoàn toàn mới cho CPU.
Vài năm qua, trọng tâm cạnh tranh sức mạnh tính toán chủ yếu nằm ở GPU không thể thiếu cho đào tạo AI. Nhưng năm nay, sau khi ứng dụng tác nhân thông minh bùng nổ, nhu cầu suy luận tác nhân thông minh ngày càng thịnh vượng, cần rất nhiều quản lý trạng thái, gọi công cụ, điều phối quy trình, đây là các tác vụ tập trung vào CPU.
Intel, AMD vẫn đang củng cố lợi thế của bộ xử lý x86 trong lĩnh vực trung tâm dữ liệu. Còn các tay chơi mới nổi, bao gồm Amazon, Google, NVIDIA, v.v., về cơ bản đều đặt cược vào hướng đi CPU Arm. Ngay cả Arm cũng đưa ra "quyết định trái với tổ tông", chính thức lao vào sân chơi CPU trung tâm dữ liệu trong năm nay.
Một hiện tượng rất thú vị là, ngành công nghiệp chip đang hình thành một xu hướng tích hợp dọc mới.
Các tập đoàn chip phong phú sản phẩm như NVIDIA, Intel, AMD, v.v., đều ngày càng nhấn mạnh đặc tính toàn diện của chính mình, nhấn mạnh lợi thế của giải pháp nhà mình cũng cùng đích: hiệu suất năng lượng cao hơn, có đủ mọi thứ, có thể tiết kiệm nhiều tiền hơn.
Các doanh nghiệp hàng đầu các ngành cũng lần lượt "vượt biên giới": các ông lớn đám mây mở rộng xuống dưới tự nghiên cứu chip, doanh nghiệp chip mở rộng lên trên làm giải pháp máy hoàn chỉnh, doanh nghiệp IP bán dẫn mở rộng lên trên nghiên cứu chip.
Trong bối cảnh token trở thành đồng tiền cạnh tranh mới, nhu cầu sức mạnh tính toán tăng trưởng bùng nổ, làm thế nào để mỗi watt tạo ra nhiều tính toán hiệu quả hơn, sẽ là trục chính của cạnh tranh chip tiếp theo.
Bài viết này đến từ tài khoản WeChat công cộng "Tin tức chip", tác giả: ZeR0, biên tập: Mo Ying






















