Ba năm qua, câu chuyện về sức mạnh tính toán AI gần như chỉ xoay quanh GPU.
Từ H100, H200 của NVIDIA, đến GB200, GB300, rồi đến các cụm chục nghìn card mà các nhà cung cấp đám mây tranh nhau mở rộng – tất cả các câu chuyện ngành đều nói lên một điều: nút thắt sức mạnh tính toán nằm ở GPU. CPU trong câu chuyện này, lâu nay bị mặc định là một vai trò "hỗ trợ" không mấy quan trọng, nó đi theo sau GPU, đảm nhận những công việc mà GPU không muốn làm.
Nhưng từ năm 2026, câu chuyện này bắt đầu xuất hiện vài vết nứt.
Ngày 1 tháng 6, Intel tại Bắc Kinh đã ra mắt bộ xử lý Xeon 6+, được thiết kế chuyên biệt cho khối lượng công việc đám mây bản địa (cloud-native), AI agent và khối lượng công việc cường độ cao về mạng. Đây là CPU đầu tiên cho trung tâm dữ liệu sử dụng tiến trình Intel 18A.
Trong mô tả của chính Intel, Xeon 6+ không đóng vai trò "hỗ trợ" cho GPU, mà là "mặt phẳng điều khiển" của cơ sở hạ tầng AI, chịu trách nhiệm điều phối, xử lý đồng thời, luồng dữ liệu.
"Con đường mở rộng AI không nằm ở việc cộng thêm các thành phần, mà nằm ở sự vận hành phối hợp của hệ thống." Ông Kevork Kechichian, Phó Chủ tịch điều hành kiêm Tổng giám đốc Bộ phận Kinh doanh Trung tâm Dữ liệu của Intel, cho biết trong buổi gặp gỡ báo chí, "Khi AI bước vào thời đại của các agent, việc điều phối, xử lý đồng thời và luồng dữ liệu đã trở thành các yếu tố hạn chế mới.
Điều này một lần nữa củng cố một thực tế cốt lõi: CPU vẫn là mặt phẳng điều khiển của cơ sở hạ tầng AI hiện đại."
Đây không chỉ là nhận định riêng của Intel. Tháng 2 năm nay, tổ chức nghiên cứu bán dẫn độc lập SemiAnalysis đã công bố một báo cáo mang tên "Sự trở lại của CPU" về bản đồ CPU trung tâm dữ liệu năm 2026, với nhận định cũng rất trực tiếp. Trong bối cảnh đào tạo và suy luận AI được triển khai rộng rãi hiện nay, CPU đang được cần đến theo một cách hoàn toàn khác so với ba năm qua.
Chỉ là "sự trở lại" này cần được mở ra xem xét, nó không phải là việc CPU một lần nữa trở thành nhân vật chính, mà là việc CPU được định nghĩa lại ở một vị trí mới.
1. Vết nứt trong thuyết GPU là trung tâm
Để hiểu tại sao CPU "trở lại", trước hết phải quay lại chính sự thay đổi đang diễn ra trong khối lượng công việc AI.
Hai năm qua, câu chuyện chủ đạo về sức mạnh tính toán AI là đào tạo, quy mô đào tạo mô hình lớn (large model) tăng gấp bốn đến mười lần mỗi năm, việc đào tạo cần tính toán song song khổng lồ, và ở khía cạnh này GPU là nhân vật chính tuyệt đối. Nhưng đào tạo không phải là toàn bộ khối lượng công việc AI.
Theo nhận định của Intel trong buổi gặp gỡ, toàn bộ khối lượng công việc sức mạnh tính toán AI có thể được chia thành ba loại:
Loại thứ nhất là khối lượng công việc cơ bản. Lưu trữ, cơ sở dữ liệu, Web, dịch vụ vi mô (microservices), CDN, đây không phải là AI, nhưng là các dịch vụ nền tảng cần thiết để AI chạy. Phần này vẫn là chiến trường chính của CPU truyền thống.
Loại thứ hai là đào tạo. Việc đào tạo các mô hình lớn tiên tiến hầu như hoàn toàn phụ thuộc vào GPU và các bộ tăng tốc chuyên dụng. Đây là phần mà mọi người tranh giành trong ba năm qua.
Loại thứ ba là suy luận và agent. Phần này đang tăng trưởng nhanh, và khác biệt đáng kể so với đào tạo.
Sự khác biệt then chốt của loại thứ ba nằm ở hình thái của chính khối lượng công việc. Đào tạo là quá trình "tính toán" mô hình từ không đến có, tính song song cực cao, nhu cầu về sức mạnh tính toán đỉnh điểm tại một điểm cực cao. Nhưng suy luận và agent thì không – nó phải triển khai mô hình đã được đào tạo để chạy trong các nghiệp vụ thực tế.
Điều này có nghĩa là rất nhiều việc không phải là "tính toán", mà là điều phối: lên lịch cho nhiều mô hình hợp tác, quản lý ngữ cảnh (context), phối hợp luồng dữ liệu giữa các agent khác nhau, xử lý các yêu cầu đồng thời từ người dùng, đảm bảo độ trễ có thể dự đoán được.
Những việc này, GPU không giỏi.
"Trong kịch bản đó, chúng ta có thể thấy sự kết hợp của việc tăng tốc cấp độ GPU, nhưng chủ thể vẫn là khối lượng công việc lấy CPU truyền thống làm cốt lõi." Ông Kevork Kechichian cho biết trong buổi gặp gỡ.
Đằng sau sự việc này còn có một thực tế công nghiệp cụ thể hơn. SemiAnalysis trong báo cáo "Sự trở lại của CPU" đã đưa ra một ví dụ: Trong trung tâm dữ liệu "Fairwater" mà Microsoft xây dựng cho OpenAI, một tòa nhà CPU và lưu trữ 48 MW đang hỗ trợ một cụm GPU 295 MW.
Tức là, để cụm GPU 295 MW đó thực sự chạy được, cần hàng nghìn hàng vạn CPU bên cạnh xử lý luồng dữ liệu PB cấp do GPU tạo ra, điều phối tác vụ, quản lý lưu trữ.
Sức mạnh tính toán của GPU càng được đẩy cao, nhu cầu "sức mạnh tính toán ngoại vi" mà nó tạo ra càng lớn. Và những nhu cầu sức mạnh tính toán ngoại vi này, cuối cùng lại đổ dồn lên CPU.
Tức là, sự trở lại của CPU không phải là "CPU một lần nữa nhanh hơn GPU". Mà là khi hình thái sức mạnh tính toán AI từ "đào tạo một mô hình lớn" mở rộng thành "vận hành hàng nghìn hàng vạn agent", thì việc điều phối và luồng dữ liệu một lần nữa trở thành nút thắt. GPU không giải quyết được việc này, CPU thì giải quyết được.
Đây là mặt khuất khác trong câu chuyện AI ba năm qua.
2. Xeon 6+ đặt cược vào con đường nào
Nhận định mà Intel đặt cược, được phản ánh trong định nghĩa sản phẩm của Xeon 6+.
Một con số trực quan nhất là, tối đa 288 nhân, và tất cả đều là nhân hiệu suất cao (E-core).
E-core và P-core là sự phân nhánh mà Intel đã thực hiện trong kiến trúc CPU vài năm qua. P-core là nhân hiệu năng, theo đuổi hiệu năng đơn nhân cực hạn, mục tiêu thiết kế của CPU máy chủ truyền thống. E-core là nhân hiệu suất cao, hiệu năng đơn nhân yếu hơn một chút, nhưng diện tích nhỏ, tiêu thụ điện năng thấp, có thể nhét nhiều nhân hơn trong cùng diện tích chip.
Xeon 6+ đẩy sự phân nhánh này đến cực hạn. 288 nhân hiệu suất cao, điều này có nghĩa Intel đặt cược lên một CPU không phải là "mỗi nhân nhanh bao nhiêu", mà là "có thể nhét bao nhiêu nhân lên một CPU".
Logic định nghĩa sản phẩm này là: khối lượng công việc AI agent không phải là vấn đề mỗi nhân chạy nhanh đến đâu, mà là có thể đồng thời chạy hàng nghìn hàng vạn tác vụ nhẹ hay không. Khi một máy chủ cần đồng thời điều phối hàng trăm agent, xử lý hàng nghìn yêu cầu suy luận, duy trì hàng chục nghìn kết nối đồng thời, thì khả năng thông lượng của 288 E-core quan trọng hơn nhiều so với hiệu năng đơn nhân của 64 P-core.
Đây là một định nghĩa sản phẩm ngược dòng chủ lưu. Hàng chục năm qua, câu chuyện chủ lưu của CPU máy chủ đều thi đấu về hiệu năng đơn nhân, xung nhịp cao hơn, IPC mạnh hơn, bộ nhớ đệm lớn hơn. Đường lối E-core về bản chất thừa nhận: câu chuyện đó có lẽ sắp kết thúc rồi.
Nhưng có vài việc phải đặt vào cùng xem xét.
Thứ nhất, đường lối E-core không phải độc quyền của Intel. AMD đã ra mắt Bergamo năm 2023, dựa trên nhân Zen 4c được tối ưu hóa cho mật độ, dòng Graviton của AWS, dòng AmpereOne của Ampere cũng đã sớm đi theo đường lối "nhân mật độ cao + ưu tiên hiệu suất". Ampere trong lộ trình AmpereOne Aurora công bố năm 2024, số nhân đã đạt 512.
Tức là, Xeon 6+ là việc Intel đang đuổi theo một hướng đi công nghiệp đã tồn tại – Intel không phải người dẫn đầu, mà là người chơi quay trở lại hướng đi công nghiệp.
Thứ hai, Xeon 6+ là CPU đầu tiên cho trung tâm dữ liệu sử dụng tiến trình Intel 18A, việc này trong ngữ cảnh của chính Intel, có lẽ còn quan trọng hơn "288 nhân E-core".
Intel 18A là cược lớn nhất của Intel vài năm qua. Nó không chỉ gánh vác một CPU, mà còn là việc Intel Foundry, hoạt động kinh doanh gia công của Intel, có đứng vững được hay không. Nếu tiến trình 18A không thể cho thị trường một sản phẩm đủ mạnh, câu chuyện Intel Foundry sẽ không thể tiếp tục.
Xeon 6+ dùng tiến trình 18A làm ra, đẩy số nhân hiệu suất cao lên 288, công bố đối ngoại "mật độ hiệu năng dẫn đầu ngành", đây là một trong những bài kiểm tra Intel nộp cho thị trường. Nó có được thị trường công nhận hay không, có đứng vững được trong cuộc cạnh tranh cùng thế hệ với N2 của TSMC, 2nm của Samsung hay không, lại là một vấn đề khác.
Thứ ba, trong danh sách khách hàng của Xeon 6+ xuất hiện vài cái tên có ý nghĩa công nghiệp – Ericsson dùng Xeon 6+ để thử nghiệm mạng lõi 5G, T-Systems thuộc Deutsche Telekom dùng Xeon 6+ để xây dựng cơ sở hạ tầng AI agent riêng. Hai khách hàng này đều là bên mua sắm truyền thống ổn định của CPU trung tâm dữ liệu, sự lựa chọn mua sắm của họ tự thân đã là một tín hiệu thị trường.
Đặt ba việc này cùng nhau, Xeon 6+ đặt cược vào một con đường như thế này: dùng tiến trình 18A để giành lợi thế hiệu suất, dùng 288 E-core để giành mật độ nhân, đặt cược vào loại khối lượng công việc "mật độ cao, hiệu suất cao, thông lượng cao" trong kịch bản AI suy luận và agent.
Đây không phải câu chuyện CPU trở lại sân khấu chính của sức mạnh tính toán, mà là câu chuyện CPU tìm thấy một vị trí mới.
3. Việc này rốt cuộc có thành lập hay không
Câu chuyện "CPU trở lại" mà Intel kể, rốt cuộc có thành lập hay không? Cần xem xét vài biến số khác trong ngành.
Biến số thứ nhất là phản ứng của các hãng GPU.
NVIDIA trong hai năm qua cũng đang làm những việc liên quan đến "điều phối", tổ hợp Grace CPU + Hopper GPU, bản thân nó là việc NVIDIA đang bổ sung mắt xích CPU này. Nếu các hãng GPU tự biến tổng thể phương án "CPU + GPU" thành chủ lưu, thì vị trí của các hãng CPU với vai trò độc lập sẽ bị thu hẹp. Đây là đối thủ lớn nhất của câu chuyện "CPU là mặt phẳng điều khiển" mà Intel kể, không phải AMD, mà là chính bản thân NVIDIA.
Biến số thứ hai là CPU tự nghiên cứu của các nhà cung cấp đám mây.
AWS Graviton đã được triển khai quy mô hóa trong các trung tâm dữ liệu của chính AWS, đảm nhận một phần tương đối lớn khối lượng công việc tính toán thông dụng nội bộ AWS. Microsoft đang làm Cobalt, Google đang làm Axion, Alibaba đang làm Yitian, hầu như tất cả các nhà cung cấp đám mây chính đều đang tự nghiên cứu CPU máy chủ kiến trúc ARM.
Những CPU tự nghiên cứu này cũng đi theo đường lối "mật độ cao, ưu tiên hiệu suất" – về mặt định nghĩa sản phẩm là mối cạnh tranh trực tiếp với Xeon 6+.
Tức là, thị trường mà Xeon 6+ muốn giành lấy, các nhà cung cấp đám mây đang tự làm. Intel cần chứng minh: bên ngoài CPU tự nghiên cứu của các nhà cung cấp đám mây, vẫn có đủ thị trường. Ví dụ các nhà mạng viễn thông, đám mây riêng, trung tâm dữ liệu ngành dọc.
Biến số thứ ba là bản thân tiến trình 18A.
Xeon 6+ là CPU đầu tiên cho trung tâm dữ liệu sử dụng Intel 18A, bản thân điều này có nghĩa con chip này gánh vác ý nghĩa công nghiệp vượt xa bản thân sản phẩm. Nếu tiến trình 18A gặp vấn đề về tỷ lệ sản xuất hàng loạt (yield), ổn định hiệu năng, xác minh khách hàng, thì biểu hiện thị trường của Xeon 6+ sẽ bị kéo tụt. Ngược lại, nếu 18A biểu hiện ổn định, Xeon 6+ ngược lại có thể mang lại một chút khoảng trống thở cho Intel Foundry.
Nhưng 18A không chạy trong chân không – tiến trình N2 của TSMC bắt đầu sản xuất hàng loạt vào nửa cuối năm 2026, 2nm của Samsung cũng đang trên đường. Intel 18A muốn giành lấy không chỉ là "làm ra", mà là "sau khi làm ra vẫn còn dẫn đầu", đây là một tiêu chuẩn cao hơn.
Đặt ba biến số này cùng nhau, chất lượng cuối cùng của Xeon 6+, không chỉ phụ thuộc vào bản thân nó, mà còn phụ thuộc vào việc NVIDIA có tự nuốt mất vai trò CPU hay không, các nhà cung cấp đám mây có tiếp tục tự nghiên cứu CPU hay không, Intel 18A có đứng vững được trong cuộc cạnh tranh cùng thế hệ với TSMC, Samsung hay không.
Đây là lý do tại sao việc "CPU trở lại" này, từ góc độ nhận định cấp độ ngành là thành lập, nhưng từ góc độ bản thân Intel có nhận được miếng bánh lợi ích của làn sóng trở lại này hay không, vẫn là một ẩn số.
Cuộc chiến về vị trí của CPU trên sân khấu sức mạnh tính toán AI, đã kéo dài ba năm.
Kịch bản ba năm qua là "GPU là trung tâm, CPU là hỗ trợ". Kịch bản này đến năm 2026 bắt đầu lung lay – không phải CPU một lần nữa nhanh hơn GPU, mà là bản thân sức mạnh tính toán AI đang thay đổi. Khi AI từ "đào tạo một mô hình" mở rộng thành "vận hành hàng nghìn hàng vạn agent", thì việc điều phối, xử lý đồng thời, luồng dữ liệu một lần nữa trở thành nút thắt hệ thống, CPU ở vị trí này trở nên không thể thay thế.
Intel đặt cược vào việc này, Xeon 6+ là bài kiểm tra nó nộp. Nhưng việc này có thành lập hay không, bản thân Intel có nhận được miếng bánh lợi ích này hay không, cuối cùng phải được trả lời trong các phòng máy chủ khách hàng vào năm 2027, 2028. AMD, phe ARM, CPU tự nghiên cứu của các nhà cung cấp đám mây, NVIDIA tự làm CPU, mỗi biến số đều có thể thay đổi hướng đi của kịch bản.
Sự trở lại của CPU là thật, nhưng ai sẽ dẫn dắt sự trở lại này, vẫn chưa định.






