Đừng chỉ chăm chú vào GPU, Intel tung ra đòn chí mạng, liệu có thể chấm dứt độc quyền điện toán của NVIDIA?

marsbit发布于2026-06-03更新于2026-06-03

文章摘要

Trong hai năm qua, GPU gần như là trung tâm duy nhất của phần cứng AI, đẩy giá cổ phiếu NVIDIA lên cao. Tuy nhiên, tại COMPUTEX 2026, Intel đưa ra nhận định khác: giai đoạn tiếp theo của AI không thể chỉ nhìn vào GPU, mà trọng tâm là **Agentic AI (Trí tuệ thể tác nhân)**. Agentic AI thay đổi hoàn toàn cách vận hành: thay vì hỏi-đáp từng lượt, nó hoạt động trong luồng công việc thực tế, liên tục "suy nghĩ, lập kế hoạch, hành động, phản ánh". Điều này biến suy luận AI thành một hệ thống ra quyết định tự chủ, làm thay đổi căn bản cách bố trí sức mạnh tính toán trong trung tâm dữ liệu. Tỷ lệ CPU/GPU có thể chuyển từ 1:8 (trong đào tạo mô hình) xuống 1:1 hoặc thậm chí cần nhiều CPU hơn để điều phối công việc phức tạp, vì mức tiêu thụ Token của một tác nhân có thể tăng gấp 1000 lần so với suy luận thông thường. Để đáp ứng nhu cầu này, Intel ra mắt bộ xử lý Xeon 6+ (sản xuất trên tiến trình 18A), với tối đa 288 lõi hiệu suất cao và bộ nhớ đệm 576MB, nhắm đến điện toán đám mây gốc và tải Agentic AI, cung cấp hiệu suất ổn định và tiết kiệm năng lượng hơn. Bên cạnh đó, Intel cùng các đối tác công bố kiến trúc suy luận tách rời hoàn toàn mới, nơi CPU Xeon 6 phụ trách điều phối, SambaNova SN40L RDU xử lý giải mã và GPU NVIDIA Blackwell đảm nhiệm làm đầy trước, nhằm tối đa hóa hiệu quả bằng cách chạy từng giai đoạn trên phần cứng phù hợp nhất. Ở phía thiết bị đầu cuối, Intel trình diễn máy chủ lai kết hợp bộ xử lý Core Ultra thế hệ thứ 3 (cho AI cục bộ) với máy chủ đám mây Xeon 6+, cho...

Hai năm qua, lõi phần cứng AI hầu như chỉ có một thứ: GPU.

Từ đào tạo mô hình lớn, đến cụm suy luận, cho đến điện toán từ thiết bị đến đám mây, cả ngành công nghiệp đều đang thảo luận xem ai có thể lấy được nhiều GPU hơn, ai có thể nhồi nhiều card tính toán hơn vào trung tâm dữ liệu. Có thể nói, toàn bộ ngành công nghiệp AI đang xoay quanh GPU, điều này cũng thúc đẩy giá cổ phiếu của NVIDIA liên tục lập kỷ lục mới.

Nhưng tại COMPUTEX 2026, Intel đã đưa ra một đánh giá khác: Giai đoạn tiếp theo của AI, không thể chỉ nhìn vào GPU. Cốt lõi của đánh giá này, chính là từ khóa mà Pat Gelsinger (Tạm hiểu: chú thích tiếng Việt thường gọi là Giám đốc điều hành) nhấn mạnh nhiều lần trong bài phát biểu chính: Agentic AI, tức là tác nhân thông minh mà chúng ta thường nói đến.

Nguồn ảnh: Intel

Tác nhân thông minh đang thay đổi hệ sinh thái tính toán

Sự khác biệt giữa tác nhân thông minh và AI truyền thống thực sự rất lớn, AI truyền thống sử dụng giống như một cỗ máy hỏi đáp theo lượt, trong khi tác nhân thông minh thì cần phải đi vào quy trình làm việc thực tế, chủ động hoàn thành vòng lặp "suy nghĩ, lập kế hoạch, hành động, phản ánh". Nói cách khác, nó cần học cách đọc dữ liệu, gọi công cụ, thực thi nhiệm vụ và kiểm tra kết quả, sau đó liên tục điều chỉnh bước tiếp theo dựa trên phản hồi.

Điều này có nghĩa là suy luận AI không còn chỉ là một "giao dịch một lần", mà đã trở thành một hệ thống tự quyết định và tự suy luận chạy liên tục, điều này cũng hoàn toàn thay đổi cách vận dụng điện toán. Vì vậy, quan điểm cốt lõi nhất của Intel lần này là: Agentic AI sẽ định hình lại tỷ lệ điện toán trong trung tâm dữ liệu.

Hiện tại, ở giai đoạn đào tạo mô hình tiên tiến, tỷ lệ CPU và GPU có thể gần bằng 1:8, GPU đảm nhận áp lực tính toán tuyệt đại đa số. Nhưng khi bước vào chế độ suy luận của tác nhân thông minh, CPU sẽ cần chịu trách nhiệm cho các công việc như sắp xếp nhiệm vụ, gọi công cụ, di chuyển dữ liệu và phối hợp hệ thống, lúc này tỷ lệ CPU và GPU sẽ dần tiến tới 1:1, thậm chí cần mật độ CPU cao hơn để phân giải nhiệm vụ một cách nhanh chóng.

Thực tế, khi một tác nhân thông minh không chỉ tạo ra một đoạn câu trả lời, mà cần liên tục gọi mô hình, công cụ và hệ thống bên ngoài, thì trạng thái làm việc của nó hoàn toàn khác với AI truyền thống. Intel đã đề cập đến một dữ liệu trong bài phát biểu: So với suy luận đơn luồng, lượng Token tiêu thụ của một tác nhân thông minh có thể tăng lên tối đa 1000 lần.

Nguồn ảnh: Intel

Nói cách khác, tác nhân thông minh mang lại không phải là sự tăng trưởng đơn thuần về lượng suy luận, mà là tải hệ thống phức tạp hơn, tần suất cao hơn và phân mảnh hơn. Nếu lại ném tất cả các tải này cho GPU giải quyết, thì vừa kém hiệu quả vừa đắt đỏ.

Và bộ xử lý Xeon 6+ mà Intel công bố lần này được chế tạo dựa trên quy trình 18A của Intel, trang bị tối đa 288 nhân hiệu suất cao, và đi kèm bộ nhớ đệm cấp 3 cao nhất 576MB, hướng đến nhu cầu tải như cloud-native, AgenticAI và mạng cường độ cao, có thể cung cấp hiệu suất năng lượng cao hơn và hiệu năng ổn định hơn.

Trong giải pháp mà Intel đưa ra, một giá làm mát bằng chất lỏng chiếm 32U không gian tính toán, có thể cung cấp 36864 lõi; công suất tiêu thụ của giá chỉ khoảng 100kW, đủ để triển khai các tác nhân thông minh mật độ cao. Mặc dù 100kW trông có vẻ đáng sợ, nhưng so với các giá máy chủ có hiệu năng tương đương trước đây, công suất tiêu thụ đã giảm mạnh.

Và bên cạnh Xeon 6+, còn có một thứ đáng chú ý hơn: việc Intel tái chia tách kiến trúc suy luận.

Trong bài phát biểu, Intel thông báo hợp tác với SambaNova, Vista Equity Partners, Cambium Capital và các đối tác khác, chính thức ra mắt giải pháp suy luận tách rời hoàn toàn mới. Giải pháp này chạy trên VectorCore Compute Agent Cloud, do bộ xử lý Intel Xeon 6 chịu trách nhiệm sắp xếp và thực thi, sau đó thông qua SambaNova SN40 RDU chịu trách nhiệm giải mã, và cuối cùng do GPU NVIDIA Blackwell chịu trách nhiệm điền sẵn.

Nguồn ảnh: Intel

Giải pháp mới này được thiết kế đặc biệt cho tải tác nhân thông minh. Khác với nhiều hệ thống AI trước đây có thói quen giao hầu hết công việc trong chuỗi suy luận cho GPU, trong hệ thống này, CPU, RDU, GPU sẽ mỗi bên đảm nhận một chức năng, lần lượt chịu trách nhiệm cho các khâu khác nhau như điều phối hệ thống, giải mã, điền sẵn, giúp mỗi giai đoạn suy luận chạy trên phần cứng phù hợp nhất, tối đa hóa hiệu quả.

Và sau khi giới thiệu xong Xeon 6+, bộ xử lý Core Ultra thế hệ thứ 3 được công bố cách đây không lâu cũng một lần nữa xuất hiện. Nó là một mắt xích khác trong hệ sinh thái AI của Intel - lõi AI phía thiết bị đầu cuối. Trong bài phát biểu, máy chủ hỗn hợp cục bộ mà Intel và Perplexity trình diễn, chính là được xây dựng dựa trên Core Ultra thế hệ 3 và máy chủ đám mây Xeon 6+.

Nguồn ảnh: Intel

Nó có thể phân bổ động tải công việc giữa cục bộ và đám mây dựa trên khả năng và đặc tính chức năng của thiết bị, từ đó giảm thêm sự phụ thuộc vào điện toán đám mây. Đây cũng là hình thức lý tưởng của AIPC trong tương lai: thông qua phân bổ hiệu năng động, vừa giảm chi phí Token, vừa đảm bảo tính tức thời của nhiệm vụ và tính riêng tư của dữ liệu được bảo vệ.

Ngoài PC, Intel còn tiếp tục mở rộng Core Ultra thế hệ thứ 3 sang lĩnh vực máy chơi game cầm tay và điện toán biên, bộ xử lý Arc G3 series mới được phát hành hướng đến thiết bị chơi game cầm tay, được tối ưu hóa dựa trên kiến trúc cùng thế hệ, sẽ ra mắt vào cuối tháng này (GPU tích hợp mà người dùng máy cầm tay mong đợi nhất sắp ra mắt).

Từ phổ thông đến tùy chỉnh, Intel cũng muốn trở nên "có mặt ở khắp mọi nơi"

Và ngoài bộ xử lý phổ thông, Intel lần này còn nhấn mạnh đến chip tùy chỉnh, đây cũng là lĩnh vực kinh doanh mà Pat Gelsinger đảm nhận vai trò CEO của Intel đã luôn thúc đẩy.

Intel cho rằng chip tùy chỉnh sẽ có thị trường rộng lớn trong tương lai, bởi vì khi AI đi vào các ngành công nghiệp khác nhau, khách hàng sẽ ngày càng không hài lòng với điện toán phổ thông, để theo đuổi hiệu quả và hiệu năng cao hơn, họ sẽ dần có xu hướng chọn chip tùy chỉnh để duy trì lợi thế cạnh tranh của mình.

Trong bài phát biểu, Intel đã đề cập, đang hợp tác với Google để ra mắt IPU, loại chip này rất quan trọng đối với nhà cung cấp dịch vụ đám mây để nâng cao hiệu năng cơ sở hạ tầng. Đồng thời, Intel cũng hợp tác với khách hàng viễn thông như Ericsson để cung cấp chip cơ sở hạ tầng không dây tiên tiến trên toàn cầu.

Đây thực chất là một chủ đề khác trong bài phát biểu của Pat Gelsinger: Intel không còn chỉ dựa vào một con chip phổ thông để chiến thắng thị trường, mà đóng gói chip, hệ thống, phần mềm và hợp tác ngành thành một bộ giải pháp toàn diện, và có thể tùy chỉnh tự do theo nhu cầu của các doanh nghiệp khác nhau, từ đó tối đa hóa lợi thế của Intel.

Nguồn ảnh: Intel

Theo đánh giá của Leikeji, Intel thực chất đang định nghĩa lại vị trí sinh thái của mình: trung tâm dữ liệu cần CPU chịu trách nhiệm sắp xếp tác nhân thông minh, hệ thống suy luận cần sự tách rời dị thể để giảm chi phí, PC cần xử lý AI cục bộ cho các vấn đề riêng tư và tuân thủ, biên và thực thể thông minh cần chip hiệu suất năng lượng cao, khách hàng ngành công nghiệp thì cần chip tùy chỉnh.

Bằng cách đáp ứng nhu cầu của doanh nghiệp ở các lĩnh vực khác nhau, các liên kết khác nhau, Intel sẽ trở nên "có mặt ở khắp mọi nơi" hơn cả NVIDIA.

Tất nhiên, áp lực trước mắt của Intel vẫn rất lớn, lợi thế của NVIDIA trong bộ tăng tốc AI và hệ sinh thái phần mềm vẫn rõ ràng, AMD cũng liên tục tấn công trong CPU máy chủ và chip AI. Để Intel có thể đi thông con đường này, cuối cùng vẫn phải xem tốc độ sản xuất hàng loạt của 18A và giải pháp cấp giá của Xeon 6+ có nhanh chóng triển khai được hay không, cũng như khách hàng có thực sự nhìn thấy lợi ích rõ rệt từ bộ giải pháp mới này hay không.

Nhưng ít nhất lần này, hướng đi của Intel rõ ràng hơn trước đây.

Có thể nói, khi AI bước vào thời đại tác nhân thông minh, cạnh tranh từ lâu đã không còn chỉ là so sánh hiệu năng đỉnh của một con chip đơn lẻ, mà liên quan đến tối ưu hóa hiệu quả phối hợp của toàn bộ hệ thống tính toán. GPU vẫn quan trọng, nhưng CPU, thiết bị biên, AI cục bộ và chip tùy chỉnh cũng sẽ trở nên then chốt một lần nữa.

Và điều Intel muốn nắm bắt, chính là cửa sổ thời gian phân công lại cơ sở hạ tầng AI này.

你可能也喜欢

历史底部信号再现？估值3亿的Messari以1000万贱卖

加密数据平台Messari曾估值3亿美元，近期以约1000万美元被竞争对手Blockworks收购，标志其八年创业历程结束。该公司衰落部分源于AI技术冲击——传统需耗时数周的研究报告如今可借AI工具快速生成，导致其核心业务价值锐减。 Messari的处境并非个例。2025年至2026年间，加密行业众多不发币、依赖产品服务营收的公司陷入困境：数据平台DappRadar、Parsec相继关停，CoinGecko寻求出售；媒体CoinDesk、Bankless大幅裁员或低价被购；链上数据公司Dune也进行了裁员。行业收缩浪潮明显。风险投资（VC）领域同样遇冷。加密基金数量减半，新基金募资额骤降至峰值期的12%，投资额在半年内暴跌超80%。资本与人才大量流向AI领域，连Multicoin Capital等知名加密基金创始人也转向AI。有投资人形容当前环境为“大灭绝”。然而，极端悲观信号集聚或暗示底部临近。比特币自高点跌近50%，恐慌贪婪指数长期处于“极度恐惧”区间；比特币长期持有者占比逼近80%，历史上类似情况常对应市场底部。VC交易活跃度回落至2020年水平，而当时正是新一轮牛市前夜。部分机构如Dragonfly Capital已逆势募资，Blockworks也正低价整合行业资产。历史显示，当多个底部信号共振后，往往孕育着下一轮周期起点。

marsbit15分钟前

marsbit15分钟前

谷歌TPU出货量，上修50%

近期，多家海外机构上调了谷歌TPU的出货预期，将2027年需求预测从1000万颗上修至1500万颗，增幅达50%。这一变化扭转了市场对算力硬件的保守看法，并带动整条配套产业链需求同步提升。谷歌TPU采用标准化全光互联架构，硬件配套关系固定。其中，NPO光引擎与TPU芯片按1:1匹配，光模块、OCS光交换、服务器电源、光纤及液冷等环节的需求均随芯片规模增长而确定增加。液冷成为核心受益方向。因新一代TPU功耗大幅提升，风冷已达物理极限，谷歌集群已全面转向液冷方案。预计2026年为放量元年，下半年开始大规模交付。同时，海外厂商面临技术迭代慢、产能不足的瓶颈，为国产液冷厂商让出替代窗口。凭借快速迭代和稳定交付能力，国内企业正切入谷歌供应链，行业迎来“业绩提速+格局洗牌”的双击行情。预计伴随TPU出货量从2027年的1500万颗增长至2028年的3000-3500万颗，专属液冷市场规模将从千亿级突破至3000亿级。光纤赛道逻辑亦被重塑。AI算力中心建设催生海量光纤需求，但光纤预制棒扩产周期长，导致供需缺口持续扩大。全球云厂商为锁定货源纷纷签订长期协议，使光纤价格与出货趋稳，摆脱周期性波动。国产光纤凭借产能与成本优势，预计2026年出口量将达2-3亿芯公里，占据全球AIDC需求的半壁江山。此外，1.6T光模块、OCS光交换、服务器电源等配套环节均将受益于TPU放量，需求持续扩容。投资重心正从芯片算力博弈转向基础设施配套的确定性增量，产业链未来两年业绩确定性进一步增强。

marsbit57分钟前

marsbit57分钟前

币圈故事退潮后，华尔街真正想要的是什么

币圈故事退潮后，华尔街正将传统金融的核心资产与业务系统性地迁移至区块链上，其目标并非投机或去中心化叙事，而是构建一套可控、生息且合规的链上金融基础设施。核心动向包括： 1. **资产代币化**：以贝莱德的BUIDL基金为例，它将短期美国国债等低风险资产代币化，提供链上即时结算与每日复投，成为链上金融的基石资产。过户代理机构Securitize即将上市，并与纽交所合作，旨在建立全天候的链上股票清算系统。 2. **波动率变现**：针对比特币等波动资产，贝莱德、高盛等机构推出备兑看涨期权ETF（如BITA），通过系统性卖出期权将波动转化为稳定的月度现金收益，将其包装为标准化的生息产品，以吸引传统大型资金。 3. **稳定币支付与清算**：稳定币正被定位为高效的支付与结算工具。Stripe支持商户用稳定币收款，万事达卡升级系统支持稳定币进行跨时区清算，连SWIFT也计划推出基于分布式账本的跨境清算方案，旨在释放被冻结的巨额结算准备金，提升效率。 4. **监管与合规驱动**：美国《GENIUS法案》等监管框架将合规稳定币明确定义为“支付工具”（禁止派息）并纳入强监管，使其成为美元金融体系的可编程延伸。总之，华尔街正利用区块链技术的可编程性与效率，在链上复制并优化国债、期权、清算网络等传统金融产品与服务，每一步都紧密依托美元信用与现有监管体系，旨在打造一个更高效且由其主导的新金融管道。

marsbit1小时前

marsbit1小时前

把自己绑上SpaceX战车，Cursor的600亿美元崛起之路

本文讲述了AI编程独角兽Cursor及其CEO Michael Truell的崛起。2019年，18岁的Truell在MIT展现出惊人编程天赋。他与同学创办Anysphere，并于2023年推出Cursor，旨在变革编程方式。到2025年底，Cursor用户达数百万，年收入突破10亿美元。然而，Cursor的增长揭示了AI应用公司的结构性困境：严重依赖外部AI模型供应商。Cursor早期高度依赖Anthropic的模型，但当Anthropic推出竞品Claude Code后，双方关系从合作转向竞争。Cursor为此宣布进入紧急状态，并加速自研模型Composer以降低依赖。公司内部存在争议，包括严苛的招聘流程，要求候选人参与多日甚至数周的无薪“工作试用”。同时，管理层长期担忧对单一模型供应商的过度依赖。为支撑自研模型所需的巨大算力，Cursor于2025年与Elon Musk的SpaceX达成战略合作。表面是算力与数据的互补，背后则是一项潜在的600亿美元收购安排。若交易完成，Cursor可能成为Musk AI生态的关键部分；若保持独立，则需证明自己能在巨头夹缝中成长为真正的“世代级公司”。目前，Cursor拥有700名员工，服务《财富》500强中60%的企业，收入持续高速增长。其故事的核心在于：它最终会成为定义未来的软件入口，还是AI算力战争中的一块拼图？

marsbit1小时前

marsbit1小时前

Kraken计划为美国专业交易者推出CFTC监管的永续期货

加密货币交易所Kraken计划通过其收购的衍生品交易所Bitnomial，为符合条件的美国专业交易者推出受美国商品期货交易委员会（CFTC）监管的永续期货合约。此举旨在为美国交易者提供一个受监管的国内渠道，以获取在海外加密货币市场中占据主导地位的衍生品。永续期货是全球加密货币交易中的重要产品，允许交易者在没有到期日的情况下持有多头或空头头寸，并通过资金费率机制使合约价格贴近现货市场。由于监管限制，美国交易者此前难以通过本土受监管平台获得此类产品。 Kraken计划将这款产品整合至其Kraken Pro平台，为交易者提供统一的现货、保证金和期货交易界面。该合约设计将包含连续定价、无到期日以及每八小时结算的资金费率。然而，该产品目前仅面向符合条件的美国专业交易者，并非对所有零售用户开放。此举若成功推行，可能吸引更多流动性，并推动其他竞争对手寻求类似的受监管途径，从而将永续期货进一步纳入美国受监管的市场基础设施。不过，产品的实际影响将取决于用户准入范围、流动性深度以及执行质量等因素。

bitcoinist11小时前