Stop Staring at GPUs: CPUs Are Becoming the 'New Bottleneck' in the AI Era

marsbitXuất bản vào 2026-04-13Cập nhật gần nhất vào 2026-04-13

Tóm tắt

In the AI era, while GPUs have long been the focus for computational power, the narrative is shifting as CPUs are increasingly becoming the new bottleneck. By 2026, system performance is more dependent on execution and scheduling capabilities, with CPUs playing a critical role in enabling AI operations. A supply crisis is emerging, with server CPU prices rising about 30% in Q4 2025 due to high demand and production constraints, as GPU orders compete for limited semiconductor capacity. Companies like Google and Intel have deepened collaborations, and Elon Musk is investing in custom CPU solutions for his ventures, highlighting the strategic importance of CPU infrastructure. The shift is driven by the rise of agentic AI, where CPUs handle tasks such as multi-step reasoning, API calls, and data I/O, accounting for 50–90.6% of total latency in intelligent workloads. Expanding context windows in AI models further strain GPU memory, necessitating CPU offloading for key-value cache management. Major players are adopting varied strategies: Intel is strengthening its Xeon processor line and partnerships; AMD is benefiting from increased demand, with server CPU revenue surpassing 40%; and NVIDIA is designing CPUs like Grace to optimize GPU-CPU synergy through high-speed interconnects. The industry is witnessing a rebalancing of compute infrastructure, with CPUs gaining prominence as essential enablers of scalable AI agent systems. By 2030, the CPU market is projected to double to ...

In the years of AI's rapid advancement, the industry has been largely dominated by one logic: computing power determines the ceiling, and GPUs are the core of that computing power.

However, entering 2026, this logic is beginning to shift: model inference is no longer the sole bottleneck; system performance increasingly depends on execution and scheduling capabilities. GPUs remain important, but the key factor determining whether AI can 'run' is gradually shifting to the long-overlooked CPU.

On April 9th, US local time, Google and Intel reached a multi-year agreement to deploy Intel's 'Xeon processors' at scale in global AI data centers, precisely to break this bottleneck. Intel CEO Pat Gelsinger (Note: The original Chinese name 陈立武 is likely a misattribution; the current CEO is Pat Gelsinger) stated bluntly that AI runs on the entire system, and CPUs and IPUs are the key to performance, efficiency, and flexibility. In other words, the CPU, which has been treated as a 'supporting role' for the past two years, is now choking the 'neck' of AI scaling.

Intel CEO Pat Gelsinger stated on social media: Intel is deepening its collaboration with Google, expanding from traditional CPUs to AI infrastructure (such as IPUs), to jointly advance AI and cloud computing capabilities.

The CPU is no longer just a passive supporting component but is becoming one of the key variables in AI infrastructure.

01

A 'Silent' Supply Crisis

While everyone was watching GPU delivery cycles, the tension in the CPU market had already quietly peaked.

According to the latest reports from multiple IT distributors, in the fourth quarter of 2025, the average selling price of server CPUs increased by about 30%. Such an increase is very rare in the relatively mature CPU market.

AMD's Data Center Group head, Forrest Norrod, revealed that CPU demand growth over the past three quarters has been beyond imagination. Currently, AMD's delivery lead times have extended from the original eight weeks to over ten weeks, with some models even facing delays of up to six months.

This shortage is primarily caused by a 'secondary effect' triggering a resource crunch. Industry insiders indicate that due to the extreme tightness of TSMC's 3nm production lines, wafer capacity originally allocated for CPUs is constantly being squeezed out by more profitable GPU orders. This has led to an ironic situation: AI labs have enough GPUs but find they cannot buy enough top-tier CPUs on the market to 'drive' these graphics cards.

Among those caught in this wave of CPU buying frenzy is Elon Musk.

Intel CEO Pat Gelsinger confirmed on social platforms that Musk has commissioned Intel to design and manufacture custom chips for his 'Terafab' project in Texas. This massive project aims to provide a unified computing base for xAI, SpaceX, and Tesla.

Musk's trust in Intel is largely because Intel is trying to embed itself into every layer, from ground-based data centers to orbital computing in space.

For Intel, this is undoubtedly a shot in the arm. Some industry analysts predicted that AMD's revenue share in the server CPU market would surpass Intel's in 2026, but Intel's deep inertia and manufacturing capabilities within the x86 ecosystem remain chips that major customers like Musk cannot ignore.

This kind of deep cross-industry bundling is elevating the competition in the CPU market from a pure parameter contest to a game of ecosystem and supply chain stability.

02

Why Has the CPU Become the 'Bottleneck'?

The core reason the CPU has suddenly become a bottleneck is that the work it needs to handle has fundamentally changed in the age of agents.

In the traditional chatbot model, the CPU is primarily responsible for scheduling and data processing, while the GPU handles the core inference computation. Since compute-intensive tasks are concentrated on the GPU side, overall latency is usually dominated by the GPU, and the CPU rarely becomes a performance bottleneck.

But agent workloads are completely different. An agent needs to perform multi-step reasoning, call APIs, read and write databases, orchestrate complex business flows, and integrate intermediate results into a final output. Tasks like search, API calls, code execution, file I/O, and result orchestration mostly fall on the CPU and host system side. The GPU is responsible for token generation (i.e., 'thinking'), while the CPU is responsible for translating the 'thoughts' into actual actions.

A paper published by Georgia Tech scholars in November 2025, 'A CPU-Centric Perspective on Agentic AI,' quantified the latency distribution in agent workloads. The study found that the time consumed by tool processing on the CPU side accounts for 50% to 90.6% of the total latency. In some scenarios, the GPU is ready to process the next batch of tasks while the CPU is still waiting for tool calls to return.

Another key factor is the rapid expansion of context windows. In 2024, mainstream models mostly supported 128K to 200K tokens. Entering 2025, models like Gemini 2.5 Pro, GPT-4.1, and Llama 4 Maverick began supporting over 1 million tokens. The KV cache (Key-Value Cache, used to accelerate the Transformer model inference process) grows linearly with the number of tokens, reaching about 200GB at 1 million tokens, far exceeding the 80GB VRAM capacity of a single H100.

One solution to this problem is to offload part of the KV cache to CPU memory. This means the CPU must not only manage orchestration and tool calls but also help bear data that doesn't fit in VRAM. CPU memory capacity, memory bandwidth, and the interconnect speed between the CPU and GPU thus become critical to system performance.

Therefore, CPUs suited for the agent era require low latency, consistent memory access capabilities, and stronger system-level协同 capabilities, rather than单纯 core count expansion.

03

What Are the Vendors Doing? Some Grab Territory, Others Change Designs

Faced with this sudden surge in CPU demand, the major players have completely different strategies.

Intel is the traditional leader in server CPUs. Data from Mercury Research shows that in Q4 2025, Intel still held a 60% share of the server CPU market, AMD had 24.3%, and Nvidia had 6.2%. But Intel has been playing catch-up with new technologies in recent years; this CPU demand explosion is both an opportunity and a test for them.

Intel's current strategy is a two-pronged approach. On one hand, continue selling Xeon processors, deeply绑定 with hyperscale customers like Google; on the other hand, partner with SambaNova to launch a combined solution based on Xeon processors and their self-developed RDU accelerators,主打 the selling point of 'running agent inference without GPUs'. The roadmap for Xeon 6 Granite Rapids and the 18A process will be key tests of whether Intel can turn the tables.

AMD is one of the biggest beneficiaries of this CPU demand surge. In Q4 2025, AMD's Data Center revenue was $5.4 billion, a year-on-year increase of 39%. Fifth-gen EPYC Turin accounted for over half of server CPU revenue, and deployments of cloud instances running EPYC grew over 50% year-on-year. AMD's server CPU revenue share exceeded 40% for the first time.

AMD CEO Lisa Su directly attributed the growth to the development of 'agents'—agent workloads push tasks 'back' to traditional CPU tasks.

In February 2026, AMD also announced a potential deal with Meta worth over $100 billion to supply MI450 GPUs and Venice EPYC CPUs.

However, AMD still has room for improvement in system-level协同, lacking a mature high-speed CPU-GPU interconnect capability类似 NVLink C2C. As agent (Agent) systems place increasing demands on data interaction and协同 efficiency, the importance of this aspect is also gradually rising.

Nvidia's approach to CPU design is completely different from Intel's and AMD's.

The Nvidia Grace CPU has only 72 cores, while AMD EPYC and Intel Xeon typically have 128. Nvidia's AI Infrastructure VP, Dion Harris, explained: 'If you're a hyperscaler, you want to maximize the number of cores per CPU, which basically drives down the cost, the dollar-per-core cost. So it's a business model.'

In other words, in the AI computing体系, the CPU's role is no longer that of a general-purpose workhorse but rather a 'scheduling hub' serving the GPU. If the CPU can't keep up, the expensive GPUs are forced to wait, and overall efficiency drops.

Therefore, Nvidia prioritizes efficient协同 between the CPU and GPU in its design. For example, through the NVLink C2C interconnect, the bandwidth between the CPU and GPU is boosted to about 1.8TB/s, far higher than traditional PCIe, and the CPU can directly access GPU memory, greatly simplifying KV cache management.

Currently, Nvidia sells the Vera CPU as a standalone product. CoreWeave was the first customer. The deal with Meta is even more夸张; this is its first large-scale 'pure Grace deployment,' meaning CPUs deployed大规模 independently without GPUs paired.

Ben Bajarin, Principal Analyst at Creative Strategies, pointed out that in high-intensity system collaboration, the CPU's processing power must keep pace with the accelerator's iteration speed. If there is even a one percent delay in the data通道, the entire AI cluster's economic efficiency suffers significantly. This pursuit of极致 system efficiency is forcing all major players to re-evaluate CPU performance metrics.

Holger Mueller, VP and Principal Analyst at Constellation Research, stated that as AI workloads shift towards agent-driven architectures, the CPU's position is becoming more central. He noted: 'In the agent world, agents need to call APIs and various business applications, tasks most suitable for CPUs to complete.'

He added: 'Currently, there is no consensus on whether GPUs or CPUs are more suitable for handling inference tasks. GPUs have an advantage in model training, and custom ASICs like TPUs have their specialties. But one thing is clear: Google needs to adopt a hybrid processor architecture. Therefore, Google's choice to partner with Intel is reasonable.'

04

Conclusion: In the Agent Era, the Computing Power Balance is Swinging Back

In the latest industry observations, one data point deserves attention. In the massive $38 billion合作协议 between Amazon AWS and OpenAI, the official announcement also explicitly mentioned scaling 'tens of millions of CPUs'.

In recent years, the industry's focus has typically been on those 'hundreds of thousands of GPUs'. However, the fact that cutting-edge labs like OpenAI are proactively treating CPU scale as a key planning variable sends a clear signal: scaling agent workloads must be built upon a massive CPU infrastructure.

Bank of America predicts that by 2030, the global CPU market size could double from the current $27 billion to $60 billion. Almost all of this additional share will be driven by AI.

We are witnessing the expansion of a全新的 infrastructure: big tech is no longer just stacking GPUs but is simultaneously expanding an entire layer of 'CPU scheduling infrastructure' specifically to support the operation of AI agents.

The alliance between Intel and Google, as well as Musk's heavy investment in custom chips, all prove one fact: the winning point in the AI race is moving forward. When computing power is no longer scarce, whoever can solve the system-level 'bottleneck' first will have the last laugh in this trillion-dollar game.

*Special contributor Jin Lu also contributed to this article.

This article is from the WeChat public account 'Tencent Technology', author: Li Hailun, editor: Xu Qingyang

Câu hỏi Liên quan

QWhy is CPU becoming the new bottleneck in the AI era according to the article?

ACPU is becoming the bottleneck because AI workloads, especially in the agentic AI era, require extensive multi-step reasoning, API calls, database operations, and complex task orchestration. These tasks are primarily handled by the CPU, and studies show that CPU-side tool processing can account for 50% to 90.6% of total latency. Additionally, the expansion of context windows in models requires KV cache offloading to CPU memory, making CPU memory capacity, bandwidth, and interconnect speed critical.

QWhat significant partnership is mentioned in the article to address the CPU bottleneck?

AGoogle and Intel have entered into a multi-year agreement to deploy Intel's Xeon processors globally in AI data centers. This partnership aims to enhance system performance, efficiency, and flexibility by leveraging CPUs and IPUs (Infrastructure Processing Units) as key components in AI infrastructure.

QHow did the CPU market change in Q4 2025 as reported?

AIn Q4 2025, the average selling price of server CPUs increased by approximately 30%, which is rare in the mature CPU market. Delivery cycles extended, with AMD's wait times increasing from eight to over ten weeks, and some models facing delays of up to six months due to supply constraints and competition for wafer capacity from GPU production.

QWhat role does CPU play in agentic AI workloads compared to traditional AI models?

AIn traditional AI models, CPUs mainly handle scheduling and data processing while GPUs perform core inference tasks. In agentic AI, CPUs are responsible for executing multi-step reasoning, calling APIs, reading/writing databases, orchestrating complex workflows, and integrating results—tasks that constitute the majority of the latency. The GPU generates tokens ('thinking'), but the CPU turns those results into actionable outputs.

QHow are major companies like Intel, AMD, and NVIDIA adapting to the increased importance of CPUs in AI?

AIntel is deepening partnerships (e.g., with Google) and developing combinations like Xeon processors with accelerators. AMD is benefiting from increased demand, with its EPYC CPUs seeing significant growth and new large deals (e.g., with Meta). NVIDIA is designing CPUs like Grace with a focus on high-efficiency coordination with GPUs through technologies like NVLink C2C, prioritizing system-level synergy over core count.

Nội dung Liên quan

Zcash Chứng Kiến Sự Sụp Đổ Lịch Sử Khi Hàng Tỷ Đô La Biến Mất Khỏi Giá Trị Thị Trường

Thị trường tiền điện tử chấn động bởi sự sụp đổ mạnh mẽ của Zcash (ZEC), đồng tiền tập trung vào quyền riêng tư đã mất hơn một nửa giá trị chỉ trong 24 giờ. Sự sụt giảm đột ngột này xóa sổ khoảng 5 tỷ USD từ vốn hóa thị trường của nó. Nguyên nhân chính được cho là do lo ngại xung quanh một lỗ hổng bảo mật vừa được tiết lộ ảnh hưởng đến cơ sở hạ tầng riêng tư của mạng lưới. Lỗ hổng này, ẩn trong nhóm giao dịch riêng tư Orchard của Zcash từ tháng 5/2022, cho phép tạo ra ZEC giả mạo trong thử nghiệm. Mặc dù đã được vá vào ngày 2/6, thiết kế bảo mật của Zcash khiến không thể xác minh liệu có đồng ZEC giả nào đã được tạo ra trước đó hay không, dẫn đến sự hoang mang và bán tháo. Tình huống này làm nổi bật sự đánh đổi giữa tính riêng tư và minh bạch. Để khôi phục niềm tin, Shielded Labs đang xem xét một đề xuất nâng cấp mạng lưới cho phép xác minh tính toàn vẹn của tổng nguồn cung Zcash. Cộng đồng Zcash nhấn mạnh rằng việc phát hiện lỗ hổng là kết quả của quy trình nghiên cứu bảo mật đẳng cấp và chủ động, một dấu hiệu tích cực cho thấy mạng lưới liên tục được củng cố.

bitcoinist56 phút trước

Zcash Chứng Kiến Sự Sụp Đổ Lịch Sử Khi Hàng Tỷ Đô La Biến Mất Khỏi Giá Trị Thị Trường

bitcoinist56 phút trước

Câu chuyện về Bitcoin "Vàng Kỹ Thuật Số" có thất bại hay không?

**TÓM TẮT** Bài viết phân tích Bitcoin từ góc nhìn của Jason, tập trung vào ba vấn đề chính: bản chất của Bitcoin, nguyên nhân đợt giảm giá gần đây và triển vọng dài hạn. **1. Cách nhìn nhận tài sản Bitcoin:** Tác giả vẫn coi Bitcoin là một lớp tài sản mới, ưu việt hơn vàng về tính chất "vàng kỹ thuật số" nhờ: nguồn cung cố định (21 triệu BTC), khả năng chuyển giao vượt trội và tính minh bạch có thể kiểm chứng. Dù vẫn còn sớm (tỷ lệ thâm nhập toàn cầu ~3-4%) và biến động mạnh, quá trình hợp pháp hóa đang đẩy lùi các hoạt động phi chính thức. **2. Nguyên nhân đợt giảm giá 2025-2026:** Đợt giảm khoảng 50% từ đỉnh 12.6万美元 xuống dưới 6.1万美元 là một đợt bán theo chu kỳ có tính đồng thuận cao, phù hợp với mô hình lịch sử sau mỗi lần giảm một nửa phần thưởng. Sự kiện ETF Bitcoin năm 2024 đã mở đường cho dòng tiền tổ chức mua vào, đồng thời tạo cơ hội cho các nhà đầu tư sớm (có giá gốc rất thấp) chốt lời, dẫn đến một đợt "chuyển giao lịch sử" từ những người tin tưởng ban đầu sang các tổ chức đầu tư dài hạn. Một điểm đáng chú ý là biên độ các đợt sụt giảm trong lịch sử đang thu hẹp dần (từ 93% xuống còn ~50%), cho thấy tài sản đang trưởng thành và biến động giảm bớt. **3. Triển vọng dài hạn:** Về dài hạn, nếu tin vào luận điểm "vàng kỹ thuật số", giá trị Bitcoin nên được định giá theo vàng vật chất. Với vốn hóa hiện tại (~1.4 nghìn tỷ USD) chỉ bằng 7% vốn hóa vàng (~20 nghìn tỷ USD), tiềm năng tăng trưởng vẫn còn rất lớn nếu luận điểm này được hiện thực hóa một phần. Tuy nhiên, tác giả cảnh báo rủi ro thực sự không nằm ở bản thân Bitcoin (xác suất về 0 thấp hơn xác suất tăng trưởng), mà ở hai yếu tố: **cơ cấu danh mục đầu tư** (không all-in, vay mượn) và **độ hiểu biết sâu sắc về tài sản**. Chỉ khi hiểu rõ logic cốt lõi, nhà đầu tư mới có thể giữ vững lập trường qua các đợt biến động mạnh. Bài học từ Amazon (sụt 95% năm 2000 rồi tăng 42 lần) cho thấy điều quan trọng là "sống sót" được đến lúc tiềm năng được giải phóng. Câu hỏi cuối cùng được đặt ra: Liệu đợt giảm giá này chứng minh luận điểm "vàng kỹ thuật số" đã thất bại, hay chỉ đơn giản là quá trình chuyển giao chưa kết thúc? Câu trả lời phụ thuộc vào niềm tin nền tảng của mỗi người vào loại tài sản này.

marsbit1 giờ trước

Câu chuyện về Bitcoin "Vàng Kỹ Thuật Số" có thất bại hay không?

marsbit1 giờ trước

Chủ đề “Vàng kỹ thuật số” của BTC có thất bại không?

Tác giả, qua góc nhìn của Jason, phân tích về Bitcoin dưới ba khía cạnh chính: bản chất của tài sản Bitcoin, nguyên nhân đợt giảm giá gần đây và triển vọng dài hạn. **1. Bản chất của Bitcoin:** Tác giả coi Bitcoin là một loại tài sản mới, một phiên bản "vàng kỹ thuật số" ưu việt hơn nhờ tính chất: nguồn cung cố định (21 triệu), khả năng chuyển giao và kiểm toán vượt trội. Dù còn sớm với tỷ lệ thâm nhập toàn cầu khoảng 3-4% và biến động cao, Bitcoin đang dần được hợp thức hóa. **2. Nguyên nhân đợt giảm giá:** Đợt điều chỉnh từ đỉnh ~126k USD (10/2025) xuống ~61k USD (2/2026) được xem là một đợt bán theo chu kỳ 4 năm (sau sự kiện giảm một nửa phần thưởng) và là quá trình "chuyển giao lịch sử" từ các nhà đầu tư sớm sang các tổ chức dài hạn thông qua ETF. Đáng chú ý, mức độ sụt giảm qua các chu kỳ đang thu hẹp (từ 93% xuống ~50%), phản ánh sự trưởng thành của tài sản. **3. Triển vọng dài hạn:** Với vai trò "vàng kỹ thuật số", vốn hóa Bitcoin hiện chỉ bằng ~7% vốn hóa vàng vật chất. Nếu đạt 30-50% vốn hóa vàng, tiềm năng tăng trưởng vẫn rất lớn. Tuy nhiên, tác giả không đưa ra lời khuyên mua ngay và nhấn mạnh hai rủi ro thực sự: **cấu trúc danh mục đầu tư** (không nên all-in, dùng đòn bẩy hoặc tiền không nên dùng) và **độ hiểu biết về tài sản** - yếu tố then chốt để giữ vững tâm lý qua các đợt biến động mạnh. Câu hỏi then chốt là liệu bạn có thể "sống sót" để chứng kiến tiềm năng dài hạn, giống như cổ phiếu Amazon đã vượt qua đợt sụt giảm 95% năm 2000. Bài viết kết luận bằng một câu hỏi mở: Liệu việc vàng tăng 60% trong khi Bitcoin giảm 50% có nghĩa là câu chuyện "vàng kỹ thuật số" đã thất bại, hay đơn giản phản ánh quá trình chuyển giao chưa kết thúc và sự tiến hóa từ tài sản đầu cơ sang tài sản được định vị? Câu trả lời phụ thuộc vào niềm tin cốt lõi của mỗi người vào loại tài sản này.

链捕手1 giờ trước

Chủ đề “Vàng kỹ thuật số” của BTC có thất bại không?

链捕手1 giờ trước

Từ Mã đến Nhận Thức: Hướng Dẫn Nghìn Chữ về Sự Tiến Hóa của Bộ Não Robot

Từ nhiều thập kỷ trước, robot chủ yếu được điều khiển bằng mã lập trình truyền thống, với các lớp như cảm nhận, ước tính trạng thái, lập kế hoạch và điều khiển được xây dựng thủ công. Chúng hoạt động tốt trong môi trường được thiết kế trước nhưng thiếu khả năng tổng quát hóa. Sự xuất hiện của học sâu (deep learning) đã cách mạng hóa lớp cảm nhận, trong khi học tăng cường (reinforcement learning) và học bắt chước (imitation learning) bắt đầu cải thiện lớp điều khiển. Tuy nhiên, mỗi chính sách học được vẫn còn hẹp và thiếu linh hoạt. Sự bùng nổ của các mô hình ngôn ngữ lớn (LLM) như ChatGPT đã mang lại bước nhảy vọt: LLM đóng vai trò như một bộ lập kế hoạch thông minh, dịch chỉ dẫn ngôn ngữ tự nhiên thành chuỗi hành động để hệ thống robot (như ROS2) thực thi. Dù vậy, LLM vẫn chỉ nằm ở lớp lập kế hoạch. Bước tiến quan trọng tiếp theo là các Mô hình Thị giác-Ngôn ngữ-Hành động (VLA). Các mô hình như RT-2 của Google hay OpenVLA hợp nhất lý luận và hành động trong một mạng thần kinh duy nhất, nhận đầu vào là hình ảnh và lệnh, rồi trực tiếp xuất ra các chỉ thị chuyển động, giúp robot linh hoạt và có khả năng tổng quát hóa hơn. Kiến trúc tiên tiến nhất hiện nay cho robot hình người là "hệ thống kép" (System 1/System 2), lấy cảm hứng từ tâm lý học. System 2 (chậm) là một VLA lớn, xử lý cảnh quan và lý luận ở tần số thấp. System 1 (nhanh) là một mạng nhỏ, tốc độ cao, nhận ý định từ System 2 và xuất ra các lệnh chuyển động liên tục. Một số hệ thống còn có System 0 như một lớp phản xạ để giữ thăng bằng. Việc tính toán được chia sẻ: các vòng lặp điều khiển an toàn quan trọng chạy cục bộ trên bo mạch (ví dụ: NVIDIA Jetson) để đảm bảo độ trễ thấp và độ tin cậy, trong khi các tác vụ như giao diện hội thoại hay học tập nhóm có thể chạy trên đám mây. Các mô hình mã nguồn mở như OpenVLA, NVIDIA Isaac GR00T, và Physical Intelligence π0 đang thúc đẩy lĩnh vực này, cho phép các công ty khởi nghiệp tinh chỉnh chúng với dữ liệu riêng thay vì đào tạo từ đầu. Dù đã có tiến bộ lớn, robot VLA hiện tại vẫn có hạn chế: khó khăn trong phục hồi sau lỗi, hiệu quả mẫu thấp, khó khăn với nhiệm vụ dài hạn và thiếu "hiểu biết vật lý" thực sự. Để giải quyết những hạn chế này, lĩnh vực đang tập trung vào "Mô hình Thế giới" (World Model). Đây là các mạng thần kinh có thể dự đoán hệ quả của hành động dựa trên trạng thái hiện tại. Bằng cách mô phỏng nhiều tương lai khả thi trước khi hành động, robot có thể lập kế hoạch tốt hơn, phục hồi tốt hơn và cải thiện khả năng tổng quát hóa. Các kiến trúc chính gồm: mô hình khuếch tán pixel (Cosmos/Sora), Kiến trúc Dự đoán Nhúng Chung (JEPA của LeCun) và Mô hình Thế giới Hành động Tiềm ẩn (Genie/Dreamer). Tương lai, robot tiên tiến có thể kết hợp VLA với Mô hình Thế giới để lập kế hoạch và kiểm tra hành động trong mô phỏng trước khi thực thi, đồng thời tạo ra lượng dữ liệu tổng hợp khổng lồ cho đào tạo. Yếu tố then chốt hiện nay là dữ liệu, với việc điều khiển từ xa (teleoperation) là phương pháp thu thập chính. Mô phỏng (simulation) cũng đóng vai trò ngày càng quan trọng. Về kinh tế, chi phí phần cứng robot hình người đang giảm nhanh, mở ra thị trường rộng lớn hơn. Tuy nhiên, lĩnh vực này vẫn đang ở giai đoạn phát triển, tương tự "thời kỳ GPT-2" của AI vật lý, với tiềm năng to lớn nhưng cần thêm thời gian để trưởng thành hoàn toàn và triển khai một cách tự chủ, an toàn.

marsbit1 giờ trước

Từ Mã đến Nhận Thức: Hướng Dẫn Nghìn Chữ về Sự Tiến Hóa của Bộ Não Robot

marsbit1 giờ trước

Bong bóng AI đang vỡ

Thị trường đang biến động mạnh với nhiều ý kiến về "bong bóng AI". Mặc dù các chuyên gia như Ray Dalio cảnh báo mức độ bong bóng tương đối cao, nhưng những người như CEO NVIDIA, Jensen Huang, vẫn nhìn thấy cơ hội to lớn và nhu cầu về năng lực tính toán mới chỉ bắt đầu bùng nổ. Cả hai quan điểm đều có phần đúng. Bong bóng trong lĩnh vực AI là có thực, giống như bong bóng Internet năm 2000. Tuy nhiên, bong bóng công nghệ thường là cách thị trường phản ứng với một lực lượng sản xuất đột phá. Sau khi bong bóng vỡ, cơ sở hạ tầng vật chất và công nghệ cốt lõi được xây dựng sẽ trở thành nền tảng cho sự phát triển bùng nổ tiếp theo, như đã thấy với Internet. Hiện tại, đầu tư vào cơ sở hạ tầng AI (như GPU, hệ thống làm mát, điện) là rất lớn, trong khi doanh thu từ các công ty thuần AI còn hạn chế, cho thấy sự mất cân đối. Nhưng một yếu tố then chốt là chi phí suy luận AI (inference cost) đã giảm hơn 99.7% trong hai năm qua. Khi chi phí biên của "trí thông minh" tiến gần đến 0, nó mở khóa một lượng lớn nhu cầu và ứng dụng mới trong mọi ngành công nghiệp, từ phần mềm, y sinh đến sản xuất. Điều này tuân theo "Nghịch lý Jevons": hiệu quả tăng lên dẫn đến mức tiêu thụ tổng thể cao hơn. Thị trường hiện đang trong giai đoạn thanh lọc, nơi các công ty chỉ dựa vào khái niệm sẽ bị đào thải. Xu hướng sâu xa bao gồm: 1) Chuyển dịch giá trị từ chi đầu tư (CapEx) sang chi vận hành (OpEx), nơi các ứng dụng AI thực sự tạo ra lợi nhuận; 2) Các công ty cơ sở hạ tầng có thể tiêu hóa định giá cao thông qua tăng trưởng lợi nhuận mạnh mẽ; 3) AI đang được tích hợp sâu vào các ngành như tài chính, pháp lý, chăm sóc sức khỏe và sản xuất, nâng cao hiệu quả đáng kể. Tóm lại, trong khi bong bóng đầu tư có thể xì hơi và gây ra đợt sàng lọc, động lực cơ bản của AI với tư cách là một lực lượng sản xuất đột phá là không thể đảo ngược. Giống như Internet trước đây, tương lai sẽ là một kỷ nguyên mà hầu hết mọi ngành công nghiệp đều được chuyển đổi và trao quyền bởi AI.

链捕手2 giờ trước

Bong bóng AI đang vỡ

链捕手2 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

Làm thế nào để Mua ERA

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Caldera (ERA) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Caldera (ERA) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Caldera (ERA) của BạnSau khi mua Caldera (ERA), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Caldera (ERA)Giao dịch Caldera (ERA) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 523Xuất bản vào 2025.07.17Cập nhật vào 2026.06.02

Làm thế nào để Mua ERA

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của ERA (ERA) được trình bày dưới đây.

活动图片