a16z: 5 Ways Blockchain Can Help AI Agent Infrastructure

marsbitXuất bản vào 2026-04-21Cập nhật gần nhất vào 2026-04-21

Tóm tắt

Blockchain technology provides critical infrastructure for AI agents by addressing five key challenges: 1) Non-human identity: AI agents lack standardized, portable identity systems. Blockchain enables verifiable, cross-platform agent identities (like "Know Your Agent" frameworks) through cryptographic credentials and on-chain registries. 2) AI governance: When AI systems execute decisions, blockchain ensures transparency and prevents centralized control by recording actions on-chain and enabling auditable execution logs. 3) Payments: Stablecoins and crypto payments (e.g., x402, MPP) serve as default settlement layers for agent-to-agent commerce, enabling frictionless, programmable transactions for "headless" AI-native businesses. 4) Trust and verification: As AI scales, blockchain provides cryptographic proof of origin and auditable histories, making verification—not intelligence—the scarce resource. 5) User control: Crypto-native tools (e.g., delegation toolkits, intent-based architectures) allow users to set boundaries and maintain oversight over autonomous agents, minimizing blind trust. Together, blockchain and AI can create an economic infrastructure built on transparency, accountability, and user sovereignty.

Author: a16z

Compiled by: Hu Tao, ChainCatcher

 

AI agents are rapidly transitioning from "co-pilots" to economic actors, even faster than the surrounding infrastructure can keep up.

While agents can now perform tasks and conduct transactions, they lack standardized methods to prove their identity, authority, and how they are compensated across environments. Identity information cannot be shared across platforms, payment methods are not programmable by default, and coordination efforts are conducted in isolation.

Blockchain addresses this problem at the infrastructure layer. Public ledgers provide a record for every transaction, auditable by anyone. Wallets provide users with portable identities. Stablecoins offer an alternative settlement method. These are not distant future technologies. They are available now and can enable permissionless operation as true economic entities.

 

1. Non-Human Identity

The current bottleneck in the agent economy is no longer intelligence, but identity.

In the financial services industry alone, the number of non-human identities (automated trading systems, risk engines, fraud models) already outnumbers human employees by about 100 to 1. With the large-scale deployment of modern agent frameworks (tool-using LLMs, autonomous workflows, multi-agent orchestration), this ratio is bound to rise across all industries.

Yet, these agents are effectively unbanked. They can interact with the financial system, but the manner of interaction lacks portability, verifiability, and is not trusted by default. They lack standardized ways to prove authority, operate independently across platforms, or be held accountable for their actions.

What is missing is a universal identity layer—an SSL equivalent for agents—to standardize coordination across platforms. There are significant attempts, but the approaches remain fragmented: on one side, vertically integrated, fiat-first stacks; on the other, crypto-native, open standards (like x402 and emerging agent identity proposals); and developer frameworks like MCP (Model Context Protocol) extensions trying to bridge identity at the application layer.

There is still no widely adopted, interoperable way for one agent to prove to another: who it represents, what it is allowed to do, and how it gets paid. This is the core idea of KYA (Know Your Agent).

Just as humans rely on credit history and KYC (Know Your Customer), agents need cryptographically signed credentials that bind the agent to its principal, permissions, constraints, and reputation. Blockchain provides a neutral coordination layer for all this: portable identities, programmable wallets, and verifiable proofs that can be parsed in chat apps, APIs, and marketplaces.

We are already seeing early implementations emerge: on-chain agent registries, wallet-native agents using USDC, ERC standards for "trust-minimized agents," and developer toolkits that combine identity with embedded payments and fraud controls.

But until a universal identity standard emerges, merchants will continue to block agents at the firewall.

 

2. Governance of AI-Operated Systems

Agents beginning to operate real systems raises new questions.

The key is who is truly in control. Imagine a community or company where AI systems coordinate critical resources, whether capital allocation or supply chain management. Even if people vote on policy changes, if the underlying AI layer is controlled by a single vendor who can push model updates, adjust constraints, or override decisions, that power is very weak. The formal governance layer might be decentralized, but the operational layer remains centralized; whoever controls the model ultimately controls the outcome.

When agents take on governance roles, they introduce a new layer of dependency. Theoretically, this could make direct democracy easier to implement: everyone could have an AI representative responsible for understanding complex proposals, weighing trade-offs, and voting based on their stated preferences.

But this vision only works if these agents are truly accountable to the people they represent, are通用 across service providers, and are technically constrained to follow human instructions. Otherwise, you end up with a system that looks democratic on the surface but is actually driven by opaque model behavior that no one really controls.

If the current reality is that agents are built from a small number of foundation models, then we need ways to prove that an agent acts in the user's interest, not the model company's. This might require cryptographic guarantees at multiple levels: (1) exactly which training data, fine-tuning process, or RL process a model instance originated from; (2) the exact prompts and instructions controlling a particular agent; (3) a record of the agent's actual behavior in the real world; and (4) reliable assurance that once deployed, the provider cannot change the instructions or retrain the agent to operate differently without the user's knowledge. Without these guarantees, agent governance ultimately devolves into governance by whoever controls the model weights.

This is where crypto comes in. If collective decisions are recorded on-chain and automatically executed, AI systems can be required to carry out verified outcomes. If agents have cryptographic identities and transparent execution logs, people can check whether their representatives followed the rules. And if the AI layer is user-owned and portable, not locked into a single platform, then no single company can change the rules via model updates.

Ultimately, the governance of AI systems is an infrastructure challenge, not a policy challenge. Real authority depends on building enforceable guarantees into the system itself.

 

3. Filling the Gaps in Traditional Payment Systems for AI-Native Businesses

AI agents are starting to buy things—web scraping, browser sessions, image generation—and stablecoins are becoming the alternative settlement layer for these transactions. Meanwhile, a new class of agent-oriented marketplaces is taking shape. For example, the MPP marketplace by Stripe and Tempo aggregates over 60 services specifically designed for AI agents. In its first week live, it processed over 34,000 transactions with fees as low as $0.003, and stablecoins were one of the default payment methods.

The difference is in how these services are accessed. There is no checkout page. The agent reads a schema, sends a request, pays, and receives the output in one exchange. They represent a new class of "headless" merchants: just a server, a set of endpoints, and a price per call. No front-end—neither a storefront nor a sales team.

The payment rails to enable this are live. Coinbase's x402 and MPP take different approaches, but both embed payment directly into the HTTP request. Visa is also extending the card rails in a similar direction, offering a CLI tool that lets developers spend from the terminal, with merchants receiving stablecoins instantly on the backend.

The data is still early. Filtering out non-organic activity like wash trading, x402 processes around $1.6 million in agent-driven payments per month, far below the $24 million recently reported by Bloomberg (citing x402.org data). But the surrounding infrastructure is expanding rapidly: Stripe, Cloudflare, Vercel, and Google have all integrated x402 into their platforms.

There is a huge opportunity in the developer tools space. The rise of Vibe Coding has expanded the population of software developers and thus the potential market for developer tools. Companies like Merit Systems are working on future-proof solutions, launching AgentCash, a CLI wallet and marketplace platform that connects to both the MPP and x402 protocols. These products allow agents to buy the data, tools, and functions they need using stablecoins from a single account. For example, an agent for a sales team can enrich lead information using data from Apollo, Google Maps, and Whitepages by calling an endpoint, without ever leaving the command line interface.

There are several reasons why this agent-to-agent commerce leans towards crypto payments (and emerging card-based solutions). One is underwriting. When a payment processor onboards a merchant, it takes on that merchant's risk. A headless merchant with no website or legal entity is difficult for traditional processors to underwrite. Another is that stablecoins are permissionlessly programmable on open networks: any developer can make an endpoint support payments without integrating a payment processor or signing a merchant agreement.

We've seen this pattern before. Every shift in business models催生 a new class of merchants that existing systems initially struggle to serve. The companies building this infrastructure aren't betting on the $1.6 million per month revenue, but on what it will be when agents become the default buyers.

 

4. Repricing Trust in the Agent Economy

For three hundred thousand years, human cognition has been the bottleneck to progress. Today, AI is pushing the marginal cost of execution towards zero. When a scarce resource becomes abundant, the constraints shift. When intelligence becomes cheap, what becomes expensive? Verification.

In the agent economy, the real limit to scale is our biological limitation—our ability to audit and evaluate<极好的span dir="auto" style="font-size: inherit; font-family: PingFang SC,Helvetica Neue,Helvetica,Arial,Hiragino Sans GB,Heiti SC,Microsoft YaHei,WenQuanYi Micro Hei,sans-serif;"> machine decisions. Agent throughput already far exceeds human supervision capacity. Because supervision is costly and failures take time to manifest, markets tend to under-invest in supervision. "Human-in-the-loop" is quickly becoming a practical impossibility.

But deploying unverified agents creates compounding risk. Systems will relentlessly optimize for "agentic" metrics while quietly drifting from human intent, creating a false illusion of productivity that masks the massive accrual of AI debt. To safely delegate the economy to machines, trust can no longer rely on manual audits—trust must be hard-coded into the architecture itself.

When anyone can generate content for free, what matters is verifiable provenance—knowing where something came from and whether it can be trusted. Blockchain, along with on-chain attestations and decentralized digital identity systems, changes the economic boundaries of safe deployment. AI is no longer treated as a black box, but with a clear, auditable history.

As more AI agents begin to transact with each other, settlement mechanisms and provenance systems become inextricably linked. Systems for moving money—like stablecoins and smart contracts—can also carry cryptographic receipts that record who did what and who is liable if things go wrong.

The human comparative advantage keeps moving up the stack: from spotting minor errors to setting strategic direction to being the backstop when things fail. The lasting advantage will belong to those who can cryptographically certify their outputs, insure them, and stand behind them when they fail.

Scaling without verification is a risk that compounds over time.

 

5. Preserving User Control

For decades, layers of abstraction have shifted how users interact with technology. Programming languages abstracted machine code. The command line was replaced by graphical user interfaces, which then evolved into mobile apps and APIs. Each shift hid more underlying complexity while keeping the user ultimately in control.

In the agent world, users specify outcomes, not actions, and the system determines how to achieve them. Agents abstract not just how tasks are done, but also who performs them. Users set initial parameters and then recede into the background, and the system runs on its own. The user's role shifts from interaction to oversight; the system defaults to "on" unless the user intervenes.

As users delegate more tasks to agents, new risks emerge: ambiguous inputs can lead agents to act on wrong assumptions without the user's knowledge; failures might not be reported, leaving no clear path for diagnosis; a single approval could trigger multi-step workflows that no one anticipated.

This is where crypto fits in. Crypto's core has always been about minimizing the need for blind trust. As users delegate more decision-making to software, agent systems make this problem more acute and raise the bar for rigor in system design—we need clearer boundaries, more transparency, and stronger guarantees about what these systems can and cannot do.

To meet this challenge, a new generation of crypto-native tools is emerging. For example, scoped delegation frameworks like MetaMask's Delegation Toolkit, Coinbase's AgentKit and agent wallets, and Merit Systems' AgentCash allow users to define at the smart contract level what actions an agent can and cannot perform. And intent-based architectures like NEAR Intents (with cumulative DEX volume exceeding $15 billion since Q4 2024) allow users to specify desired outcomes—like "bridge tokens and stake them"—without specifying the exact implementation.

***

AI makes scale cheap, but trust hard to come by. Crypto can rebuild trust at scale.

The internet infrastructure is being built where individuals can participate in the economy directly. The question now is whether it will be designed for maximum transparency, accountability, and user control, or whether it will be built on systems that were never meant for non-human actors.

Câu hỏi Liên quan

QAccording to the article, what is the current bottleneck in the agent economy, and how can blockchain help address it?

AThe current bottleneck in the agent economy is identity, not intelligence. AI agents lack a standardized, portable, and verifiable way to prove who they represent, what they are authorized to do, and how they should be paid across different platforms. Blockchain provides a neutral coordination layer for this by offering portable identities, programmable wallets, and verifiable credentials that can be cryptographically signed and audited across applications and markets, essentially enabling a 'Know Your Agent' (KYA) framework.

QHow does the article suggest blockchain can ensure that AI systems governing communities or companies are accountable to users, not the model providers?

AThe article argues that if the AI layer running a governance system is controlled by a single provider, that provider can ultimately control the outcomes through model updates. Blockchain can provide cryptographic guarantees by recording collective decisions on-chain for automatic execution, giving agents transparent and auditable execution logs, and ensuring the AI layer is user-owned and portable rather than locked to a single platform. This prevents any one company from changing the rules via a model update and makes agents accountable to the users they represent.

QWhy are stablecoins and crypto payments becoming a preferred settlement method for AI-native, 'headless' businesses, as described in the article?

AStablecoins and crypto payments are preferred for AI-native commerce because they are programmable on open networks without requiring permission. This allows any developer to add payment functionality to an endpoint without integrating a traditional payment processor or signing a merchant agreement. Furthermore, traditional processors find it difficult to underwrite the risk of 'headless' businesses that have no website or legal entity, making crypto's permissionless nature a key advantage for this new class of automated, agent-to-agent transactions.

QThe article states that 'as intelligence becomes cheap, verification becomes expensive.' What role does blockchain play in repricing trust in the agent economy?

ABlockchain reprices trust by shifting it from costly human verification to cryptographically verifiable architecture. It provides a system for on-chain attestations and decentralized identity, giving AI agents a clear, auditable history of their actions. Settlement mechanisms like stablecoins and smart contracts can carry cryptographic receipts that record who did what and who is liable if something goes wrong. This allows for trust to be hardcoded into the system itself, which is essential for scaling safely as human oversight becomes economically impractical.

QWhat is the core cryptographic principle that the article says is crucial for maintaining user control as more decisions are delegated to AI agents?

AThe core cryptographic principle is the minimization of blind trust. As users delegate more decision-making to AI agents, it becomes critical to have systems with clearly defined boundaries, greater transparency, and strong guarantees about what these systems can and cannot do. Crypto-native tools, such as scoped delegation frameworks and intent-based architectures, allow users to define the precise actions an agent is permitted to take at the specific outcomes it should achieve, all enforced at the smart contract level to maximize user control and minimize unforeseen risks.

Nội dung Liên quan

Near Tái Xuất Hiện Trên Sân Khấu AI: Chuyển Đổi Thành Blockchain Công Cộng Vì 'Khó Trả Lương', Agent và Quyền Riêng Tư Trở Thành Câu Chuyện Tăng Trưởng Mới

Tác giả: Jae, PANews Dù đã trải qua nhiều chu kỳ thị trường với các xu hướng khác nhau, từ blockchain hiệu suất cao, phân mảnh đến trừu tượng chuỗi và gần đây là AI Agent, Near luôn có mặt. Được đồng sáng lập bởi Illia Polosukhin, một trong những tác giả của kiến trúc AI Transformer nổi tiếng, Near có nền tảng kỹ thuật vững chắc. Điều ít người biết là Near ban đầu là một công ty khởi nghiệp AI, tập trung vào "tổng hợp chương trình" (dạy máy viết code). Tuy nhiên, họ gặp khó khăn trong việc trả lương xuyên biên giới cho các nhà phát triển toàn cầu do hạn chế của hệ thống thanh toán truyền thống và phí gas cao, tốc độ chậm của các blockchain thời kỳ đầu. Điều này buộc họ tạm dừng giấc mơ AI và tự xây dựng một blockchain riêng - Near - vào năm 2018. Sau một thời gian phát triển công nghệ phân mảnh nhưng gặp khó khăn trong việc thu hút hệ sinh thái, Near tìm thấy cơ hội mới khi làn sóng AI bùng nổ. Danh tiếng của Polosukhin với tư cách là đồng tác giả Transformer được công nhận rộng rãi, đưa Near trở lại ánh đèn sân khấu với tư cách là một dự án có "dòng máu AI" chính thống. Near hiện tập trung vào hai hướng phát triển chính: Near Intents và giao dịch riêng tư (Confidential Transactions). **Near Intents** đơn giản hóa trải nghiệm giao dịch chuỗi chéo. Thay vì thực hiện nhiều thao tác thủ công trên các chuỗi khác nhau, người dùng chỉ cần nêu ý định (ví dụ: "đổi BTC lấy ETH"), và mạng lưới "trình giải quyết" (Solver) sẽ tự động tìm đường đi tối ưu. Cơ chế này đã xử lý hơn 200 tỷ USD khối lượng giao dịch tích lũy, tạo ra hơn 34 triệu USD phí giao dịch, với TVL đạt 85 triệu USD trên 25 blockchain. Tuy nhiên, nguy cơ tập trung hóa trong mạng lưới Solver là một rủi ro tiềm ẩn. **Giao dịch riêng tư** là lợi thế cạnh tranh khác. Tính năng "Hoán đổi Bảo mật" cho phép ẩn số lượng, hướng giao dịch trước khi thanh toán, bảo vệ người dùng khỏi MEV và trượt giá. Trong 30 ngày qua, giao dịch riêng tư chiếm tới 41,63% tổng khối lượng giao dịch trên Near (~87 triệu USD trong tổng số 209 triệu USD), phản ánh nhu cầu thị trường mạnh mẽ. Tuy nhiên, tỷ lệ cao này cũng có thể thu hút sự giám sát từ các cơ quan quản lý. Tóm lại, sau hành trình đầy biến động, Near đang định vị lại mình ở giao lộ của blockchain và AI, thông qua trừu tượng hóa chuỗi, cơ chế ý định và giao dịch riêng tư. Việc liệu những nỗ lực này có giúp Near xây dựng được hào rào cạnh tranh vững chắc hay không vẫn cần được theo dõi thêm.

marsbit2 giờ trước

Near Tái Xuất Hiện Trên Sân Khấu AI: Chuyển Đổi Thành Blockchain Công Cộng Vì 'Khó Trả Lương', Agent và Quyền Riêng Tư Trở Thành Câu Chuyện Tăng Trưởng Mới

marsbit2 giờ trước

Từ Ethereum đến "CROPS" của AI: Bộ "Biến số Chậm" mà Vitalik Liên Tục Nhấn Mạnh Rốt Cuộc Là Gì?

Bài viết này giải thích khái niệm CROPS, một thuật ngữ được Vitalik Buterin nhấn mạnh nhiều lần gần đây, liên quan đến định hướng phát triển cốt lõi của Ethereum và tương lai của trải nghiệm người dùng trong thời đại AI. CROPS là viết tắt của năm nguyên tắc: Kháng kiểm duyệt (Censorship Resistance), Kháng chiếm đoạt (Capture Resistance), Mã nguồn mở/Mở (Open Source/Openness), Quyền riêng tư (Privacy) và Bảo mật (Security). Đây không chỉ là giá trị cốt lõi của Ethereum mà còn là kim chỉ nam cho Quỹ Ethereum (EF) trong việc phân bổ nguồn lực vào các nhiệm vụ dài hạn, đảm bảo người dùng giữ được quyền kiểm soát tối thượng đối với tài sản và hành động số của họ. Bài viết chỉ ra rằng khi AI, đặc biệt là AI Agent, ngày càng đóng vai trò là "đại lý số" xử lý các tác vụ phức tạp (như giao dịch, quản lý tài sản), CROPS trở thành vấn đề sống còn. Một hệ thống AI tuân thủ CROPS cần chạy cục bộ (local) khi có thể, bảo vệ quyền riêng tư, minh bạch và trao cho người dùng quyền xác nhận cuối cùng, tránh biến thành một "hộp đen" tập trung. Giao điểm giữa "CROPS Ethereum Access Layer" và "CROPS AI" nằm ở việc giải quyết cùng một vấn đề: làm sao để người dùng truy cập các dịch vụ từ xa (như mô hình LLM hoặc dữ liệu blockchain) mà không phải hy sinh thông tin cá nhân, ý định hay quyền kiểm soát. Các giải pháp như gọi LLM từ xa thanh toán bằng ZK-proof hay đọc RPC Ethereum riêng tư là những ví dụ điển hình. Tóm lại, trong bối cảnh AI đang định hình lại tương tác kỹ thuật số, CROPS nổi lên như một khuôn khổ quan trọng đảm bảo rằng sự tiện lợi và quyền lực của công nghệ không đi kèm với cái giá phải trả là quyền tự chủ, bảo mật và quyền riêng tư của người dùng. Điều này sẽ định hướng cho sự phát triển của các lớp cơ sở hạ tầng, đặc biệt là ví tiền điện tử, trong tương lai.

marsbit2 giờ trước

Từ Ethereum đến "CROPS" của AI: Bộ "Biến số Chậm" mà Vitalik Liên Tục Nhấn Mạnh Rốt Cuộc Là Gì?

marsbit2 giờ trước

Lỗi Zcash Có Thể Đúc Vô Hạn ZEC Mà Không Bị Phát Hiện

Một lỗ hổng nghiêm trọng trong nhóm giao dịch được bảo vệ Orchard của Zcash có thể đã cho phép kẻ tấn công tạo ra lượng ZEC giả không giới hạn mà không bị phát hiện, theo tiết lộ mới từ Zooko Wilcox, Jason McGee và nhà nghiên cứu bảo mật Taylor Hornby. Lỗ hổng được phát hiện vào ngày 29 tháng 5, được khắc phục khẩn cấp trước ngày 2 tháng 6, và đã châm ngòi cho cuộc tranh luận về cách Zcash có thể chứng minh tính toàn vẹn nguồn cung trong một hệ thống bảo vệ quyền riêng tư. Lỗi nằm trong một quy tắc được viết thủ công trong mạch Orchard, khiến nó có thể chấp nhận thông tin sai nhưng vẫn cho phép giao dịch hợp lệ. Do tính chất bảo mật của Orchard, không có cách nào để chứng minh bằng mật mã liệu lỗ hổng có bị khai thác trước khi sửa chữa hay không, gây ra lo ngại về tính toàn vẹn nguồn cung. Để giải quyết, Shielded Labs đang xem xét đề xuất nâng cấp mạng để triển khai một nhóm bảo mật mới, nhằm cho phép bất kỳ ai cũng có thể xác minh nguồn cung ZEC. Họ cũng đang đẩy nhanh công việc xác minh chính thức mạch Orchard để ngăn chặn sự cố tương tự trong tương lai. Giá ZEC đã giảm gần 45% trong bối cảnh không chắc chắn này.

bitcoinist2 giờ trước

Lỗi Zcash Có Thể Đúc Vô Hạn ZEC Mà Không Bị Phát Hiện

bitcoinist2 giờ trước

Steve Hoffman, 'Cha đẻ đầu tư mạo hiểm' Thung lũng Silicon: Web3 + AI có thể là một cái bẫy

Ngày 28/5, công ty Anthropic đứng sau mô hình AI Claude đã huy động thành công 7,5 tỷ USD trong vòng tài trợ Series H, nâng định giá lên 96,5 tỷ USD, vượt mặt OpenAI. Trong bối cảnh các gã khổng lồ AI cạnh tranh khốc liệt về nền tảng tính toán, Steve Hoffman - nhà sáng lập Founder Space, được mệnh danh là "cha đỡ đầu" trong giới đầu tư mạo hiểm tại Thung lũng Silicon - đã có cuộc trò chuyện về tương lai của ngành. Hoffman nhận định, Thung lũng Silicon sẽ tiếp tục dẫn đầu trong nghiên cứu cơ bản về các mô hình lớn (foundation models), trong khi Trung Quốc sẽ chiến thắng trong việc triển khai ứng dụng và thương mại hóa, đặc biệt thống lĩnh lĩnh vực robot. Ông khuyến nghị các startup nên theo đuổi chiến lược "toàn cầu hóa ngay từ ngày đầu" (Global from Day 1) thay vì chỉ tập trung vào thị trường nội địa. Về tác động của AI, Hoffman dự đoán điểm bùng phát thực sự của các tác nhân tự trị (Autonomous Agents) - có khả năng phối hợp và xử lý các mục tiêu phức tạp - sẽ đến trong khoảng 2-4 năm tới, dẫn đến thay thế lao động trên quy mô lớn, bao gồm nhiều công việc tri thức. Giải pháp là thiết kế mô hình kinh doanh theo hướng "cộng tác người-máy" (Human-AI Collaboration) và cải cách chính sách về đào tạo lại, an sinh xã hội. Đối với các startup AI, Hoffman khuyên nên tập trung vào các lĩnh vực chuyên sâu, phức tạp, gắn với ngành cụ thể để tạo ra hàng rào phòng thủ trước các gã khổng lồ công nghệ. Tốc độ lặp lại sản phẩm nhanh chính là lợi thế cạnh tranh then chốt. Ông cũng chỉ ra cơ hội lớn trong lĩnh vực an ninh mạng và chống gian lận AI. Cuối cùng, Hoffman thẳng thắn bày tỏ quan điểm về "Web3 + AI". Ông cho rằng Web3 chủ yếu mang lại giá trị cho một nhóm người nhất định trong hệ sinh thái tiền mã hóa, nhưng không tạo ra tác động thực chất đối với thị trường đại chúng. Việc kết hợp Web3 với AI chủ yếu làm tăng thêm sự phức tạp và có thể là một cái bẫy đối với hầu hết các nhà sáng lập, thay vì một cơ hội. AI mới là công nghệ nền tảng phổ quát thực sự có khả năng chạm đến mọi ngành công nghiệp.

marsbit3 giờ trước

Steve Hoffman, 'Cha đẻ đầu tư mạo hiểm' Thung lũng Silicon: Web3 + AI có thể là một cái bẫy

marsbit3 giờ trước

Vượt qua "Bức tường Bộ nhớ": Cuộc Cách mạng ở Cấp độ Wafer và Lộ trình Tính toán trong Thời đại Suy luận AI

Năm 2026, chi phí đầu tư cho suy luận AI của các nhà cung cấp điện toán đám mây quy mô lớn lần đầu tiên vượt quá chi phí cho huấn luyện, đánh dấu bước chuyển từ "luyện mô hình lớn" sang "sử dụng mô hình lớn". Trong thời đại suy luận, điểm nghẽn chính chuyển sang "tường bộ nhớ" (memory wall), nơi chi phí và độ trễ di chuyển dữ liệu giữa GPU và DRAM (như HBM) vượt xa bản thân tính toán. Cerebras Systems, với kiến trúc động cơ quy mô wafer (WSE), đề xuất một giải pháp triệt để: thay vì cắt một tấm wafer thành nhiều chip nhỏ, họ sử dụng gần như toàn bộ wafer làm một chip khổng lồ duy nhất. Chip WSE-3 mới nhất cung cấp băng thông bộ nhớ trên chip cực cao nhờ 44GB SRAM, lên tới 21 PB/s, cao hơn 2625 lần so với GPU B200 của NVIDIA, giúp giảm đáng kể độ trễ trong suy luận mô hình lớn. Trong kiến trúc của Cerebras, trọng số mô hình được lưu trữ bên ngoài trên MemoryX và được truyền theo từng lớp đến chip khi cần, cho phép thông lượng token nhanh hơn từ 1.5 đến 5 lần so với B200 trong các mô hình khác nhau. Nó cũng có lợi thế lớn về hiệu suất năng lượng cho kết nối trên chip. Tuy nhiên, Cerebras phải đối mặt với những thách thức: lợi thế SRAM có thể chạm trần vật lý do giới hạn thu nhỏ theo tiến trình bán dẫn, yêu cầu hệ thống làm mát chuyên dụng, băng thông I/O ra bên ngoài thấp gây khó khăn cho mở rộng quy mô lớn, và hệ sinh thái phần mềm độc quyền. Các gã khổng lồ công nghệ đang theo đuổi nhiều con đường khác để giải quyết điểm nghẽn suy luận, bao gồm tự phát triển ASIC (như TPU, Maia), tận dụng công nghệ đóng gói tiên tiến phổ biến (như SoW của TSMC), và khám phá kết nối/quang học. Áp lực thương mại cũng rất lớn, khi Cerebras phải chuyển đổi thành nhà cung cấp dịch vụ đám mây và triển khai năng lực trung tâm dữ liệu khổng lồ theo các hợp đồng. Tóm lại, cuộc đua kiến trúc suy luận AI là về sự đánh đổi: Cerebras tối ưu hóa cực độ cho độ trễ thấp trên một wafer, trong khi NVIDIA duy trì tính linh hoạt và thông lượng cao thông qua kiến trúc cụm GPU. Tương lai của cả hai hướng đi vẫn chưa được định đoạt, phụ thuộc vào sự phát triển của tải công việc và công nghệ.

marsbit3 giờ trước

Vượt qua "Bức tường Bộ nhớ": Cuộc Cách mạng ở Cấp độ Wafer và Lộ trình Tính toán trong Thời đại Suy luận AI

marsbit3 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片