Token Inefficient, Economy Tokenless

marsbitXuất bản vào 2026-06-05Cập nhật gần nhất vào 2026-06-05

Tóm tắt

The article "Tokens Aren't Economical, Economics Aren't Tokenized" analyzes a pivotal shift in the AI industry from a technology-driven narrative to one dominated by capital efficiency. It highlights two concurrent trends: a severe capital shortage due to the exorbitant and recurring costs of compute (e.g., OpenAI's high burn rate) and a wave of corporate spin-offs where major tech companies are separating their AI units (like Kuaishou's Kling and Baidu's Kunlunxin). The core argument is that AI's "anti-internet" business model, where user growth increases costs rather than profits, has created a disconnect between high valuations and actual cash flow. Spin-offs address this by allowing AI assets to be valued independently. Within a parent company, they are seen as cost centers, but as standalone entities, they are priced based on their growth potential and scarcity in the primary market, leading to massive valuation premiums (e.g., Kling's estimated value tripling post-spin-off). The industry is at an inflection point, moving from "model worship" to "value realization." The competition is evolving from a pure compute (GPU) race to a broader focus on systemic efficiency and full-stack engineering (involving CPUs and orchestration) to achieve viable commercialization. The year 2026 is framed as a critical moment where the industry must definitively answer how to economically translate AI capability into tangible business value, reshaping the sector's future power structure.

Recently, OpenAI's IPO plans have thrust the lab, long operating under a 'capped-profit' structure, into the spotlight of the public market. Meanwhile, Alphabet, Google's parent company, launched an $80 billion financing plan, with Berkshire Hathaway alone subscribing to $10 billion.

The conservative investment giant's first foray into tech stocks signals that the AI capital game has reached a new peak. Only now can we say that the AI industry is undergoing a profound paradigm shift.

The most direct manifestation is that "shortage of capital" and "spin-offs" have become the two dominant narratives for current AI companies.

The reason for the former is unsurprising: computing power is a heavy asset. Google's capital expenditure for 2026 is projected to be as high as $180 to $190 billion, with Microsoft, Meta, and Amazon also investing hundreds of billions. An H100 chip, a transformer for a data center, a grid connection – each step requires real money.

The latter has become a major strategic move for large domestic companies recently. Kuaishou's Kling AI had an internal valuation of around $6 billion within the group. After spinning off independently, its pre-money valuation skyrocketed to $18 billion, a threefold increase. Baidu's Kunlunxin was spun off for a separate listing, with external estimates suggesting it could contribute nearly $30 billion in incremental market cap to Baidu, equivalent to over 60% of its current total market value.

This phenomenon reflects the capital market's redefinition of AI assets. Within a conglomerate's consolidated financials, the AI business is seen as a profit-consuming investment. Once independent, it's priced based on the scarcity of the sector, revenue growth rate, and future potential, where price-to-sales ratios of several dozen times are not uncommon.

These two threads, seemingly independent, actually point to the same core: AI is transitioning from a technology-narrative-driven landscape to a new competitive environment dominated by capital efficiency.

The End of the Computing Power Race: The Breakdown and Reconfiguration of Financing Logic

Behind the "capital shortage" lies a fundamental logical chain. Today's large language model competition is essentially no longer a product competition but a heavy-asset race of computing power scale. OpenAI has committed to about $600 billion in future expenditure for computing power expansion. Even after completing a $122 billion financing round, this capital is expected to be depleted within three years.

More directly, OpenAI's CFO, John F. Ray, previously disclosed that while annualized revenue for 2025 has exceeded $20 billion, it's still insufficient to cover massive losses. The company incurs about $1.22 in losses for every $1 of revenue it generates.

The crux of the problem is that the cost curve of the AI business is fundamentally different from that of the traditional internet.

Adding one more user to WeChat brings marginal costs close to zero. But the more popular ChatGPT is, the more calls are made, and the higher the inference costs. User growth becomes pure benefit but also a cost pressure. This "anti-internet" business model means that economies of scale not only fail to bring profits but actually amplify cash flow pressure – user growth no longer directly equates to value growth.

Deeper still is the phenomenon of "circular accounting" in the AI era: Microsoft's $13 billion investment in OpenAI was not delivered in cash but in the form of "cloud credits." OpenAI uses these credits to train models, while Microsoft books them as new cloud revenue.

This closed-loop operation of "using investment to buy cloud services" appears on the surface as healthy revenue growth but is essentially paying oneself with one's own money and then classifying it as sales revenue. Estimates suggest OpenAI's annual cloud service bill has ballooned to over $60 billion, more than double its actual revenue of $25 billion.

This is the essential contradiction of the "capital shortage": the disconnect between valuation bubbles and actual cash flow. When investors start caring about "free cash flow" rather than "paper profits," the valuation system previously propped up by mutual investment promises and circular orders faces the risk of valuation deflation.

OpenAI plans for a $14 billion loss in 2026, expecting profitability only by 2029. Google's projected $180-$190 billion capital expenditure for 2026 indicates that the current AI "capital shortage" is not a cyclical liquidity issue but a dilemma of the entire business model at the capital structure level.

Why Is One Financial Statement Worth Three Times More?

One of the most noteworthy signals for 2026 is the concentrated spin-off of core AI assets by major tech companies.

Kuaishou's AI video product, Kling, plans a Pre-IPO round with a valuation of $20 billion, close to 70% of Kuaishou's parent company market cap. Concurrently, Baidu is pushing its AI chip company, Kunlunxin, towards a dual listing on A-share and Hong Kong markets, with 2025 revenue expected to exceed 3.5 billion RMB and achieve breakeven. Alibaba is reportedly planning to spin off Pingtouge, and ByteDance's Doubao could follow the same path at any time.

Think about it: before the spin-off, Morgan Stanley valued Kling at only around $6 billion. After the spin-off, targeting a $20 billion financing, the same assets, same revenue, same team – just by changing the financial statement – the valuation instantly differed by over three times.

The change in valuation logic here reveals a structural divide at the mechanism level: the primary market is different from the secondary market. Its game rules follow the unconventional pricing mechanism of "consensus determines value." The primary market looks at the future, sector positioning, imagination, and whether there will be buyers in the next round, but pays little attention to current profits and revenue.

The core logic for Kling's $20 billion valuation lies in the scarcity of such top-tier assets. After Sora's closure, the number of leading players in the AI video generation sector can be counted on one hand. The label of "AI infrastructure for the content industry" itself commands a premium.

So, what qualifies as a top-tier asset currently? In the current AI landscape, it's companies that possess self-developed foundation models (whether language, video, or multimodal), not wrapper or fine-tuning models; have proven at least one vertical scenario with large-scale users or revenue (not a demo, not proof-of-concept); and have "takeover expectations" for subsequent financing – either a strategic buyer (major tech company) or an IPO channel (US, Hong Kong, or A-share markets).

Companies meeting these three criteria globally can be counted on two hands: OpenAI, Anthropic, xAI, Google DeepMind (if independent), China's Zhipu AI, Moonshot AI, MiniMax, ByteDance's Doubao (if independent), Kuaishou's Kling (in spin-off process), Baidu's Kunlunxin (chip side). Each is a scarce target, each in a state of "buyers queuing, sellers raising prices."

The underlying logic of this "revaluation" is the cognitive shift of AI assets within major tech companies from "cost centers" to "value centers."

Within a conglomerate, the AI business is treated as part of the group's operations. Inside a major company, AI business is typically categorized as "strategic investment," meaning its costs (computing power, R&D, data annotation) are co-mingled with the group's mature cash flow businesses (like ads, e-commerce, gaming). The group CFO looks at consolidated statements. As long as the AI business is burning cash, it's constantly asked to explain "when it will contribute net profit."

In this context, AI teams are forced into short-term ROI justifications, and the valuation logic is naturally suppressed under the shadow of the group's overall P/E multiple – mature internet companies typically only get 10-15x P/E. Even high-growth businesses only enjoy a 20% premium, not the 3-5x P/S ratio of an independent sector.

Once spun off independently, the independent financial statements can redefine the boundaries of "costs" and "revenue." For example, the computing power costs previously consumed internally by the group can now be repriced at market rates as "related-party transaction revenue"; model training previously booked as R&D expenses can now be capitalized as "intangible assets" and amortized over periods.

In other words, these assets gain the pricing model of a "growth enterprise." The spun-off AI company can proceed with financing and strategy more flexibly, avoiding the constraints of internal resource allocation within the group, and receive independent pricing in the capital market based on its own growth prospects.

Simultaneously, this involves a further differentiation of valuation systems. The growth potential and forward-looking valuation of existing businesses in major companies, now tagged with AI, are beginning to command new premiums in the secondary market.

This also explains why traditional internet giants (like Baidu at $47.5 billion, Kuaishou at $27 billion) are being caught up with or even surpassed by AI newcomers in absolute market cap terms – Zhipu AI's latest market cap translates to approximately $58.6 billion, already surpassing Baidu to become China's ninth-largest AI tech stock.

From "Model Worship" to "Value Realization": The Industry Narrative Has Structurally Shifted

Some professionals suggest that the rapid development of the current AI era is reminiscent of the previous mobile internet explosion. This analogy is accurate, but the key difference lies in the essential difference in cost structures.

The mobile internet explosion relied on smartphone proliferation and continuously declining bandwidth costs – marginal costs trended downward. The AI explosion faces hard constraints like rising computing power costs, surging electricity consumption, and long data center construction cycles.

One observation is that the current AI industry is in a state of "85-degree water temperature – about to boil but not yet boiling."

The direction of technological breakthroughs (agents, multimodal) is clear, computing infrastructure investment is unprecedented (large US hyperscale cloud companies' 2026 capital expenditure will reach $805 billion, nearly double predictions from a year ago). But true commercialization, monetization, and adoption scale are still at a critical point of about to begin.

Currently, only a small fraction of CFOs saw actual financial value from AI in 2025, and even fewer Chinese enterprises achieved revenue growth through AI. This tension of "high investment, low return" is precisely the growing pain signal of the industry shifting from hype to practical implementation.

Many may not have noticed that the weight in the AI value chain has shifted from the GPU side to the entire system side. The latest Morgan Stanley research points out, "Agent AI marks a structural shift from computing to orchestration." In agent workflows, CPU-side orchestration time can account for 50% to 90% of total latency, leading to projections of an incremental $32.5 to $60 billion CPU market space by 2030.

This means the industry's core contradiction is shifting from "insufficient computing power" to "insufficient system efficiency." Correspondingly, the investment logic will expand from a "single-chip computing power race" to "full-stack system engineering." GPUs determine "if it can be done," but CPUs and systems determine "if it can be profitable."

If the mobile internet explosion was driven by "connectivity" as the core, then the AI explosion will likely have "intelligence" at its core, and the breadth of its value chain will likely surpass that of mobile internet, covering the entire chain of computing power, models, applications, and data.

Some economists point out that 2026 is becoming the singularity year for AI's leap from "assisting thinking" to "autonomous execution." The core contradiction at this stage is shifting from "who can train the strongest model" to "who can be the first to transform AI capabilities into tangible commercial value and user benefits in the most economical way, fastest speed, and widest coverage."

"It's not just about redefinition, but also about revaluation." Everything happening in the AI industry in 2026 – giants short on capital, frenzied financing, corporate spin-offs, IPO clusters – is essentially the concentrated release of the same capital logic: when the path of "burning money for growth" reaches its end, the industry must answer a most fundamental question: How much is this technology really worth?

The answer to this question will determine the power structure of the AI industry for the next decade. And 2026 is precisely the moment when this game of capital and technology fully unfolds.

This article is from WeChat public account "New Eyes" (ID: xinmouls), author: Li Xiaodong.

Câu hỏi Liên quan

QAccording to the article, what is the fundamental reason behind the 'lack of money' faced by AI companies like OpenAI?

AThe article states the fundamental reason is a structural flaw in the business model. Unlike traditional internet services with near-zero marginal costs, AI models like ChatGPT have costs that scale directly with usage and growth, creating negative cash flow. Furthermore, practices like 'circular accounting' (e.g., Microsoft investing 'cloud credits' which OpenAI spends, counting as Microsoft revenue) create valuation bubbles disconnected from actual cash flow, leaving companies reliant on continuous heavy investment.

QWhat valuation change occurred when Kuaishou's Kling AI was spun off, and what is the primary reason given for this dramatic increase?

AKuaishou's Kling AI was valued at around $6 billion within the parent company. Upon announcing its spin-off for independent financing, its pre-money valuation target jumped to approximately $20 billion, a more than three-fold increase. The primary reason is the shift in valuation logic. Within a conglomerate, AI is a cost center judged by its profit contribution. As an independent entity, it is valued as a scarce, high-growth asset based on its market potential, growth narrative, and scarcity, allowing for much higher price-to-sales multiples.

QThe article describes a shift in the core focus of the AI industry. What is this shift according to the analysis provided?

AThe analysis indicates a structural migration in the industry narrative from 'model supremacy' or 'model worship' to 'value realization.' The core contradiction is shifting from 'who can train the strongest model' to 'who can most efficiently, quickly, and broadly convert AI capabilities into tangible commercial value and user benefits.' The industry is moving from a technology narrative to a capital efficiency and business model-driven competitive landscape.

QWhat is the '85-degree water' analogy used in the article meant to describe about the current state of the AI industry?

AThe analogy of '85-degree water' is used to describe the current AI industry as being in a state of high tension and imminent change that has not yet fully materialized. It signifies that key directions like multi-modal AI and agents are clear, and massive infrastructure investment is underway. However, widespread commercial adoption and significant revenue generation are still at a critical tipping point, creating a phase of 'high investment, low return' before the industry fully 'boils over' into mainstream value creation.

QHow does the article contrast the cost structure of the AI boom with that of the mobile internet boom?

AThe article contrasts them as fundamentally opposite. The mobile internet boom was driven by falling marginal costs—smartphone普及 and decreasing bandwidth costs allowed user growth to scale profitably. In contrast, the AI boom faces rising marginal costs: compute (GPU) costs, soaring power consumption, and long data center construction cycles mean that more users and usage directly increase costs, challenging traditional scale economies.

Nội dung Liên quan

Near Tái Xuất Hiện Trên Sân Khấu AI: Chuyển Đổi Thành Blockchain Công Cộng Vì 'Khó Trả Lương', Agent và Quyền Riêng Tư Trở Thành Câu Chuyện Tăng Trưởng Mới

Tác giả: Jae, PANews Dù đã trải qua nhiều chu kỳ thị trường với các xu hướng khác nhau, từ blockchain hiệu suất cao, phân mảnh đến trừu tượng chuỗi và gần đây là AI Agent, Near luôn có mặt. Được đồng sáng lập bởi Illia Polosukhin, một trong những tác giả của kiến trúc AI Transformer nổi tiếng, Near có nền tảng kỹ thuật vững chắc. Điều ít người biết là Near ban đầu là một công ty khởi nghiệp AI, tập trung vào "tổng hợp chương trình" (dạy máy viết code). Tuy nhiên, họ gặp khó khăn trong việc trả lương xuyên biên giới cho các nhà phát triển toàn cầu do hạn chế của hệ thống thanh toán truyền thống và phí gas cao, tốc độ chậm của các blockchain thời kỳ đầu. Điều này buộc họ tạm dừng giấc mơ AI và tự xây dựng một blockchain riêng - Near - vào năm 2018. Sau một thời gian phát triển công nghệ phân mảnh nhưng gặp khó khăn trong việc thu hút hệ sinh thái, Near tìm thấy cơ hội mới khi làn sóng AI bùng nổ. Danh tiếng của Polosukhin với tư cách là đồng tác giả Transformer được công nhận rộng rãi, đưa Near trở lại ánh đèn sân khấu với tư cách là một dự án có "dòng máu AI" chính thống. Near hiện tập trung vào hai hướng phát triển chính: Near Intents và giao dịch riêng tư (Confidential Transactions). **Near Intents** đơn giản hóa trải nghiệm giao dịch chuỗi chéo. Thay vì thực hiện nhiều thao tác thủ công trên các chuỗi khác nhau, người dùng chỉ cần nêu ý định (ví dụ: "đổi BTC lấy ETH"), và mạng lưới "trình giải quyết" (Solver) sẽ tự động tìm đường đi tối ưu. Cơ chế này đã xử lý hơn 200 tỷ USD khối lượng giao dịch tích lũy, tạo ra hơn 34 triệu USD phí giao dịch, với TVL đạt 85 triệu USD trên 25 blockchain. Tuy nhiên, nguy cơ tập trung hóa trong mạng lưới Solver là một rủi ro tiềm ẩn. **Giao dịch riêng tư** là lợi thế cạnh tranh khác. Tính năng "Hoán đổi Bảo mật" cho phép ẩn số lượng, hướng giao dịch trước khi thanh toán, bảo vệ người dùng khỏi MEV và trượt giá. Trong 30 ngày qua, giao dịch riêng tư chiếm tới 41,63% tổng khối lượng giao dịch trên Near (~87 triệu USD trong tổng số 209 triệu USD), phản ánh nhu cầu thị trường mạnh mẽ. Tuy nhiên, tỷ lệ cao này cũng có thể thu hút sự giám sát từ các cơ quan quản lý. Tóm lại, sau hành trình đầy biến động, Near đang định vị lại mình ở giao lộ của blockchain và AI, thông qua trừu tượng hóa chuỗi, cơ chế ý định và giao dịch riêng tư. Việc liệu những nỗ lực này có giúp Near xây dựng được hào rào cạnh tranh vững chắc hay không vẫn cần được theo dõi thêm.

marsbit2 giờ trước

Near Tái Xuất Hiện Trên Sân Khấu AI: Chuyển Đổi Thành Blockchain Công Cộng Vì 'Khó Trả Lương', Agent và Quyền Riêng Tư Trở Thành Câu Chuyện Tăng Trưởng Mới

marsbit2 giờ trước

Từ Ethereum đến "CROPS" của AI: Bộ "Biến số Chậm" mà Vitalik Liên Tục Nhấn Mạnh Rốt Cuộc Là Gì?

Bài viết này giải thích khái niệm CROPS, một thuật ngữ được Vitalik Buterin nhấn mạnh nhiều lần gần đây, liên quan đến định hướng phát triển cốt lõi của Ethereum và tương lai của trải nghiệm người dùng trong thời đại AI. CROPS là viết tắt của năm nguyên tắc: Kháng kiểm duyệt (Censorship Resistance), Kháng chiếm đoạt (Capture Resistance), Mã nguồn mở/Mở (Open Source/Openness), Quyền riêng tư (Privacy) và Bảo mật (Security). Đây không chỉ là giá trị cốt lõi của Ethereum mà còn là kim chỉ nam cho Quỹ Ethereum (EF) trong việc phân bổ nguồn lực vào các nhiệm vụ dài hạn, đảm bảo người dùng giữ được quyền kiểm soát tối thượng đối với tài sản và hành động số của họ. Bài viết chỉ ra rằng khi AI, đặc biệt là AI Agent, ngày càng đóng vai trò là "đại lý số" xử lý các tác vụ phức tạp (như giao dịch, quản lý tài sản), CROPS trở thành vấn đề sống còn. Một hệ thống AI tuân thủ CROPS cần chạy cục bộ (local) khi có thể, bảo vệ quyền riêng tư, minh bạch và trao cho người dùng quyền xác nhận cuối cùng, tránh biến thành một "hộp đen" tập trung. Giao điểm giữa "CROPS Ethereum Access Layer" và "CROPS AI" nằm ở việc giải quyết cùng một vấn đề: làm sao để người dùng truy cập các dịch vụ từ xa (như mô hình LLM hoặc dữ liệu blockchain) mà không phải hy sinh thông tin cá nhân, ý định hay quyền kiểm soát. Các giải pháp như gọi LLM từ xa thanh toán bằng ZK-proof hay đọc RPC Ethereum riêng tư là những ví dụ điển hình. Tóm lại, trong bối cảnh AI đang định hình lại tương tác kỹ thuật số, CROPS nổi lên như một khuôn khổ quan trọng đảm bảo rằng sự tiện lợi và quyền lực của công nghệ không đi kèm với cái giá phải trả là quyền tự chủ, bảo mật và quyền riêng tư của người dùng. Điều này sẽ định hướng cho sự phát triển của các lớp cơ sở hạ tầng, đặc biệt là ví tiền điện tử, trong tương lai.

marsbit2 giờ trước

Từ Ethereum đến "CROPS" của AI: Bộ "Biến số Chậm" mà Vitalik Liên Tục Nhấn Mạnh Rốt Cuộc Là Gì?

marsbit2 giờ trước

Lỗi Zcash Có Thể Đúc Vô Hạn ZEC Mà Không Bị Phát Hiện

Một lỗ hổng nghiêm trọng trong nhóm giao dịch được bảo vệ Orchard của Zcash có thể đã cho phép kẻ tấn công tạo ra lượng ZEC giả không giới hạn mà không bị phát hiện, theo tiết lộ mới từ Zooko Wilcox, Jason McGee và nhà nghiên cứu bảo mật Taylor Hornby. Lỗ hổng được phát hiện vào ngày 29 tháng 5, được khắc phục khẩn cấp trước ngày 2 tháng 6, và đã châm ngòi cho cuộc tranh luận về cách Zcash có thể chứng minh tính toàn vẹn nguồn cung trong một hệ thống bảo vệ quyền riêng tư. Lỗi nằm trong một quy tắc được viết thủ công trong mạch Orchard, khiến nó có thể chấp nhận thông tin sai nhưng vẫn cho phép giao dịch hợp lệ. Do tính chất bảo mật của Orchard, không có cách nào để chứng minh bằng mật mã liệu lỗ hổng có bị khai thác trước khi sửa chữa hay không, gây ra lo ngại về tính toàn vẹn nguồn cung. Để giải quyết, Shielded Labs đang xem xét đề xuất nâng cấp mạng để triển khai một nhóm bảo mật mới, nhằm cho phép bất kỳ ai cũng có thể xác minh nguồn cung ZEC. Họ cũng đang đẩy nhanh công việc xác minh chính thức mạch Orchard để ngăn chặn sự cố tương tự trong tương lai. Giá ZEC đã giảm gần 45% trong bối cảnh không chắc chắn này.

bitcoinist2 giờ trước

Lỗi Zcash Có Thể Đúc Vô Hạn ZEC Mà Không Bị Phát Hiện

bitcoinist2 giờ trước

Steve Hoffman, 'Cha đẻ đầu tư mạo hiểm' Thung lũng Silicon: Web3 + AI có thể là một cái bẫy

Ngày 28/5, công ty Anthropic đứng sau mô hình AI Claude đã huy động thành công 7,5 tỷ USD trong vòng tài trợ Series H, nâng định giá lên 96,5 tỷ USD, vượt mặt OpenAI. Trong bối cảnh các gã khổng lồ AI cạnh tranh khốc liệt về nền tảng tính toán, Steve Hoffman - nhà sáng lập Founder Space, được mệnh danh là "cha đỡ đầu" trong giới đầu tư mạo hiểm tại Thung lũng Silicon - đã có cuộc trò chuyện về tương lai của ngành. Hoffman nhận định, Thung lũng Silicon sẽ tiếp tục dẫn đầu trong nghiên cứu cơ bản về các mô hình lớn (foundation models), trong khi Trung Quốc sẽ chiến thắng trong việc triển khai ứng dụng và thương mại hóa, đặc biệt thống lĩnh lĩnh vực robot. Ông khuyến nghị các startup nên theo đuổi chiến lược "toàn cầu hóa ngay từ ngày đầu" (Global from Day 1) thay vì chỉ tập trung vào thị trường nội địa. Về tác động của AI, Hoffman dự đoán điểm bùng phát thực sự của các tác nhân tự trị (Autonomous Agents) - có khả năng phối hợp và xử lý các mục tiêu phức tạp - sẽ đến trong khoảng 2-4 năm tới, dẫn đến thay thế lao động trên quy mô lớn, bao gồm nhiều công việc tri thức. Giải pháp là thiết kế mô hình kinh doanh theo hướng "cộng tác người-máy" (Human-AI Collaboration) và cải cách chính sách về đào tạo lại, an sinh xã hội. Đối với các startup AI, Hoffman khuyên nên tập trung vào các lĩnh vực chuyên sâu, phức tạp, gắn với ngành cụ thể để tạo ra hàng rào phòng thủ trước các gã khổng lồ công nghệ. Tốc độ lặp lại sản phẩm nhanh chính là lợi thế cạnh tranh then chốt. Ông cũng chỉ ra cơ hội lớn trong lĩnh vực an ninh mạng và chống gian lận AI. Cuối cùng, Hoffman thẳng thắn bày tỏ quan điểm về "Web3 + AI". Ông cho rằng Web3 chủ yếu mang lại giá trị cho một nhóm người nhất định trong hệ sinh thái tiền mã hóa, nhưng không tạo ra tác động thực chất đối với thị trường đại chúng. Việc kết hợp Web3 với AI chủ yếu làm tăng thêm sự phức tạp và có thể là một cái bẫy đối với hầu hết các nhà sáng lập, thay vì một cơ hội. AI mới là công nghệ nền tảng phổ quát thực sự có khả năng chạm đến mọi ngành công nghiệp.

marsbit3 giờ trước

Steve Hoffman, 'Cha đẻ đầu tư mạo hiểm' Thung lũng Silicon: Web3 + AI có thể là một cái bẫy

marsbit3 giờ trước

Vượt qua "Bức tường Bộ nhớ": Cuộc Cách mạng ở Cấp độ Wafer và Lộ trình Tính toán trong Thời đại Suy luận AI

Năm 2026, chi phí đầu tư cho suy luận AI của các nhà cung cấp điện toán đám mây quy mô lớn lần đầu tiên vượt quá chi phí cho huấn luyện, đánh dấu bước chuyển từ "luyện mô hình lớn" sang "sử dụng mô hình lớn". Trong thời đại suy luận, điểm nghẽn chính chuyển sang "tường bộ nhớ" (memory wall), nơi chi phí và độ trễ di chuyển dữ liệu giữa GPU và DRAM (như HBM) vượt xa bản thân tính toán. Cerebras Systems, với kiến trúc động cơ quy mô wafer (WSE), đề xuất một giải pháp triệt để: thay vì cắt một tấm wafer thành nhiều chip nhỏ, họ sử dụng gần như toàn bộ wafer làm một chip khổng lồ duy nhất. Chip WSE-3 mới nhất cung cấp băng thông bộ nhớ trên chip cực cao nhờ 44GB SRAM, lên tới 21 PB/s, cao hơn 2625 lần so với GPU B200 của NVIDIA, giúp giảm đáng kể độ trễ trong suy luận mô hình lớn. Trong kiến trúc của Cerebras, trọng số mô hình được lưu trữ bên ngoài trên MemoryX và được truyền theo từng lớp đến chip khi cần, cho phép thông lượng token nhanh hơn từ 1.5 đến 5 lần so với B200 trong các mô hình khác nhau. Nó cũng có lợi thế lớn về hiệu suất năng lượng cho kết nối trên chip. Tuy nhiên, Cerebras phải đối mặt với những thách thức: lợi thế SRAM có thể chạm trần vật lý do giới hạn thu nhỏ theo tiến trình bán dẫn, yêu cầu hệ thống làm mát chuyên dụng, băng thông I/O ra bên ngoài thấp gây khó khăn cho mở rộng quy mô lớn, và hệ sinh thái phần mềm độc quyền. Các gã khổng lồ công nghệ đang theo đuổi nhiều con đường khác để giải quyết điểm nghẽn suy luận, bao gồm tự phát triển ASIC (như TPU, Maia), tận dụng công nghệ đóng gói tiên tiến phổ biến (như SoW của TSMC), và khám phá kết nối/quang học. Áp lực thương mại cũng rất lớn, khi Cerebras phải chuyển đổi thành nhà cung cấp dịch vụ đám mây và triển khai năng lực trung tâm dữ liệu khổng lồ theo các hợp đồng. Tóm lại, cuộc đua kiến trúc suy luận AI là về sự đánh đổi: Cerebras tối ưu hóa cực độ cho độ trễ thấp trên một wafer, trong khi NVIDIA duy trì tính linh hoạt và thông lượng cao thông qua kiến trúc cụm GPU. Tương lai của cả hai hướng đi vẫn chưa được định đoạt, phụ thuộc vào sự phát triển của tải công việc và công nghệ.

marsbit3 giờ trước

Vượt qua "Bức tường Bộ nhớ": Cuộc Cách mạng ở Cấp độ Wafer và Lộ trình Tính toán trong Thời đại Suy luận AI

marsbit3 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片