Why Are GPU Prices Spiraling Out of Control?

marsbitXuất bản vào 2026-04-06Cập nhật gần nhất vào 2026-04-06

Tóm tắt

GPU prices are surging due to a fundamental shift in market dynamics, driven by AI's transition from a tool to core infrastructure. Demand is exploding from multi-agent systems, AI-generated content, and coding tools like Claude Code, causing token consumption growth. This has led to a severe GPU shortage, with H100 one-year lease prices rising nearly 40% from late 2025 to early 2026. Supply is constrained further by component cost increases (e.g., DRAM, NAND) and extended delivery times for new clusters, many pre-booked into late 2026. The market is dominated by long-term contracts, with AI labs locking in capacity for 4-5 years. High ROI (5-10x) from AI tools makes demand relatively inelastic to price hikes. Neocloud providers now hold pricing power, and the divergence between physical scarcity and market expectations of future oversupply is reshaping valuation logic. Key factors to watch: GB300 cluster deployment pace, chip supply chain stability, and AI lab revenue growth.

Editor's Note: As AI transitions from a "tool" to a "workflow infrastructure," GPU rental prices are accelerating upwards, with supply continuously tightening.

From the nearly 40% price surge in H100 one-year contracts to computing power being locked in until the second half of 2026, and AI labs continuously securing supply through long-term contracts and renewal mechanisms, the operating logic of the GPU market has fundamentally changed: prices are no longer primarily determined by hardware costs but are shaped by token consumption, model capabilities, and production efficiency.

Changes on the demand side are particularly critical. New paradigms like multi-agent systems, native content generation, and AI programming tools are driving token usage into an exponential growth phase. The core conclusion of the report is also becoming clear: the return on investment (ROI) of AI tools has been validated, with 5–10x returns making it difficult for computing power prices to effectively constrain demand for a considerable period.

The resulting tension is increasingly evident: the real-world computing power market shows comprehensive shortages and shifting pricing power upwards, while the capital market remains stuck in the expectation of "eventual oversupply and commoditization." This misalignment between expectations and reality is reshaping the valuation logic of the AI infrastructure sector.

As computing power becomes a new factor of production, its pricing mechanism, supply structure, and capital returns are undergoing a deep restructuring.

The following is the original text:

Anthropic's Claude 4.6 Opus and Claude Code demand has surged significantly. Its Annual Recurring Revenue (ARR) leaped from $9 billion at the end of last year to over $25 billion currently in just one quarter, nearly tripling. Meanwhile, open-source models represented by GLM and Kimi K2.5 have also driven the rapid expansion of application scenarios related to open-source models. Continued financing by companies including Anthropic, OpenAI, and several Neolabs is also intensifying the demand for GPU resources.

This inflection point means demand has risen sharply in a short period, triggering a GPU buying frenzy among hyperscalers and emerging cloud service providers (Neoclouds).

This new demand is pushing prices higher along the entire supply chain, from DRAM and NAND storage to fiber optic cables, data center colocation, and infrastructure like gas turbines—almost all related products and services are experiencing price increases.

GPU rental prices have become the latest area among computing power-related products and services to experience supply tightness and price surges. The price of a one-year H100 GPU rental contract rose from a low of $1.70 per GPU per hour in October 2025 to $2.35 in March 2026, an increase of nearly 40%.

On-demand GPU rental capacity is almost completely sold out across all models—users who have secured on-demand instances are unwilling to release computing power back to the market even after price increases. In early 2026, finding GPU computing power was almost like trying to snag a ticket for the "last flight out": prices were high, and tickets were scarce. A more apt analogy might be "finding a channel to buy medicine."

At SemiAnalysis, we have long and deeply tracked various trends and key issues within the Neocloud and hyperscaler ecosystem, including GPU rental prices. This capability stems from our ongoing research and practice in projects like ClusterMAX, InferenceX, and AI Cloud Total Cost of Ownership (TCO).

Simultaneously, we invest significant effort in helping various AI labs connect with Neocloud service providers, search for GPU rental resources on the market, and continuously exchange insights on GPU rental price trends with almost all participants in the ecosystem.

Since 2023, we have established and maintained a GPU rental price index system for our clients, covering mainstream GPU models (such as H100, H200, B200, B300, GB200, GB300, MI300, MI325, MI355) across different lease terms, from on-demand and 1-month short-term leases to long-term contracts of up to 5 years. This index is built based on survey data from multiple Neocloud service providers and computing power buyers, cross-validated with actual transaction data and our participation in facilitating negotiations and deals.

Today, we are making the SemiAnalysis H100 One-Year GPU Rental Price Index publicly available, hoping to provide the industry with more data and insights. This index is updated monthly, and we will also continuously publish the latest trend interpretations and market observations via X and LinkedIn. As for the complete pricing data covering different lease structures and other mainstream GPU models, it is currently only available to institutional subscribers of our AI Cloud TCO model.

This report will focus on the latest trends in the GPU rental market, firsthand market observations, and key data, analyzing how we understand the overall market structure and providing a preliminary judgment on the future direction of rental prices.

GPU Rental Market Enters "Dynamic Pricing" Phase

Looking solely at the H100 one-year rental price curve is insufficient to fully capture the market's tightness—our actual experiences sourcing computing power on the front lines and feedback from market participants paint a more severe picture.

Current demand comes from multiple highly heterogeneous use cases, with almost no "one-size-fits-all" solution. For instance, on the inference side, large-scale Mixture-of-Experts (MoE) models are better suited to run on the latest large-scale systems like the GB300 NVL72; whereas on the training side, H100 still holds a cost-performance advantage, keeping demand for even relatively "older generation" GPUs high.

Clients are now even scrambling to pay $14 per GPU per hour for AWS p6-b200 spot instance prices; some leading Neocloud providers have stopped selling single nodes; renewal prices for some H100 contracts are identical to those signed two or three years ago; and some H100 contracts have been directly renewed until 2028, a lease term of 4 years. Finding even an 8-node (64 GPU) H100 or H200 cluster is not easy now—half the providers we asked were completely sold out, and most replied that no Hopper architecture GPUs would be released from expiring contracts anytime soon.

We've even heard that some computing power lessees have started subdividing and subletting the clusters they've rented, much like splitting apartments for short-term rentals during the Monaco Grand Prix. The emergence of so-called "Neocloud subletters" might not be a joke anymore.

Blackwell supply is also extremely tight. We understand that due to strong demand for open-weight models and the ongoing inference boom, the deployment and delivery cycle for new Blackwell clusters has now extended to June-July. Moreover, these upcoming clusters are mostly pre-booked. In fact, looking at the entire market, almost all new capacity scheduled to come online until August-September 2026 has already been reserved.

GPU Rental Prices: Making a Comeback

But how did the market get here? Just 6 months ago, most market observers were skeptical about the GPU's "terminal value" and普遍认为 GPU rental prices would inevitably decline over time. Back then, if a Neocloud or hyperscaler used a 6-year depreciation cycle for GPU computing assets in their financial models, they might even be criticized by financial analysts. Before discussing future trends, let's quickly review how things evolved to this point.

Before the second half of 2025, the mainstream expectation across the ecosystem was that with the large-scale deployment of Blackwell and its significantly lower cost per unit of compute, Hopper (i.e., H100 and H200) rental prices would noticeably fall. The opposite happened. By H2 2025, H100 demand not only didn't weaken but intensified in many scenarios. The rapid adoption of open-weight models and the continued acceleration of inference demand at that time were the earliest signals of this near-limitless wave of computing demand.

By January 2026, the computing power market reached its next inflection point: DRAM and NAND storage prices, after several quarters of rapid increases, began a near-"parabolic" surge. According to our storage models, LPDDR5 and DDR5 contract prices saw year-on-year increases approaching approximately 4x and 5x respectively in Q1 2026.

To mitigate margin risks from sharply rising component costs, OEMs began raising AI server prices, with increases significantly higher than the underlying component price hikes themselves. This complicated cluster capital expenditure decisions: higher server procurement costs compressed project expected returns, forcing some operators to slow deployment pace or even cancel projects outright. The result was that some potential new supply was delayed or shelved, further exacerbating the tightness in the rental market.

Amid this procurement chaos triggered by "AI server pricing getting out of control," GPU rental demand accelerated significantly, and the remaining computing power on the market was almost completely absorbed in January and February. By March, available capacity was nearly impossible to find for H100, H200, or B200 across any lease term. One-year rental prices broke through $2 per GPU per hour by the end of January and rose another 15%–20% from late January levels by mid-to-late February, with an expected further 15%–20% month-on-month increase by the end of March.

A key driver of demand earlier this year came from native media generation. Applications like Seedance and Nano Banana are driving users to generate and iterate images and videos at scale, significantly increasing token throughput. But a more critical and visible source of demand is the rise of multi-agent workloads—these systems execute multi-step processes, continuously iterating in high-concurrency environments, driving token consumption and computing demand in an "exponential" growth pattern.

This trend is particularly evident in the data related to Claude Code, which we have mentioned in several articles. Taking SemiAnalysis as an example, in just the past 7 days, the company internally consumed billions of tokens, at an average cost of about $5 per million tokens. But the resulting time savings, workflow expansion, and capability enhancements far exceeded the cost itself. Today, SemiAnalysis has embedded a suite of AI tools into multiple workflows, no longer limited to simple search and summarization but extending to data dashboards, automated scraping, large-scale data processing, and agent-based financial modeling.

We also track this explosive demand growth through metrics like Claude Commits Daily. At the current trend, we expect Claude Code to account for over 20% of all code commits by the end of 2026. It's fair to say that, in the time you haven't noticed, AI has begun "eating" the entire software development process. Institutional clients interested in accessing this dataset can contact our API team. A sneak peek: this commit volume is already significantly higher than when we first released it.

In our circle, almost everyone is a heavy user of Claude Code. But we also know this circle is deeply immersed in AI and semiconductors, essentially just "a small group on the front lines."

For many Fortune 500 companies and the broader public, Claude Code and the "agent world" are merely slightly novel fringe topics, occasionally appearing in Facebook feeds or NPR podcasts. They have hardly realized that a productivity wave and structural shock driven by agents is approaching.

As more participants from the real economy gradually realize the astonishing ROI offered by using AI tools and join this "computing power wave," token consumption will continue to see step-like increases. The debate about AI ROI is, in fact, settled—the value created by using AI tools often exceeds their cost by an order of magnitude. Against this backdrop, the continuous rightward shift of the token demand curve is forming a strong and (at this stage) relatively inelastic force pushing GPU rental prices higher.

Simply put, if the ROI from using AI tools can reach 5–10x, then GPU rental prices still have considerable room to rise before they truly start to suppress demand. We also cannot rule out the possibility that further increases in rental prices will continue to be passed upstream, pushing server and core component costs even higher.

SemiAnalysis H100 One-Year Rental Price Index Release

Today, we are making the SemiAnalysis H100 One-Year Rental Contract Price Index freely available to the public, aiming to enhance market awareness and transparency regarding GPU rental price trends.

This index is built based on monthly survey data from over 100 market participants (including Neocloud providers, computing power buyers, and sellers) to determine the representative range (25th to 75th percentile) of GPU rental prices. It is also cross-validated with actual transaction data, and we facilitate deals between buyers and sellers within our network, directly participating in some transactions to further calibrate price levels.

Since 2023, we have continuously tracked contract prices for GPUs including H100, H200, B200, B300, GB200, GB300 across lease terms from 3 months to 5 years; data for the AMD series (MI300, MI325, MI355) is also included.

Compared to existing GPU indices on the market, the SemiAnalysis H100 One-Year Contract Price Index has several key differences:

First, many GPU rental indices are based on spot/on-demand quotes or publicly listed prices, but in reality, the vast majority of GPU rental transactions are completed through long-term contracts, typically with terms of 6 months or more. These prices are often formed through bilateral negotiations and do not appear in any public database. Most large Neocloud providers prefer leases of at least 1 year, 2–3 years is more ideal, and 5-year large-scale offtake agreements are even better. The SemiAnalysis H100 One-Year Rental Index focuses precisely on this "contract market"—where the actual transaction volume is most concentrated. By clearly targeting a specific lease term, this index also makes it easier for users to understand the market segment it covers and compare it with their own observations.

Second, publicly disclosed prices do not represent actual transaction prices. Prices published by hyperscalers and Neoclouds provide more of a directional reference for trends rather than actual transaction levels. These prices often lag behind changes in the contract market, usually adjusting only after computing demand has already shifted. Especially in the on-demand market, prices are often set at relatively fixed levels, while actual supply-demand changes are reflected through utilization or occupancy rates, with adjustments made only when necessary. This market mechanism will be discussed further later in the article.

Third, while there are many indices capable of processing large-scale quote, price, and transaction data, offering advantages in trend analysis, our approach emphasizes direct interaction with market participants. Behind every quote, every transaction, there is specific context and decision logic. We aim to complement quantitative data with these qualitative insights and frontline observations to more fully还原 the true structure of the GPU rental market.

For institutional subscribers, we also provide complete term structure data covering almost the entire mainstream GPU rental market.

Alongside releasing the H100 One-Year Contract Price Index, we have also launched the SemiAnalysis Tokenomics Dashboard for institutional Tokenomics model subscribers, to track and understand the frontier AI model landscape. This dashboard allows users to perform custom comparisons across dimensions like code, reasoning, math, and agent evaluation, compare API pricing across different models and service providers, and view key data disclosed by major AI labs, including token usage, revenue, valuation, and customer scale.

Current Structure of the GPU Rental Market

Before the second half of 2025, the pricing environment in the GPU rental market was relatively more competitive. At that time, operators had more ample GPU inventory, and end demand was just beginning to accelerate. Therefore, competition among Neocloud service providers was fierce,普遍通过更具吸引力的价格来争夺客户 with the core goal of increasing utilization,尽可能 "extracting" the value of existing computing assets before the next GPU iteration cycle arrived.

Since then, the market landscape has done a 180-degree turn. Today, Neoclouds and hyperscalers completely hold the initiative—they can demand higher upfront payments, better pricing, longer contract terms, and even自主选择合约的起止时间 to match their own inventory and capacity plans. Time is also on the supply side's side: they can proceed with deployment at their own pace and, in a continuously rising price environment, gradually筛选出最优质的客户组合.

Structurally, the GPU rental market can be roughly divided into three segments, corresponding to different types of customer demand:

Short-Term Leases: On-demand, spot, and contracts under 3 months

Mid-Term Contracts: Contracts from 3 months to over 3 years

Long-Term Offtakes: 4–5 year contracts, with 5 years being most common

Short-Term Leases: On-Demand, Spot, and Sub-3-Month Contracts

Short-term leases are at the very front end of the entire term structure and often correspond to "excess capacity." However, some providers (like Runpod, Lambda) specialize in providing sizable, flexible on-demand or spot computing power.

It's important to note that the pricing mechanism of the on-demand market differs significantly from other contract markets. Typically, service providers set a relatively fixed price level for on-demand resources and adjust it only in rare circumstances. In other words, prices in the short-term market are not entirely driven by real-time supply and demand but rather reflect market tightness through changes in resource utilization.

Service providers usually make one-time adjustments to prices based on resource utilization: when utilization is low, they stimulate demand by lowering prices; when utilization is near full capacity, they raise prices because demand can still be sustained even at higher price levels.

This also explains why, viewed over time, the on-demand prices published by Neoclouds often remain unchanged for long periods before suddenly experiencing "jump-like" increases or decreases. For the on-demand market, the true high-frequency indicator of demand change is not price, but resource utilization.

Mid-Term Contracts

From an economic perspective, the more critical segment is the "contract market," as the vast majority of GPU rental transaction value occurs here. Among these, 1-year contracts are particularly important—they reflect both the marginal demand from non-AI lab customers and the spillover demand from large customers, making them the most sensitive indicator for gauging market tightness.

AI-native companies and small-to-medium-sized AI labs are primarily active in the 1–3 year range. However, a recent clear trend is that these organizations are also beginning to try to lock in computing resources through longer-term contracts—many extending to 4 years or more, even willing to pay over 20% upfront payments, which was not common in past contracts over 4 years.

Long-Term Offtakes

In the longer-term 4–5 year market, the dominant force is large AI labs, which lock in large-scale computing resources early on. These deals typically correspond to clusters of 50MW, 100MW, or even larger scale, roughly equivalent to about 24,000 to 48,000 GB300 NVL72 GPUs. Overall,这类长期包销协议已占据 Neocloud GPU 租赁市场相当大的份额.

AI labs favor such contracts because they can lock in large-scale computing power at once to cope with rapidly growing end demand. Simultaneously, these organizations often deeply participate in cluster design, including key aspects like storage, networking, and CPU configuration. These transactions are often delivered in **bare metal** form, as AI labs possess sufficient engineering capability to customize the technology stack at a lower level, achieving optimal TCO (Total Cost of Ownership) and performance.

For Neocloud service providers, such deals are also attractive. On one hand, they can concentrate sales efforts on a few large orders rather than handling numerous small clients for the same revenue; on the other hand, long-term contracts facilitate better terms for debt financing—matching financing duration with contract terms可以有效降低期限错配与价格波动风险, and in most cases lock in project internal rates of return (IRR) of several percentage points.

Furthermore, hyperscalers often play the role of "backstop"—they act as direct承购方, purchasing computing power from Neoclouds and reselling it to AI labs. This structure is a win-win for all parties: Neoclouds can secure better financing terms based on AAA-rated承购方; while hyperscalers can share in a portion of the project's profits by providing credit backing without expanding their own balance sheets.

The table below lists some large offtake agreements we are tracking. We conduct in-depth analysis of these deals to reverse-engineer the implied GPU hourly price ($/hr/GPU), as well as key profitability metrics like project IRR and EBIT margins.

In the current market environment, the vast majority of large AI clusters being expanded are actually "internally consumed" by AI labs. However, these organizations still enter the sub-4-year contract market to supplement computing power, while also indirectly preventing supply from re-entering this market by renewing existing H100 and H200 clusters. As GB200 and GB300 ultra-large-scale clusters gradually come online, how the supply-demand relationship evolves in the 1–3 year contract market will become a key variable to watch.

"Where The Puck is Going"

Currently, the most striking feature is the clear divergence between underlying reality and market sentiment. Although signals that should be bullish for Neoclouds (margin expansion, extended asset useful life) like supply tightening and rising prices are very clear, the public market has grown increasingly pessimistic about companies like CoreWeave, Nebius, Iris Energy, whose stock prices remain near the lows of the past 6–12 months.

The market is still dominated by the narrative of "eventual oversupply and compute commoditization," and the aforementioned changes have not truly alleviated investor concerns about the long-term value of GPUs. But from the frontline perspective,持续紧张, enhanced pricing power means almost all computing power is being "absorbed" by demand—even with performance variations, it remains in short supply in this extreme shortage environment.

Three Key Future Observables

To judge whether GPU rental prices will remain high, focus on three variables:

1、GB300 Cluster Expansion Pace (2026)
The key is the relative speed between新增算力 and token demand—whether supply alleviates tightness or demand continues to outpace supply. This will directly affect whether AI labs continue to participate in the sub-4-year market and the price trend in that segment.

2、Worsening Chip Shortages
Including key bottlenecks like TSMC's N3 process capacity, HBM, DRAM, NAND—any fluctuations in manufacturing execution could further tighten supply.

3、AI Lab Revenue (ARR) & Token Consumption Growth Rate
The expansion of AI commercialization and usage scale will determine the strength of end demand, which is the core variable driving computing power demand.

Prices Move Unidirectionally Upward, Returns Follow

Overall, a relatively clear conclusion is: the probability of GPU rental prices continuing to rise is higher than the probability of them falling.

This process is distinctly self-reinforcing: when Neoclouds observe supply tightening and prices rising, they lock in more hardware in advance, further compressing market supply and pushing prices even higher. This is similar to the GPU shortage cycle of 2023–2024—where supply tightness drove significant profit expansion for OEMs and led to substantial server price increases (though this process may not fully repeat given the market's higher maturity this cycle).

Simultaneously, the renewed rise in GPU rental prices is also improving Neoclouds' Return on Invested Capital (ROIC):

On one hand, it increases the profit margin of deployed assets

On the other hand, it extends the economic useful life of GPUs, allowing capital to generate cash flow for a longer period

Who Benefits Most Currently?

The most direct beneficiaries currently are computing power providers with the following characteristics:

· Short-cycle contracts为主 (can be repriced quickly)

· Possess large存量 of H100 equipment

· Have new capacity coming online in the short term

Neoclouds with short-lease structures can release old contracts faster and re-sign at higher prices, quickly achieving profit expansion. Also, hyperscalers and Neoclouds that locked in next-generation computing power (multi-year contracts) early will benefit in the future cycle.

So the question arises: This time, will it really be "different"?

Câu hỏi Liên quan

QWhat are the main factors driving the surge in GPU rental prices according to the article?

AThe surge in GPU rental prices is primarily driven by three key factors: 1) Exponential growth in token consumption due to new AI paradigms like multi-agent systems, native content generation, and AI programming tools. 2) Supply chain constraints affecting components like DRAM, NAND storage, and AI servers, which have delayed new deployments. 3) A shift in market dynamics where AI labs and large cloud providers are locking in long-term contracts (up to 4-5 years), reducing available supply in the market.

QHow much did the H100 one-year lease price increase from October 2025 to March 2026?

AThe H100 one-year lease price increased from $1.70 per GPU per hour in October 2025 to $2.35 per GPU per hour in March 2026, representing a nearly 40% price increase.

QWhat role do long-term offtake agreements play in the GPU rental market?

ALong-term offtake agreements (typically 4-5 years) allow large AI labs to secure massive compute resources early, often for clusters of 50MW or larger. These agreements benefit Neocloud providers by enabling better debt financing terms and reducing market risk, while AI labs gain guaranteed capacity for their growing needs. These contracts significantly reduce available supply in shorter-term markets.

QWhy is the investment return ratio of AI tools significant for GPU demand?

AThe investment return ratio of AI tools is significant because it creates relatively inelastic demand for GPU compute. With AI tools delivering 5-10x returns on investment, companies are willing to pay significantly higher prices for GPU rentals before cost becomes a constraint on demand, creating sustained upward pressure on prices.

QWhat are the three key variables to watch for future GPU rental price trends?

AThe three key variables to watch are: 1) The pace of GB300 cluster expansion in 2026 relative to token demand growth. 2) Whether chip shortages worsen further across TSMC N3 capacity, HBM, DRAM and NAND. 3) The growth rate of AI lab revenue (ARR) and token consumption, which drives ultimate demand for compute resources.

Nội dung Liên quan

Tôi mất một năm để nhìn ra sự thật đau lòng về thanh toán Agent

Trong một năm qua, tôi đã làm việc để xây dựng cơ sở hạ tầng cho nền kinh tế Agent, trao đổi với các công ty như Stripe, Visa, Coinbase, Google và nhiều startup. Kết luận chính: nhu cầu thực sự cho thanh toán Agent hiện chưa tồn tại, và các startup đối mặt với nhiều vấn đề cấu trúc. **Phân tích bốn lĩnh vực:** 1. **Agent với Người bán:** Trải nghiệm mua sắm qua chat thường kém hơn giao diện thương mại điện tử trực quan cho các mặt hàng như quần áo, điện tử. Nhu cầu từ người bán chủ yếu là phòng thủ (tối ưu hóa cho Agent - AEO), không phải thiết yếu. Cơ hội tồn tại ở giao dịch tần suất cao, quyết định nhanh (như gọi đồ ăn) hoặc cho các giao diện phức tạp, nhưng đòi hỏi kênh phân phối B2C quy mô lớn – lợi thế của các gã khổng lồ. 2. **Agent với API:** Các nhà phát triển đã có sẵn cơ chế thanh toán (thẻ tín dụng, nạp tiền trước) cho các API. Vấn đề sâu xa là mô hình kinh doanh của nhiều nhà cung cấp SaaS dựa trên hợp đồng doanh nghiệp dài hạn, không thích hợp cho giao dịch vi mô. Cơ hội nằm ở thị trường dài (long-tail) với các dịch vụ nhỏ, nhưng đây là thị trường ngách với người dùng sẵn sàng chi trả thấp. 3. **Agent với Agent:** Đây là tầm nhìn dài hạn, hiện chủ yếu là lý thuyết, chưa có khối lượng giao dịch đáng kể. Kịch bản này sẽ yêu cầu cơ sở hạ tầng thanh toán chuyên biệt cho các giao dịch tốc độ cao, khác biệt với các mô hình hiện có, nhưng là một lĩnh vực đáng đầu tư lâu dài. 4. **Agent với Tài chính:** Đây là lĩnh vực duy nhất có nhu cầu hiện tại rõ ràng, từ các quỹ, nhóm tài chính và người dùng DeFi. AI có thể nâng cao đáng kể khả năng, tạo ra các hành vi mới. Thách thức chính là cạnh tranh với các định chế tài chính lớn đã có giấy phép, quan hệ khách hàng và cơ sở hạ tầng. **Điểm mấu chốt thực sự:** Lý do các công ty vẫn xây dựng là: 1) Các gã khổng lồ có dòng tiền để đặt cược phòng thủ cho tương lai, và 2) Có sự thiên kiến nhận định vấn đề là vấn đề thanh toán. Tuy nhiên, thanh toán chỉ là một phần của vấn đề lớn hơn: **Sự phối hợp (Orchestration)** – điều phối công việc giữa Agent và con người, xác minh kết quả và quyết toán. Thanh toán sẽ nảy sinh từ nhu cầu phối hợp quy mô lớn. Các công ty giải quyết được bài toán phối hợp sẽ chiếm lĩnh thị trường, không phải ngược lại. Khác với các tập đoàn lớn, các startup không có thời gian chờ đợi và cần tìm kiếm thị trường thực sự đang hoạt động và tăng trưởng – một thị trường nằm ngoài bốn danh mục phân tích trên.

marsbit6 phút trước

Tôi mất một năm để nhìn ra sự thật đau lòng về thanh toán Agent

marsbit6 phút trước

Tôi mất một năm mới nhận ra sự thật trần trụi về thanh toán Agent

Tác giả, với một năm kinh nghiệm xây dựng cơ sở hạ tầng cho nền kinh tế Agent, chia sẻ những nhận thức thực tế về thị trường thanh toán Agent hiện nay. **Hiện trạng & Thách thức:** - **Nhu cầu thực tế còn hạn chế:** Dữ liệu từ Stripe, Visa, Coinbase cho thấy khối lượng giao dịch Agent thực sự rất thấp, dù có nhiều quan tâm. Các rào cầu pháp lý (như KYC kéo dài, ngưỡng doanh thu cao từ Visa) khiến chỉ các tập đoàn lớn như Amazon mới có thể triển khai. - **Agent vs Người bán (B2C):** Trải nghiệm mua sắm qua chat kém hiệu quả với các mặt hàng cần so sánh trực quan (quần áo, đồ điện tử). Nhu cầu từ người bán hiện chủ yếu mang tính phòng thủ ("tối ưu hóa cho Agent - AEO") chứ không phải từ làn sóng người dùng thực sự. Các điểm sáng như đặt đồ ăn lại bị cản trở bởi thiếu API mở từ các nền tảng lớn và chi phí vận hành cao. - **Agent vs API (B2B):** Nhu cầu thanh toán vi mô cho API tồn tại nhưng khó mở rộng vì mô hình kinh doanh của nhiều nhà cung cấp SaaS dựa vào hợp đồng doanh nghiệp dài hạn. Các giao thức như MPP, x402 phù hợp với thị trường ngách nhưng quy mô nhỏ. - **Agent vs Agent:** Vẫn là tầm nhìn dài hạn, chưa có khối lượng giao dịch đáng kể. Nếu phát triển, nó sẽ cần cơ sở hạ tầng thanh toán chuyên biệt với tốc độ cao, độ trễ thấp. - **Agent vs Tài chính:** Đây có lẽ là lĩnh vực có nhu cầu hiện tại rõ ràng nhất, với người dùng sẵn sàng trả phí (quản lý quỹ, DeFi). Tuy nhiên, thị trường bị chi phối bởi các định chế lâu năm với lợi thế về giấy phép và quan hệ khách hàng. **Điểm mấu chốt thực sự:** Lý do nhiều công ty vẫn xây dựng là: 1) Động cơ phòng thủ của các gã khổng lồ (họ có đủ nguồn lực để đặt cược vào tương lai), và 2) Tư duy thiên lệch khi nhìn mọi vấn đề qua lăng kính "thanh toán". Tuy nhiên, vấn đề cốt lõi không phải là **thanh toán**, mà là **sự phối hợp (coordination)** giữa Agent và con người - bao gồm xác thực công việc, xử lý kết quả và sau đó mới là thanh toán. Thanh toán chỉ là một phần của giải pháp phối hợp. Các công ty giải quyết được bài toán phối hợp quy mô lớn sẽ chiếm lĩnh thị trường. Đối với startup, cần tìm kiếm thị trường thực sự đang hoạt động và tăng trưởng thay vì chờ đợi làn sóng tương lai.

链捕手29 phút trước

Tôi mất một năm mới nhận ra sự thật trần trụi về thanh toán Agent

链捕手29 phút trước

Claude Opus 4.8 Tìm Thấy Lỗ Hổng 4.5 Tỷ Đô La, Thời Đại AI Đang Sản Xuất Hàng Loạt Tin Tặc

Một nhà nghiên cứu đã sử dụng Claude Opus 4.8 để tìm ra lỗ hổng nghiêm trọng trong giao thức Orchard của Zcash, cho phép tạo token không giới hạn, làm bay hơi 45 tỷ USD vốn hóa thị trường chỉ sau thông báo chính thức. Sự việc cho thấy AI đang hạ thấp đáng kể ngưỡng phát hiện lỗ hổng, biến nó từ công việc của chuyên gia thành khả năng phổ cập. Điều đáng lo ngại không phải là mô hình mạnh nhất (như Claude Mythos), mà là những mô hình đủ mạnh, rẻ và phổ biến như Opus. Chúng cho phép cả người bảo vệ lẫn kẻ tấn công nhanh chóng hiểu hệ thống, dẫn đến hai hệ quả: một là tràn ngập báo cáo lỗi chất lượng thấp do AI tạo ra, làm kiệt quệ đội ngũ bảo trì mã nguồn mở; hai là các lỗ hổng ẩn sâu trước đây bị phát hiện với tốc độ chóng mặt. An ninh mạng vốn dựa vào một chuỗi hợp tác con người dài và mong manh để duy trì trải nghiệm "bình thường" cho người dùng. Tuy nhiên, khi AI làm gia tăng theo cấp số nhân cả lỗ hổng lẫn báo cáo, lực lượng phòng thủ vốn đã thiếu hụt nhân lực trầm trọng (khắp toàn cầu thiếu khoảng 4.8 triệu người) lại càng thêm quá tải. Chi phí phát hiện lỗi giảm, nhưng chi phí sửa chữa, phán đoán và phối hợp vẫn cao như cũ. Kỷ nguyên AI không phá hủy internet, mà giống như bật đèn sáng, cho chúng ta thấy sự thật: sự an toàn kỹ thuật số mà chúng ta hưởng thụ là thành quả của việc liên tục đè nén rủi ro bởi con người. Thứ đắt đỏ và khan hiếm thực sự bây giờ không phải là tìm ra lỗi, mà là có còn đủ người sẵn sàng sửa chữa chúng hay không.

marsbit1 giờ trước

Claude Opus 4.8 Tìm Thấy Lỗ Hổng 4.5 Tỷ Đô La, Thời Đại AI Đang Sản Xuất Hàng Loạt Tin Tặc

marsbit1 giờ trước

Dự Đoán Giá Ethereum: ETH Có Thể Tăng Gấp Đôi Trong Khi Cardano (ADA) Và Token Mới Này Tiến Gần Đến Mức Tăng Trưởng 500%

Thị trường tiền điện tử đang cho thấy những dấu hiệu khởi sắc khi các nhà đầu tư chuẩn bị cho chu kỳ tăng giá tiếp theo. Trong bối cảnh này, bài viết nêu bật tiềm năng của ba dự án: Ethereum (ETH), hiện giao dịch quanh 2.014,7 USD, được kỳ vọng có thể tăng gấp đôi lên mức 4.000 USD nếu thị trường tích cực vào năm 2026, nhờ vị thế nền tảng hợp đồng thông minh hàng đầu. Cardano (ADA), giao dịch ở mức 0,2329 USD, thu hút nhà đầu tư tin tưởng vào lộ trình phát triển dựa trên nghiên cứu và khả năng mở rộng của mạng lưới. Đáng chú ý là sự xuất hiện của Little Pepe (LILPEPE), một token mới trong giai đoạn bán trước. Dự án này đang xây dựng một blockchain Layer 2 tương thích Ethereum dành cho cộng đồng meme, với mục tiêu giảm phí và tăng tốc độ giao dịch. Được định giá 0,0022 USD ở đợt bán thứ 13 và đã huy động được hơn 28 triệu USD, một số nhà đầu tư kỳ vọng nó có tiềm năng tăng 500%. Sức hút của dự án đến từ nhu cầu bán trước mạnh mẽ, các tính năng hệ sinh thái như staking và sự tham gia tích cực của cộng đồng. Tóm lại, trong khi Ethereum và Cardano được xem là những lựa chọn dài hạn vững chắc, Little Pepe đang thu hút sự chú ý như một dự án mới có thể mang lại cơ hội tăng trưởng cao.

TheNewsCrypto1 giờ trước

Dự Đoán Giá Ethereum: ETH Có Thể Tăng Gấp Đôi Trong Khi Cardano (ADA) Và Token Mới Này Tiến Gần Đến Mức Tăng Trưởng 500%

TheNewsCrypto1 giờ trước

Hướng dẫn sử dụng chế độ Goal của Codex: Cách để AI không ngừng thúc đẩy một mục tiêu cụ thể

Biên tập viên: Bài viết này từ Dominik Kundel, thành viên quan hệ nhà phát triển của OpenAI, tổng kết kinh nghiệm sử dụng tính năng "goal mode / /goal" của Codex. Nó không chỉ nói về kỹ thuật nhắc lệnh thông thường, mà nói về sự thay đổi vai trò của công cụ lập trình AI: Codex không còn chỉ là trợ lý mã hóa phản hồi lệnh đơn lẻ, mà bắt đầu trở thành một tác nhân hành động có thể liên tục thúc đẩy theo đuổi một mục tiêu rõ ràng. Trong chế độ /goal, điều thực sự quan trọng không phải là viết yêu cầu càng dài càng chi tiết, mà là thiết lập tiêu chuẩn thoát rõ ràng, có thể xác minh cho Codex. Ví dụ: "giảm 30% thời gian triển khai", "đạt 100% parity về phạm vi kiểm thử", "LCP xuống dưới 2,5 giây". Những chỉ số này cho phép Codex đánh giá nhiệm vụ đã hoàn thành hay chưa, đồng thời tránh nó thử sai vô hạn trong mục tiêu mơ hồ. Đồng thời, người dùng cần cung cấp đủ định hướng, công cụ và môi trường thực tế để Codex có thể đo lường tiến độ, xác minh kết quả, thay vì chỉ hoàn thành một giải pháp khả thi trong điều kiện giả định cục bộ. Bài viết đặc biệt nhắc nhở, nhiệm vụ liên quan đến hình ảnh dễ khiến Codex sa lầy vào chi tiết nhất. Thay vì yêu cầu "khôi phục chính xác đến từng pixel 100%", nên phân giải mục tiêu hình ảnh thành danh sách chức năng, quy tắc hệ thống thiết kế và chỉ số có thể đánh giá. Đối với nhiệm vụ dài hạn kéo dài hàng giờ thậm chí vài ngày, cũng cần theo dõi liên tục thông qua commit, draft PR, tài liệu tiến độ, cập nhật Slack hoặc side chat, tránh cuối cùng chỉ nhận được một loạt thay đổi không thể truy nguyên. Thông tin tăng thêm của bài viết nằm ở việc định nghĩa lại /goal như một "cơ chế quản lý nhiệm vụ dài hạn". Khi AI có thể thực thi liên tục hàng chục thậm chí hàng trăm giờ, năng lực cốt lõi của nhà phát triển cũng thay đổi: không chỉ là để AI tạo mã, mà là định nghĩa mục tiêu cho nó, thiết lập hệ thống đo lường, cấu hình môi trường thực thi, và cuối cùng hoàn thành xem xét và tổng kết. Nói cách khác, lập trình AI đang chuyển từ "viết lời nhắc" sang "quản lý một tác nhân thực thi kỹ thuật làm việc liên tục".

marsbit2 giờ trước

Hướng dẫn sử dụng chế độ Goal của Codex: Cách để AI không ngừng thúc đẩy một mục tiêu cụ thể

marsbit2 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

ATWO là gì

I. Giới thiệu Dự ánArena Two là một nền tảng tương tác phi tập trung cho phép người hâm mộ đóng vai trò tích cực, có thể mã hóa trong kết quả sự kiện theo thời gian thực. Khác với các mô hình phát sóng truyền thống khiến người hâm mộ trở thành người xem thụ động, Arena Two tận dụng công nghệ blockchain để cho phép người hâm mộ trực tiếp bỏ phiếu theo thời gian thực và ảnh hưởng đến kết quả trên sân.II. Thông tin TokenTên token: ATWO(Arena Two)III. Liên kết liên quanWebsite:https://arenatwo.com/Explorers:https://basescan.org/token/0x499D35eBE6cEe9B2Ac35Fd003fcBbeeB9CFc7B32Twitter:https://x.com/arenatwoXGhi chú: Giới thiệu dự án đến từ các tài liệu được công bố hoặc cung cấp bởi đội ngũ dự án chính thức, chỉ mang tính tham khảo và không cấu thành lời khuyên đầu tư. HTX không chịu trách nhiệm cho bất kỳ tổn thất trực tiếp hoặc gián tiếp nào phát sinh.

Tổng lượt xem 251Xuất bản vào 2026.05.18Cập nhật vào 2026.06.02

ATWO là gì

ZEST là gì

I. Giới thiệu Dự án1. Zest Protocol là gì?Zest Protocol là một giao thức cho vay gốc Bitcoin được xây dựng trên Stacks Layer 2, cho phép người dùng kiếm lợi suất với BTC hoặc vay tài sản bằng cách thế chấp BTC. Các hợp đồng thông minh của giao thức được viết bằng ngôn ngữ Clarity, hoạt động hoàn toàn trên chuỗi và mã nguồn mở, với thiết kế được lấy cảm hứng từ Aave v3. Zest hiện là giao thức DeFi lớn nhất trên Stacks, với hơn 800 BTC được gửi và tổng giá trị khóa (TVL) đạt đỉnh vượt quá 100 triệu USD. Vào tháng 5 năm 2026, giao thức đã giới thiệu thêm Kho thế chấp Bitcoin, mở rộng khả năng cho vay từ Stacks sang mạng chính Bitcoin. Điều này cho phép người dùng vay stablecoin mà không cần chuyển BTC ra khỏi mạng Bitcoin, cho phép cho vay tự quản lý.2. Zest Protocol hoạt động như thế nào?Zest Protocol bao gồm hai thị trường. Thị trường Stacks được xây dựng trên Aave v3, cho phép người dùng gửi tài sản như sBTC, STX và USDC để kiếm lợi suất hoặc nhận các khoản vay thừa thế chấp. Tỷ lệ LTV tối đa mặc định là 50% (70% đối với sBTC). Thị trường Bitcoin hoạt động thông qua các Kho thế chấp Bitcoin mới được ra mắt. Người dùng vay stablecoin bằng cách khóa BTC trong các kho tự quản lý trên chuỗi Bitcoin. Tài sản thế chấp vẫn ở trên mạng chính Bitcoin trong suốt quá trình, và người dùng giữ quyền quản lý trừ khi vị trí bị thanh lý.3. Ai là người sáng lập Zest Protocol?Tycho Onnasch (Đồng sáng lập): Tốt nghiệp từ Đại học Oxford. Tham gia nghiên cứu và cấp vốn cho Quỹ Internet Mở Stacks. Cựu Giám đốc tại Trust Machines và Người sáng lập Deedmob. Hồ sơ LinkedIn: https://www.linkedin.com/in/tychokoonnasch/.Fernando Foy (Đồng sáng lập): Trước đây làm việc trong lĩnh vực tư vấn CNTT tại Objectif Emploi. Hồ sơ LinkedIn: https://www.linkedin.com/in/fernando-foy/.Emil E. (Đồng sáng lập): Có bằng Thạc sĩ Vật lý từ Đại học Warwick. Cựu Đối tác Kỹ thuật tại Trust Machines, Nhà phát triển Full-Stack cho các dự án Web3, và Nhà khoa học dữ liệu tại HSBC. Hồ sơ LinkedIn: https://www.linkedin.com/in/emil-e-49771a145/.Chi tiết về tài trợ: Vào tháng 5 năm 2024, Zest Protocol thông báo hoàn thành vòng gọi vốn hạt giống 3,5 triệu USD do Tim Draper dẫn đầu, với sự tham gia của Binance Labs, Flow Traders, Trust Machines và những người khác.4. Tokenomics của $ZEST$ZEST là token gốc của Zest Protocol với tổng cung cố định là 1 tỷ token và không có cơ chế lạm phát.Cộng đồng (27.83%): Dùng cho airdrop và khuyến khích người dùng;Phát triển hệ sinh thái (24.82%): Dùng cho thanh khoản, hợp tác, tiếp thị, niêm yết trên sàn giao dịch, v.v.;Nhà đầu tư (22.35%): Hỗ trợ các bên đầu tư đã hỗ trợ sự phát triển ban đầu của Zest Protocol;Đội ngũ (25%): Phân bổ cho các đóng góp chính.Lịch trình vesting: Token của đội ngũ và nhà đầu tư sẽ bị khóa trong 1 năm, sau đó mở khóa theo hình thức tuyến tính trong 3 năm.5. Thời gian của các cột mốc quan trọng2022: Zest Protocol chính thức được thành lập.Tháng 3 năm 2024: Hoàn thành kiểm toán bảo mật và ra mắt thị trường cho vay Stacks trên mạng chính.Vào tháng 2 năm 2026, Thị trường Stacks V2 ra mắt, giới thiệu Nhóm Rủi ro.Vào tháng 5 năm 2026, các Kho thế chấp Bitcoin được giới thiệu, và một nguyên mẫu mạng chính hoạt động hiện đã có sẵn. Điều này cho phép người dùng sử dụng BTC tự quản lý trên Bitcoin L1 làm tài sản thế chấp để vay stablecoin trên các chuỗi EVM, kết thúc việc cầu nối, bọc và quản lý của bên thứ ba. Việc triển khai này được chia thành hai giai đoạn. Giai đoạn 1: Sử dụng các giao dịch đã ký trước để hạn chế việc di chuyển BTC; Giai đoạn 2: Sử dụng BitVM để xác minh. II. Thông tin TokenTên token: ZEST (Zest Protocol)III. Liên kết liên quanWebsite:https://www.zestprotocol.com/Khám phá:https://bscscan.com/token/0x5506599c722389a60580b5213ea1da60d64754a1Twitter:https://twitter.com/ZestProtocolChú ý: Giới thiệu dự án được lấy từ các tài liệu được công bố hoặc cung cấp bởi đội ngũ dự án chính thức, chỉ nhằm mục đích tham khảo và không cấu thành lời khuyên đầu tư. HTX không chịu trách nhiệm cho bất kỳ tổn thất trực tiếp hoặc gián tiếp nào phát sinh.

Tổng lượt xem 120Xuất bản vào 2026.05.19Cập nhật vào 2026.06.02

ZEST là gì

USOIL là gì

Hợp đồng Vĩnh viễn USOILUSDT là ký hiệu giao dịch cho Dầu thô Tây Texas (WTI) được định giá bằng đô la Mỹ, đại diện cho 1 thùng dầu thô.

Tổng lượt xem 102Xuất bản vào 2026.05.25Cập nhật vào 2026.05.25

USOIL là gì

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của G (G) được trình bày dưới đây.

活动图片