Why 'AI Service Subscription' Is Destined to Die Out?

marsbitXuất bản vào 2026-06-15Cập nhật gần nhất vào 2026-06-15

Tóm tắt

"Why 'AI Service Subscription Models' Are Doomed to Disappear" The article argues that the flat-rate subscription model for AI services is fundamentally unsustainable. It points to recent industry shifts, such as Anthropic limiting access to its flagship Claude Fable 5 model for subscribers after just 14 days, and GitHub and OpenAI moving towards credit-based or usage-based billing. The core problem is that subscription models rely on a capped human consumption limit—like watching videos or listening to music—which keeps costs predictable. However, the rise of autonomous AI agents shatters this premise. Agents can consume 5 to 30 times more computing resources (tokens) than a human chatting, and they operate continuously without user presence. This removes the natural usage cap, making fixed-price plans financially unviable as heavy users incur massive costs. Attempts to patch the model with higher tiers or usage caps have failed, often leading to "adverse selection" where only the heaviest users subscribe. The industry's solution is to hollow out subscriptions, replacing "unlimited" access with prepaid credits charged per token, akin to a utility meter. While chat-based subscriptions may linger, the real value and revenue are shifting to pay-as-you-go models. The current period represents a final, heavily subsidized phase for users. The conclusion is that the soul of subscription—a fixed price for worry-free use—is dying, soon to be replaced by pure usage-based pricing wher...

Subscription models will be hollowed out. Use it while you still can.

On June 9, Anthropic released its most powerful public model to date, Claude Fable 5. As per tradition, this should have been a celebration for paying subscribers—your monthly fee finally granting you first dibs on the flagship model.

But a single line in the announcement sparked immediate and widespread controversy: After June 22, Fable 5 will be removed from all subscription plans, requiring separate purchases of usage credits for continued access.

In other words, even if you're a paying member, the flagship model is only yours to use for 14 days.

A model arriving with its own 'eviction notice' on launch day is unprecedented in the AI industry.

Many view this as a misstep or an act of arrogance by Anthropic. My take is the opposite: This is not a mistake; it's a preview.

The AI subscription model is heading toward an inevitable demise—not because any company is greedy, but because the very premise on which subscriptions are built is being dismantled, by AI itself.

01 A Flagship Model with a 14-Day Countdown

Let's lay out the facts first. According to Anthropic's official schedule (June 9, 2026), Fable 5 will be included for free in Pro, Max, Team, and seat-based Enterprise plans from launch until June 22. Starting June 23, it will be removed from these plans, with every subsequent token charged against prepaid usage credits at the same rate as the API.

This rate isn't cheap: $10 per million input tokens and $50 per million output tokens, exactly double the rate of the previous flagship, Opus 4.8. More subtly, even during the free window, Fable 5 consumption counts roughly double against subscription limits—doing the same work burns through your allowance twice as fast.

The user reaction was predictable. On Hacker News, someone bluntly called this 'give-then-take' move unsettling, suspecting Anthropic aimed to nudge subscribers toward pay-as-you-go. Another developer reported that on the $100/month Max plan, a single agent programming session consumed nearly $100 worth of tokens.

And this isn't an isolated move by Anthropic. Over the past eight weeks, the entire industry has been doing the same thing. On April 2, OpenAI switched Codex from per-message billing to per-token billing aligned with its API, later extending this to all existing enterprise customers.

GitHub froze new personal Copilot registrations on April 20, announced a full shift to AI Credits billing a week later, and completed the transition by June 1—the $10/month Pro tier now comes with a $10 credit.

Anthropic's own moves have been the most frequent. Starting April 4, it banned third-party agent frameworks like OpenClaw from using subscription allowances, forcing them onto pay-as-you-go. On April 21, a red 'X' mysteriously appeared next to Claude Code on the Pro plan pricing page, causing an uproar and retracted within 24 hours with an official 'small test for about 2% of new users' explanation. On May 14, it was formally announced that starting June 15, the Agent SDK and headless usage would be removed from subscription pools, becoming independent credits charged at API rates.

Three companies, eight weeks, the same direction—this isn't a coincidence; it's the entire industry turning in the same answer sheet to the same math problem.

What does that math problem look like?

02 What's Being Priced Is Never Compute

Research firm SemiAnalysis recently put this math problem on the table. They purchased one of each subscription tier from Anthropic and OpenAI, ran long programming tasks until exhausting the weekly limits, and then converted that usage into dollar values based on API list prices.

The prevailing industry belief was that a $200/month plan could, at most, generate around $2000 worth of tokens. The actual results far exceeded this: The $20 Claude Pro had an upper limit of about $400; the $200 Max 20x, about $8000.

OpenAI's numbers were even more staggering—the $20 ChatGPT Plus could yield about $700 worth, and the $200 Pro 20x, about $14,000.

Two fair points must be made upfront: These are 'maxed-out limit' upper bounds, not typical daily usage levels for average users; API list prices include a margin, so the conversion numbers don't equal real compute costs.

But pricing must account for the upper bound—an insurance company cannot assume no one will file a claim.


Subsidies themselves aren't fatal. Streaming services have subsidized, ride-hailing apps have subsidized; burning cash for growth is the internet's ancestral craft. What's truly fatal is that AI subscriptions have a fundamental difference from those models.


Netflix dares to sell subscriptions based on two things: the marginal cost of adding one more show approaches zero, and a person has at most 24 hours a day to watch. Spotify is the same. The implied premise of flat-rate subscriptions is that consumption is capped by human physiological limits—what's truly being priced is never the content, but a person's time.

AI in the chatbot era barely fit this premise. Even the chattiest person has a limit to how much they can type in a day; the unused allowances of light users could cover the overconsumption of heavy users.

Then, Agents arrived.

What does a single agent task look like? It reads 20 files, makes plans, modifies code, runs tests, reads errors, and iterates—one round consumes 5 to 30 times the tokens of a normal conversation. Worse yet, it doesn't require your presence.

I've experienced this myself: I recently had an agent organize flight data for two airports. I went to take a shower, came back to find the task completed, and my allowance nearly depleted. You're asleep, the meter's running.

What agents eliminate isn't the price ceiling, it's the consumption ceiling. And every evolutionary direction in the AI industry—longer tasks, greater autonomy, parallel instances—is sprinting toward the same endpoint:

Removing humans from the consumption loop entirely.

GitHub's announcement put it bluntly: agent usage 'is becoming the default.' This means the only scenario where subscriptions could still barely hold—people sitting at their screens chatting one line at a time—will only constitute a shrinking portion of AI's value map.

At this point, some might ask: The subsidy is too deep, so why not just raise prices?

They tried, and got an even worse result. Looking back at the SemiAnalysis table, there's a counterintuitive detail: the higher the tier, the greater the subsidy multiplier.

On Claude's side, the $20 tier is a 20x multiplier, while the $200 tier is 40x; on OpenAI's side, it jumps from 35x to 70x. Half is by pricing design—higher tiers multiply allowances, effectively giving bulk discounts to big customers. The other half is user behavior—those willing to spend $200 on a 20x plan are doing so specifically to max it out; light users wouldn't even appear in this tier.

In the insurance industry, this has a name: adverse selection. When a policy's price attracts only the highest-risk applicants, that policy has no actuarial path to viability. Any fixed price will precisely filter in the users whose usage exceeds it—this isn't an operational issue, it's structural. Adjusting prices only makes the filter finer.

Throughout all of 2025, the industry essentially tried every patch. In January, Sam Altman admitted on X that the $200/month ChatGPT Pro was losing money due to usage far exceeding expectations—the price hike tier failed.

Mid-year, Cursor changed from per-request to per-compute billing, triggering massive cancellations and a public apology from the CEO—midstream rule changes failed. In the summer, Anthropic added weekly limits to Claude Code, citing users running agents 24/7 with individual compute costs in the tens of thousands of dollars—throttling only attracted fury.

After all patches failed, we got the collective showdown of these past eight weeks. OpenAI's ChatGPT lead, Nick Turley, spelled it out on the BG2 podcast: 'In this current era, offering unlimited plans might be like offering unlimited electricity plans.'

03 The Shell Remains, the Core Is Already Dead

Of course, there's a seemingly strong counterargument: Subscription models are clearly still alive and well. ChatGPT Plus is still $20/month, Claude Pro is still for sale, GitHub's code completion even retains flat-rate pricing. Is talk of demise just alarmism?

This counterargument deserves serious consideration because the phenomenon it describes is real. But it misidentifies what is dying.

The soul of a subscription was never the form of 'charging once a month,' but the promise of 'fixed price, use with peace of mind'—you don't have to calculate the cost of each use. That was the entire reason it triumphed over pay-per-use in the first place.

What's happening now is: The billing cycle remains, but the promise is being pulled away.

GitHub Pro's $10 monthly fee now contains a $10 credit, used up and done—this isn't a subscription; it's a prepaid card disguised in subscription clothing. Anthropic's credits are deducted at API rates; OpenAI's credits support auto-replenishment. Subscription models won't be canceled; they will be hollowed out. The shell remains, but the core is already dead.

There remains one true enclave: pure chat. It can still have flat-rate pricing because it's the last AI scenario where consumption is still capped by human time. But a moat cannot protect an enclave—every dollar of R&D in this industry pushes AI from 'you ask, it answers' toward 'it proactively helps you complete.'

Chat subscriptions won't be killed; they will be marginalized: left behind, watching real value and real revenue gradually migrate into the world of pay-as-you-go.

Another coincidental timing is hard to ignore. According to a TechCrunch report (June 2026), as Fable 5 launched, Anthropic was preparing for an IPO alongside OpenAI. Over the past three years, subsidies have been funded by venture capital; public market investors will not accept a P&L statement that 'loses more money with every heavy user.' The capital exit schedule dictates that the showdown cannot be postponed indefinitely.

This means different things for different parties. For enterprises, AI spending must now be managed like cloud spending—The Information reported that Uber's CTO stated in an internal memo the company burned through its entire 2026 AI budget in just four months. Budgeting, installing monitoring, and routing models per task will become required skills for every team.

For individual users, the past saw light users subsidizing heavy users. Now, everyone pays for their own meter.

To be honest, this might not be all bad. With the return of price signals, 'Is this task worth running an AI on?' becomes a real question for the first time—and when an industry starts seriously answering that question, it's often the beginning of its move away from the cash-burn narrative toward a normal business.

Writing this, I want to interject one sentence: Before the meter is installed, the current subscription model is likely the most generous moment this industry will ever offer users—use it while you still can, and cherish it.

The logic is hidden in that SemiAnalysis table. Read from the user's perspective, it's not a death sentence at all, but a still-active benefit list: You pay $200 a month, and the platform lets you burn up to $14,000 worth of compute.

The last time we saw subsidies of this magnitude was during the ride-hailing and food delivery wars—and we all remember how those ended. After the subsidies faded, prices never went back.

So run those heavy tasks now, while you can. For instance, Fable 5's window in subscriptions only lasts until June 22. Instead of carefully budgeting when the credit era arrives, better to schedule those long-running tasks you've always wanted to run but found too expensive. This isn't about gaming the system—it's about being a clear-eyed beneficiary of a pricing error that is destined to be corrected.

Turley's metaphor may run deeper than he intended. The true sign of electricity becoming infrastructure isn't that it reached every household, but that every household installed a meter—from that moment on, no one debated 'should electricity be flat-rate?', they only debated the electricity rate.

There will be no obituary for the subscription model. It will simply become a small line item on your expense report labeled 'admission fee' on some quiet billing day.

Until then—use it while you still can, and cherish it.

Câu hỏi Liên quan

QAccording to the article, why is the AI subscription model doomed to disappear?

AThe AI subscription model is doomed because its fundamental premise—fixed pricing for unlimited use—is being dismantled by AI itself, specifically the rise of autonomous agents. Agents consume vastly more computational resources (tokens) than human-driven chat, effectively removing the human consumption limit that made fixed-price subscriptions viable. This creates unsustainable financial subsidies from providers and leads to 'adverse selection,' where the heaviest users are disproportionately attracted to the plans.

QWhat is the key difference between AI subscription models and successful ones like Netflix or Spotify, as stated in the article?

AThe key difference is the existence of a natural consumption limit. Netflix and Spotify subscription models work because the marginal cost of serving more content is near-zero, and a user's consumption is capped by the physical limit of human time (e.g., 24 hours in a day). In contrast, AI agents operate autonomously, removing the human from the consumption loop. An agent can run tasks continuously, consuming tokens at 5 to 30 times the rate of a chat, with no upper bound tied to user time, making a fixed-price, all-you-can-eat model financially unsustainable.

QWhat does the article suggest is the 'soul' of a subscription model, and what is happening to it?

AThe 'soul' of a subscription model is the promise of 'fixed price, worry-free use.' The article argues that while the billing cycle (the 'shell') of subscriptions remains, this core promise is being hollowed out. Services are replacing true unlimited access with prepaid credits or usage allowances tied to API rates (like GitHub's $10 monthly fee for $10 in credits). The subscription form persists, but its essential value proposition is dead.

QWhat event involving Anthropic's Claude Fable 5 model does the article use to illustrate the shift away from subscriptions?

AThe article cites Anthropic's release of the Claude Fable 5 model on June 9th, which was initially available to subscription users but was scheduled to be removed from all subscription plans on June 22nd, just 14 days later. After that date, users would need to purchase separate usage credits to access it. The author argues this immediate 'eviction notice' for a flagship model is not a mistake but a预告 (advance notice) of the industry's move away from including high-cost models in flat-rate subscriptions.

QWhat final advice does the author give to users regarding the current state of AI subscriptions?

AThe author advises users to 'use it while you can, and cherish it.' They characterize the current subscription period as potentially the most generous moment from the industry, where users can run heavy, expensive tasks at a heavily subsidized flat rate. The recommendation is to run those long, resource-intensive tasks they've been postponing before the pricing model fully shifts to pure pay-per-use (the 'electric meter' era), as prices are unlikely to return to such subsidized levels after the transition.

Nội dung Liên quan

Bốn câu hỏi về lỗ hổng Zcash Orchard: Đã từng bị khai thác? Tiền có thể truy tìm được? Nguồn cung có thể kiểm tra? Còn lỗ hổng khác không?

Tác giả: Jason McGee (Giám đốc điều hành Shielded Labs) & Zooko Wilcox (Người sáng lập Zcash) Bài viết giải đáp bốn câu hỏi chính xoay quanh lỗ hổng nghiêm trọng (có thể tạo ZEC giả) từng tồn tại trong nhóm giao dịch riêng tư Orchard của Zcash: 1. **Lỗ hổng đã bị khai thác chưa?** Nhóm phát triển đánh giá khả năng bị khai thác là thấp, dù không thể loại trừ hoàn toàn. Lý do: lỗi rất khó phát hiện, được tìm thấy nhờ nỗ lực chủ động; nhóm đã nhanh chóng vá lỗi; và thông thường, nếu bị khai thác, sẽ có bằng chứng rõ ràng xuất hiện. 2. **Người dùng có thể lấy lại tiền hợp pháp trong Orchard không?** Nếu lỗ hổng chưa bị khai thác, tất cả số ZEC hợp pháp đều có thể được lấy lại. Tuy nhiên, bài viết khuyến nghị người dùng thận trọng có thể chuyển tiền ra khỏi Orchard, đồng thời cảnh báo về các rủi ro tiềm ẩn khi chuyển sang địa chỉ minh bạch (t-addr) hoặc nhóm Sapling. 3. **Người dùng có thể tự xác minh tổng cung ZEC không?** Hiện tại thì **chưa thể**. Lỗ hổng đã phá vỡ khả năng tự xác minh này. Tuy nhiên, bản nâng cấp "Ironwood" được đề xuất sẽ giải quyết vấn đề bằng cách "niêm phong" nhóm Orchard (ngừng nhận/luân chuyển tiền mới), chỉ cho phép tiền hợp pháp rời đi thông qua cơ chế chuyển đổi hiện có. Điều này sẽ khôi phục khả năng cho mọi người tự xác minh tính toàn vẹn của tổng cung Zcash. 4. **Có lỗ hổng giả mạo nào khác không?** Các cuộc kiểm tra chuyên sâu, bao gồm sử dụng AI, từ nhiều nhóm vẫn đang được tiến hành. Cho đến nay, **chưa phát hiện thêm lỗ hổng nào tương tự**, làm tăng sự tin tưởng rằng không còn lỗi nào như vậy. Tuy nhiên, cần thêm công việc để khẳng định chắc chắn. **Kết luận:** Nhóm phát triển tin rằng lỗ hổng có thể chưa bị khai thác, số tiền hợp pháp an toàn và không còn lỗi tương tự. Quan trọng nhất, bản nâng cấp Ironwood sắp tới sẽ khôi phục khả năng then chốt: cho phép người dùng **tự xác minh** tổng cung ZEC, thay vì phải tin tưởng vào đánh giá của bất kỳ ai.

marsbit16 phút trước

Bốn câu hỏi về lỗ hổng Zcash Orchard: Đã từng bị khai thác? Tiền có thể truy tìm được? Nguồn cung có thể kiểm tra? Còn lỗ hổng khác không?

marsbit16 phút trước

Bốn câu hỏi về lỗ hổng Zcash Orchard: Đã từng bị khai thác? Số tiền có thể truy hồi? Nguồn cung có thể xác minh? Còn lỗ hổng nào khác không?

Bài viết thảo luận về lỗ hổng quan trọng trong nhóm giao dịch riêng tư Orchard của Zcash (ZEC) và trả lời bốn câu hỏi chính. Khả năng lỗ hổng đã bị khai thác là thấp, dựa trên tính phức tạp của việc phát hiện, hành động nhanh chóng để vá lỗi và không có bằng chứng rõ ràng về việc khai thác. Do đó, các khoản tiền hợp pháp trong Orchard được cho là có thể thu hồi đầy đủ. Hiện tại, người dùng không thể tự xác minh liệu tổng cung ZEC có vượt quá mức quy định hay không do lỗ hổng này. Tuy nhiên, bản nâng cấp Ironwood sắp tới sẽ khắc phục điều này bằng cách "niêm phong" nhóm Orchard, ngăn không cho tiền mới vào hoặc lưu thông trong đó, chỉ cho phép rút tiền thông qua cơ chế hiện có. Điều này sẽ cho phép bất kỳ ai cũng có thể tự xác minh tính toàn vẹn của tổng cung. Các nhóm nghiên cứu đang tiếp tục kiểm tra kỹ lưỡng để tìm các lỗ hổng giả mạo khác và cho đến nay chưa phát hiện thêm lỗi nào. Việc sử dụng các công cụ AI tiên tiến và chuyên môn cao làm tăng sự tin tưởng rằng không còn lỗi tương tự. Tóm lại, mặc dù có rủi ro, khả năng lỗ hổng bị khai thác được đánh giá là thấp và bản nâng cấp Ironwood sẽ khôi phục khả năng xác minh tổng cung quan trọng của người dùng, củng cố niềm tin lâu dài vào giao thức Zcash.

Odaily星球日报17 phút trước

Bốn câu hỏi về lỗ hổng Zcash Orchard: Đã từng bị khai thác? Số tiền có thể truy hồi? Nguồn cung có thể xác minh? Còn lỗ hổng nào khác không?

Odaily星球日报17 phút trước

Paul Graham: Cách Kiếm Một Tỷ Đô La

Làm thế nào để kiếm được một tỷ đô la? Paul Graham, người sáng lập Y Combinator, lập luận rằng điều này không phải là bất khả thi hay chỉ dành cho những kẻ lừa đảo. Chìa khóa nằm ở sự tăng trưởng theo cấp số nhân của một công ty khởi nghiệp. Sự giàu có lớn được quyết định bởi hai biến số: **tốc độ tăng trưởng** và **thời gian duy trì** được tốc độ đó. Nếu một công ty tạo ra sản phẩm mà người dùng yêu thích đến mức sẵn sàng giới thiệu cho bạn bè, nó sẽ đạt được tăng trưởng theo cấp số nhân. Ví dụ, với mức tăng trưởng doanh thu 15% mỗi tháng, một công ty có thể tăng giá trị lên hàng nghìn lần trong vòng 5 năm, từ đó biến người sáng lập thành tỷ phú. Để đạt được điều này, hãy xây dựng thứ **bạn và bạn bè bạn thực sự muốn**. Những người trẻ tuổi thường là tín hiệu cho nhu cầu tương lai. Ý tưởng tốt nhất thường xuất hiện một cách tự nhiên từ các dự án cá nhân đam mê chứ không phải từ việc tìm kiếm ý tưởng một cách có ý thức. Hãy thấu hiểu người dùng thật sâu sắc. Sự đồng cảm, chứ không phải bóc lột, mới là nền tảng cho một công ty khởi nghiệp thành công. Khi bạn liên tục làm hài lòng khách hàng trong một thị trường đủ lớn, sự giàu có sẽ là kết quả toán học tất yếu của tăng trưởng theo cấp số nhân.

marsbit26 phút trước

Paul Graham: Cách Kiếm Một Tỷ Đô La

marsbit26 phút trước

Khủng hoảng 'Thế chấp dưới chuẩn' phiên bản AI? Dưới cơn sốt, khoản nợ ngầm 1,8 nghìn tỷ USD đang tích tụ trong bóng tối

Dưới cơn sốt đầu tư vào cơ sở hạ tầng AI, một khoản nợ tiềm ẩn khổng lồ 1.800 tỷ USD đang tích tụ ngoài bảng cân đối kế toán, cảnh báo nguy cơ khủng hoảng tiềm tàng. Theo báo cáo của Morgan Stanley, bên cạnh mức chi tiêu vốn (capex) dự báo lên tới 1.100-1.400 tỷ USD vào năm 2027, các gã khổng lồ điện toán đám mây còn có khoản cam kết mua hàng ~9.820 tỷ USD, hợp đồng thuê chưa hiệu lực ~8.220 tỷ USD và các khoản phải trả kéo dài cho nhà cung cấp. Tổng cộng tạo ra rủi ro ngoại bảng ~1.800 tỷ USD, khóa chặt dòng tiền mặt tương lai. Đòn bẩy tài chính của nhóm này đã tăng từ 0,9 lên 1,8 lần chỉ trong hai quý. Lợi nhuận hiện tại bị thổi phồng do phần lớn tài sản chưa khấu hao. Dự báo khấu hao tích lũy 3 năm tới của Microsoft, Oracle, Meta, Google vượt 520 tỷ USD, gây áp lực lớn lên tỷ suất lợi nhuận. Rủi ro còn lan rộng trong chuỗi cung ứng thông qua các cấu trúc tài chính phức tạp như SPV, chuyển giao đòn bẩy sang các quỹ tín dụng tư nhân (ví dụ: Apollo, Blackstone), tạo ra vòng luân chuyển vốn khó theo dõi. Mấu chốt vấn đề là sự chênh lệch thời gian: tốc độ tăng trưởng chi tiêu vốn vượt xa tốc độ tăng doanh thu và dòng tiền tự do. Nếu quá trình thương mại hóa AI chậm hơn dự kiến, hoặc nhu cầu chuyển sang các giải pháp rẻ hơn, toàn bộ hệ thống tài chính mong manh này sẽ đối mặt với bài kiểm tra áp lực nghiêm trọng.

marsbit28 phút trước

Khủng hoảng 'Thế chấp dưới chuẩn' phiên bản AI? Dưới cơn sốt, khoản nợ ngầm 1,8 nghìn tỷ USD đang tích tụ trong bóng tối

marsbit28 phút trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片