Claude 'đốt' nổ 500 triệu đô, tăng 60 lần chỉ trong một đêm: Hóa đơn Token của bạn còn chịu nổi không?

marsbitPublié le 2026-06-01Dernière mise à jour le 2026-06-01

Résumé

Một doanh nghiệp đã chi tới 500 triệu USD chỉ trong một tháng cho Claude do quên đặt giới hạn ngân sách, trong khi một cá nhân khác nhận hóa đơn 18.000 USD từ Google Cloud vì khóa API bị lạm dụng. Các sự cố này báo hiệu một thực tế: hóa đơn AI có thể "phát nổ" bất ngờ do các tác nhân tự động (AI agent) chạy không kiểm soát, khóa bảo mật bị rò rỉ hoặc thiếu giới hạn sử dụng. Nguyên nhân sâu xa nằm ở việc các nền tảng như OpenAI và GitHub đang chuyển từ tính phí theo tháng sang tính phí theo lượng token tiêu thụ. Sự thay đổi này tác động mạnh tới người dùng nặng, đặc biệt là những người dùng AI agent cho các tác vụ dài, khiến chi phí tăng vọt – có trường hợp từ 28 USD lên 746 USD mỗi tháng. Một vấn đề khác là việc lãng phí token có chủ đích. Tại Amazon, một bảng xếp hạng sử dụng AI nội bộ (KiroRank) đã vô tình khuyến khích nhân viên "token maxxing" – tăng lượng token sử dụng chỉ để nâng thứ hạng, dù không tạo ra giá trị thực. Trong bối cảnh này, các giải pháp tối ưu chi phí đang nổi lên. Các công ty như Glean tập trung cung cấp ngữ cảnh tốt hơn cho AI để giảm lượt xử lý, trong khi các nền tảng định tuyến (như Factory AI) tự động phân công tác vụ cho mô hình phù hợp nhất về chi phí. Nghiên cứu cho thấy việc tiêu thụ token cao hơn không luôn đồng nghĩa với độ chính xác tốt hơn. Đáng chú ý, chi phí AI trong doanh nghiệp đang bắt đầu so sánh được với chi phí nhân sự. Các CEO như Arvind Jain của Glean nhận định đây là lần đầu tiên chi phí công nghệ ngang bằng chi phí con người, ...

1 tháng đốt ra hóa đơn 500 triệu đô la!

Gần đây, giới công nghệ đã lộ ra một vụ nhầm lẫn chấn động. Theo báo cáo của Axios, một doanh nghiệp chỉ trong vòng 1 tháng, đã "quẹt" nổ tới 500 triệu đô la trên Claude!

Nguyên nhân lại buồn cười đến mức khó tin: ban lãnh đạo khi cấp quyền sử dụng tài khoản Claude cho nhân viên, đã quên thiết lập giới hạn mức sử dụng.

Thực tế, không chỉ mỗi công ty này bị "vỡ trận" hóa đơn AI.

Tháng 4 năm nay, một người dùng Google Cloud do API key còn sót lại trong dịch vụ công khai bị lạm dụng, tài khoản chỉ có ngân sách 7 đô la, chỉ sau một đêm đã nhận được hóa đơn 1.8 vạn đô la.

Người dùng xui xẻo này tên là Jesse Davies, một cố vấn AI người Úc, người sáng lập Agentic Labs. Anh ta đã đặt hai lớp bảo vệ cho tài khoản Google Cloud của mình: một cảnh báo ngân sách 10 đô la Úc (khoảng 7 USD), và một giới hạn chi tiêu cứng 1400 USD.

Theo Tom's Hardware, kẻ tấn công phát hiện ra một dịch vụ Cloud Run mà anh ta đã phát hành từ AI Studio vài tháng trước, đã gửi hơn 60 nghìn yêu cầu, cả hai lớp bảo vệ đều không cản được: việc tính toán hóa đơn có độ trễ, đến khi hệ thống phản ứng, số tiền đã tăng vọt lên 1.8 vạn đô la.

Giữa tháng 5, Peter Steinberger, người sáng lập dự án mã nguồn mở OpenClaw, đã đăng một ảnh chụp màn hình lên X: 30 ngày, hóa đơn OpenAI API 1.3 triệu đô la.

Đội ngũ của anh chỉ có ba người, nhưng 100 tác nhân thông minh Codex mà họ chỉ huy đang chạy song song: 30 ngày đốt hết 603 tỷ Token, thực hiện 7.6 triệu yêu cầu. May mắn thay, 1.3 triệu đô la này không phải anh tự bỏ tiền túi.

Steinberger gia nhập OpenAI vào tháng 2 năm nay, 1.3 triệu đô la này được coi như một thí nghiệm nội bộ:

Thử nghiệm xem nếu không tính đến chi phí Token, lập trình AI có thể chạy đến giới hạn nào. Anh bổ sung, đây là kết quả của chế độ "Fast Mode" (tính phí tốc độ cao) của Codex, sau khi tắt đi thì vào khoảng 30 vạn đô la.

Sớm hơn một chút, CTO của Uber, Praveen Neppalli Naga, cũng từng thừa nhận với The Information rằng công ty đã đốt hết ngân sách Claude Code của cả năm vào tháng 4, COO của họ cũng công khai cho biết, chi phí AI ngày càng "khó tự biện minh".

500 triệu, 1.3 triệu, 1.8 vạn, số tiền tuy chênh lệch vài bậc số, nhưng đều chỉ về cùng một sự thật:

Trong thời đại tác nhân thông minh, một khóa bí mật mất kiểm soát, một đội quân tác nhân hoạt động suốt ngày đêm, một tài khoản quên đặt giới hạn: bất kỳ cái nào trong số đó, cũng có thể khiến hóa đơn Token của bạn bị "quẹt" nổ chỉ sau một đêm.

Tại sao hóa đơn AI lại "vỡ trận"?

Câu trả lời chủ yếu nằm ở sự thay đổi trong cách tính phí.

Từ tháng 4 năm nay, cách tính phí theo gói tháng của OpenAI bắt đầu chuyển sang tính theo mức sử dụng Token.

Ngày 2/4, việc tính phí Codex chuyển từ ước tính theo tin nhắn sang căn chỉnh theo mức sử dụng Token: ba loại Token đầu vào, đầu vào cache, đầu ra được tính riêng. Ngày 23/4, quy tắc này được mở rộng sang tất cả các gói Enterprise, Edu, Health, Gov: khoản chiết khấu vô hình trong phí tháng đã bị rút bỏ.

GitHub cũng theo sát ngay sau đó, vừa chính thức thông báo: tất cả các gói Copilot từ ngày 1 tháng 6 năm 2026, chuyển sang tính phí theo mức sử dụng. Logic yêu cầu cao cấp cũ bị hủy bỏ, thay bằng hạn mức AI, căn cứ theo mức tiêu thụ thực tế của Token đầu vào, Token đầu ra, Token cache, đối chiếu với mức phí API của từng mô hình để thanh toán.

GitHub chính thức giải thích lý do làm vậy:

Hiện tại, một câu hỏi chat nhanh, và một nhiệm vụ mã hóa tự chủ chạy vài giờ đồng hồ, người dùng phải trả tiền như nhau. GitHub luôn phải trả thay cho những người dùng chạy nhiệm vụ nặng, nhưng mô hình này đã không thể duy trì được nữa.

Trước khi tác nhân AI trỗi dậy, chi phí chat và hoàn thiện gần như nhau, phí tháng có thể bao trùm.

Sau khi tác nhân AI trỗi dậy, một nhiệm vụ có thể chạy liên tục vài giờ, thay đổi toàn bộ kho mã nguồn, chênh lệch chi phí giữa người dùng nặng và nhẹ có thể lên tới vài bậc số. Chế độ phí tháng đứng trước khoảng cách này, trực tiếp sụp đổ.

Tin tức vừa ra, Reddit và X xôn xao dậy sóng.

Một nhà phát triển có ID là JBusu đăng ảnh chụp hóa đơn, thẳng thắn nói mức giá mới "thật là trò cười". Chi phí trước đây 28.12 USD/tháng, theo chế độ mới phải trả 746.01 USD, anh ta đã quyết định hủy đăng ký, "với giá này, tôi tự thuê máy chủ đám mây còn rẻ hơn".

Một người dùng khác có ảnh chụp còn kinh khủng hơn, chi phí từ 50 USD tăng vọt lên 3000 USD, anh ta nói không ngờ định giá lại kỳ lạ đến vậy, "còn ai tiếp tục đăng ký nữa không?"

Tuy nhiên cũng có người dùng Copilot lâu năm lên tiếng phản bác: những hóa đơn cực đoan này phần lớn là do những "vibe-coder" (người viết code theo cảm giác) không coi việc đốt Token là gì mà đốt ra, chưa chắc đã đại diện cho sử dụng bình thường.

Một người dùng lâu năm bình luận: "Tôi dùng cả ngày, cuối tháng cơ bản không vượt hạn mức, khó tin đây là sự khác biệt về độ phức tạp công việc." Một người khác thì trực tiếp hơn: "Chính là có người muốn chế độ phát triển YOLO tự động hoàn toàn, để AI chạy tùy ý. Loại lãng phí này bị loại bỏ, với người khác ngược lại là việc tốt."

Có một điều phải rõ: GitHub không bãi bỏ phí tháng, giá đăng ký cơ bản không thay đổi. Cái thực sự thay đổi là lượng dùng thêm, nhiệm vụ tác nhân thông minh, gọi mô hình đắt tiền hơn, từ nay bước vào tính phí theo mức sử dụng.

Bị tác động mạnh nhất, là những người dùng tác nhân thông minh nặng dùng Copilot để chạy chuỗi nhiệm vụ dài.

Bảng xếp hạng bị chính người nhà làm hỏng

Phí tháng thất thủ, một mặt là nền tảng đổi quy tắc tính phí, mặt khác là người dùng AI, cũng đang cố gắng đốt.

Tháng 5, Business Insider đưa tin, Amazon đã gỡ xuống một bảng xếp hạng sử dụng AI nội bộ có tên là KiroRank.

Bài báo dẫn lời người trong cuộc cho biết, bảng xếp hạng này đã âm thầm thúc đẩy một cách làm việc kỳ lạ: một số nhân viên để leo lên vài bậc trên bảng xếp hạng, sẽ đi "quẹt" một số lượng tiêu hao Token không giải quyết vấn đề thực tế, chỉ thuần túy vì thứ hạng.

Sự việc lộ ra sau đó, Phó chủ tịch cấp cao Amazon Dave Treadwell trực tiếp gửi thông điệp tới toàn thể nhân viên: "Đừng dùng AI chỉ vì muốn dùng AI. Hãy dùng nó để giải quyết vấn đề của khách hàng, giải quyết vấn đề kinh doanh, để đổi mới."

Việc này tuy hơi phi lý, nhưng chẳng có gì bất ngờ. Khi "đốt Token" có thể lên bảng, nhân viên đương nhiên sẽ đi đốt Token.

Thung lũng Silicon đặt tên riêng cho hiện tượng này: Tokenmaxxing (đốt Token cực hạn), coi mức tiêu hao là năng suất.

Báo cáo của Axios cũng đề cập, có CTO phát hiện nhân viên dùng mô hình AI để tra thời tiết, viết email hàng ngày, những việc đơn giản không thể tả, nhưng lại dùng mô hình tiên phong đắt nhất, hóa đơn có thể tăng vọt trong im lặng.

KiroRank không phải là hệ thống đánh giá chính thức của Amazon, mà là công cụ không chính thức do nhân viên tự xây dựng. Nhưng nó đã phơi bày rõ ràng một quy luật quản lý kinh điển: khi KPI đặt sai, con người sẽ dùng cách thông minh nhất để lách kẽ hở.

Coi "dùng bao nhiêu" tương đương với "làm tốt hay không" — đây chính là nguồn gốc mang tính thể chế của sự lãng phí AI trong đợt này.

Người tính toán sổ sách Token, đã đang kiếm tiền

Mặt khác của nỗi lo hóa đơn Token, có người lặng lẽ biến nó thành việc kinh doanh.

Con đường thứ nhất: Dùng ngữ cảnh nuôi no AI.

Glean chính là công ty của chính Arvind. Nó làm trợ lý công việc AI doanh nghiệp: thông suốt tri thức phân tán khắp nơi trong công ty, để AI của nhân viên trực tiếp nhận được ngữ cảnh, không cần phải lục lọi khắp nơi nữa. AI ít đường vòng, đốt Token tự nhiên ít đi.

Cơ chế này giúp doanh thu hàng năm của Glean trong 15 tháng tăng gấp ba lần, vượt qua 300 triệu đô la, khách hàng bao gồm Databricks, Reddit, Samsung.

Con đường thứ hai: Phân chia công việc cho đúng mô hình.

Công ty khởi nghiệp định tuyến mô hình Factory AI làm chính việc này: tự động phân công mỗi nhiệm vụ cho mô hình phù hợp nhất, nhiệm vụ đơn giản đi dòng rẻ, nhiệm vụ phức tạp đi cấu hình cao nhất. Arvind cũng từng nói: Định tuyến làm đúng, có thể tiết kiệm 10 lần.

Hai con đường này tuy khác nhau nhưng cùng đích: Để AI làm việc, nhưng đừng để nó đốt bừa.

Nghiên cứu của giới học thuật, cũng đang đặt nền móng cho sự chuyển hướng này.

https://arxiv.org/pdf/2604.22750

Một bài báo arXiv tháng 4 năm 2026, lần đầu tiên phân tích có hệ thống xem nhiệm vụ mã hóa của tác nhân thông minh rốt cuộc tiêu hao tiền như thế nào.

Kết luận một: Lượng tiêu hao Token của nhiệm vụ tác nhân thông minh, có thể lên tới hàng nghìn lần so với suy luận mã thông thường và đối thoại mã, nguyên nhân chính đẩy cao chi phí là Token đầu vào.

Kết luận hai: Cùng một nhiệm vụ chạy nhiều lần, lượng tiêu hao Token có thể chênh lệch 30 lần.

Kết luận ba: Lượng tiêu hao Token cao hơn, không nhất thiết mang lại độ chính xác cao hơn. Độ chính xác thường đạt đỉnh ở mức chi phí trung bình — đốt thêm nữa lên trên, tiền tiêu rồi, hiệu quả ngược lại bão hòa.

Bài báo còn phát hiện, mô hình tiên phong ngay cả việc dự đoán mình sẽ đốt bao nhiêu Token cũng không làm được, phổ biến là đánh giá thấp chi phí thực tế.

Bạn tưởng nhiều tiền hơn sẽ làm được nhiều việc hơn. Thực tế là tiền tiêu rồi, việc chưa chắc đã tốt hơn, ngân sách còn tính không chuẩn.

Khi hóa đơn AI bắt đầu đuổi kịp chi phí nhân lực

"Đây là lần đầu tiên trong ký ức của tôi, chi phí công nghệ bắt đầu ngang bằng với chi phí nhân lực."

Ngày 29 tháng 5, CEO Glean Arvind Jain trong cuộc phỏng vấn với phóng viên CNBC Deirdre Bosa đã nói như vậy.

Quan sát của Phó chủ tịch Học sâu Ứng dụng Nvidia Bryan Catanzaro cũng chứng thực điều này.

Trong cuộc phỏng vấn với Axios, ông đề cập: Đối với đội ngũ của ông, chi phí tính toán đã vượt xa lương của nhân viên.

Hiện tượng tương tự đang xuất hiện ở nhiều công ty: từ Glean làm AI doanh nghiệp, đến Nvidia bán sức mạnh tính toán AI, rồi Uber sử dụng AI, đều đang xem xét lại khoản sổ sách này.

Theo quan điểm của Arvind, trong lịch sử, công nghệ chỉ là một phần rất nhỏ trong tổng chi phí của doanh nghiệp, nhưng bây giờ chi phí AI đã có thể đuổi kịp bảng lương rồi, ngân sách AI hàng năm của nhiều doanh nghiệp thường chỉ một đến hai tháng là đốt hết.

Một năm qua, tỷ lệ sử dụng AI là chỉ số được tôn sùng: dùng nhiều là tiên tiến, đốt Token là ôm lấy tương lai. Giờ đây, nhiều doanh nghiệp bắt đầu suy ngẫm lại câu nói mộc mạc đó: những Token bị đốt này, rốt cuộc đổi lại được gì?

Giai đoạn cửa sổ dùng thoải mái theo gói tháng miễn phí, lại đang khép lại đúng lúc này.

Tiếp theo, đặt trước mặt tất cả nhà phát triển là một câu hỏi như thế này: Làm thế nào để tính toán chi li, để mỗi Token phát huy giá trị lớn nhất.

Người chiến thắng thực sự trong tương lai, không nghi ngờ gì sẽ là người học cách tính toán sổ sách Token sớm nhất.

Tài liệu tham khảo:

https://x.com/dee_bosa/status/2060791500049613306%20

https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20

https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20

https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5

Bài viết này đến từ tài khoản công chúng WeChat "Tân Trí Nguyên", tác giả: ASI Khải Thị Lục

Questions liées

QBài viết đề cập đến sự việc gì khiến một công ty phải trả hóa đơn 5 tỷ USD chỉ trong một tháng trên Claude?

ABài viết đề cập rằng một công ty đã phải trả hóa đơn 5 tỷ USD trên Claude chỉ trong một tháng do quản lý quên thiết lập giới hạn chi tiêu khi cấp quyền tài khoản cho nhân viên.

QViệc chuyển đổi từ tính phí theo gói sang tính phí theo lượng Token sử dụng đã gây ra phản ứng như thế nào trong cộng đồng nhà phát triển?

AViệc chuyển đổi từ tính phí theo gói sang tính phí theo lượng Token sử dụng, đặc biệt là từ GitHub Copilot, đã gây ra nhiều phản ứng tiêu cực trên Reddit và X. Nhiều nhà phát triển phàn nàn về hóa đơn tăng đột biến, có trường hợp từ 28.12 USD lên 746.01 USD/tháng, và một số người đã quyết định hủy đăng ký.

QHiện tượng 'Token maxxing' được đề cập trong bài có nghĩa là gì và nó phản ánh vấn đề gì trong môi trường doanh nghiệp?

A'Token maxxing' là một thuật ngữ chỉ việc cố tình sử dụng tối đa lượng Token chỉ để tăng chỉ số tiêu thụ, thay vì giải quyết vấn đề thực tế. Nó phản ánh vấn đề khi các chỉ số đo lường (KPI) bị đặt sai, nhân viên sẽ tìm cách lợi dụng để đạt thành tích ảo, dẫn đến lãng phí tài nguyên AI.

QTheo bài viết, những giải pháp nào đang được phát triển để giúp doanh nghiệp quản lý và tối ưu chi phí Token hiệu quả?

ABài viết đề cập đến hai giải pháp chính: 1) Cung cấp ngữ cảnh đầy đủ cho AI (như Glean) để giảm việc AI phải tìm kiếm thông tin, tiết kiệm Token. 2) Sử dụng định tuyến mô hình (model routing, như Factory AI) để tự động phân công nhiệm vụ cho mô hình phù hợp nhất, nhiệm vụ đơn giản dùng mô hình rẻ hơn, từ đó cắt giảm chi phí.

QBài viết đưa ra nhận định nào về mối quan hệ giữa chi phí AI và chi phí nhân lực trong tương lai?

ABài viết trích dẫn ý kiến của Glean CEO Arvind Jain rằng đây là lần đầu tiên chi phí công nghệ (cụ thể là chi phí AI/Token) bắt đầu ngang bằng với chi phí nhân lực. Ông chỉ ra rằng ngân sách AI hàng năm của nhiều công ty thường bị 'đốt cháy' chỉ trong một đến hai tháng, buộc các doanh nghiệp phải xem xét lại giá trị thực sự mà những Token này mang lại.

Lectures associées

La narration du BTC en tant qu'« or numérique » a-t-elle échoué ?

**Résumé en français :** L'article aborde la récente chute brutale du Bitcoin (plus de 50% depuis son pic de 2025) pour explorer la solidité de son récit de "l'or numérique". L'auteur développe trois points principaux. **1. La nature de l'actif Bitcoin :** Il est présenté comme une catégorie d'actif nouvelle et potentiellement supérieure à l'or physique en raison de son plafond fixe (21 millions), de sa facilité de transfert et de sa traçabilité sur la blockchain. L'auteur souligne son stade encore précoce (taux de pénétration ~3-4%), similaire à Internet dans les années 2000, ce qui explique une volatilité extrême. **2. Comprendre la correction actuelle :** Cette chute est interprétée comme une vente cyclique prévisible post-halving (2024), amplifiée par un "grand transfert" historique. L'arrivée des ETF a permis aux investisseurs institutionnels d'entrer, incitant les premiers détenteurs (miners, early adopters) à réaliser leurs bénéfices. L'auteur note que l'amplitude des baisses historiques diminue (93% → ~50%), signe d'une maturation et d'une diversification des détenteurs. **3. Perspective à long terme :** Le potentiel est évalué par rapport à la capitalisation boursière de l'or (~20 000 Md$). Même si le Bitcoin n'en captait que 30 à 50%, sa valorisation actuelle (~1 400 Md$) laisse une marge de hausse significative. Le véritable risque n'est pas la disparition du Bitcoin, mais une mauvaise gestion de portefeuille (effet de levier, allocation excessive) ou un manque de conviction qui empêcherait de supporter les fortes volatilités. **Conclusion :** L'auteur compare cette phase à la chute d'Amazon après la bulle internet. La question n'est pas de savoir si le Bitcoin va augmenter, mais si l'investisseur a la structure et la conviction pour survivre aux turbulences. La divergence actuelle entre la performance de l'or et celle du Bitcoin refléterait moins un échec du récit qu'une période nécessaire de transition et de consolidation vers un actif de placement mature.

marsbitIl y a 1 h

La narration du BTC en tant qu'« or numérique » a-t-elle échoué ?

marsbitIl y a 1 h

Le récit du Bitcoin en tant qu'« or numérique » a-t-il échoué ?

L'auteur Jason propose un cadre de réflexion sur le bitcoin, en abordant trois points essentiels. Il voit le bitcoin comme un nouvel actif, une forme de « digital gold » supérieur sur le long terme : offre fixe à 21 millions d'unités, transferabilité facile et vérifiabilité totale via la blockchain. Comparant sa pénétration actuelle (3-4%) à celle d'internet ou du e-commerce à leurs débuts, il souligne son potentiel de croissance, tout en rappelant sa très grande volatilité inhérente à ce stade précoce. Concernant la récente forte baisse (de 126 000 $ à environ 61 000 $), il l'interprète comme une vente cyclique attendue après le pic post-réduction de moitié (« halving ») de 2024, et surtout comme un « grand transfert » historique des premiers détenteurs vers les nouveaux investisseurs institutionnels via les ETF. Il note que l'amplitude des corrections historiques diminue (de -93% en 2011 à -50% actuellement), signe d'une maturité croissante de l'actif. Sur le long terme, en comparant la capitalisation du bitcoin (environ 7% de celle de l'or), il estime que son potentiel de hausse reste important si le récit d'« or numérique » se réalise, même partiellement. Il met cependant en garde : le risque principal n'est pas que le bitcoin échoue, mais une mauvaise gestion du portefeuille (position trop importante, effet de levier) ou un manque de compréhension profonde de l'actif, qui pourraient forcer une sortie prématurée lors des fortes corrections. La clé, comme pour Amazon après l'éclatement de la bulle internet, est de « survivre » assez longtemps pour bénéficier de la tendance à long terme.

链捕手Il y a 1 h

Le récit du Bitcoin en tant qu'« or numérique » a-t-il échoué ?

链捕手Il y a 1 h

Du code à la cognition : un guide de dix mille mots sur l'évolution du cerveau robotique

Auteur: Matt White, CTO AI mondial de la Linux Foundation. Compilé par: Felix, PANews. Cette longue exploration retrace l'évolution de l'intelligence des robots, des systèmes classiques codés à la main aux approches modernes fondées sur l'IA. **L'ère pré-LLM** était dominée par une pile logicielle modulaire (perception, estimation d'état, planification, contrôle) et des arbres de comportement, prévisible mais peu adaptable. **L'apprentissage automatique** a ensuite révolutionné la perception (réseaux neuronaux) et le contrôle (apprentissage par renforcement, imitation), mais chaque compétence restait étroite et spécifique. **L'avènement des LLM** a introduit un planificateur en langage naturel, capable de décomposer une instruction en séquences d'actions atomiques exécutées par des contrôleurs existants (ex: SayCan de Google). Le saut suivant fut les **modèles Vision-Langage-Action (VLA)**, comme RT-2 de DeepMind ou OpenVLA. Ces réseaux de neurones unifiés fusionnent flux visuel et instruction linguistique pour générer directement des commandes motrices, couplant raisonnement et action. Les architectures les plus performantes, comme le GR00T de NVIDIA ou Helix de Figure AI, adoptent une **stratégie à "deux cerveaux"** : un système 2 lent (VLA, ~7-9 Hz) pour la réflexion et un système 1 rapide (~200 Hz) pour l'exécution réactive, avec parfois un système 0 réflexe pour l'équilibre. Les calculs critiques s'exécutent localement (ex: sur module NVIDIA Jetson) pour la latence et la fiabilité. **L'essor des modèles open-source** (OpenVLA, GR00T N1.7, π0) est crucial, permettant aux startups de raffiner des bases pré-entraînées avec leurs propres données, accélérant le développement et favorisant l'audit de sécurité. Cependant, des défis persistent : récupération après erreur, efficacité des données, généralisation entre corps robotiques, planification à long terme et raisonnement physique/spatial. C'est là qu'interviennent les **modèles du monde (World Models)**, comme NVIDIA Cosmos ou Meta V-JEPA 2. Ces réseaux prédisent les conséquences futures d'une action (simulant une vidéo). Ils permettent au robot d'évaluer mentalement plusieurs scénarios avant d'agir, améliorant la reprise, la généralisation et la planification. Différentes approches architecturales coexistent (diffusion de pixels, JEPA, modèles à actions latentes). L'acquisition de **données** (téléopération) reste un gouffre clé. La simulation (Isaac Sim) permet un entraînement massif. Les coûts matériels chutent rapidement (ex: robots humanoïdes à ~2500$). Les modes de défaillance des robots pilotés par LLM peuvent être étranges, nécessitant des contraintes de sécurité. En conclusion, l'intelligence robotique migre progressivement du code des ingénieurs vers des modèles apprenant le monde lui-même. Nous en sommes à une phase de progression constante (analogue à GPT-2 pour l'IA physique), promettant à terme des robots bien plus généraux et adaptatifs. La question évolue de "que peuvent-ils faire ?" vers "que devrions-nous leur faire faire ?".

marsbitIl y a 1 h

Du code à la cognition : un guide de dix mille mots sur l'évolution du cerveau robotique

marsbitIl y a 1 h

La bulle de l'IA est en train d'éclater

Le titre "La bulle de l'IA est en train d'éclater" reflète les discussions actuelles sur une potentielle surévaluation du secteur. Des figures comme Ray Dalio de Bridgewater évoquent une bulle "relativement élevée", tandis que Jensen Huang de NVIDIA souligne le potentiel de croissance de la demande en capacité de calcul. L'article compare cette situation à la bulle Internet des années 2000. Bien que celle-ci ait provoqué un krach, les infrastructures construites à l'époque (câbles sous-marins, réseaux) ont ensuite permis l'émergence de géants comme Amazon, Netflix ou le cloud. De même, les investissements massifs actuels dans l'infrastructure AI (data centers, refroidissement, énergie), estimés à 5 300 milliards de dollars d'ici 2030, pourraient jeter les bases d'une transformation durable. Un paradoxe clé est observé : le coût de l'intelligence artificielle s'effondre (baisse de >99,7% du coût par token entre 2023 et 2025), mais les dépenses des entreprises en cloud AI ont triplé. Ceci s'explique par la "Paradoxe de Jevons" appliquée à l'IA : une efficacité accrue et un coût réduit déclenchent une explosion de la demande et de nouveaux cas d'usage (agents autonomes, RAG, multimodale), intégrant l'IA dans tous les secteurs. La bulle se dégonfle déjà au niveau des startups sans réelle innovation. Le marché entre dans une phase de maturation où la valeur migre des dépenses d'investissement (CapEx) vers les applications qui optimisent les dépenses opérationnelles (OpEx). La consolidation est inévitable, éliminant les acteurs superficiels. En conclusion, comme pour Internet, une correction du marché est probable, mais elle nettoiera le terrain. Les investissements en infrastructure et la baisse radicale du coût de l'"intelligence" préparent l'avènement d'une ère où l'IA+ sera omniprésente, transformant fondamentalement tous les secteurs industriels. La bulle spéculative passera, mais l'élan de la productivité sous-jacente, lui, est bien réel.

链捕手Il y a 1 h

La bulle de l'IA est en train d'éclater

链捕手Il y a 1 h

Trading

Spot
Futures

Articles tendance

Comment acheter BILL

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Billions Network (BILL) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Billions Network (BILL).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Billions Network (BILL)Après avoir acheté vos Billions Network (BILL), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Billions Network (BILL)Tradez facilement Billions Network (BILL) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

225 vues totalesPublié le 2026.05.07Mis à jour le 2026.06.02

Comment acheter BILL

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de BILL (BILL) sont présentées ci-dessous.

活动图片