Bằng chứng không thể chối cãi: GPT-5.5 bị bắt quả tang 'hạ trí', tài liệu chính thức của OpenAI thừa nhận

marsbitXuất bản vào 2026-05-27Cập nhật gần nhất vào 2026-05-27

Tóm tắt

**Sự thật: GPT-5.5 bị bắt quả tang "giảm trí", tài liệu chính thức của OpenAI thừa nhận** Người dùng phát hiện GPT-5.5, đặc biệt là chế độ "Suy nghĩ mở rộng" (Extended Thinking), có biểu hiện giảm chất lượng đột ngột sau một thời gian sử dụng ngắn (1-2 giờ), trả lời nhanh nhưng kém thông minh trong khi giao diện vẫn hiển thị nhãn cũ. Các khiếu nại trên diễn đàn OpenAI cho thấy mô hình mất khả năng tuân theo chỉ dẫn, xử lý tác vụ kém hơn trước. Một số thử nghiệm tiết lộ: dù chọn GPT-5.5 Thinking, hệ thống thực tế lại chạy phiên bản Instant (dựa trên ngày cắt dữ liệu huấn luyện); hoặc yêu cầu GPT-5.3 Codex nhưng nhận về kết quả từ GPT-5.2. Quan trọng nhất, tài liệu Trung tâm Trợ giúp chính thức của OpenAI xác nhận cơ chế: sau khi người dùng gói Plus dùng hết 160 tin nhắn GPT-5.5/3 giờ, hệ thống sẽ **chuyển thầm (silent switch)** sang mô hình mini mà không có cảnh báo hay thay đổi nhãn giao diện. Người dùng gói Pro cũng có thể bị giới hạn dung lượng ở chế độ Heavy khi máy chủ quá tải. Sự cố "giảm cấp thầm lặng" này không mới, đã từng xảy ra với GPT-5.3 Codex vào tháng 2/2026 và là một mô hình lặp lại qua các bản cập nhật từ GPT-5 đến 5.5. Dù OpenAI từng đánh dấu sự cố "đã giải quyết", các báo cáo mới nhất vẫn tiếp tục xuất hiện. Phân tích cho rằng động cơ có thể là để tiết kiệm chi phí điện toán. Trong khi người dùng vật lộn với trải nghiệm không ổn định của GPT-5.5, thì GPT-5.6 đã xuất hiện trong nhật ký backend, dự kiến ra mắt sớm. Điều này làm dấy lên lo ngại về cuộc đua...

【Dẫn nhập】 GPT-5.5 bị lật tẩy 'suy nghĩ giả', bị thay lén bằng phiên bản mini chỉ sau hai giờ sử dụng. 200 USD phí hàng tháng mua được 'bộ não Schrödinger'. Lệnh trace ra bằng chứng xác thực, tài liệu chính thức tự tay nhận tội. Người dùng sau đó ùn ùn lên tiếng phàn nàn: OpenAI, các người đang đùa với ai vậy?

ChatGPT lại bị tố 'hạ trí' rồi!

Ngay trong hai ngày qua, X (Twitter) nổ ra trước tiên.

Người dùng Lisan al Gaib phát hiện, sau khi dùng GPT-5.5 khoảng một hai tiếng thì nó đột nhiên trở nên ngốc nghếch, mỗi yêu cầu đều trả lời ngay lập tức, chất lượng suy giảm thảm hại.

Nhưng trên giao diện hiển thị, vẫn là 'GPT-5.5 Extended Thinking'.

Nghĩa là, nhãn 'Đang suy nghĩ' vẫn còn đó, nhưng bản thân quá trình suy nghĩ đã biến mất.

200 USD/tháng, mua được một 'mô hình Schrödinger'

Trên diễn đàn dành cho nhà phát triển của OpenAI, một bài đăng phàn nàn đồng thời cũng gây bão.

Agentify.sh cho biết, GPT-5.5 đang dùng bỗng nhiên mất khả năng tuân theo chỉ thị.

Nhìn thấy nó hồ hởi thông báo 'đã sửa xong', nhưng chất lượng code tệ đến mức gây ra việc rollback trên diện rộng.

Trước đây, nhiệm vụ UI mà 5.5-med có thể dễ dàng giải quyết, giờ đây ngay cả thay đổi đơn giản nhất cũng không làm được.

Nâng cấp lên 5.5-high, vô dụng. Nâng tiếp lên xhigh, vẫn không được.

Và trước đây xhigh có thể chạy vài tiếng đồng hồ, giờ đây thời gian rõ ràng là ngắn hơn.

Ngay khi bài đăng xuất hiện, khu vực phản hồi lập tức nổ tung.

Có người trực tiếp quay về dùng 5.4.

Có người dùng mức cao nhất là xhigh, nhưng 'so với tuần trước rõ ràng tệ hơn, các nhiệm vụ dài thường xuyên sai, hoàn toàn không tuân theo quy trình làm việc'.

Có người phản ánh tình huống còn kỳ lạ hơn, 'truy vấn đơn giản cũng phải xoay vòng rất lâu, bạn ngắt nó để sửa hướng đi, nó trực tiếp phớt lờ bạn, tiếp tục đi theo kế hoạch sai trước đó'.

Không sai, tất cả mọi người đều đang mô tả cùng một hiện tượng – bộ não của GPT, không biết lúc nào đã bị thay thế lén lút.

Hiện tại, biểu hiện của GPT-5.5 cũng tương đương với 5.3, không hề ngoa ngôn chút nào. Mấy ngày đầu còn xuất sắc đến kinh ngạc, giờ thì hoàn toàn không tìm thấy bóng dáng của mô hình hồi đó nữa.

Không phải ảo giác, chính OpenAI đã ghi rõ ràng bằng giấy trắng mực đen

Để kiểm chứng, Lisan al Gaib đã đặc biệt thực hiện một bài kiểm tra so sánh.

Cùng một tài khoản, bên phía ChatGPT dùng Extended Thinking chạy ra toàn rác, quay sang bên phía Codex dùng xhigh, lập tức trở lại bình thường.

Dùng nguyên văn lời của anh ấy nói thì là, Codex 'thông minh hơn thứ này 4 tỷ lần'.

Nhà phát triển Andrew Curran thì nghĩ ra một cách hay – hỏi trực tiếp mô hình 'Ngày cắt dữ liệu huấn luyện của bạn là khi nào?'

Mô hình trả lời, tháng 8 năm 2025.

Vấn đề là, ngày cắt của GPT-5.5 Thinking là tháng 12. Tháng 8, là ngày cắt của phiên bản Instant!

Có nghĩa là, anh ấy chọn Thinking, nhưng hệ thống thực tế chạy cho anh ấy là Instant.

Nhãn mô hình trên giao diện không thay đổi một chữ nào, nhưng mô hình đằng sau đã bị thay đổi một cách lén lút......

Buồn cười là, lần này OpenAI lại tự tay cung cấp bằng chứng xác thực cho người dùng ngay trong tài liệu trợ giúp của chính mình.

Theo hướng dẫn chính thức từ Trung tâm Trợ giúp OpenAI, người dùng Plus được gửi tối đa 160 tin nhắn GPT-5.5 mỗi 3 giờ.

Sau khi dùng hết, hệ thống sẽ im lặng chuyển sang mô hình mini, cho đến khi hạn mức được đặt lại.

Chú ý hai chữ 'im lặng'.

Không có cảnh báo pop-up, không có thay đổi nhãn mô hình, không có bất kỳ phản hồi trực quan nào.

Bạn vẫn tưởng mình đang dùng mô hình cao cấp nhất, đối phương đã lặng lẽ đổi thành mini.

Người dùng Pro cũng đừng vội mừng.

Chế độ suy nghĩ Heavy, cấp độ suy luận cao nhất độc quyền cho Pro, khi tải máy chủ cao, cũng sẽ bị hạn chế dung lượng. Cũng không có cảnh báo trước.

Nói cách khác, gói đăng ký Pro 200 USD/tháng, mua được một dịch vụ bất cứ lúc nào cũng có thể bị 'đánh tráo'.

Và thao tác 'nhãn không đổi, não đã thay' kiểu này, ở phía Codex còn bị bắt quả tang sớm hơn.

Tháng 2 năm nay, một issue xuất hiện trên GitHub, một người dùng Pro dùng lệnh trace bắt được, mình yêu cầu GPT-5.3 Codex, nhưng mô hình thực tế trả về là GPT-5.2.

Ngay cả 5.2 Codex cũng không phải, mà là phiên bản cơ bản thấp hơn 5.2.

Anh ấy đã đăng lệnh tái hiện:

  • RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
  • Đầu ra: gpt-5.2-2025-12-11
  • Dự kiến: gpt-5.3-codex

Nhiều người dùng Pro khác trong cùng issue đó đã xác nhận việc hạ cấp tương tự.

Và việc hạ cấp này mang tính 'dính', không tự khôi phục, cũng không có bất kỳ giải thích nào.

Thậm chí, vào ngày phát hành GPT-5.5 tháng 4, còn có người dùng báo cáo tốc độ của chế độ Fast tương đương với Standard, nhưng tính phí vẫn theo mức Fast.

Nhiệm vụ đơn giản chạy mất 7 phút 49 giây, bình thường chỉ nên 5-6 phút.

OpenAI thừa nhận rồi, và sau đó không có gì nữa

Ngày 15 tháng 5, trang status của OpenAI xuất hiện một bản ghi.

GPT5.5 Performance Degradation, chúng tôi đang điều tra vấn đề hiệu suất GPT-5.5 suy giảm được phản ánh bởi một số người dùng.

Ngày 17 tháng 5, trạng thái được cập nhật thành 'Đã giải quyết'.

Nhưng nhìn theo dòng thời gian các bài đăng trên diễn đàn, các khiếu nại 'hạ trí' từ ngày 24-26/5 còn dữ dội hơn đợt ngày 15/5.

Hoặc là vấn đề đã 'giải quyết' lại tái diễn, hoặc là căn bản chưa từng thực sự được giải quyết.

Mỗi lần nâng cấp là một lần 'tranh cãi hạ trí'

Mặc dù các hãng đều gặp phải lời phàn nàn 'mô hình trở nên ngu ngốc', nhưng mỗi lần cập nhật từ GPT-5 đến GPT-5.5 của OpenAI, một lần cũng không vắng mặt.

Mỗi lần OpenAI đều nói đang điều tra, mỗi lần đều nói đã giải quyết, rồi phiên bản tiếp theo lại tiếp tục.

Tháng 8 năm 2025, GPT-5 ra mắt. Tiêu đề bài hot trên Reddit trực tiếp là 'GPT-5 quá tệ'. Người dùng phàn nàn về phản hồi ngắn, từ chối nhiều hơn, cảm giác cá tính ít hơn.

OpenAI buộc phải khôi phục khẩn cấp tùy chọn GPT-4o. Sam Altman trong Reddit AMA đã thừa nhận 'gập ghềnh hơn chúng tôi dự kiến'.

Tháng 12 năm 2025, GPT-5.2. Chất lượng dịch thuật thụt lùi, bịa đặt API không tồn tại, từ chối thực hiện chỉ thị phong cách mà 5.1 có thể hoàn thành dễ dàng.

Tháng 2 năm 2026, GPT-5.3-Codex. Người dùng Pro bị hạ cấp im lặng xuống 5.2, lệnh trace ra bằng chứng xác thực.

Tháng 3 năm 2026, GPT-5.4. Diễn đàn cộng đồng OpenAI xuất hiện bài đăng 'GPT-5.4 trong Codex rõ ràng đã thoái hóa', các phản hồi của người dùng đều xác nhận.

Đầu tháng 5 năm 2026, GPT-5.5 Instant ra mắt. Độ dài phản hồi rút ngắn 30%, emoji gần như biến mất. Người dùng tóm tắt: độ chính xác tăng, nhưng 'nhiệt độ' biến mất.

Cuối tháng 5 năm 2026, tức là hiện tại. Các khiếu nại hạ trí đối với chế độ Thinking lại bùng nổ.

Lisan al Gaib tiết lộ, kể từ khi GPT-5 ra mắt và anh ấy dẫn đầu cuộc chiến tranh giành hạn mức ChatGPT Plus, 'mỗi tuần đều nhận được tin nhắn riêng kiểu như vậy'.

Tin nhắn mới nhất là có người nhờ anh ấy giúp đòi lại xhigh/heavy thinking.

Ngày chạy điểm mạnh nhất, là ngày phát hành

chatgptdisaster.com đã tổng hợp 1087 khiếu nại của người dùng đã được xác minh, trong đó một loại tình huống được nhắc đi nhắc lại gọi là 'lớp định tuyến hỏng', UI hiển thị GPT-5.5 Pro, nhưng đầu ra hoàn toàn là thứ ở một đẳng cấp khác.

Người dùng mô tả một mô hình có thể tái hiện, sau phiên dài thì mô hình bắt đầu 'hoàn toàn phớt lờ những gì bạn nói', nhưng trên bộ chọn mô hình vẫn treo nhãn cấu hình cao nhất.

Chú thích phi lý nhất là, cơ chế tự động chuyển sang mini sau khi người dùng Plus dùng hết 160 tin/3 giờ, trong tài liệu chính thức của OpenAI được mô tả là một 'tính năng'.

Tại sao lại như vậy? Lisan al Gaib phân tích cho rằng, câu trả lời chỉ có hai chữ, tiết kiệm tiền.

Sự thắt chặt về năng lực tính toán và khả năng sinh lời đang ảnh hưởng đến mọi người. Mọi nơi đều tính toán chi li, không bỏ qua bất kỳ cơ hội tiết kiệm tiền nào.

Tuy nhiên, ngay trong tuần người dùng GPT-5.5 đồng loạt khiếu nại, bóng dáng GPT-5.6 đã xuất hiện trong nhật ký backend của Codex.

Mã nội bộ iris-alpha, ngữ cảnh 1.5 triệu Token, xác suất ra mắt tháng 6 do Polymarket đưa ra vượt quá 85%.

Một bên là người dùng 5.5 thậm chí không giữ được trải nghiệm cơ bản, một bên là 5.6 đã lặng lẽ chạy lưu lượng thực trong backend.

Đây chính là cuộc đua ASI năm 2026.

Tốc độ tạo ra mô hình mới ngày càng nhanh, nhưng để mô hình cũ chạy tốt một phiên làm việc lại ngày càng khó.

Ngày chạy điểm mạnh nhất mãi mãi là ngày phát hành, mỗi ngày sau đó đều là GPT Schrödinger.

Tài liệu tham khảo: https://x.com/scaling01/status/2058643470357590058?s=20

Bài viết này đến từ tài khoản công chúng WeChat "Tân Trí Nguyên" (新智元), tác giả: ASI Khải Thị Lục; Biên tập: Môi Tây (摩西)

Câu hỏi Liên quan

QNgười dùng phát hiện hiện tượng gì ở GPT-5.5 "Extended Thinking"?

ANgười dùng phát hiện rằng sau một đến hai giờ sử dụng, GPT-5.5 "Extended Thinking" trở nên kém thông minh hơn, trả lời ngay lập tức và chất lượng giảm mạnh, trong khi giao diện vẫn hiển thị nhãn "GPT-5.5 Extended Thinking".

QTheo tài liệu chính thức của OpenAI, điều gì xảy ra sau khi người dùng Plus gửi hết 160 tin nhắn GPT-5.5 trong 3 giờ?

ATheo tài liệu Trung tâm Trợ giúp chính thức của OpenAI, sau khi người dùng Plus gửi hết 160 tin nhắn GPT-5.5 trong 3 giờ, hệ thống sẽ tự động chuyển sang sử dụng mô hình mini một cách "im lặng" (không có cảnh báo hay thay đổi nhãn hiển thị) cho đến khi hạn mức được đặt lại.

QLệnh trace đã chứng minh điều gì về việc chuyển đổi mô hình?

ALệnh trace đã chứng minh rằng một người dùng Pro yêu cầu mô hình "GPT-5.3 Codex" nhưng thực tế nhận được phản hồi từ mô hình cấp thấp hơn là "GPT-5.2-2025-12-11", cho thấy việc hạ cấp mô hình diễn ra mà không có thông báo.

QPhản ứng của OpenAI trước các khiếu nại về hiệu suất GPT-5.5 là gì?

AVào ngày 15 tháng 5, OpenAI đã đăng một bản ghi trên trang trạng thái thừa nhận đang điều tra vấn đề hiệu suất GPT-5.5 và đánh dấu là "đã giải quyết" vào ngày 17 tháng 5. Tuy nhiên, các khiếu nại vẫn tiếp tục xuất hiện sau đó, cho thấy vấn đề có thể chưa được khắc phục triệt để.

QTheo bài viết, lý do cốt lõi nào được đưa ra để giải thích cho các vấn đề về hiệu suất và chuyển đổi mô hình?

ATheo phân tích trong bài viết, lý do cốt lõi được đưa ra là để tiết kiệm chi phí. Áp lực về khả năng tính toán và lợi nhuận khiến OpenAI phải cắt giảm chi phí ở mọi nơi có thể, dẫn đến việc hạ cấp mô hình một cách lén lút để giảm tải và chi phí vận hành.

Nội dung Liên quan

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

**Tóm tắt tiếng Việt:** Năm 2026, tác giả Vương Kiến Thạc nhìn lại 20 dự đoán của mình về ChatGPT từ năm 2023, sử dụng AI (41 agent Opus 4.8) để đối chiếu với dữ liệu thực tế. **Kết quả chính:** Phần lớn các dự đoán về **cơ chế và xu hướng** là đúng: * **Đúng:** Kiến trúc RAG + tìm kiếm trở thành chuẩn để giảm ảo giác. LUI (Giao diện ngôn ngữ tự nhiên) tạo ra một "lục địa mới" cho tương tác máy tính. Mạng lưới agent với giao thức kết nối mới đang hình thành. Trung Quốc thu hẹp khoảng cách về mô hình lớn có thể sử dụng. ChatGPT không có ý thức, vượt qua bài kiểm tra Turing nhờ biểu diễn. Nó là bước tiến lớn nhưng chưa phải AGI, chưa gây ra làn sóng thất nghiệp hàng loạt. * **Sai/Sai một phần:** Dự đoán cụ thể **GPT-4 có 100 nghìn tỷ tham số** là sai hoàn toàn (thực tế ~1.8 nghìn tỷ). Nhận định **LLM không thể tự học toán** bị bác bỏ khi các mô hình giành huy chương IMO. **Giá trị sẽ thuộc về lớp ứng dụng** bị chứng minh ngược lại khi lợi nhuận khổng lồ thuộc về lớp nền tảng tính toán (như NVIDIA). **AI có thể né tránh vấn đề bản quyền** là sai, với các vụ kiện và khoản bồi thường lớn. Dự đoán **chi phí đào tạo mô hình lớn chỉ 5-10 tỷ USD** là quá thấp so với thực tế. **Bài học rút ra:** 1. **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể hay mức độ tuyệt đối.** 2. **Có xu hướng đánh giá quá cao tốc độ thay đổi trong ngắn hạn, nhưng lại đánh giá thấp mức độ thay đổi trong dài hạn.** 3. **Sai lầm tinh vi thường nằm ở "sự phân bố":** tổng thể đúng nhưng tác động không đồng đều (ví dụ: việc làm). 4. **Những phát biểu có giới hạn, thận trọng thường đứng vững theo thời gian.** 5. **Ba năm là chưa đủ để kết luận cho một số vấn đề sâu xa** (như ý thức máy móc, sự xuất hiện năng lực). Bài viết kết luận rằng việc nhìn đúng hướng đi lớn không quá khó, nhưng thừa nhận những sai lầm trong ước tính chi tiết, tốc độ và phân bố mới là điều đáng ghi nhớ cho những dự đoán trong tương lai.

marsbit3 giờ trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

marsbit3 giờ trước

Ba năm sau: Nhìn lại những dự đoán của tôi về ChatGPT năm 2023

**Tóm tắt: Nhìn lại 20 dự đoán về ChatGPT năm 2023 sau 3 năm** Vào tháng 3/2023, khi ChatGPT mới xuất hiện và GPT-4 chưa ra mắt, tác giả Vương Kiến Thạc đã đưa ra 20 nhận định về tương lai của AI. Giờ đây, vào cuối tháng 5/2026, một hệ thống AI gồm 41 agent đã được sử dụng để kiểm chứng lại từng dự đoán đó dựa trên dữ liệu thực tế. **Kết quả kiểm chứng (Tính đến 5/2026):** * **Đúng/Bản chất đúng (✅/🟢):** 13/20 dự đoán. * **Một phần đúng (🟡):** 6/20 dự đoán. * **Sai (❌):** 1/20 dự đoán. **Những điểm dự đoán chính xác nổi bật:** 1. **Kiến trúc RAG & Tìm kiếm:** Dự đoán việc bổ sung kiến thức thông qua cơ chế truy xuất bên ngoài (như vector search) thay vì chỉ fine-tune model đã trở thành tiêu chuẩn. 2. **Giao diện ngôn ngữ tự nhiên (LUI):** Nhận định ChatGPT mở ra kỷ nguyên LUI, tạo ra một hệ sinh thái rộng lớn hơn cả việc phát triển model cơ bản, đã được chứng minh. 3. **Mô hình lớn Trung Quốc:** Dự báo khoảng cách về khả năng giữa các mô hình Trung Quốc và đỉnh cao thế giới sẽ thu hẹp nhanh chóng trong khoảng 3 năm đã thành hiện thực. 4. **Ý thức và Kiểm tra Turing:** Quan điểm cho rằng ChatGPT không có ý thức và bài kiểm tra Turing chỉ đánh giá biểu hiện bề ngoài vẫn vững vàng. **Những điểm dự đoán chưa chính xác hoặc sai lệch:** 1. **Tham số GPT-4 (❌):** Thông tin GPT-4 có 100 nghìn tỷ tham số là hoàn toàn sai. 2. **Khả năng toán học của LLM:** Mặc dù đúng khi cho rằng cần công cụ bổ trợ, nhưng khẳng định LLM "không thể" tự học toán thuần túy đã bị bác bỏ khi các model năm 2025 giành huy chương IMO. 3. **Nơi nắm giữ giá trị:** Dự đoán giá trị sẽ thuộc về tầng ứng dụng, còn các công ty làm model cơ bản có thể không sinh lời, đã không tính đến sự thống trị và lợi nhuận khổng lồ của NVIDIA ở tầng phần cứng tính toán. 4. **Bản quyền:** Nhận định AI có thể "né tránh" vi phạm bản quyền là sai, khi thực tế đã có những vụ kiện và dàn xếp bồi thường lớn nhất lịch sử liên quan đến dữ liệu huấn luyện. **Bài học rút ra sau 3 năm:** * **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể.** * Xu hướng chung: **Đánh giá quá lạc quan về tốc độ, nhưng lại đánh giá thấp mức độ phát triển** về lâu dài. * Sai lầm tinh vi thường nằm ở **sự phân bổ** (ví dụ: tác động việc làm lên nhóm người lao động trẻ), chứ không phải tổng thể. * **Những nhận định có giới hạn, điều kiện đi kèm thường chính xác hơn** những phát biểu tuyệt đối. * Một số câu hỏi lớn vẫn chưa có câu trả lời cuối cùng sau 3 năm. Bản tổng kết này không chỉ chấm điểm cho quá khứ, mà còn đặt ra những quy tắc cho việc dự đoán trong tương lai.

链捕手5 giờ trước

Ba năm sau: Nhìn lại những dự đoán của tôi về ChatGPT năm 2023

链捕手5 giờ trước

Cảnh báo bong bóng AI: Đầu tư vào AI mang lại lợi nhuận âm cho hầu hết các gã khổng lồ công nghệ

Bài viết cảnh báo về bong bóng đầu tư AI khi phân tích chỉ ra rằng hầu hết các gã khổng lồ công nghệ như Microsoft, Alphabet, Meta, Oracle (trừ Amazon) có thể nhận tỷ suất lợi nhuận âm từ các khoản đầu tư hàng nghìn tỷ USD vào trung tâm dữ liệu AI. Dựa trên kỳ vọng của nhà phân tích về doanh thu và chi tiêu vốn giai đoạn 2025-2030, tốc độ tăng đầu tư (~20%/năm) vượt xa tốc độ tăng doanh thu dự kiến (~15%/năm). Tác giả nhấn mạnh, đầu tư công nghệ hiện giải thích 93% tăng trưởng GDP Mỹ. Nếu các công ty cắt giảm chi tiêu, không chỉ chuỗi cung ứng (Nvidia, TSMC, ASML) bị ảnh hưởng mà nền kinh tế Mỹ có thể suy thoái, kéo theo thị trường chứng khoán lao dốc. Các IPO của OpenAI, Anthropic được xem như cách chuyển giao rủi ro từ nhà đầu tư ban đầu sang các nhà đầu tư tổ chức và cá nhân. Dù cơn sốt có thể kéo dài đến 2026 nhờ IPO, nhưng thực tế toán học khắc nghiệt (cần thêm 2-5 nghìn tỷ USD doanh thu để đạt lợi nhuận 10%) khiến việc điều chỉnh là không tránh khỏi vào 2027-2028, tương tự bong bóng dot-com những năm 2000. Câu hỏi then chốt: ai sẽ trả giá cho cuộc chạy đua cơ sở hạ tầng đắt đỏ này?

marsbit6 giờ trước

Cảnh báo bong bóng AI: Đầu tư vào AI mang lại lợi nhuận âm cho hầu hết các gã khổng lồ công nghệ

marsbit6 giờ trước

Từ Token đến Lao động Máy móc: AI đang chuyển từ Công cụ thành 'Người lao động'

Từ công cụ thành "công nhân": AI đang trở thành lực lượng lao động máy móc Bài viết phân tích sự chuyển dịch trong thị trường AI: từ việc bán token hay giờ GPU đơn thuần, sang một thị trường "lao động máy móc" mới, nơi chính công việc được hoàn thành bởi phần mềm trở thành đối tượng được định giá và giao dịch. Tác giả dự đoán cơ chế định giá AI sẽ phát triển qua bốn giai đoạn: token thô -> thị trường năng lực LLM tiêu chuẩn hóa -> thị trường lao động theo ngành -> thị trường kết quả có thể lập trình. Trong tương lai, doanh nghiệp có thể không còn quan tâm công việc do model hay GPU cụ thể nào thực hiện, mà chỉ quan tâm liệu nó có được giao đúng tiêu chuẩn về độ trễ, độ chính xác, độ tin cậy và chi phí hay không. Điều này cũng làm thay đổi vai trò của con người, chuyển sang giám sát, chịu trách nhiệm, quản lý ngữ cảnh và đưa ra phán quyết cuối cùng - những yếu tố có thể trở nên có giá trị hơn. Bài viết nhấn mạnh AI không chỉ đơn thuần thay thế lao động mà mở rộng thị trường tổng thể. Khi chi phí công việc giảm, nhu cầu có thể tăng lên, tạo ra những loại hình công việc và dịch vụ mới khả thi về mặt kinh tế. Thị trường lao động máy móc sẽ bắt đầu từ những công việc có thể được xác định rõ ràng và đo lường được, hướng tới việc biến lao động máy móc thành một yếu tố sản xuất mới có thể được thu mua, thanh toán và giao dịch.

marsbit6 giờ trước

Từ Token đến Lao động Máy móc: AI đang chuyển từ Công cụ thành 'Người lao động'

marsbit6 giờ trước

Việc giảm giá 99% của Xiaomi MiMo không phải là chiêu trò marketing! Luo Fuli đăng X để phản bác những kẻ bi quan

Trong bài viết, tác giả phân tích động thái giảm giá API lên tới 99% cho dòng MiMo-V2.5 của Xiaomi và phản bác các ý kiến cho rằng đây chỉ là chiến lược marketing hay "bán lỗ cướp thị trường". Lộ Phúc Lợi, người đứng đầu MiMo, đã công bố một blog kỹ thuật dài 5000 chữ để giải thích cơ sở kỹ thuật của mức giá mới. Bài viết mô tả sáu trụ cột công nghệ chính cho phép mức giảm giá này: 1. **Kiến trúc Hybrid SWA (Sliding Window Attention):** Giảm dung lượng bộ nhớ tạm (KVCache) xuống còn 1/7 so với Full Attention truyền thống. 2. **Quản lý KVCache hai bể riêng biệt:** Tối ưu hóa việc phân bổ bộ nhớ để triệt để tận dụng lợi thế của SWA, tăng gấp 5 lần số lượng người dùng đồng thời. 3. **Hệ thống tiền tố cache được cải tiến:** Đảm bảo an toàn và nâng cao tỷ lệ trúng cache lên tới 93-95%, khiến phần lớn yêu cầu đọc lặp lại hầu như không cần tính toán lại. 4. **Hệ thống lưu trữ phân tán GCache:** Triển khai trực tiếp trên ổ SSD của máy GPU, giảm chi phí lưu trữ xuống gần bằng 0. 5. **Hệ thống điều phối LLM-Router:** Tối ưu định tuyến và lập lịch, ưu tiên các yêu cầu có cache, tăng hiệu suất tổng thể. 6. **Dự đoán đa token (MTP):** Giảm chi phí tạo văn bản (output), hoàn thiện vòng tròn giảm chi phí cho toàn bộ quá trình xử lý. Những cải tiến này, khi kết hợp, tạo ra một chuỗi tối ưu toàn diện làm giảm đáng kể chi phí tính toán và lưu trữ cho mỗi yêu cầu. Bài viết kết luận rằng mức giảm 99% không phải là con số tiếp thị, mà là kết quả có thể chứng minh của một hệ thống kỹ thuật hoàn chỉnh, một phương pháp giảm chi phí đáng để ngành tham khảo.

marsbit8 giờ trước

Việc giảm giá 99% của Xiaomi MiMo không phải là chiêu trò marketing! Luo Fuli đăng X để phản bác những kẻ bi quan

marsbit8 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片