Bằng chứng không thể chối cãi: GPT-5.5 bị bắt quả tang 'hạ trí', tài liệu chính thức của OpenAI thừa nhận

marsbitXuất bản vào 2026-05-27Cập nhật gần nhất vào 2026-05-27

Tóm tắt

**Sự thật: GPT-5.5 bị bắt quả tang "giảm trí", tài liệu chính thức của OpenAI thừa nhận** Người dùng phát hiện GPT-5.5, đặc biệt là chế độ "Suy nghĩ mở rộng" (Extended Thinking), có biểu hiện giảm chất lượng đột ngột sau một thời gian sử dụng ngắn (1-2 giờ), trả lời nhanh nhưng kém thông minh trong khi giao diện vẫn hiển thị nhãn cũ. Các khiếu nại trên diễn đàn OpenAI cho thấy mô hình mất khả năng tuân theo chỉ dẫn, xử lý tác vụ kém hơn trước. Một số thử nghiệm tiết lộ: dù chọn GPT-5.5 Thinking, hệ thống thực tế lại chạy phiên bản Instant (dựa trên ngày cắt dữ liệu huấn luyện); hoặc yêu cầu GPT-5.3 Codex nhưng nhận về kết quả từ GPT-5.2. Quan trọng nhất, tài liệu Trung tâm Trợ giúp chính thức của OpenAI xác nhận cơ chế: sau khi người dùng gói Plus dùng hết 160 tin nhắn GPT-5.5/3 giờ, hệ thống sẽ **chuyển thầm (silent switch)** sang mô hình mini mà không có cảnh báo hay thay đổi nhãn giao diện. Người dùng gói Pro cũng có thể bị giới hạn dung lượng ở chế độ Heavy khi máy chủ quá tải. Sự cố "giảm cấp thầm lặng" này không mới, đã từng xảy ra với GPT-5.3 Codex vào tháng 2/2026 và là một mô hình lặp lại qua các bản cập nhật từ GPT-5 đến 5.5. Dù OpenAI từng đánh dấu sự cố "đã giải quyết", các báo cáo mới nhất vẫn tiếp tục xuất hiện. Phân tích cho rằng động cơ có thể là để tiết kiệm chi phí điện toán. Trong khi người dùng vật lộn với trải nghiệm không ổn định của GPT-5.5, thì GPT-5.6 đã xuất hiện trong nhật ký backend, dự kiến ra mắt sớm. Điều này làm dấy lên lo ngại về cuộc đua...

【Dẫn nhập】 GPT-5.5 bị lật tẩy 'suy nghĩ giả', bị thay lén bằng phiên bản mini chỉ sau hai giờ sử dụng. 200 USD phí hàng tháng mua được 'bộ não Schrödinger'. Lệnh trace ra bằng chứng xác thực, tài liệu chính thức tự tay nhận tội. Người dùng sau đó ùn ùn lên tiếng phàn nàn: OpenAI, các người đang đùa với ai vậy?

ChatGPT lại bị tố 'hạ trí' rồi!

Ngay trong hai ngày qua, X (Twitter) nổ ra trước tiên.

Người dùng Lisan al Gaib phát hiện, sau khi dùng GPT-5.5 khoảng một hai tiếng thì nó đột nhiên trở nên ngốc nghếch, mỗi yêu cầu đều trả lời ngay lập tức, chất lượng suy giảm thảm hại.

Nhưng trên giao diện hiển thị, vẫn là 'GPT-5.5 Extended Thinking'.

Nghĩa là, nhãn 'Đang suy nghĩ' vẫn còn đó, nhưng bản thân quá trình suy nghĩ đã biến mất.

200 USD/tháng, mua được một 'mô hình Schrödinger'

Trên diễn đàn dành cho nhà phát triển của OpenAI, một bài đăng phàn nàn đồng thời cũng gây bão.

Agentify.sh cho biết, GPT-5.5 đang dùng bỗng nhiên mất khả năng tuân theo chỉ thị.

Nhìn thấy nó hồ hởi thông báo 'đã sửa xong', nhưng chất lượng code tệ đến mức gây ra việc rollback trên diện rộng.

Trước đây, nhiệm vụ UI mà 5.5-med có thể dễ dàng giải quyết, giờ đây ngay cả thay đổi đơn giản nhất cũng không làm được.

Nâng cấp lên 5.5-high, vô dụng. Nâng tiếp lên xhigh, vẫn không được.

Và trước đây xhigh có thể chạy vài tiếng đồng hồ, giờ đây thời gian rõ ràng là ngắn hơn.

Ngay khi bài đăng xuất hiện, khu vực phản hồi lập tức nổ tung.

Có người trực tiếp quay về dùng 5.4.

Có người dùng mức cao nhất là xhigh, nhưng 'so với tuần trước rõ ràng tệ hơn, các nhiệm vụ dài thường xuyên sai, hoàn toàn không tuân theo quy trình làm việc'.

Có người phản ánh tình huống còn kỳ lạ hơn, 'truy vấn đơn giản cũng phải xoay vòng rất lâu, bạn ngắt nó để sửa hướng đi, nó trực tiếp phớt lờ bạn, tiếp tục đi theo kế hoạch sai trước đó'.

Không sai, tất cả mọi người đều đang mô tả cùng một hiện tượng – bộ não của GPT, không biết lúc nào đã bị thay thế lén lút.

Hiện tại, biểu hiện của GPT-5.5 cũng tương đương với 5.3, không hề ngoa ngôn chút nào. Mấy ngày đầu còn xuất sắc đến kinh ngạc, giờ thì hoàn toàn không tìm thấy bóng dáng của mô hình hồi đó nữa.

Không phải ảo giác, chính OpenAI đã ghi rõ ràng bằng giấy trắng mực đen

Để kiểm chứng, Lisan al Gaib đã đặc biệt thực hiện một bài kiểm tra so sánh.

Cùng một tài khoản, bên phía ChatGPT dùng Extended Thinking chạy ra toàn rác, quay sang bên phía Codex dùng xhigh, lập tức trở lại bình thường.

Dùng nguyên văn lời của anh ấy nói thì là, Codex 'thông minh hơn thứ này 4 tỷ lần'.

Nhà phát triển Andrew Curran thì nghĩ ra một cách hay – hỏi trực tiếp mô hình 'Ngày cắt dữ liệu huấn luyện của bạn là khi nào?'

Mô hình trả lời, tháng 8 năm 2025.

Vấn đề là, ngày cắt của GPT-5.5 Thinking là tháng 12. Tháng 8, là ngày cắt của phiên bản Instant!

Có nghĩa là, anh ấy chọn Thinking, nhưng hệ thống thực tế chạy cho anh ấy là Instant.

Nhãn mô hình trên giao diện không thay đổi một chữ nào, nhưng mô hình đằng sau đã bị thay đổi một cách lén lút......

Buồn cười là, lần này OpenAI lại tự tay cung cấp bằng chứng xác thực cho người dùng ngay trong tài liệu trợ giúp của chính mình.

Theo hướng dẫn chính thức từ Trung tâm Trợ giúp OpenAI, người dùng Plus được gửi tối đa 160 tin nhắn GPT-5.5 mỗi 3 giờ.

Sau khi dùng hết, hệ thống sẽ im lặng chuyển sang mô hình mini, cho đến khi hạn mức được đặt lại.

Chú ý hai chữ 'im lặng'.

Không có cảnh báo pop-up, không có thay đổi nhãn mô hình, không có bất kỳ phản hồi trực quan nào.

Bạn vẫn tưởng mình đang dùng mô hình cao cấp nhất, đối phương đã lặng lẽ đổi thành mini.

Người dùng Pro cũng đừng vội mừng.

Chế độ suy nghĩ Heavy, cấp độ suy luận cao nhất độc quyền cho Pro, khi tải máy chủ cao, cũng sẽ bị hạn chế dung lượng. Cũng không có cảnh báo trước.

Nói cách khác, gói đăng ký Pro 200 USD/tháng, mua được một dịch vụ bất cứ lúc nào cũng có thể bị 'đánh tráo'.

Và thao tác 'nhãn không đổi, não đã thay' kiểu này, ở phía Codex còn bị bắt quả tang sớm hơn.

Tháng 2 năm nay, một issue xuất hiện trên GitHub, một người dùng Pro dùng lệnh trace bắt được, mình yêu cầu GPT-5.3 Codex, nhưng mô hình thực tế trả về là GPT-5.2.

Ngay cả 5.2 Codex cũng không phải, mà là phiên bản cơ bản thấp hơn 5.2.

Anh ấy đã đăng lệnh tái hiện:

  • RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
  • Đầu ra: gpt-5.2-2025-12-11
  • Dự kiến: gpt-5.3-codex

Nhiều người dùng Pro khác trong cùng issue đó đã xác nhận việc hạ cấp tương tự.

Và việc hạ cấp này mang tính 'dính', không tự khôi phục, cũng không có bất kỳ giải thích nào.

Thậm chí, vào ngày phát hành GPT-5.5 tháng 4, còn có người dùng báo cáo tốc độ của chế độ Fast tương đương với Standard, nhưng tính phí vẫn theo mức Fast.

Nhiệm vụ đơn giản chạy mất 7 phút 49 giây, bình thường chỉ nên 5-6 phút.

OpenAI thừa nhận rồi, và sau đó không có gì nữa

Ngày 15 tháng 5, trang status của OpenAI xuất hiện một bản ghi.

GPT5.5 Performance Degradation, chúng tôi đang điều tra vấn đề hiệu suất GPT-5.5 suy giảm được phản ánh bởi một số người dùng.

Ngày 17 tháng 5, trạng thái được cập nhật thành 'Đã giải quyết'.

Nhưng nhìn theo dòng thời gian các bài đăng trên diễn đàn, các khiếu nại 'hạ trí' từ ngày 24-26/5 còn dữ dội hơn đợt ngày 15/5.

Hoặc là vấn đề đã 'giải quyết' lại tái diễn, hoặc là căn bản chưa từng thực sự được giải quyết.

Mỗi lần nâng cấp là một lần 'tranh cãi hạ trí'

Mặc dù các hãng đều gặp phải lời phàn nàn 'mô hình trở nên ngu ngốc', nhưng mỗi lần cập nhật từ GPT-5 đến GPT-5.5 của OpenAI, một lần cũng không vắng mặt.

Mỗi lần OpenAI đều nói đang điều tra, mỗi lần đều nói đã giải quyết, rồi phiên bản tiếp theo lại tiếp tục.

Tháng 8 năm 2025, GPT-5 ra mắt. Tiêu đề bài hot trên Reddit trực tiếp là 'GPT-5 quá tệ'. Người dùng phàn nàn về phản hồi ngắn, từ chối nhiều hơn, cảm giác cá tính ít hơn.

OpenAI buộc phải khôi phục khẩn cấp tùy chọn GPT-4o. Sam Altman trong Reddit AMA đã thừa nhận 'gập ghềnh hơn chúng tôi dự kiến'.

Tháng 12 năm 2025, GPT-5.2. Chất lượng dịch thuật thụt lùi, bịa đặt API không tồn tại, từ chối thực hiện chỉ thị phong cách mà 5.1 có thể hoàn thành dễ dàng.

Tháng 2 năm 2026, GPT-5.3-Codex. Người dùng Pro bị hạ cấp im lặng xuống 5.2, lệnh trace ra bằng chứng xác thực.

Tháng 3 năm 2026, GPT-5.4. Diễn đàn cộng đồng OpenAI xuất hiện bài đăng 'GPT-5.4 trong Codex rõ ràng đã thoái hóa', các phản hồi của người dùng đều xác nhận.

Đầu tháng 5 năm 2026, GPT-5.5 Instant ra mắt. Độ dài phản hồi rút ngắn 30%, emoji gần như biến mất. Người dùng tóm tắt: độ chính xác tăng, nhưng 'nhiệt độ' biến mất.

Cuối tháng 5 năm 2026, tức là hiện tại. Các khiếu nại hạ trí đối với chế độ Thinking lại bùng nổ.

Lisan al Gaib tiết lộ, kể từ khi GPT-5 ra mắt và anh ấy dẫn đầu cuộc chiến tranh giành hạn mức ChatGPT Plus, 'mỗi tuần đều nhận được tin nhắn riêng kiểu như vậy'.

Tin nhắn mới nhất là có người nhờ anh ấy giúp đòi lại xhigh/heavy thinking.

Ngày chạy điểm mạnh nhất, là ngày phát hành

chatgptdisaster.com đã tổng hợp 1087 khiếu nại của người dùng đã được xác minh, trong đó một loại tình huống được nhắc đi nhắc lại gọi là 'lớp định tuyến hỏng', UI hiển thị GPT-5.5 Pro, nhưng đầu ra hoàn toàn là thứ ở một đẳng cấp khác.

Người dùng mô tả một mô hình có thể tái hiện, sau phiên dài thì mô hình bắt đầu 'hoàn toàn phớt lờ những gì bạn nói', nhưng trên bộ chọn mô hình vẫn treo nhãn cấu hình cao nhất.

Chú thích phi lý nhất là, cơ chế tự động chuyển sang mini sau khi người dùng Plus dùng hết 160 tin/3 giờ, trong tài liệu chính thức của OpenAI được mô tả là một 'tính năng'.

Tại sao lại như vậy? Lisan al Gaib phân tích cho rằng, câu trả lời chỉ có hai chữ, tiết kiệm tiền.

Sự thắt chặt về năng lực tính toán và khả năng sinh lời đang ảnh hưởng đến mọi người. Mọi nơi đều tính toán chi li, không bỏ qua bất kỳ cơ hội tiết kiệm tiền nào.

Tuy nhiên, ngay trong tuần người dùng GPT-5.5 đồng loạt khiếu nại, bóng dáng GPT-5.6 đã xuất hiện trong nhật ký backend của Codex.

Mã nội bộ iris-alpha, ngữ cảnh 1.5 triệu Token, xác suất ra mắt tháng 6 do Polymarket đưa ra vượt quá 85%.

Một bên là người dùng 5.5 thậm chí không giữ được trải nghiệm cơ bản, một bên là 5.6 đã lặng lẽ chạy lưu lượng thực trong backend.

Đây chính là cuộc đua ASI năm 2026.

Tốc độ tạo ra mô hình mới ngày càng nhanh, nhưng để mô hình cũ chạy tốt một phiên làm việc lại ngày càng khó.

Ngày chạy điểm mạnh nhất mãi mãi là ngày phát hành, mỗi ngày sau đó đều là GPT Schrödinger.

Tài liệu tham khảo: https://x.com/scaling01/status/2058643470357590058?s=20

Bài viết này đến từ tài khoản công chúng WeChat "Tân Trí Nguyên" (新智元), tác giả: ASI Khải Thị Lục; Biên tập: Môi Tây (摩西)

Câu hỏi Liên quan

QNgười dùng phát hiện hiện tượng gì ở GPT-5.5 "Extended Thinking"?

ANgười dùng phát hiện rằng sau một đến hai giờ sử dụng, GPT-5.5 "Extended Thinking" trở nên kém thông minh hơn, trả lời ngay lập tức và chất lượng giảm mạnh, trong khi giao diện vẫn hiển thị nhãn "GPT-5.5 Extended Thinking".

QTheo tài liệu chính thức của OpenAI, điều gì xảy ra sau khi người dùng Plus gửi hết 160 tin nhắn GPT-5.5 trong 3 giờ?

ATheo tài liệu Trung tâm Trợ giúp chính thức của OpenAI, sau khi người dùng Plus gửi hết 160 tin nhắn GPT-5.5 trong 3 giờ, hệ thống sẽ tự động chuyển sang sử dụng mô hình mini một cách "im lặng" (không có cảnh báo hay thay đổi nhãn hiển thị) cho đến khi hạn mức được đặt lại.

QLệnh trace đã chứng minh điều gì về việc chuyển đổi mô hình?

ALệnh trace đã chứng minh rằng một người dùng Pro yêu cầu mô hình "GPT-5.3 Codex" nhưng thực tế nhận được phản hồi từ mô hình cấp thấp hơn là "GPT-5.2-2025-12-11", cho thấy việc hạ cấp mô hình diễn ra mà không có thông báo.

QPhản ứng của OpenAI trước các khiếu nại về hiệu suất GPT-5.5 là gì?

AVào ngày 15 tháng 5, OpenAI đã đăng một bản ghi trên trang trạng thái thừa nhận đang điều tra vấn đề hiệu suất GPT-5.5 và đánh dấu là "đã giải quyết" vào ngày 17 tháng 5. Tuy nhiên, các khiếu nại vẫn tiếp tục xuất hiện sau đó, cho thấy vấn đề có thể chưa được khắc phục triệt để.

QTheo bài viết, lý do cốt lõi nào được đưa ra để giải thích cho các vấn đề về hiệu suất và chuyển đổi mô hình?

ATheo phân tích trong bài viết, lý do cốt lõi được đưa ra là để tiết kiệm chi phí. Áp lực về khả năng tính toán và lợi nhuận khiến OpenAI phải cắt giảm chi phí ở mọi nơi có thể, dẫn đến việc hạ cấp mô hình một cách lén lút để giảm tải và chi phí vận hành.

Nội dung Liên quan

Sự Quan Tâm Tăng Cao Đối Với Little Pepe (LILPEPE) Đẩy Nhanh Đợt Bán Trước Với Hơn 28 Triệu USD Tài Trợ

Dự án tiền điện tử Little Pepe (LILPEPE) đang thu hút sự chú ý đáng kể với đợt mở bán trước (presale) cực kỳ thành công. Tính đến nay, dự án đã huy động được hơn 28 triệu USD, với Giai đoạn 13 đã bán được 98.46%. Đây được coi là một trong những đợt presale meme coin nhanh nhất năm 2025. LILPEPE nổi bật nhờ chiến lược phát hành với vốn hóa thị trường bằng 0, được xây dựng trên mạng Lớp 2 tương thích Ethereum và có cơ sở hạ tầng rõ ràng. Dự án áp dụng mô hình không thuế giao dịch, tích hợp cơ chế staking, bảo vệ chống bot sniper và hướng tới quản trị cộng đồng DAO. Dự án đã được kiểm toán bởi CertiK. Cộng đồng của LILPEPE rất sôi động, thể hiện qua các chương trình giveaway với tổng giải thưởng lớn, thu hút hàng trăm nghìn lượt tham gia. Sức hút của dự án còn được phản ánh qua lượng tìm kiếm trực tuyến vượt trội so với các meme coin khác như PEPE, DOGE hay SHIB. Giá token tại Giai đoạn 13 là 0.0022 USD và sẽ được niêm yết ở mức 0.0030 USD, mang lại cơ hội tăng giá cho các nhà đầu tư. Đợt presale có tổng cộng 19 giai đoạn và đang tiến gần đến lúc kết thúc.

TheNewsCrypto5 phút trước

Sự Quan Tâm Tăng Cao Đối Với Little Pepe (LILPEPE) Đẩy Nhanh Đợt Bán Trước Với Hơn 28 Triệu USD Tài Trợ

TheNewsCrypto5 phút trước

Thượng Viện Anh Kêu Gọi BoE Nới Lỏng Quy Định Stablecoin Vì Lo Ngại Về Năng Lực Cạnh Tranh

Thượng viện Vương quốc Anh (House of Lords) đã kêu gọi Ngân hàng Trung ương Anh (BoE) và các cơ quan quản lý xem xét lại một số đề xuất quy định gây tranh cãi đối với stablecoin, cảnh báo rằng các quy tắc cứng nhắc có thể khiến Anh tụt hậu trong cuộc cạnh tranh toàn cầu. Ủy ban Quy định Dịch vụ Tài chính của Thượng viện, trong một báo cáo công bố hôm thứ Tư, ủng hộ nhiều đề xuất cốt lõi của BoE như yêu cầu stablecoin phải được đảm bảo 1:1 bằng tài sản dự trữ. Tuy nhiên, họ chỉ ra rằng một số khía cạnh cần được cân nhắc thêm. Cụ thể, ủy ban đề nghị đánh giá lại đề xuất yêu cầu các nhà phát hành stablecoin hệ thống phải giữ ít nhất 40% dự trữ dưới dạng tiền gửi ngân hàng không hưởng lãi. Họ cho rằng điều này tạo gánh nặng vận hành và có thể làm suy yếu khả năng cạnh tranh của thị trường Anh. Ngoài ra, các giới hạn sở hữu được đề xuất (10.000-20.000 bảng cho cá nhân, 10 triệu bảng cho doanh nghiệp) cũng bị cho là có thể cản trở không cần thiết sự phát triển của stablecoin dựa trên đồng bảng và khó thực thi. Báo cáo nhấn mạnh rằng khung quy định cuối cùng phải linh hoạt, minh bạch và tạo sân chơi bình đẳng để stablecoin cạnh tranh với các phương thức thanh toán khác. Nếu không, Vương quốc Anh có nguy cơ "tụt lại phía sau" so với các quốc gia khác, nơi có khung pháp lý rõ ràng hơn. Lời kêu gọi này diễn ra sau khi Phó Thống đốc BoE phụ trách ổn định tài chính, Sarah Breeden, thừa nhận các đề xuất trước đó có thể đã "quá thận trọng" và ngân hàng sẵn sàng xem xét lại các quy tắc. BoE dự kiến sẽ công bố chính sách cuối cùng và dự thảo quy tắc vào cuối tháng này.

bitcoinist1 giờ trước

Thượng Viện Anh Kêu Gọi BoE Nới Lỏng Quy Định Stablecoin Vì Lo Ngại Về Năng Lực Cạnh Tranh

bitcoinist1 giờ trước

SpaceX, OpenAI, Anthropic: Ba Gã Khổng Lồ AI Đồng Loạt Chạy Đà Lên Sàn, Nên Đặt Cược Vào Ai?

**Tóm tắt Podcast: SpaceX, OpenAI, Anthropic Đua Nhau IPO - Cơn Khát Vốn AI** Trong tập podcast này, hai host Josh Kale và Ejaaz Ahamadeen thảo luận về làn sóng IPO chưa từng có từ ba gã khổng lồ AI: SpaceX, OpenAI và Anthropic. Tổng số vốn huy động dự kiến lên tới 1800 tỷ USD, lớn hơn cả tổng vốn thời bong bóng dot-com. Lý do chính là nhu cầu chi tiêu vốn (capex) cho cơ sở hạ tầng AI (như chip, trung tâm dữ liệu, điện năng) đang vượt quá khả năng tài chính từ dòng tiền tự do của chính các công ty. **Điểm nổi bật:** * **SpaceX:** IPO của họ có thể thay đổi luật lệ thị trường, với các quỹ chỉ số (index fund) và quỹ hưu trí 401(k) phải mua vào cổ phiếu một cách thụ động chỉ sau vài ngày niêm yết. Tuy nhiên, mô hình kinh doanh trung tâm dữ liệu trong vũ trụ vẫn chưa được chứng minh. * **Anthropic:** Là công ty có tốc độ tăng trưởng doanh thu ấn tượng nhất, đạt 450 tỷ USD doanh thu thường niên hóa (ARR) nhờ Claude Code và các hợp đồng doanh nghiệp. Họ dự kiến sớm có lãi và có độ phủ rộng trong nhóm Fortune 10. * **OpenAI & Google:** OpenAI cần vốn để xây dựng thêm trung tâm dữ liục phục vụ việc đào tạo mô hình. Trong khi đó, Google - một công ty đã niêm yết - cũng huy động 800 tỷ USD bên ngoài để đổ vào cuộc đua AI, phản ánh sự cấp thiết và quy mô chi tiêu khổng lồ. **Quan điểm chính:** Dù có lo ngại về rủi ro bong bóng, các host nhìn chung lạc quan. Họ cho rằng đây không phải là hiện tượng đầu cơ rỗng mà là việc xây dựng nền tảng công nghệ thiết yếu cho tương lai. Nhu cầu về sức mạnh tính toán (compute) hiện vượt xa nguồn cung, bị giới hạn bởi các ràng buộc vật lý như tốc độ sản xuất chip và xây dựng cơ sở hạ tầng. Cuộc chạy đua vốn này có thể dẫn đến một sự tái công nghiệp hóa quan trọng tại Mỹ.

marsbit2 giờ trước

SpaceX, OpenAI, Anthropic: Ba Gã Khổng Lồ AI Đồng Loạt Chạy Đà Lên Sàn, Nên Đặt Cược Vào Ai?

marsbit2 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片