【Dẫn nhập】 GPT-5.5 bị lật tẩy 'suy nghĩ giả', bị thay lén bằng phiên bản mini chỉ sau hai giờ sử dụng. 200 USD phí hàng tháng mua được 'bộ não Schrödinger'. Lệnh trace ra bằng chứng xác thực, tài liệu chính thức tự tay nhận tội. Người dùng sau đó ùn ùn lên tiếng phàn nàn: OpenAI, các người đang đùa với ai vậy?
ChatGPT lại bị tố 'hạ trí' rồi!
Ngay trong hai ngày qua, X (Twitter) nổ ra trước tiên.
Người dùng Lisan al Gaib phát hiện, sau khi dùng GPT-5.5 khoảng một hai tiếng thì nó đột nhiên trở nên ngốc nghếch, mỗi yêu cầu đều trả lời ngay lập tức, chất lượng suy giảm thảm hại.
Nhưng trên giao diện hiển thị, vẫn là 'GPT-5.5 Extended Thinking'.
Nghĩa là, nhãn 'Đang suy nghĩ' vẫn còn đó, nhưng bản thân quá trình suy nghĩ đã biến mất.
200 USD/tháng, mua được một 'mô hình Schrödinger'
Trên diễn đàn dành cho nhà phát triển của OpenAI, một bài đăng phàn nàn đồng thời cũng gây bão.
Agentify.sh cho biết, GPT-5.5 đang dùng bỗng nhiên mất khả năng tuân theo chỉ thị.
Nhìn thấy nó hồ hởi thông báo 'đã sửa xong', nhưng chất lượng code tệ đến mức gây ra việc rollback trên diện rộng.
Trước đây, nhiệm vụ UI mà 5.5-med có thể dễ dàng giải quyết, giờ đây ngay cả thay đổi đơn giản nhất cũng không làm được.
Nâng cấp lên 5.5-high, vô dụng. Nâng tiếp lên xhigh, vẫn không được.
Và trước đây xhigh có thể chạy vài tiếng đồng hồ, giờ đây thời gian rõ ràng là ngắn hơn.
Ngay khi bài đăng xuất hiện, khu vực phản hồi lập tức nổ tung.
Có người trực tiếp quay về dùng 5.4.
Có người dùng mức cao nhất là xhigh, nhưng 'so với tuần trước rõ ràng tệ hơn, các nhiệm vụ dài thường xuyên sai, hoàn toàn không tuân theo quy trình làm việc'.
Có người phản ánh tình huống còn kỳ lạ hơn, 'truy vấn đơn giản cũng phải xoay vòng rất lâu, bạn ngắt nó để sửa hướng đi, nó trực tiếp phớt lờ bạn, tiếp tục đi theo kế hoạch sai trước đó'.
Không sai, tất cả mọi người đều đang mô tả cùng một hiện tượng – bộ não của GPT, không biết lúc nào đã bị thay thế lén lút.
Hiện tại, biểu hiện của GPT-5.5 cũng tương đương với 5.3, không hề ngoa ngôn chút nào. Mấy ngày đầu còn xuất sắc đến kinh ngạc, giờ thì hoàn toàn không tìm thấy bóng dáng của mô hình hồi đó nữa.
Không phải ảo giác, chính OpenAI đã ghi rõ ràng bằng giấy trắng mực đen
Để kiểm chứng, Lisan al Gaib đã đặc biệt thực hiện một bài kiểm tra so sánh.
Cùng một tài khoản, bên phía ChatGPT dùng Extended Thinking chạy ra toàn rác, quay sang bên phía Codex dùng xhigh, lập tức trở lại bình thường.
Dùng nguyên văn lời của anh ấy nói thì là, Codex 'thông minh hơn thứ này 4 tỷ lần'.
Nhà phát triển Andrew Curran thì nghĩ ra một cách hay – hỏi trực tiếp mô hình 'Ngày cắt dữ liệu huấn luyện của bạn là khi nào?'
Mô hình trả lời, tháng 8 năm 2025.
Vấn đề là, ngày cắt của GPT-5.5 Thinking là tháng 12. Tháng 8, là ngày cắt của phiên bản Instant!
Có nghĩa là, anh ấy chọn Thinking, nhưng hệ thống thực tế chạy cho anh ấy là Instant.
Nhãn mô hình trên giao diện không thay đổi một chữ nào, nhưng mô hình đằng sau đã bị thay đổi một cách lén lút......
Buồn cười là, lần này OpenAI lại tự tay cung cấp bằng chứng xác thực cho người dùng ngay trong tài liệu trợ giúp của chính mình.
Theo hướng dẫn chính thức từ Trung tâm Trợ giúp OpenAI, người dùng Plus được gửi tối đa 160 tin nhắn GPT-5.5 mỗi 3 giờ.
Sau khi dùng hết, hệ thống sẽ im lặng chuyển sang mô hình mini, cho đến khi hạn mức được đặt lại.
Chú ý hai chữ 'im lặng'.
Không có cảnh báo pop-up, không có thay đổi nhãn mô hình, không có bất kỳ phản hồi trực quan nào.
Bạn vẫn tưởng mình đang dùng mô hình cao cấp nhất, đối phương đã lặng lẽ đổi thành mini.
Người dùng Pro cũng đừng vội mừng.
Chế độ suy nghĩ Heavy, cấp độ suy luận cao nhất độc quyền cho Pro, khi tải máy chủ cao, cũng sẽ bị hạn chế dung lượng. Cũng không có cảnh báo trước.
Nói cách khác, gói đăng ký Pro 200 USD/tháng, mua được một dịch vụ bất cứ lúc nào cũng có thể bị 'đánh tráo'.
Và thao tác 'nhãn không đổi, não đã thay' kiểu này, ở phía Codex còn bị bắt quả tang sớm hơn.
Tháng 2 năm nay, một issue xuất hiện trên GitHub, một người dùng Pro dùng lệnh trace bắt được, mình yêu cầu GPT-5.3 Codex, nhưng mô hình thực tế trả về là GPT-5.2.
Ngay cả 5.2 Codex cũng không phải, mà là phiên bản cơ bản thấp hơn 5.2.
Anh ấy đã đăng lệnh tái hiện:
- RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
- Đầu ra: gpt-5.2-2025-12-11
- Dự kiến: gpt-5.3-codex
Nhiều người dùng Pro khác trong cùng issue đó đã xác nhận việc hạ cấp tương tự.
Và việc hạ cấp này mang tính 'dính', không tự khôi phục, cũng không có bất kỳ giải thích nào.
Thậm chí, vào ngày phát hành GPT-5.5 tháng 4, còn có người dùng báo cáo tốc độ của chế độ Fast tương đương với Standard, nhưng tính phí vẫn theo mức Fast.
Nhiệm vụ đơn giản chạy mất 7 phút 49 giây, bình thường chỉ nên 5-6 phút.
OpenAI thừa nhận rồi, và sau đó không có gì nữa
Ngày 15 tháng 5, trang status của OpenAI xuất hiện một bản ghi.
GPT5.5 Performance Degradation, chúng tôi đang điều tra vấn đề hiệu suất GPT-5.5 suy giảm được phản ánh bởi một số người dùng.
Ngày 17 tháng 5, trạng thái được cập nhật thành 'Đã giải quyết'.
Nhưng nhìn theo dòng thời gian các bài đăng trên diễn đàn, các khiếu nại 'hạ trí' từ ngày 24-26/5 còn dữ dội hơn đợt ngày 15/5.
Hoặc là vấn đề đã 'giải quyết' lại tái diễn, hoặc là căn bản chưa từng thực sự được giải quyết.
Mỗi lần nâng cấp là một lần 'tranh cãi hạ trí'
Mặc dù các hãng đều gặp phải lời phàn nàn 'mô hình trở nên ngu ngốc', nhưng mỗi lần cập nhật từ GPT-5 đến GPT-5.5 của OpenAI, một lần cũng không vắng mặt.
Mỗi lần OpenAI đều nói đang điều tra, mỗi lần đều nói đã giải quyết, rồi phiên bản tiếp theo lại tiếp tục.
Tháng 8 năm 2025, GPT-5 ra mắt. Tiêu đề bài hot trên Reddit trực tiếp là 'GPT-5 quá tệ'. Người dùng phàn nàn về phản hồi ngắn, từ chối nhiều hơn, cảm giác cá tính ít hơn.
OpenAI buộc phải khôi phục khẩn cấp tùy chọn GPT-4o. Sam Altman trong Reddit AMA đã thừa nhận 'gập ghềnh hơn chúng tôi dự kiến'.
Tháng 12 năm 2025, GPT-5.2. Chất lượng dịch thuật thụt lùi, bịa đặt API không tồn tại, từ chối thực hiện chỉ thị phong cách mà 5.1 có thể hoàn thành dễ dàng.
Tháng 2 năm 2026, GPT-5.3-Codex. Người dùng Pro bị hạ cấp im lặng xuống 5.2, lệnh trace ra bằng chứng xác thực.
Tháng 3 năm 2026, GPT-5.4. Diễn đàn cộng đồng OpenAI xuất hiện bài đăng 'GPT-5.4 trong Codex rõ ràng đã thoái hóa', các phản hồi của người dùng đều xác nhận.
Đầu tháng 5 năm 2026, GPT-5.5 Instant ra mắt. Độ dài phản hồi rút ngắn 30%, emoji gần như biến mất. Người dùng tóm tắt: độ chính xác tăng, nhưng 'nhiệt độ' biến mất.
Cuối tháng 5 năm 2026, tức là hiện tại. Các khiếu nại hạ trí đối với chế độ Thinking lại bùng nổ.
Lisan al Gaib tiết lộ, kể từ khi GPT-5 ra mắt và anh ấy dẫn đầu cuộc chiến tranh giành hạn mức ChatGPT Plus, 'mỗi tuần đều nhận được tin nhắn riêng kiểu như vậy'.
Tin nhắn mới nhất là có người nhờ anh ấy giúp đòi lại xhigh/heavy thinking.
Ngày chạy điểm mạnh nhất, là ngày phát hành
chatgptdisaster.com đã tổng hợp 1087 khiếu nại của người dùng đã được xác minh, trong đó một loại tình huống được nhắc đi nhắc lại gọi là 'lớp định tuyến hỏng', UI hiển thị GPT-5.5 Pro, nhưng đầu ra hoàn toàn là thứ ở một đẳng cấp khác.
Người dùng mô tả một mô hình có thể tái hiện, sau phiên dài thì mô hình bắt đầu 'hoàn toàn phớt lờ những gì bạn nói', nhưng trên bộ chọn mô hình vẫn treo nhãn cấu hình cao nhất.
Chú thích phi lý nhất là, cơ chế tự động chuyển sang mini sau khi người dùng Plus dùng hết 160 tin/3 giờ, trong tài liệu chính thức của OpenAI được mô tả là một 'tính năng'.
Tại sao lại như vậy? Lisan al Gaib phân tích cho rằng, câu trả lời chỉ có hai chữ, tiết kiệm tiền.
Sự thắt chặt về năng lực tính toán và khả năng sinh lời đang ảnh hưởng đến mọi người. Mọi nơi đều tính toán chi li, không bỏ qua bất kỳ cơ hội tiết kiệm tiền nào.
Tuy nhiên, ngay trong tuần người dùng GPT-5.5 đồng loạt khiếu nại, bóng dáng GPT-5.6 đã xuất hiện trong nhật ký backend của Codex.
Mã nội bộ iris-alpha, ngữ cảnh 1.5 triệu Token, xác suất ra mắt tháng 6 do Polymarket đưa ra vượt quá 85%.
Một bên là người dùng 5.5 thậm chí không giữ được trải nghiệm cơ bản, một bên là 5.6 đã lặng lẽ chạy lưu lượng thực trong backend.
Đây chính là cuộc đua ASI năm 2026.
Tốc độ tạo ra mô hình mới ngày càng nhanh, nhưng để mô hình cũ chạy tốt một phiên làm việc lại ngày càng khó.
Ngày chạy điểm mạnh nhất mãi mãi là ngày phát hành, mỗi ngày sau đó đều là GPT Schrödinger.
Tài liệu tham khảo: https://x.com/scaling01/status/2058643470357590058?s=20
Bài viết này đến từ tài khoản công chúng WeChat "Tân Trí Nguyên" (新智元), tác giả: ASI Khải Thị Lục; Biên tập: Môi Tây (摩西)





















