Nếu bạn đã sử dụng AI vào tối ngày 29 tháng 3, rất có thể bạn đã trải qua một cuộc "mất liên lạc" đột ngột.
Tâm bão của sự cố này là nhà phát triển mô hình lớn hàng đầu trong nước - DeepSeek. Bắt đầu từ 9:35 tối hôm đó, cả phiên bản web và ứng dụng di động của họ đều xuất hiện sự cố bất thường cùng lúc: đăng nhập thất bại, hội thoại gián đoạn, nội dung bị mất, thông báo "máy chủ quá tải" tràn ngập màn hình. Đối với người dùng thông thường, đây chỉ là một bất tiện tạm thời, nhưng đối với những sinh viên đang vội hoàn thành luận văn hay những người đi làm chạy deadline, đây giống như một "thảm họa" không có cảnh báo trước.
Điều khiến người ta bực bội hơn là sự cố này không phải là sự cố sụp đổ một lần, mà là một sự cố "dao động liên tục". Khôi phục trong thời gian ngắn lúc 23h, sụp đổ lại lúc 0h, sửa chữa khẩn cấp vào lúc nửa đêm, và chỉ dần ổn định trở lại vào sáng hôm sau.
12 giờ dao động liên tục này không chỉ thiết lập kỷ lục thời gian ngừng hoạt động mới của DeepSeek, mà còn khiến người dùng nghi ngờ chưa từng có về tính ổn định của các mô hình lớn.
01 Một sự sụp đổ ngoài dự kiến, vấn đề có thực sự chỉ là "quá nhiều người"?
Sau khi sự cố xảy ra, lời giải thích đầu tiên được đưa ra là "quá nhiều người dùng, máy chủ bị quá tải".
Nghe có vẻ hợp lý, nhưng nhanh chóng bị dập tắt bởi dữ liệu thực tế. Theo bảng xếp hạng ứng dụng AI gần đây, quy mô người dùng hoạt động hàng tháng (MAU) của DeepSeek vào khoảng 150 triệu, mặc dù khá lớn nhưng không có sự tăng trưởng bùng nổ. Nói cách khác, đây không phải là một cuộc tấn công lưu lượng truy cập điển hình kiểu "vượt ra ngoài phạm vi".
Vậy thì vấn đề trở nên thú vị hơn: Nếu số lượng người dùng không đột biến, tại sao hệ thống lại mất kiểm soát hoàn toàn trong thời gian ngắn?
Câu trả lời rất có thể nằm ở cấu trúc sâu hơn.
02 Va chạm trực tiếp giữa năng lực tính toán và nhu cầu, cuộc khủng hoảng ngầm của ngành AI
Một năm qua, khả năng của mô hình lớn đã tiến hóa với tốc độ có thể nhìn thấy bằng mắt thường. Từ ngữ cảnh dài hơn, đến khả năng suy luận mạnh hơn, và sự mở rộng không ngừng của đa phương thức, "giới hạn khả năng" của mô hình liên tục được nâng cao.
Nhưng đồng thời, một vấn đề cơ bản hơn nhưng quan trọng hơn đang được phóng đại - cung cấp năng lực tính toán đang dần tiến gần đến giới hạn.
Mỗi phản hồi của mô hình lớn, về bản chất, đều là một lần tiêu thụ năng lực tính toán. Mô hình càng lớn, ngữ cảnh càng dài, suy luận càng phức tạp, thì tài nguyên tính toán cần thiết đằng sau càng cao. Khi quy mô người dùng, tần suất gọi và độ phức tạp của mô hình cùng tăng lên, áp lực lên hệ thống gần như là kết quả tất yếu.
Cũng trong bối cảnh này, sự cố ngừng hoạt động của DeepSeek lần này không còn chỉ là sự cố đơn điểm, mà giống như một "bài kiểm tra áp lực hệ thống".
Theo thông tin hiển thị trên nền tảng Tianyancha, chủ thể liên quan đến DeepSeek đã và đang tăng cường bố trí trong lĩnh vực nghiên cứu và phát triển thuật toán AI và cơ sở hạ tầng năng lực tính toán, đầu tư công nghệ liên kết và hợp tác ngành không ngừng được tăng cường.
Trên thực tế, không chỉ mình DeepSeek chịu áp lực. Gần đây, một số nhà cung cấp, bao gồm MiniMax, đã bắt đầu hạn chế tần suất gọi trong giờ cao điểm, và các nhà cung cấp dịch vụ năng lực tính toán như Alibaba Cloud cũng đang điều chỉnh chiến lược giá cả ở các mức độ khác nhau.
Bề ngoài, đây là hành vi thương mại, nhưng đằng sau phản ánh một thực tế giống nhau - cung cấp cơ sở hạ tầng AI đang không theo kịp tốc độ tăng trưởng của nhu cầu.
03 Cơn sốt "nuôi tôm hùm", bộ khuếch đại lưu lượng bị bỏ qua
Trong sự kiện này, còn có một yếu tố dễ bị bỏ qua nhưng có sức ảnh hưởng lớn - cách chơi gọi là "nuôi tôm hùm".
Về bản chất, cách chơi này là liên tục gọi API đến mô hình, để AI tự động thực hiện nhiệm vụ, thuộc dạng ứng dụng Agent thời kỳ đầu. So với hội thoại thông thường, tần suất gọi loại này cực cao, thậm chí có thể đạt đến mức kích hoạt theo phút hoặc thậm chí theo giây.
Khi một lượng nhỏ người dùng sử dụng, nó chỉ là một thử nghiệm thú vị; nhưng một khi hình thành quy mô, nó sẽ nhanh chóng trở thành "bộ khuếch đại" tiêu thụ năng lực tính toán. Điều này cũng giải thích tại sao khi tổng số người dùng không thay đổi đáng kể, hệ thống vẫn có thể xảy ra tình trạng giống như "tuyết lở".
Ở một mức độ nào đó, sự cố ngừng hoạt động này thực chất là một trường hợp điển hình về "ứng dụng mới đột phá cơ sở hạ tầng cũ".
04 V4 sắp ra mắt, áp lực lớn hơn đằng sau sự kỳ vọng
Điều thú vị là, sự cố ngừng hoạt động kéo dài 12 giờ này không làm suy yếu rõ rệt sự kỳ vọng của thị trường đối với DeepSeek, mà ngược lại còn làm tăng mức độ chú ý ở một mức độ nào đó.
Lý do rất đơn giản - mô hình thế hệ tiếp theo V4 sắp ra mắt.
Thông tin lưu truyền trong ngành hiện nay cho thấy, DeepSeek V4 sẽ đạt được bước nhảy vọt ở nhiều khả năng then chốt: độ dài ngữ cảnh dự kiến sẽ tăng từ 128K tokens lên đến hàng triệu tokens, khả năng đa phương thức và khả năng thực thi Agent cũng sẽ được tăng cường đồng thời. Quan trọng hơn, việc thích ứng năng lực tính toán của nó có thể tiếp tục nghiêng về hệ thống chip nội địa, điều này có ý nghĩa không nhỏ đối với hệ sinh thái AI trong nước.
Nhưng vấn đề cũng rõ ràng: khi khả năng của mô hình được nâng cao hơn nữa, nhu cầu về năng lực tính toán cũng sẽ được khuếch đại đồng thời. Nếu cơ sở hạ tầng nền tảng không được nâng cấp đồng bộ, thì những vấn đề về tính ổn định tương tự rất có thể sẽ xuất hiện trở lại.
05 Từ "cạnh tranh mô hình" đến "cạnh tranh cơ sở hạ tầng"
Nhìn lại sự kiện này, ý nghĩa của nó có lẽ đã vượt ra ngoài phạm vi sản phẩm đơn lẻ.
Hai năm qua, trọng tâm cạnh tranh của ngành mô hình lớn luôn xoay quanh "khả năng" - ai thông minh hơn, ai mạnh mẽ hơn, ai dẫn đầu trên Benchmark. Nhưng khi quy mô ứng dụng mở rộng, một khía cạnh mới đang xuất hiện: tính ổn định và chi phí.
Người dùng bắt đầu quan tâm không chỉ là "dùng được hay không", mà là "có thể dùng liên tục hay không"; doanh nghiệp quan tâm cũng không chỉ là chỉ số hiệu suất, mà là chi phí vận hành tổng thể và tính bền vững.
Nói cách khác, cạnh tranh AI đang chuyển từ "lớp mô hình" sang "lớp cơ sở hạ tầng".
Sự cố ngừng hoạt động 12 giờ của DeepSeek lần này, giống như một lời nhắc nhở đến sớm: khi AI thực sự bước vào giai đoạn ứng dụng quy mô lớn, thứ quyết định thắng thua, chưa chắc đã là bản thân mô hình, mà là năng lực tính toán, kiến trúc và năng lực kỹ thuật đằng sau.
06 Kết luận: Một sự cố bất ngờ, hay một tín hiệu?
Vậy, 12 giờ này thực sự có ý nghĩa gì?
Nó vừa có thể được xem là một sự cố ngoài ý muốn trong quá trình phát triển, vừa có thể được hiểu là một "cảnh báo cấu trúc". Cái trước liên quan đến cá nhân, cái sau liên quan đến ngành.
Có thể chắc chắn rằng, khi ứng dụng AI không ngừng đi sâu, những bài kiểm tra áp lực tương tự sẽ tiếp tục xuất hiện. Và mỗi lần dao động, sẽ thúc đẩy toàn ngành tiến thêm một bước đến giai đoạn trưởng thành hơn.
Theo một nghĩa nào đó, sự sụp đổ lần này của DeepSeek không phải là kết thúc, mà là một sự khởi đầu.
Cuối cùng cũng muốn hỏi một câu: Trong 12 giờ đó, bạn đã dùng AI để làm gì?
Bài viết từ tài khoản WeChat công cộng "铑科技", tác giả: 铑科技









