Ngành AI bất ngờ dậy sóng!
Anthropic ra cảnh báo cho toàn nhân loại: Dừng nghiên cứu AI!
Dữ liệu nội bộ của Anthropic cho thấy, AI đang đẩy nhanh sự phát triển của chính AI, con đường dẫn đến việc tự cải tiến đệ quy có lẽ đã xuất hiện.
Nói cách khác, AI đang tiến gần đến điểm tới hạn "tự tạo ra chính mình".
Quá trình này diễn ra nhanh hơn Anthropic dự kiến, vì vậy Anthropic kêu gọi làm chậm hoặc tạm dừng nghiên cứu AI.
Trong khi đó, Yann Dubois, trưởng nhóm hậu huấn luyện của OpenAI, trong một cuộc phỏng vấn mới nhất, đã đưa ra một góc nhìn vi mô hơn nhưng cũng đáng suy ngẫm:
Tiến hóa của AI không phải là đột nhiên khai ngoại, mà là vừa vượt qua ngưỡng đủ tiêu chuẩn!
Trong cuộc phỏng vấn mới nhất, anh ấy tiết lộ nhiều góc nhìn nội bộ:
Sự tăng trưởng năng lực của AI là tuyến tính, liên tục, nhưng tính "hữu dụng" mà người dùng cảm nhận lại là rời rạc, nhảy vọt.
Bởi vì trước khi đạt đến một "ngưỡng tin cậy" nào đó, AI chỉ là một món đồ chơi biết làm trò ảo thuật; một khi vượt qua điểm đó, nó trở thành một nhân viên có thể giao phó công việc, và sẽ tự tăng tốc.
Ngưỡng này, OpenAI mới vượt qua vào khoảng tháng 12 năm ngoái.
Ngoài ra, Yann Dubois đưa ra một luận điểm phản trực giác: việc xây dựng AI giống "thủ công (Craft)" hơn là "khoa học".
Nhận thức này cực kỳ căng thẳng: trong lĩnh vực nhấn mạnh sức mạnh tính toán cứng này, cuối cùng thắng thế lại là "flare (trực giác/cảm hứng)" giống như thuật giả kim.
Anh ấy còn đề xuất "lợi ích AI cây số cuối".
Nếu đóng băng tất cả các mô hình ngay bây giờ, chỉ dựa vào việc làm ứng dụng chuyên sâu (Harness), chúng ta thực ra đã có thể đạt được AGI rồi.
Nút thắt không nằm ở bộ não mô hình, mà ở "quyền hạn, kết nối và dữ liệu". Điều này trực tiếp làm nản lòng các nhà phát triển đang quan sát, đồng thời cũng chỉ ra vị trí của mỏ vàng.
Ngưỡng tin cậy đã vượt qua, AI tự tăng tốc
Vài tuần qua, cộng đồng AI sôi động không ngừng: GPT5.5 ra mắt, Claude Mythos cũng xuất hiện.
Đặc biệt trong lĩnh vực an ninh mạng, mã hóa tác tử AI, cảm giác thực sự là mỗi ngày mỗi khác, tiến bộ của AI khiến người ta cảm thấy như đột nhiên "nhảy một bước lớn".
Cách nói của Dubois rất thẳng thắn: Khả năng thực sự tăng lên khá liên tục, lý do mọi người cảm thấy như ngồi tên lửa, là vì ở giữa có một "ngưỡng cửa tin cậy" ngăn cách.
Trước khi vượt qua ngưỡng cửa, AI giống như một thực tập sinh thông minh nhưng hay gây rắc rối: biết viết, biết tính toán, biết đưa ý tưởng, nhưng bạn không dám giao hoàn toàn công việc cho nó.
Sau khi vượt qua ngưỡng cửa, bạn mới dám để nó "thực sự nhận việc".
Anh ấy phán đoán OpenAI đại khái đã vượt qua ranh giới này vào "tháng 12 năm ngoái", từ đó mới xuất hiện cảm nhận "nhảy vọt theo cấp số nhân" từ bên ngoài.
Kích thích hơn là nguyên nhân thứ hai: khi mô hình đủ tốt, nó sẽ đẩy nhanh chính quá trình nghiên cứu và phát triển.
Đây là điều Anthropic lo lắng nhất.
Dubois đề cập, đặc biệt trong bối cảnh lập trình, các nhà nghiên cứu tự viết mã mỗi ngày, mô hình càng mạnh, tương đương với toàn bộ nhân viên có thêm một đối tác không ngủ – vừa có thể giúp nhà nghiên cứu xây dựng chuỗi công cụ, cũng có thể "dùng AI nuôi AI" khi huấn luyện thế hệ mô hình tiếp theo.
Một khi vòng lặp tăng tốc bắt đầu quay, nó sẽ quay càng ngày càng nhanh, vài tháng gần đây "ngày càng mạnh mẽ" không có gì lạ.
Điều này cũng xảy ra trong nội bộ Anthropic, đến quý 2 năm 2026, số lượng mã mỗi người đóng góp mỗi quý đã gấp 8 lần so với quý 1 năm 2024.
Động lực thúc đẩy thứ ba, đến từ sự "chuyển đổi nâng cấp" của học tăng cường (RL).
Những mô hình suy luận ban đầu như o1, chủ yếu tập trung vào các nhiệm vụ "phần thưởng có thể xác minh" – bài toán toán, cuộc thi lập trình, vì đúng sai rõ ràng, phần thưởng dễ định nghĩa.
Nhưng một năm qua, họ đã chuyển bộ công cụ tập luyện trong cuộc thi đó sang các tình huống công việc thực tế hơn, mơ hồ hơn: không chỉ tối ưu hóa "bài có đáp án chuẩn", mà tối ưu hóa "thứ người dùng thực sự thấy hữu ích".
Một câu: từ tuyển thủ luyện bài, bắt đầu tiến hóa thành người lao động thực tế.
Kỹ sư AI không phải là nhà khoa học, AI là "nuôi" ra
Nhưng một khi bước vào thế giới thực, rắc rối liền kéo đến: làm thế nào nâng cao độ tin cậy?
Dubois đưa ra một "mô hình xác suất" rất thẳng thắn:
Vì hiện nay nhiều hệ thống là tác tử AI (agentic), bạn có thể nghĩ một cách thô thiển là "cứ hai phút có một xác suất nhất định phạm sai lầm"; thời gian chạy càng lâu, xác suất câu trả lời cuối cùng gặp sự cố càng cao.
Vì vậy, cái gọi là "nâng cao độ tin cậy", bản chất là liên tục đẩy tỷ lệ "sai số mỗi hai phút" này xuống.
Đây là xương cứng vốn có của tác tử AI.
Điều này cũng giải thích tại sao Dubois nói, việc xây dựng AI giống "công việc thủ công" hơn, không giống "thí nghiệm khoa học" trong sách giáo khoa.
Quy trình thực tế thường là: trước hết dựa vào kinh nghiệm, trực giác, thử đi thử lại để tạo ra sản phẩm, thậm chí mang chút hương vị "thuật giả kim"; chờ khi nó thực sự chạy được, thực sự dùng được, mới quay lại bổ sung giải thích và phương pháp luận khoa học hơn.
Anh ấy còn đề cập đến một giai thoại nhỏ đầy tính đảo ngược –
Năm đó ChatGPT công khai nói đã sử dụng RL, phản ứng đầu tiên của anh ấy là "quá phức tạp, dùng tinh chỉnh có giám sát (SFT) là đủ", đây cũng chính là ý tưởng anh ấy muốn kiểm chứng khi làm Alpaca ở Stanford.
Nhưng sau đó sự thật cho thấy, một khi quy mô mô hình vượt qua một mức độ nào đó, RL thực sự sẽ "đột nhiên bắt đầu hữu ích", chỉ là chi phí không thấp – lấy mẫu nhiều câu trả lời, phán đoán cái nào đúng, cái nào sai, tính toán và hệ thống kỹ thuật đều rất tốn kém.
Harness lĩnh vực chuyên sâu đã đạt đến AGI
Nói đến "kéo AI vào thực tế", không thể bỏ qua từ được giới khởi nghiệp yêu thích gần đây: Harness (hệ thống sắp xếp).
Có người coi nó là "khung xương ngoại lai" của tác tử AI, cũng có người nghi ngờ nó sớm muộn cũng bị mô hình "nuốt chửng".
Thái độ của Dubois rất thực tế:
Trong ngắn hạn, Harness cho các tình huống chuyên sâu rất có giá trị, có thể đẩy độ tin cậy từ 80% lên 85%.
Nhưng điều kiện tiên quyết là bạn phải chấp nhận: mô hình đang tiếp tục mạnh lên, Harness cũng phải liên tục điều chỉnh lại.
Muốn tạo ra một "Harness chung" ổn định lâu dài, áp dụng khắp nơi, anh ấy cho rằng về cơ bản không thể đi được.
Thậm chí anh ấy còn ném ra một phán đoán rất "khiêu khích": Nếu hôm nay "đóng băng" các mô hình hiện có, chỉ chăm chỉ mài giũa Harness và tập luyện xung quanh nó, nhiều người trong các lĩnh vực có thể sẽ "cảm nhận rõ ràng hương vị của trí tuệ nhân tạo chung (AGI)".
Cây số cuối cùng
Nhưng điều thực sự khiến Dubois vừa hào hứng vừa nhăn mặt, là vấn đề khó nhằn lâu nay: "Học liên tục (continual learning)".
Ba năm trước khi ChatGPT mới nổi, anh ấy và bạn bè thậm chí đã thảo luận nghiêm túc về việc có nên khởi nghiệp làm bộ nhớ cá nhân hóa và học liên tục hay không.
Lúc đó họ nghĩ "trong vòng 6 tháng OpenAI sẽ giải quyết", nên không làm; ba năm sau anh ấy đã vào OpenAI, nhưng phát hiện việc này vẫn chưa thực sự được giải quyết.
Mô hình hiện nay đang ở trong tình trạng khó xử: ngày đầu nhảy dù vào công ty, có thể hữu ích hơn hầu hết nhân viên mới (điểm xuất phát cao); nhưng sau đó về cơ bản "giữ nguyên trạng", bởi vì nó không thể càng làm càng hiểu bạn, càng làm càng hiệu quả trong môi trường cụ thể.
Đường cong học tập của con người là leo lên, đường cong này của AI lại dễ trở nên bằng phẳng.
Biến đường cong của AI từ "phẳng" thành "liên tục tăng", Dubois cho rằng sẽ là một trong những vấn đề quan trọng nhất tiếp theo.
Vậy, công ty khởi nghiệp còn có không gian để làm ứng dụng chuyên sâu không?
Dubois đưa ra câu trả lời rất dứt khoát: không những có, mà còn rất lớn.
Bởi vì nút thắt thực sự thường không phải là "mô hình có đủ thông minh không", mà là cây số cuối cùng – làm thế nào cấp quyền, kết nối dữ liệu ra sao, làm thế nào kết nối các đầu nối, làm thế nào nhúng vào quy trình nghiệp vụ cụ thể.
Mô hình lớn bay trên trời cao thế nào, không đáp đất cũng chỉ có thể làm pháo hoa; mà kéo nó xuống mặt đất, để nó lấy được chìa khóa nên lấy, mở cánh cửa nên mở, ngược lại là công việc khổ cực có hàm lượng vàng cao nhất.
Tài liệu tham khảo:
https://x.com/Potatoloogs/status/2062494654885749126
https://www.youtube.com/watch?v=DhD1zZ8w8Mw&t=3s
Bài viết này đến từ tài khoản WeChat công cộng "Tân Trí Nguyên", tác giả: ASI Khải Thị Lục


















