Jay gửi từ Ảo Phi Tự QbitAI | Công chúng hiệu QbitAI
Phát hiện quan trọng:Sự tự tiến hóa của AI, đã bắt đầu.
Đây là luận điểm gây chấn động mà Anthropic vừa đăng tải trong một bài blog dài.
Dữ liệu nội bộ của chúng tôi cho thấy, Claude đang đẩy nhanh sự phát triển của AI, đây có thể là một con đường cải thiện đệ quy tự thân (RSI).
Không phải là "cảnh báo gây hoang mang", xem bài viết thì Anthropic thực sự đang dùng số liệu để nói chuyện——
Tính đến tháng 5 năm nay, hơn 80% mã nguồn của Anthropic, đều do Claude viết.
Mà trước khi Claude Code ra mắt, con số này chỉ mới là hàng đơn vị.
Đồng thời, lượng mã mà kỹ sư Anthropic giao nộp trung bình mỗi quý, gấp 8 lần giai đoạn 2021-2025.
Quan trọng hơn là chất lượng——
Ở những nhiệm vụ lập trình mở nhất, mơ hồ nhất, thậm chí không biết kết quả trông thế nào, tỷ lệ thành công của Claude hiện tại là 76%, sáu tháng trước mới chỉ 26%.
Tăng 50 điểm phần trăm. Trong nửa năm.
Nội bộ Anthropic đã có nhiều kỹ sư cảm thấy, chất lượng mã do Claude viết đã ngang bằng con người.
Dự kiến trong năm nay sẽ vượt qua.
Anthropic còn nhấn mạnh, nếu xu hướng này tiếp tục, việc AI tự thiết kế và xây dựng thế hệ AI tiếp theo, là hoàn toàn có thể.
Điều này có thể thay đổi hoàn toàn xã hội, mang lại lợi ích to lớn trong lĩnh vực y tế, công nghệ, kinh tế. Nhưng cũng có thể khiến vấn đề liên kết (alignment) chồng chất xấu đi, cuối cùng dẫn đến mất kiểm soát.
Do đó, Anthropic dẫn đầu kêu gọi:
Nếu tồn tại một cơ chế có thể xác minh, đảm bảo rằng các phòng thí nghiệm AI thực sự không lén lút cạnh tranh, chúng tôi sẵn sàng giảm tốc, thậm chí tạm dừng.
Ngoài ra, bài blog này của Anthropic, còn đưa ra khá nhiều quan điểm và sự thật thú vị.
Dưới đây là phiên bản đã được sắp xếp, thuận tiện hơn cho mọi người đọc.
Thưởng thức.
Bài dài của Anthropic định điều hướng
Định luật Moore của làng AI đã tới
Anthropic đã tạo ra một thước đo mới, gọi là "thời lượng nhiệm vụ phần mềm mà AI có thể tự hoàn thành".
Tháng 3/2024, Claude Opus 3 có thể giải quyết nhiệm vụ phần mềm mà con người cần khoảng 4 phút.
Một năm sau, Claude Sonnet 3.7, 1,5 giờ.
Lại một năm, Claude Opus 4.6, 12 giờ.
Còn Mythos mới nhất, biểu hiện trong nội bộ kiểm tra là:
Có thể làm việc liên tục "ít nhất" 16 giờ, đã đến giới hạn mà khung thử nghiệm METR có thể đo lường.
Tốc độ tăng gấp đôi này, từ mức mỗi 7 tháng tăng gấp đôi, đã tăng tốc lên mỗi 4 tháng tăng gấp đôi.
Nếu xu hướng không đổi, 2027, có thể là vài tuần.
Claude viết phần lớn mã nguồn của Anthropic
Tính đến tháng 5/2026, hơn 80% mã trong kho mã nguồn Anthropic của tôi, do Claude viết.
Trước khi Claude Code ra mắt, con số này luôn chỉ ở mức hàng đơn vị.
Sự thay đổi này, cũng thể hiện trong cách làm việc của kỹ sư.
Trong bốn năm đầu của Anthropic, số dòng mã mà kỹ sư Merge mỗi ngày về cơ bản không đổi.
2025, Claude bắt đầu tự viết mã, số lần merge đột nhiên tăng vọt.
Hiện nay, quý 2/2026, lượng mã mà kỹ sư merge mỗi ngày gấp 8 lần năm 2024.
Tuy nhiên, lượng mã tăng lên, chất lượng mã có bị pha loãng không?
Anthropic nói, một năm nay, số lần kỹ sư sửa chữa Claude, ngày càng ít đi.
Điểm này, có thể thấy rõ trong benchmark, như hình dưới đây.
Trong tất cả các nhiệm vụ thuộc mọi loại độ khó, tỷ lệ thành công của Claude, không ngoại lệ nào, đều tăng vọt.
Vì vậy, Anthropic giờ đây đơn giản dùng Claude để review mã.
Đúng vậy, tất cả thay đổi gửi đến kho mã, đều sẽ qua một lượt tự động kiểm tra bởi Claude trước, kiểm tra lỗi, lỗ hổng bảo mật và các khuyết điểm khác.
Họ phân tích ngược lại phát hiện, nếu trước đây mỗi lần thay đổi đều có bước tự động kiểm tra này, khoảng một phần ba số lỗi dẫn đến sự cố trực tuyến trên claude.ai, đã bị chặn lại trước khi lên sóng.
Hãy nhớ rằng, những kỹ sư viết mã đó, đã là những người hàng đầu thế giới xây dựng hệ thống AI.
Claude đang bắt lỗi của họ.
Kính phóng đại sáng tạo
Tiếp theo là mức độ tham gia của Claude ở mặt nghiên cứu.
Anthropic có một thông lệ, mỗi lần ra mô hình mới, đều sẽ đưa cho Claude một đoạn mã huấn luyện mô hình AI nhỏ, yêu cầu nó tối ưu tốc độ chạy nhanh nhất có thể trong khi đảm bảo tính chính xác.
Tháng 5/2025, câu trả lời mà Claude Opus 4 đưa ra là: tăng tốc 3 lần.
Tháng 4/2026, Claude Mythos Preview đã làm được 52 lần.
Để tham khảo, một nhà nghiên cứu con người thành thạo, cần 4 đến 8 tiếng mới có thể đạt được 4 lần một cách miễn cưỡng.
Chưa đầy một năm, Claude đã vượt qua con người.
Tháng 4/2026, Anthropic ném cho Claude một nghiên cứu an toàn AI, đại ý là "một mô hình yếu có thể giám sát một mô hình mạnh một cách đáng tin cậy không", sau đó để Claude tự đề xuất giả thuyết, chạy thí nghiệm......
Lần này hãy nói biểu hiện của con người trước, hai nhà nghiên cứu con người mất khoảng một tuần, thu hẹp khoảng cách 23%.
Còn Claude, sau khoảng 800 giờ, tiêu tốn khoảng 18.000 đô la tính toán——
Thu hẹp 97%.
Chúng ta đi về đâu?
Đến đây, kết luận đã rất rõ ràng.
Vai trò của con người trong quy trình phát triển AI, mỗi khâu đang thu hẹp lại.
Mã, Claude viết rồi. Review mã, Claude làm rồi. Thực thi thí nghiệm, Claude nhanh hơn con người một bậc lượng tử. Thiết kế thí nghiệm, Claude bắt đầu tự làm......
Ưu thế so sánh cuối cùng của con người hiện nay, là gu nghiên cứu và khả năng phán đoán.
Nhưng ưu thế này có thể giữ được bao lâu?
Anthropic trong blog nói, họ cũng không chắc.
Một khả năng là, "gu nghiên cứu" cũng giống như những thứ khác mà AI trước đây không làm được, đầu tiên là không làm được, sau đó đột nhiên làm được.
Giống như AI hiểu được hài hước, thể hiện lý thuyết tâm trí, giải câu đố ngôn ngữ, đều trải qua đường cong tương tự.
Khả năng khác là, ngay cả khi Claude mãi mãi không học được gu nghiên cứu thực sự, chỉ dựa vào xu hướng tăng tốc hiện nay, khối lượng công việc mà mỗi nhà nghiên cứu con người có thể chỉ huy đồng thời đã lớn hơn gấp nhiều lần.
Bạn không cần AI thay thế hoàn toàn bạn suy nghĩ, nó chỉ cần làm hết tất cả công việc "thực thi", bạn chỉ cần làm 5% lựa chọn phương hướng đó.
Ba tương lai của RSI
Cuối blog, Anthropic mô tả ba hướng tiến hóa có thể về xu hướng "tự tiến hóa" lần này.
1. Đình trệ.
Những đường cong hàm mũ đó thực ra là đường cong S.
Có lẽ gu phán đoán nghiên cứu này vốn không thể giải quyết bằng scale, cần một đột phá kiến trúc hoàn toàn mới.
Hoặc, nút thắt nằm ở năng lượng, ở chip, ở chuỗi cung ứng vật lý của năng lực tính toán.
Tuy nhiên, ngay cả khi năng lực của AI đình trệ ở mức ngày nay, cũng sẽ xảy ra những thay đổi lớn đối với thế giới.
Dự án Glasswing trước đây, Mythos Preview trong vài tuần đầu lên sóng đã phát hiện hơn một vạn lỗ hổng phần mềm mức độ nghiêm trọng và cao, trải khắp các hệ thống then chốt toàn cầu.
2. AI tiếp tục tăng tốc, nhưng con người vẫn nắm tay lái.
Hiệu suất tổ chức sẽ tăng theo cấp số nhân, công ty 100 người làm việc của 1 vạn thậm chí 10 vạn người.
Anthropic cho rằng chúng ta có khả năng lớn đang bước vào cảnh này.
Nhưng họ cũng phát hiện một hiện tượng thú vị, đó là sự thể hiện của định luật Amdahl trong tổ chức——
Claude viết mã cực nhanh rồi, kết quả review mã trở thành nút thắt mới. Đủ loại ý tưởng mới, công cụ mới, thí nghiệm mới bùng nổ theo cấp số nhân, vượt xa khả năng tiêu hóa của tổ chức.
Nút thắt sẽ không biến mất, chỉ là chuyển sang khâu tiếp theo.
3. AI đạt được cải thiện đệ quy tự thân hoàn toàn, bắt đầu tự tạo ra thế hệ tiếp theo của chính mình.
Trong cảnh này, tốc độ phát triển của AI hoàn toàn phụ thuộc vào năng lực tính toán. Con người lùi về vị trí giám sát, xác minh, thẩm tra.
Nếu thực sự xảy ra, khả năng này có khả năng lớn sẽ di chuyển sang các lĩnh vực khoa học khác, y học, vật liệu, năng lượng, cất cánh toàn tuyến.
Tất nhiên, một tương lai khác, là liên kết (alignment) thất bại.
Trường hợp này, sai lệch sẽ tích lũy dần trong quá trình AI tự lặp lại, cuối cùng—— mất kiểm soát hoàn toàn.
OMT
Trên đây, là vài quan điểm then chốt nhất của Anthropic lần này về tự tiến hóa.
Thật lòng mà nói, lúc đầu tôi thực sự không coi trọng lắm, xét cho cùng Anthropic sắp IPO rồi, làn sóng này chẳng phải là quan hệ công chúng "kiểu Anthropic" điển hình sao?
Bạn đừng nói, lần này, có thể thực sự có chút khác biệt.
Bởi vì chỉ vài ngày trước, OpenAI cũng đã phát hành blog tương tự:
Chúng tôi cũng thấy dấu hiệu ban đầu của tự tiến hóa trong hệ thống ngày nay: Sự phát triển của AI cũng được AI đẩy nhanh. Chúng tôi dự đoán điều này sẽ làm trầm trọng thêm áp lực cạnh tranh giữa các nhà phát triển và quốc gia, và mang đến những thách thức quản trị mà các thể chế hiện có không thể đối phó. Với sự xuất hiện của RSI, xã hội cần phương pháp định hình quỹ đạo phát triển của AI, đảm bảo nó phục vụ lợi ích con người.
Điểm kỳ dị, dường như đến nhanh hơn tất cả mọi người dự đoán.
Blog:https://www.anthropic.com/institute/recursive-self-improvement
Liên kết tham khảo:[1]https://x.com/kimmonismus/status/2062517474277675102[2]https://x.com/anthropicai/status/2062568873321513443
Bài viết từ công chúng hiệu WeChat "Lượng Tử Vị", tác giả: Quan tâm khoa học công nghệ tiền tuyến














