Nếu ai đó nói với bạn rằng, AGI (Trí tuệ nhân tạo phổ quát) đã được hiện thực hóa, bạn sẽ phán đoán như thế nào để biết họ đang nói thật hay chỉ là khoác lác?
Trong thỏa thuận bí mật được tiết lộ giữa OpenAI và Microsoft, thước đo đó là báo cáo tài chính – phát triển được một hệ thống AI tạo ra ít nhất 100 tỷ USD lợi nhuận thì được coi là AGI. Còn trong miệng của Huang Jen-Hsun, thước đo đó là thời gian – sẽ xuất hiện trong vòng năm năm; Elon Musk thậm chí còn nhiều lần đưa ra dự đoán "sẽ đạt được vào năm sau".
Các lãnh đạo ngành nói mỗi người một phách, căn nguyên không phải ở chỗ ai đang nói dối, mà là ở chỗ bản thân khái niệm AGI này, vốn dĩ không có một cái thước đo nào được công nhận chung. Như nhà nghiên cứu có tư duy độc lập Bennett trong lĩnh vực nghiên cứu AGI đã nói trong bài báo của mình, AGI đã bị sự thổi phồng và phỏng đoán khôi phục thành "Bài kiểm tra mực Rorschach" – mỗi người chỉ nhìn thấy hình ảnh trong tâm trí mình, chứ không phải sự thật khách quan; và nhà khoa học Melanie Mitchell của Viện Nghiên cứu Santa Fe cũng cho rằng, cuộc tranh luận này chỉ có thể được làm sáng tỏ thông qua nghiên cứu khoa học lâu dài. (Đính kèm địa chỉ bài báo: https://arxiv.org/pdf/2503.23923)
Đây là tình thế khó xử lố bịch nhất của ngành AI hiện tại: chúng ta đang chạy hết tốc lực để đuổi theo một mục tiêu mà ngay cả vạch đích cũng chưa được vẽ rõ ràng.
2025, Ai Đang Vẽ Lại Vạch Xuất Phát Cho AGI?
Đối mặt với khoảng trống định nghĩa này, giới học thuật bắt đầu dồn dập "lấp chỗ trống" vào năm 2025. Bengio và các học giả khác nhấn mạnh "tính đa chức năng" và "trình độ thành thạo"; DeepMind đề xuất "AGI phân tán", cố gắng phá vỡ ảo tưởng về một thực thể toàn năng đơn lẻ.
Nhưng nhà nghiên cứu Michael Timothy Bennett từ Đại học Quốc gia Úc, trong một bài báo gửi lên arXiv vào cuối tháng 3, đã đưa ra một câu trả lời đầy khiêu khích nhưng cũng trúng nhất vấn đề cốt lõi.
Ông chỉ ra rằng, các định nghĩa trước đây loanh quanh, vẫn cứ đọng lại ở việc so sánh với "một người trưởng thành có học thức". Bennett tiếp nhận định nghĩa về trí thông minh của học giả Pei Wang – coi trí thông minh là khả năng thích ứng dưới sự hạn chế của tài nguyên hữu hạn – về cơ bản đã nhảy ra khỏi khuôn khổ "giống người", và định nghĩa AGI là một "nhà khoa học nhân tạo".
Ông đề xuất, một AGI thực sự phải là một hệ thống có thể, dưới những ràng buộc thực tế như tính toán, bộ nhớ và năng lượng, thích ứng rộng rãi, hiệu quả và mang tính khoa học với các môi trường và nhiệm vụ mới, giống như một nhà khoa học con người.
Ẩn ý của câu này là: tiêu chuẩn đánh giá AGI, không nên là nó bắt chước con người giống đến mức nào, mà là khả năng "khám phá tri thức mới" của nó mạnh đến đâu.
Tại sao lại cần gấp một cái thước đo mới? Bởi vì cái thước cũ – bài kiểm tra Turing và các bài kiểm tra chuẩn mực của con người – đã bị các mô hình lớn vượt qua dễ dàng, nhưng chúng ta lại càng ngày càng xa rời trí thông minh phổ quát thực sự.
Năm 2025, nếu bạn hỏi một mô hình lớn đỉnh cao "9.11 và 9.9 cái nào lớn hơn", nó vẫn có thể trả lời bạn một cách đầy tự tin rằng 9.11 lớn hơn, bởi vì 11 lớn hơn 9. Khi giải các bài toán chứng minh bất đẳng thức toán học phức tạp, ngay cả khi mô hình lớn đoán đúng đáp án, quá trình suy luận của nó thường là sụp đổ về mặt logic.
Bennett chỉ thẳng ra căn bệnh: con đường mà các mô hình lớn hiện tại đang đi là tuyến "xấp xỉ tối đa hóa quy mô" – sử dụng dữ liệu khổng lồ và sức mạnh tính toán, lưu trước các đáp án xấp xỉ cho các nhiệm vụ khác nhau trong trọng số mạng. Một khi gặp phải vấn đề ngoài phân phối chưa từng thấy, nó lập tức lộ tẩy.
Nguy hiểm hơn nữa, mô hình lớn không có "khả năng chủ động". Nó không thể chủ động làm thí nghiệm để kiểm chứng giả thuyết, không thể tự xây dựng chuỗi nguyên nhân - kết quả, càng không thể cân bằng giữa "tiếp tục khám phá" và "tận dụng cái đã biết".
Quay lại với việc so sánh 9.11 và 9.9 – mô hình lớn không phải là không biết tính toán, mà là nó căn bản chưa xây dựng được mô hình nguyên nhân - kết quả về so sánh số. Nó chỉ đang dùng xác suất để đoán đoạn văn bản mà nó đã từng thấy và gần giống nhất.
Vực sâu ngăn cách giữa "khả năng bắt chước" và "khả năng thích ứng", chính là cốt lõi mà tiêu chuẩn AGI mới muốn đo lường.
Thang Đo Mới Của Trí Thông Minh: Tháo Rời "Nhà Khoa Học Nhân Tạo"
Bộ tiêu chuẩn này của Bennett đáng được coi trọng, bởi vì ông đã hạ cấp AGI từ một đề mục triết học mơ hồ, xuống thành một vấn đề kỹ thuật có thể định lượng được.
Theo quan điểm của ông, một AGI thực sự, mô hình hành vi của nó phải hoàn toàn thẳng hàng với mô hình nghiên cứu của các nhà khoa học con người:
Thứ nhất, từ "con rối" đến "người thí nghiệm chủ động".
AI ngày nay hoàn toàn là người học thụ động, chỉ có thể "nhìn" dữ liệu con người nhồi nhét cho nó. Nhưng nhà khoa học thì không, nếu một nhà khoa học bị nhốt trong một căn phòng lạ, anh ta tuyệt đối sẽ không đứng yên chờ thông tin, mà sẽ đi đẩy cửa, kéo tay nắm, kiểm tra cửa sổ – đó chính là "thí nghiệm chủ động". Một AGI thực sự, phải có khả năng tự lập kế hoạch thí nghiệm, thu thập thông tin then chốt thông qua tương tác chủ động.
Thứ hai, từ "biết là thế" đến "biết tại sao lại thế".
Đây là điểm yếu lớn nhất của AI hiện tại. Mô hình lớn là một "bộ học tương quan" cực đoan, nó biết "mưa" thường đi kèm với "đất ướt", nhưng không biết cái nào dẫn đến cái nào. Chỉ khi hiểu được nguyên nhân - kết quả, nó mới biết rằng khi trời quang mây tạnh nhưng mặt đất ẩm ướt, phải suy luận là xe tưới cây vừa đi qua chứ không phải sắp mưa. Không có hiểu biết về nhân quả, AI mãi mãi chỉ có thể luẩn quẩn trong phân phối dữ liệu huấn luyện, điều này hoàn toàn không liên quan đến "phổ quát".
Thứ ba, đi trên dây giữa "khám phá" và "tận dụng".
Nếu chỉ khám phá mà không tận dụng, nắm giữ nhiều kiến thức đến mấy cũng không giải quyết được vấn đề trước mắt; nếu chỉ tận dụng mà không khám phá, môi trường thay đổi là bó tay. AGI phải cân bằng động cặp mâu thuẫn này dưới sự hạn chế tài nguyên – biết mình không biết gì, và dựa vào đó để phân bổ sức mạnh tính toán.
Ngoài ra, Bennett còn thêm vào một chiều kích mang tính hiện thực sâu sắc: hạn chế năng lượng. Việc đưa "năng lượng" vào định nghĩa, có nghĩa là ông đã vạch ra một đường ranh giới dưới cùng: trí thông minh thực sự không phải là sở hữu tài nguyên vô hạn, mà là thích ứng một cách thanh lịch dưới tài nguyên hữu hạn. Một AI cần tiêu thụ một nhà máy điện hạt nhân mới giải quyết được vấn đề mới, chỉ là một chiếc máy tính đắt tiền, không phải AGI.
Thiết Lập Lại Lộ Trình Đến AGI: Tạm Biệt Scaling Law Đơn Nhất
Dựa trên khuôn khổ trên, Bennett tháo rời các phương pháp siêu việt hiện tại để xây dựng hệ thống thông minh thành ba loại:
Scale-maxing (Tối đa hóa quy mô): Con đường chủ đạo hiện nay của mô hình lớn, đổ dồn tham số, dữ liệu và sức mạnh tính toán. Nhưng điểm nghẽn đã lộ rõ: hiệu suất mẫu và năng lượng cực kỳ thấp.
Simp-maxing (Tối đa hóa sự đơn giản): Theo đuổi cấu trúc mô hình cực kỳ đơn giản, tôn sùng dao cạo Occam. Nhưng sự đơn giản là thuộc tính của hình thức chứ không phải thuộc tính của chức năng – "đơn giản nhất" dưới các máy Turing khác nhau có thể hoàn toàn khác nhau, khiến nó khó thoát khỏi cái bẫy chủ quan.
W-maxing (Tối đa hóa việc làm yếu đi ràng buộc): Làm yếu đi các ràng buộc chức năng nhiều nhất có thể, để hệ thống tự tìm ra giải pháp tối ưu. Thí nghiệm cho thấy, chỉ riêng W-maxing đã có thể đạt được mức cải thiện tỷ lệ khái quát hóa 110%-500% trên các nhiệm vụ cụ thể, nhưng nó cần tìm kiếm trong không gian vô hạn các hình thái phần cứng, độ khó tối ưu hóa cực cao.
Kết luận của Bennett vô cùng rõ ràng: Mặc dù Scale-maxing hiện đang chiếm ưu thế tuyệt đối, nhưng AGI tuyệt đối không phải là thứ có thể đạt được chỉ bằng mỹ học bạo lực của một con đường duy nhất, nó tất yếu phải là sự hòa trộn của nhiều phương pháp siêu việt.
Nếu định nghĩa "nhà khoa học nhân tạo" được chấp nhận rộng rãi, ngành AI sẽ đón nhận một sự dịch chuyển mô hình ở tầng sâu.
Tiêu chuẩn đánh giá sẽ thay đổi triệt để. Chúng ta không còn cần xem mô hình lớn trên bảng xếp hạng thi cử của con người lại vượt bao nhiêu điểm nữa, mà là thiết lập một bộ "chuẩn mực thích ứng": ném AI vào một môi trường vật lý chưa từng thấy, xem nó có thể phát hiện quy luật trong số lần tương tác hạn chế hay không; đưa cho nó một trò chơi mới, xem nó có thể hiểu luật chơi nhanh hơn con người hay không; thậm chí để nó giải quyết các vấn đề khoa học thực tế, xem nó có thể tự đề xuất giả thuyết và thiết kế thí nghiệm kiểm chứng hay không. Cốt lõi không còn là "bạn biết bao nhiêu", mà là "bạn có thể khám phá ra bao nhiêu".
Lộ trình kỹ thuật cũng sẽ chuyển hướng theo đó. Scaling Law thuần túy sẽ sớm chạm trần, bởi vì dữ liệu tiếp nhận thụ động không thể nuôi dưỡng tính nhân quả. Tìm kiếm và xấp xỉ, tối đa hóa quy mô và làm yếu đi ràng buộc – việc đạt được AGI tất yếu phải là sự hòa trộn của nhiều công cụ và phương pháp siêu việt, chứ không phải là phần mở rộng của một con đường duy nhất.
Bài báo của Bennett quan trọng, không phải vì ông đưa ra câu trả lời cuối cùng cho AGI, mà vì ông đã lau sạch một góc của tấm gương mờ ảo mang tên "trí thông minh". Ông để chúng ta thấy rằng, việc hiện thực hóa AGI không phải là sự lặp lại tuyến tính của mô hình lớn, mà là một lần thiết lập lại lộ trình.
AGI rốt cuộc nên như thế nào? Câu trả lời không nằm ở những cuộc đối thoại ngày càng giống người, mà nằm ở những khả năng có thể chủ động truy hỏi "tại sao", và tự tay đi kiểm chứng câu trả lời. Khi AI thực sự bước ra khỏi màn sương mù của "Bài kiểm tra mực Rorschach", nó sẽ không còn chỉ là bắt chước hình dáng của con người, mà sẽ sở hữu tinh thần của một nhà khoa học. (Bài viết này được đăng tải lần đầu trên ứng dụng Titan Media, tác giả | Silicon Valley Tech News, biên tập | Zhao Hongyu)






