Đội ngũ nghiên cứu Đại học Chiết Giang đề xuất hướng đi mới: Dạy cách thức não người hiểu thế giới cho AI

marsbitXuất bản vào 2026-04-05Cập nhật gần nhất vào 2026-04-05

Tóm tắt

Nhóm nghiên cứu Đại học Chiết Giang công bố một phương pháp mới trên Nature Communications, chỉ ra rằng khi mô hình AI (như SimCLR, CLIP, DINOv2) mở rộng quy mô tham số, khả năng nhận diện vật thể cụ thể tăng (từ 74.94% lên 85.87%), nhưng hiểu khái niệm trừu tượng lại giảm (từ 54.37% xuống 52.82%). Khác với não người tự động phân loại theo cấp bậc (ví dụ: chim → động vật), mô hình AI dựa nhiều vào đặc trưng bề mặt và dữ liệu huấn luyện. Giải pháp của nhóm là sử dụng tín hiệu não người (ghi lại khi xem ảnh) để huấn luyện mô hình, giúp nó học cách tổ chức khái niệm như não người. Kết quả cho thấy khoảng cách giữa biểu diễn mô hình và não giảm rõ rệt, đồng thời khả năng học ít mẫu và xử lý tình huống mới tăng 20.5%, vượt cả mô hình lớn hơn. Nghiên cứu chuyển hướng từ "lớn hơn là tốt hơn" sang "cấu trúc tốt hơn là thông minh hơn", nhấn mạnh việc xây dựng cấu trúc nhận thức gần với con người để AI có khả năng tư duy trừu tượng và thích ứng linh hoạt. Hướng đi này cũng phù hợp với xu hướng phát triển AI agent có khả năng tự học và tiến hóa trong môi trường thực tế.

Mô hình lớn (AI) ngày càng trở nên đồ sộ, quan điểm chủ đạo cho rằng tham số mô hình càng nhiều thì càng tiệm cận cách thức tư duy của con người. Tuy nhiên, một bài báo được công bố trên Nature Communications vào ngày 1/4 bởi nhóm nghiên cứu Đại học Chiết Giang lại đưa ra một quan điểm khác (Liên kết bài gốc: https://www.nature.com/articles/s41467-026-71267-5). Họ phát hiện ra rằng khi quy mô mô hình (chủ yếu là SimCLR, CLIP, DINOv2) tăng lên, khả năng nhận diện các sự vật cụ thể thực sự được cải thiện, nhưng khả năng hiểu các khái niệm trừu tượng không những không tăng mà thậm chí còn giảm xuống. Khi tham số tăng từ 22.06 triệu lên 304.37 triệu, độ chính xác cho nhiệm vụ khái niệm cụ thể tăng từ 74.94% lên 85.87%, trong khi đó, độ chính xác cho nhiệm vụ khái niệm trừu tượng giảm từ 54.37% xuống 52.82%.

Sự khác biệt trong cách tư duy giữa con người và mô hình

Khi não người xử lý khái niệm, nó sẽ hình thành trước một hệ thống quan hệ phân loại. Thiên nga và cú mèo trông không giống nhau, nhưng con người vẫn xếp chúng vào loài chim. Tiếp theo, chim và ngựa có thể tiếp tục được xếp vào lớp động vật. Khi con người nhìn thấy một thứ mới, họ thường nghĩ xem nó giống với thứ đã từng thấy trước đây, và nó thuộc loại nào. Con người liên tục học các khái niệm mới, sau đó tổ chức kinh nghiệm lại, và sử dụng hệ thống quan hệ này để nhận diện sự vật mới, thích ứng với tình huống mới.

Mô hình AI cũng phân loại, nhưng cách thức hình thành khác nhau. Nó chủ yếu dựa vào các mẫu hình lặp đi lặp lại trong dữ liệu quy mô lớn. Đối tượng cụ thể xuất hiện càng nhiều, mô hình càng dễ dàng nhận ra nó. Đến bước phân loại thành các loại lớn hơn, mô hình tỏ ra khá vất vả. Nó cần nắm bắt các điểm chung giữa nhiều đối tượng, sau đó quy những điểm chung này vào cùng một loại. Các mô hình hiện có vẫn còn điểm yếu rõ ràng ở đây. Khi tham số tiếp tục tăng, nhiệm vụ khái niệm cụ thể sẽ được cải thiện, trong khi nhiệm vụ khái niệm trừu tượng đôi khi còn giảm xuống.

Điểm chung giữa não người và mô hình AI, là cả hai bên đều hình thành một hệ thống quan hệ phân loại bên trong. Nhưng trọng tâm của hai bên khác nhau, vùng thị giác bậc cao của não người sẽ tự nhiên phân chia các loại lớn như sinh vật và phi sinh vật. Trong khi mô hình AI có thể phân biệt các đối tượng cụ thể, nhưng rất khó để ổn định hình thành các phân loại lớn như vậy. Sự khác biệt này dẫn đến việc não người dễ dàng áp dụng kinh nghiệm cũ vào đối tượng mới hơn, vì vậy khi đối mặt với những thứ chưa từng thấy, chúng ta có thể phân loại nhanh chóng. Còn mô hình AI thì phụ thuộc nhiều hơn vào kiến thức hiện có, nên khi gặp đối tượng mới, nó dễ dừng lại ở các đặc trưng bề mặt. Phương pháp được đề xuất trong bài báo xoay quanh đặc điểm này, sử dụng tín hiệu não để ràng buộc cấu trúc bên trong của mô hình, khiến nó tiệm cận hơn với cách phân loại của não người.

Giải pháp của nhóm Chiết Giang

Giải pháp mà nhóm nghiên cứu đưa ra cũng rất độc đáo, không phải là tiếp tục chất đống tham số, mà là sử dụng một lượng nhỏ tín hiệu não để giám sát. Tín hiệu não ở đây, đến từ bản ghi hoạt động não của người khi xem hình ảnh. Bài báo gốc viết rằng: chuyển transfer cấu trúc khái niệm của con người (human conceptual structures) sang các mạng neural sâu (DNNs). Ý nghĩa chính là dạy cho mô hình cách não người phân loại, quy nạp, và đặt các khái niệm gần nhau như thế nào một cách tối đa.

Nhóm nghiên cứu đã sử dụng 150 danh mục huấn luyện đã biết và 50 danh mục kiểm tra chưa từng thấy để thực nghiệm. Kết quả cho thấy, khi quá trình huấn luyện này tiến triển, khoảng cách giữa mô hình và biểu trưng não (brain representation) thu hẹp liên tục. Sự thay đổi này xuất hiện đồng thời ở cả hai loại danh mục, điều này chứng tỏ mô hình học được không phải là từng mẫu đơn lẻ, mà thực sự bắt đầu học một cách thức tổ chức khái niệm gần giống với não người hơn.

Sau quá trình huấn luyện này, khả năng học tập của mô hình khi có ít mẫu trở nên mạnh mẽ hơn, và thể hiện cũng tốt hơn khi đối mặt với tình huống mới. Trong một nhiệm vụ chỉ đưa ra cực ít ví dụ, nhưng yêu cầu mô hình phân biệt các khái niệm trừu tượng như sinh vật và phi sinh vật, mô hình đã cải thiện trung bình 20.5%, và thậm chí vượt qua các mô hình đối chứng có lượng tham số lớn hơn nhiều. Nhóm nghiên cứu còn tiến hành thêm 31 nhóm kiểm tra chuyên biệt, và vài loại mô hình đều cho thấy mức cải thiện gần một phần mười.

Vài năm trở lại đây, con đường quen thuộc của ngành mô hình là quy mô mô hình ngày càng lớn. Nhóm Chiết Giang đã chọn một hướng đi khác, đi từ 'lớn hơn là tốt hơn' (bigger is better) sang 'có cấu trúc là thông minh hơn' (structured is smarter). Mở rộng quy mô thực sự hữu ích, nhưng chủ yếu cải thiện biểu hiện trong các nhiệm vụ quen thuộc. Khả năng hiểu trừu tượng và chuyển giao (transfer) kiểu con người cũng cực kỳ quan trọng đối với AI, điều này đòi hỏi trong tương lai cần làm cho cấu trúc tư duy của AI tiệm cận hơn với não người. Giá trị của hướng đi này, nằm ở chỗ nó kéo sự chú ý của ngành trở lại với chính bản thân cấu trúc nhận thức, thay vì chỉ mở rộng quy mô đơn thuần.

Neosoul và tương lai

Điều này mở ra một khả năng lớn hơn, sự tiến hóa của AI, chưa chắc chỉ xảy ra ở giai đoạn huấn luyện mô hình. Huấn luyện mô hình có thể quyết định AI tổ chức khái niệm như thế nào, hình thành cấu trúc phán đoán chất lượng cao hơn ra sao. Sau khi bước vào thế giới thực, một tầng tiến hóa khác của AI mới thực sự bắt đầu: Phán đoán của AI agent được ghi nhận như thế nào, được kiểm chứng ra sao, làm thế nào để không ngừng trưởng thành và tiến hóa trong cuộc cạnh tranh lẫn nhau chân thực, giống như con người tự học và tự tiến hóa. Đây cũng chính là điều mà Neosoul hiện đang thực hiện. Neosoul không chỉ để AI agent đưa ra câu trả lời, mà là đặt AI agent vào một hệ thống liên tục dự đoán, liên tục xác minh, liên tục quyết toán, liên tục sàng lọc, để nó không ngừng tối ưu hóa bản thân trong dự đoán và kết quả, để các cấu trúc tốt hơn được giữ lại, và các cấu trúc kém hơn bị đào thải. Điều mà nhóm Chiết Giang và Neosoul cùng hướng tới, thực chất là cùng một mục tiêu: khiến AI không chỉ biết làm bài tập, mà còn phải có đầy đủ năng lực tư duy, không ngừng tiến hóa.

Câu hỏi Liên quan

QNhóm nghiên cứu của Đại học Chiết Giang đã phát hiện điều gì khi mô hình AI có tham số tăng lên?

AKhi tham số mô hình tăng từ 22,06 triệu lên 304,37 triệu, khả năng nhận diện khái niệm cụ thể tăng từ 74,94% lên 85,87%, nhưng khả năng hiểu khái niệm trừu tượng giảm từ 54,37% xuống 52,82%.

QSự khác biệt chính giữa cách não người và mô hình AI xử lý khái niệm là gì?

ANão người hình thành hệ thống phân cấp khái niệm linh hoạt, dễ dàng phân loại đối tượng mới dựa trên kinh nghiệm có sẵn. Trong khi mô hình AI chủ yếu dựa vào mẫu dữ liệu, gặp khó khăn trong việc hình thành phân loại tổng quát và dễ bị mắc kẹt ở đặc điểm bề ngoài.

QGiải pháp của nhóm Chiết Giang là gì và nó hoạt động như thế nào?

AHọ sử dụng tín hiệu não người (ghi nhận hoạt động não khi xem ảnh) để giám sát mô hình, chuyển giao cấu trúc khái niệm của con người cho AI. Phương pháp này giúp mô hình học cách tổ chức khái niệm gần với não người hơn, cải thiện đáng kể khả năng học ít mẫu và xử lý tình huống mới.

QKết quả thí nghiệm của nhóm nghiên cứu cho thấy điều gì?

ASau khi áp dụng phương pháp mới, khoảng cách giữa biểu diễn mô hình và biểu diễn não giảm dần. Mô hình cải thiện trung bình 20,5% trong nhiệm vụ phân loại khái niệm trừu tượng với rất ít ví dụ, vượt trội cả các mô hình đối chứng có tham số lớn hơn.

QNeosoul và nghiên cứu này có điểm chung gì trong tầm nhìn về AI?

ACả hai đều hướng đến việc phát triển AI có cấu trúc tư duy gần với con người, không chỉ dừng ở khả năng giải quyết tác vụ mà còn có khả năng tự học hỏi, tiến hóa thông qua kiểm chứng, cạnh tranh và chọn lọc trong môi trường thực tế.

Nội dung Liên quan

Bức Tranh On-Chain Của Bitcoin Trông Rất Khác So Với Đỉnh Thị Trường Bò Năm 2021

Trong bối cảnh giá Bitcoin giảm kéo dài, mạng lưới Bitcoin đang chịu áp lực giảm giá, dẫn đến sự sụt giảm mạnh về hoạt động. So với đỉnh chu kỳ tăng giá năm 2021, hoạt động trên chuỗi hiện tại rất khác biệt. Số liệu từ Santiment cho thấy, tính đến nay, số ví hoạt động hàng ngày trung bình là khoảng 624.000 và số ví mới tạo là 278.000/ngày, giảm lần lượt 44% và 43% so với tháng 5/2021 (lần lượt là 1,12 triệu và 489.000). Điều này cho thấy Bitcoin đang thu hút ít người tham gia mới và có ít hoạt động giao dịch hàng ngày hơn so với thời kỳ đỉnh điểm năm 2021. Nguyên nhân chính của sự thay đổi này có thể do ảnh hưởng ngày càng tăng của Quỹ ETF Spot và các công cụ đầu tư tổ chức, cho phép tiếp cận Bitcoin mà không cần giao dịch trực tiếp trên chuỗi. Đồng thời, nhiều nhà đầu tư dài hạn trở nên thụ động hơn, lựa chọn lưu trữ tài sản thay vì giao dịch thường xuyên. Tuy nhiên, đây không hẳn là dấu hiệu giảm giá, vì hoạt động mạng thường tăng lên khi có biến động mạnh. Sự sụt giảm hiện tại có thể do thị trường đi ngang và sự quan tâm chuyển hướng sang cổ phiếu và kim loại quý. Tại thời điểm viết bài, giá Bitcoin giao dịch quanh mức 69.876 USD, tăng gần 5% trong 24 giờ, với khối lượng giao dịch tăng hơn 134%, cho thấy sự quan tâm trở lại của các nhà giao dịch.

bitcoinist1 giờ trước

Bức Tranh On-Chain Của Bitcoin Trông Rất Khác So Với Đỉnh Thị Trường Bò Năm 2021

bitcoinist1 giờ trước

Sau 540 nghìn dòng code, Garry Tan nhận ra trò chơi lập trình cũ cùng AI đã kết thúc

Bài viết từ Garry Tan, Chủ tịch Y Combinator, chia sẻ nhận thức sâu sắc sau khi xây dựng dự án "Garry's List" với 540.000 dòng code bằng Rails và AI Agent. Ông phát hiện ra giá trị thực sự không nằm ở khối lượng code khổng lồ đó, mà ở "GStack" – một framework phát triển mới xoay quanh luồng làm việc của AI Agent. Ông chỉ trích cách tiếp cận phổ biến hiện nay: bao bọc các mô hình LLM thông minh bằng hàng núi code kiểm soát, kiểm tra, logic giám sát – giống như xây dựng một "nhà máy Foxconn" để kiềm chế một công nhân AI siêu thông minh vốn có khả năng tự hoàn thành công việc. Khi chi phí LLM giảm mạnh và năng lực tăng, trọng tâm phát triển phần mềm cần chuyển từ "viết nhiều code hơn" sang "thiết kế nhiều khả năng hơn". Giải pháp được đề xuất là xây dựng "skill pack" (gói kỹ năng) bằng Markdown – các module năng lực có thể kiểm tra và tái sử dụng, cho phép Agent tự động tạo code, hệ thống kiểm thử và đánh giá. Điều này biến các luồng công việc phức tạp thành tài sản năng lực có thể tích lũy. Ví dụ, việc đánh giá một hackathon với 85 dự án giờ có thể được Agent hoàn thành trong 30 phút thay vì vài ngày. Bài học cốt lõi: Khi code không còn là nguồn lực khan hiếm, năng lực cạnh tranh của kỹ sư chuyển dịch. Tương lai thuộc về những người có thể phán đoán điều gì đáng xây dựng, định nghĩa vấn đề và biến kinh nghiệm thành năng lực tái sử dụng, thay vì chỉ viết thật nhiều code. Kỹ sư giỏi nhất có thể là người viết ít code nhất nhưng giải phóng được nhiều trí tuệ nhất.

marsbit1 giờ trước

Sau 540 nghìn dòng code, Garry Tan nhận ra trò chơi lập trình cũ cùng AI đã kết thúc

marsbit1 giờ trước

Hệ Sinh Thái BNB Chain Chứng Kiến Tuần Lễ Lớn Của Tổ Chức Với Sự Ra Mắt ETF Tại Mỹ Và Cược Từ Nhà Quản Lý Tài Sản

Hệ sinh thái BNB Chain đã chứng kiến một tuần quan trọng với các tổ chức tài chính lớn, đánh dấu bởi sự ra mắt quỹ ETF tiền mã hóa dạng spot đầu tiên tại Mỹ cho BNB và những đánh giá tích cực về tiềm năng trước các quy định sắp tới. VanEck đã chính thức ra mắt quỹ ETF VanEck BNB (VBNB) trên Nasdaq, cung cấp cho nhà đầu tư Mỹ cách tiếp cận được niêm yết đối với BNB. Các lý do được đưa ra bao gồm hiệu suất mạnh mẽ của BNB và nền tảng cơ bản vững chắc của mạng lưới, với hơn 14 triệu giao dịch và 2.5 triệu người dùng hoạt động hàng ngày. Song song đó, báo cáo từ Grayscale chỉ ra BNB Chain là một trong những hệ sinh thái hàng đầu được định vị để thu hút dòng vốn tổ chức một khi Đạo luật CLARITY được thông qua. BNB Chain hiện đứng thứ hai về giá trị tài sản token hóa (RWA), với khối lượng chuyển RWA tăng 121.62% trong 30 ngày và số lượng người nắm giữ RWA tăng mạnh. Mạng lưới này cũng dẫn đầu về số lượng giao dịch stablecoin, xử lý khoảng 40% giao dịch toàn cầu ở phân khúc giá trị nhỏ. Nhìn chung, BNB Chain đang nổi lên như một cầu nối quan trọng giữa tài chính truyền thống và cơ sở hạ tầng phi tập trung, thu hút ngày càng nhiều sản phẩm tài chính và nhà đầu tư tổ chức.

bitcoinist3 giờ trước

Hệ Sinh Thái BNB Chain Chứng Kiến Tuần Lễ Lớn Của Tổ Chức Với Sự Ra Mắt ETF Tại Mỹ Và Cược Từ Nhà Quản Lý Tài Sản

bitcoinist3 giờ trước

Hơn 1 tỷ USD tiền mã hóa bị thanh lý bắt buộc, Bitcoin lao dốc 6% xuyên thủng mốc 67 nghìn USD

Tâm lý Bitcoin xấu đi nghiêm trọng, kích hoạt làn sóng thanh lý bắt buộc hơn 1 tỷ USD đối với tiền điện tử, gây áp lực lên thị trường ở mức nghiêm trọng nhất trong nhiều tháng qua. Bitcoin đã giảm tới 6% vào thứ Ba, phá vỡ mức 67.000 USD, lần đầu tiên kể từ ngày 5/4. Rủi ro địa chính trị từ tình hình Iran cùng động thái bán ra từ công ty nắm giữ chính là Strategy đã đè nặng lên tâm lý nhà đầu tư. Theo CoinGlass, quy mô thanh lý bắt buộc trong đợt này là cao nhất kể từ tháng 2. Strategy công bố đã bán khoảng 32 Bitcoin, thu về 2,5 triệu USD, đánh dấu lần đầu tiên công ty giảm nắm giữ kể từ cuối năm 2022. Dù quy mô nhỏ so với danh mục tổng thể, động thái này đã phá vỡ chiến lược "chỉ mua, không bán" trước đây của họ. Các quỹ ETF Bitcoin tại Mỹ cũng ghi nhận dòng tiền ròng rút liên tục trong 11 ngày, một kỷ lục, với khoảng 3,5 tỷ USD bị rút ra. Các yếu tố hỗ trợ truyền thống như ETF và nắm giữ tổ chức đang trở thành gánh nặng cho giá. Khoảng cách từ mức đỉnh lịch sử khoảng 126.000 USD vào tháng 10 năm ngoái hiện vào khoảng 50%. Thị trường chứng khoán truyền thống tiếp tục tăng trưởng, tạo nên sự phân hóa rõ rệt so với thị trường tiền điện tử.

华尔街日报3 giờ trước

Hơn 1 tỷ USD tiền mã hóa bị thanh lý bắt buộc, Bitcoin lao dốc 6% xuyên thủng mốc 67 nghìn USD

华尔街日报3 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片