Đội ngũ nghiên cứu Đại học Chiết Giang đề xuất hướng đi mới: Dạy cách thức não người hiểu thế giới cho AI

marsbitXuất bản vào 2026-04-05Cập nhật gần nhất vào 2026-04-05

Tóm tắt

Nhóm nghiên cứu Đại học Chiết Giang công bố một phương pháp mới trên Nature Communications, chỉ ra rằng khi mô hình AI (như SimCLR, CLIP, DINOv2) mở rộng quy mô tham số, khả năng nhận diện vật thể cụ thể tăng (từ 74.94% lên 85.87%), nhưng hiểu khái niệm trừu tượng lại giảm (từ 54.37% xuống 52.82%). Khác với não người tự động phân loại theo cấp bậc (ví dụ: chim → động vật), mô hình AI dựa nhiều vào đặc trưng bề mặt và dữ liệu huấn luyện. Giải pháp của nhóm là sử dụng tín hiệu não người (ghi lại khi xem ảnh) để huấn luyện mô hình, giúp nó học cách tổ chức khái niệm như não người. Kết quả cho thấy khoảng cách giữa biểu diễn mô hình và não giảm rõ rệt, đồng thời khả năng học ít mẫu và xử lý tình huống mới tăng 20.5%, vượt cả mô hình lớn hơn. Nghiên cứu chuyển hướng từ "lớn hơn là tốt hơn" sang "cấu trúc tốt hơn là thông minh hơn", nhấn mạnh việc xây dựng cấu trúc nhận thức gần với con người để AI có khả năng tư duy trừu tượng và thích ứng linh hoạt. Hướng đi này cũng phù hợp với xu hướng phát triển AI agent có khả năng tự học và tiến hóa trong môi trường thực tế.

Mô hình lớn (AI) ngày càng trở nên đồ sộ, quan điểm chủ đạo cho rằng tham số mô hình càng nhiều thì càng tiệm cận cách thức tư duy của con người. Tuy nhiên, một bài báo được công bố trên Nature Communications vào ngày 1/4 bởi nhóm nghiên cứu Đại học Chiết Giang lại đưa ra một quan điểm khác (Liên kết bài gốc: https://www.nature.com/articles/s41467-026-71267-5). Họ phát hiện ra rằng khi quy mô mô hình (chủ yếu là SimCLR, CLIP, DINOv2) tăng lên, khả năng nhận diện các sự vật cụ thể thực sự được cải thiện, nhưng khả năng hiểu các khái niệm trừu tượng không những không tăng mà thậm chí còn giảm xuống. Khi tham số tăng từ 22.06 triệu lên 304.37 triệu, độ chính xác cho nhiệm vụ khái niệm cụ thể tăng từ 74.94% lên 85.87%, trong khi đó, độ chính xác cho nhiệm vụ khái niệm trừu tượng giảm từ 54.37% xuống 52.82%.

Sự khác biệt trong cách tư duy giữa con người và mô hình

Khi não người xử lý khái niệm, nó sẽ hình thành trước một hệ thống quan hệ phân loại. Thiên nga và cú mèo trông không giống nhau, nhưng con người vẫn xếp chúng vào loài chim. Tiếp theo, chim và ngựa có thể tiếp tục được xếp vào lớp động vật. Khi con người nhìn thấy một thứ mới, họ thường nghĩ xem nó giống với thứ đã từng thấy trước đây, và nó thuộc loại nào. Con người liên tục học các khái niệm mới, sau đó tổ chức kinh nghiệm lại, và sử dụng hệ thống quan hệ này để nhận diện sự vật mới, thích ứng với tình huống mới.

Mô hình AI cũng phân loại, nhưng cách thức hình thành khác nhau. Nó chủ yếu dựa vào các mẫu hình lặp đi lặp lại trong dữ liệu quy mô lớn. Đối tượng cụ thể xuất hiện càng nhiều, mô hình càng dễ dàng nhận ra nó. Đến bước phân loại thành các loại lớn hơn, mô hình tỏ ra khá vất vả. Nó cần nắm bắt các điểm chung giữa nhiều đối tượng, sau đó quy những điểm chung này vào cùng một loại. Các mô hình hiện có vẫn còn điểm yếu rõ ràng ở đây. Khi tham số tiếp tục tăng, nhiệm vụ khái niệm cụ thể sẽ được cải thiện, trong khi nhiệm vụ khái niệm trừu tượng đôi khi còn giảm xuống.

Điểm chung giữa não người và mô hình AI, là cả hai bên đều hình thành một hệ thống quan hệ phân loại bên trong. Nhưng trọng tâm của hai bên khác nhau, vùng thị giác bậc cao của não người sẽ tự nhiên phân chia các loại lớn như sinh vật và phi sinh vật. Trong khi mô hình AI có thể phân biệt các đối tượng cụ thể, nhưng rất khó để ổn định hình thành các phân loại lớn như vậy. Sự khác biệt này dẫn đến việc não người dễ dàng áp dụng kinh nghiệm cũ vào đối tượng mới hơn, vì vậy khi đối mặt với những thứ chưa từng thấy, chúng ta có thể phân loại nhanh chóng. Còn mô hình AI thì phụ thuộc nhiều hơn vào kiến thức hiện có, nên khi gặp đối tượng mới, nó dễ dừng lại ở các đặc trưng bề mặt. Phương pháp được đề xuất trong bài báo xoay quanh đặc điểm này, sử dụng tín hiệu não để ràng buộc cấu trúc bên trong của mô hình, khiến nó tiệm cận hơn với cách phân loại của não người.

Giải pháp của nhóm Chiết Giang

Giải pháp mà nhóm nghiên cứu đưa ra cũng rất độc đáo, không phải là tiếp tục chất đống tham số, mà là sử dụng một lượng nhỏ tín hiệu não để giám sát. Tín hiệu não ở đây, đến từ bản ghi hoạt động não của người khi xem hình ảnh. Bài báo gốc viết rằng: chuyển transfer cấu trúc khái niệm của con người (human conceptual structures) sang các mạng neural sâu (DNNs). Ý nghĩa chính là dạy cho mô hình cách não người phân loại, quy nạp, và đặt các khái niệm gần nhau như thế nào một cách tối đa.

Nhóm nghiên cứu đã sử dụng 150 danh mục huấn luyện đã biết và 50 danh mục kiểm tra chưa từng thấy để thực nghiệm. Kết quả cho thấy, khi quá trình huấn luyện này tiến triển, khoảng cách giữa mô hình và biểu trưng não (brain representation) thu hẹp liên tục. Sự thay đổi này xuất hiện đồng thời ở cả hai loại danh mục, điều này chứng tỏ mô hình học được không phải là từng mẫu đơn lẻ, mà thực sự bắt đầu học một cách thức tổ chức khái niệm gần giống với não người hơn.

Sau quá trình huấn luyện này, khả năng học tập của mô hình khi có ít mẫu trở nên mạnh mẽ hơn, và thể hiện cũng tốt hơn khi đối mặt với tình huống mới. Trong một nhiệm vụ chỉ đưa ra cực ít ví dụ, nhưng yêu cầu mô hình phân biệt các khái niệm trừu tượng như sinh vật và phi sinh vật, mô hình đã cải thiện trung bình 20.5%, và thậm chí vượt qua các mô hình đối chứng có lượng tham số lớn hơn nhiều. Nhóm nghiên cứu còn tiến hành thêm 31 nhóm kiểm tra chuyên biệt, và vài loại mô hình đều cho thấy mức cải thiện gần một phần mười.

Vài năm trở lại đây, con đường quen thuộc của ngành mô hình là quy mô mô hình ngày càng lớn. Nhóm Chiết Giang đã chọn một hướng đi khác, đi từ 'lớn hơn là tốt hơn' (bigger is better) sang 'có cấu trúc là thông minh hơn' (structured is smarter). Mở rộng quy mô thực sự hữu ích, nhưng chủ yếu cải thiện biểu hiện trong các nhiệm vụ quen thuộc. Khả năng hiểu trừu tượng và chuyển giao (transfer) kiểu con người cũng cực kỳ quan trọng đối với AI, điều này đòi hỏi trong tương lai cần làm cho cấu trúc tư duy của AI tiệm cận hơn với não người. Giá trị của hướng đi này, nằm ở chỗ nó kéo sự chú ý của ngành trở lại với chính bản thân cấu trúc nhận thức, thay vì chỉ mở rộng quy mô đơn thuần.

Neosoul và tương lai

Điều này mở ra một khả năng lớn hơn, sự tiến hóa của AI, chưa chắc chỉ xảy ra ở giai đoạn huấn luyện mô hình. Huấn luyện mô hình có thể quyết định AI tổ chức khái niệm như thế nào, hình thành cấu trúc phán đoán chất lượng cao hơn ra sao. Sau khi bước vào thế giới thực, một tầng tiến hóa khác của AI mới thực sự bắt đầu: Phán đoán của AI agent được ghi nhận như thế nào, được kiểm chứng ra sao, làm thế nào để không ngừng trưởng thành và tiến hóa trong cuộc cạnh tranh lẫn nhau chân thực, giống như con người tự học và tự tiến hóa. Đây cũng chính là điều mà Neosoul hiện đang thực hiện. Neosoul không chỉ để AI agent đưa ra câu trả lời, mà là đặt AI agent vào một hệ thống liên tục dự đoán, liên tục xác minh, liên tục quyết toán, liên tục sàng lọc, để nó không ngừng tối ưu hóa bản thân trong dự đoán và kết quả, để các cấu trúc tốt hơn được giữ lại, và các cấu trúc kém hơn bị đào thải. Điều mà nhóm Chiết Giang và Neosoul cùng hướng tới, thực chất là cùng một mục tiêu: khiến AI không chỉ biết làm bài tập, mà còn phải có đầy đủ năng lực tư duy, không ngừng tiến hóa.

Câu hỏi Liên quan

QNhóm nghiên cứu của Đại học Chiết Giang đã phát hiện điều gì khi mô hình AI có tham số tăng lên?

AKhi tham số mô hình tăng từ 22,06 triệu lên 304,37 triệu, khả năng nhận diện khái niệm cụ thể tăng từ 74,94% lên 85,87%, nhưng khả năng hiểu khái niệm trừu tượng giảm từ 54,37% xuống 52,82%.

QSự khác biệt chính giữa cách não người và mô hình AI xử lý khái niệm là gì?

ANão người hình thành hệ thống phân cấp khái niệm linh hoạt, dễ dàng phân loại đối tượng mới dựa trên kinh nghiệm có sẵn. Trong khi mô hình AI chủ yếu dựa vào mẫu dữ liệu, gặp khó khăn trong việc hình thành phân loại tổng quát và dễ bị mắc kẹt ở đặc điểm bề ngoài.

QGiải pháp của nhóm Chiết Giang là gì và nó hoạt động như thế nào?

AHọ sử dụng tín hiệu não người (ghi nhận hoạt động não khi xem ảnh) để giám sát mô hình, chuyển giao cấu trúc khái niệm của con người cho AI. Phương pháp này giúp mô hình học cách tổ chức khái niệm gần với não người hơn, cải thiện đáng kể khả năng học ít mẫu và xử lý tình huống mới.

QKết quả thí nghiệm của nhóm nghiên cứu cho thấy điều gì?

ASau khi áp dụng phương pháp mới, khoảng cách giữa biểu diễn mô hình và biểu diễn não giảm dần. Mô hình cải thiện trung bình 20,5% trong nhiệm vụ phân loại khái niệm trừu tượng với rất ít ví dụ, vượt trội cả các mô hình đối chứng có tham số lớn hơn.

QNeosoul và nghiên cứu này có điểm chung gì trong tầm nhìn về AI?

ACả hai đều hướng đến việc phát triển AI có cấu trúc tư duy gần với con người, không chỉ dừng ở khả năng giải quyết tác vụ mà còn có khả năng tự học hỏi, tiến hóa thông qua kiểm chứng, cạnh tranh và chọn lọc trong môi trường thực tế.

Nội dung Liên quan

Chú ý: Tuần này sẽ diễn ra đợt mở khóa token quy mô lớn của 10 altcoin! Đây là danh sách theo ngày và giờ

Tuần qua, thị trường tiền mã hóa trải qua đợt suy giảm do sự cố hack ví ColdCard và ảnh hưởng từ các sự kiện địa chính trị. Tuy nhiên, tuần này sẽ chứng kiến đợt mở khóa token quy mô lớn của 10 altcoin, có thể tác động đến nguồn cung và giá cả. Lịch trình mở khóa chi tiết (giờ UTC+3): - **Lagrange (LGR)**: 4/8, 03:00 - Giá trị: 1.38 triệu USD (15.04% vốn hóa). - **Proof (PROOF)**: 5/8, 03:00 - 39.11 triệu USD (119.59% vốn hóa). - **Power Protocol (POWER)**: 5/8, 03:00 - 1.62 triệu USD (8.93% vốn hóa). - **Verona (VERONA)**: 5/8, 03:00 - 1.37 triệu USD (12.61% vốn hóa). - **Ethena (ENA)**: 5/8, 11:00 - 15.28 triệu USD (1.80% vốn hóa). - **Goldfinger (GF)**: 6/8, 03:00 - 11.52 triệu USD (5.05% vốn hóa). - **Infinity (INF)**: 7/8, 03:00 - 2.31 triệu USD (20.30% vốn hóa). - **Stable (STBL)**: 8/8, 03:00 - 28.75 triệu USD (3.55% vốn hóa). - **Name (NAME)**: 9/8, 03:00 - 48.47 triệu USD (74.54% vốn hóa). - **Move (MOVE)**: 9/8, 03:00 - 1.22 triệu USD (3.90% vốn hóa). Đặc biệt, cần lưu ý đến PROOF với khối lượng mở khóa vượt 119% vốn hóa thị trường và NAME với gần 75%. Các sự kiện này có thể làm gia tăng áp lực bán trên thị trường. Đây không phải là lời khuyên đầu tư.

cryptonews.ru46 phút trước

Chú ý: Tuần này sẽ diễn ra đợt mở khóa token quy mô lớn của 10 altcoin! Đây là danh sách theo ngày và giờ

cryptonews.ru46 phút trước

Danh sách các altcoin phổ biến nhất theo lượt tìm kiếm trong những giờ gần đây đã được công bố!

Nền tảng CoinGecko vừa công bố danh sách các đồng altcoin được tìm kiếm nhiều nhất trong ba giờ qua. Đứng đầu danh sách là Pudgy Penguins (PENGU), tiếp theo là Catecoin (CATE) và Bless (BLESS) lần lượt ở vị trí thứ hai và ba. Về biến động giá, trong 24 giờ qua, PENGU tăng 3,9%, CATE tăng mạnh 126,2% và BLESS tăng 86,1%. What IF (IF) cũng ghi nhận mức tăng 41,9%. Dưới đây là bảng xếp hạng 15 đồng tiền điện tử được tìm kiếm nhiều nhất cùng vốn hóa thị trường của chúng: 1. Pudgy Penguins (PENGU) – 389,13 triệu USD 2. Catecoin (CATE) – 19,62 triệu USD 3. Bless (BLESS) – 32,72 triệu USD 4. Aerodrome Finance (AERO) – 385,03 triệu USD 5. Hyperliquid (HYPE) – 11,43 tỷ USD 6. Ethereum (ETH) – 224,17 tỷ USD 7. Chainlink (LINK) – 6,17 tỷ USD 8. Aave (AAVE) – 1,42 tỷ USD 9. What IF (IF) – 31,24 triệu USD 10. Polkadot (DOT) – 1,34 tỷ USD 11. Bitcoin (BTC) – 1,27 nghìn tỷ USD 12. Virtual Protocol (VIRTUAL) – 366,19 triệu USD 13. Algorand (ALGO) – 758,15 triệu USD 14. Cash Cat (CASHCAT) – 41,81 triệu USD 15. Solana (SOL) – 42,38 tỷ USD Lưu ý: Đây không phải là lời khuyên đầu tư.

cryptonews.ru2 giờ trước

Danh sách các altcoin phổ biến nhất theo lượt tìm kiếm trong những giờ gần đây đã được công bố!

cryptonews.ru2 giờ trước

Với giá 100.000 đô la mỗi tháng: Truth Social bán quyền truy cập bài đăng của Trump cho các công ty đầu tư

Trump Media and Technology Group (TMTG) đã ra mắt dịch vụ Truth API từ ngày 1/8/2026. Đây là kênh dữ liệu có phí cung cấp cho các khách hàng tổ chức, chủ yếu là các công ty đầu tư và giao dịch tần suất cao, quyền truy cập thời gian thực đến các bài đăng từ những tài khoản có ảnh hưởng nhất trên nền tảng Truth Social, bao gồm cả cựu Tổng thống Donald Trump. Theo các nguồn tin, gói dịch vụ này có giá lên tới 100.000 USD một tháng, với mức giảm giá xuống 60.000 USD/tháng cho hợp đồng ba năm. TMTG tuyên bố đây là một phần trong chiến lược tạo ra nguồn thu ổn định và lợi nhuận cao từ tài sản của công ty. Tuy nhiên, sáng kiến này đã vấp phải chỉ trích từ các nhà lập pháp cả hai đảng. Các Thượng nghị sĩ Dân chủ Elizabeth Warren và Adam Schiff đã yêu cầu Ủy ban Chứng khoán Mỹ (SEC) điều tra xem liệu việc bán quyền truy cập ưu tiên đến các bài đăng của tổng thống có vi phạm luật hay không. Thượng nghị sĩ Cộng hòa Bill Cassidy cũng chỉ trích đây là hành vi bán quyền truy cập đặc quyền không thể chấp nhận được. Phân tích AI trong bài báo cảnh báo về rủi ro tiềm ẩn, so sánh với sự kiện năm 2013 khi thị trường chứng khoán sụt giảm nhanh chóng do tin tức giả mạo. Việc biến tài khoản tổng thống thành một nút tín hiệu thị trường với độ trễ mili giây có thể tạo ra mục tiêu cho tin tặc hoặc thao túng, và đặt ra câu hỏi về trách nhiệm nếu thông tin sai lệch được phát tán qua kênh này.

cryptonews.ru3 giờ trước

Với giá 100.000 đô la mỗi tháng: Truth Social bán quyền truy cập bài đăng của Trump cho các công ty đầu tư

cryptonews.ru3 giờ trước

Chiến lược giữ mức cổ tức ưu đãi STRC ở 12% khi giá vẫn dưới mệnh giá

Cổ phiếu ưu đãi STRC của Strategy vẫn giao dịch dưới mệnh giá 100 USD trong tháng 7, nhưng công ty thông báo sẽ duy trì mức cổ tức 12% cho tháng 8. Cổ tức tiếp tục được trả hai lần mỗi tháng sau khi cổ đông phê chuẩn thay đổi này vào tháng 6. Giám đốc điều hành Phong Le khẳng định mục tiêu là đưa giá STRC về 99-100 USD, nhưng không đưa ra khung thời gian cụ thể. Strategy vừa công bố khoản lỗ ròng 8,22 tỷ USD trong quý II, chủ yếu do lỗ chưa thực hiện trên khoản nắm giữ Bitcoin. Công ty cho biết đã xây dựng dự trữ tiền mặt 3,75 tỷ USD để đảm bảo chi trả cổ tức và có kế hoạch tiếp tục mua lại cổ phiếu ưu đãi khi chúng giao dịch dưới mệnh giá.

cointelegraph4 giờ trước

Chiến lược giữ mức cổ tức ưu đãi STRC ở 12% khi giá vẫn dưới mệnh giá

cointelegraph4 giờ trước

Các giao dịch rút Bitcoin tiếp tục: 8 năm lưu trữ trong ví lạnh Coldcard kết thúc bằng số không

Ví phần cứng Coldcard bị xâm phạm, dẫn đến làn sóng rút tiền mới từ các thiết bị dễ bị tấn công. Theo Galaxy Research, tổng số tiền bị đánh cắp đã lên tới 1.367,05 BTC (khoảng 88,6 triệu USD). Vấn đề không nằm ở phần mềm cập nhật, mà ở seed phrase (cụm từ khôi phục) được tạo từ tháng 3/2021 do lỗi lập trình, khiến chúng dễ bị dò tìm. Lỗi này xảy ra khi thiết bị chuyển từ bộ tạo số ngẫu nhiên phần cứng sang bộ tạo phần mềm Yasmarang, được khởi tạo bằng dữ liệu có thể dự đoán được. Người dùng các model Mk2-Mk5 và Q với phiên bản phần mềm nhất định cần tạo seed phrase mới trên bản cập nhật đã sửa và chuyển tài sản sang đó để bảo vệ. Câu chuyện đau lòng của một nhà đầu tư 39 tuổi đã mất 2 BTC (130.000 USD) tích góp suốt 8 năm trong vài phút, dù áp dụng chiến lược "mua và giữ trong ví lạnh" thận trọng. Anh mua Bitcoin như một lá chắn chống siêu lạm phát và kế hoạch nghỉ hưu sớm, nhưng lỗ hổng đã phá hỏng mọi thứ. Sự việc nhấn mạnh rằng lưu trữ offline không tự động đảm bảo an toàn, và cộng đồng hy vọng nhà sản xuất có thể tìm cách khắc phục, hoàn trả tài sản cho người dùng.

cryptonews.ru4 giờ trước

Giao dịch

Giao ngay

Danh mục Phổ biến

比特币2,371 tin tức

Đội ngũ nghiên cứu Đại học Chiết Giang đề xuất hướng đi mới: Dạy cách thức não người hiểu thế giới cho AI

Tóm tắt

Sự khác biệt trong cách tư duy giữa con người và mô hình

Giải pháp của nhóm Chiết Giang

Neosoul và tương lai

Câu hỏi Liên quan

Nội dung Liên quan

Chú ý: Tuần này sẽ diễn ra đợt mở khóa token quy mô lớn của 10 altcoin! Đây là danh sách theo ngày và giờ

Danh sách các altcoin phổ biến nhất theo lượt tìm kiếm trong những giờ gần đây đã được công bố!

Với giá 100.000 đô la mỗi tháng: Truth Social bán quyền truy cập bài đăng của Trump cho các công ty đầu tư

Chiến lược giữ mức cổ tức ưu đãi STRC ở 12% khi giá vẫn dưới mệnh giá

Các giao dịch rút Bitcoin tiếp tục: 8 năm lưu trữ trong ví lạnh Coldcard kết thúc bằng số không

Giao dịch

Danh mục Phổ biến

Thẻ Nổi bật