Mới đây, Adam Brown, người đóng góp cốt lõi của Gemini, trưởng nhóm Blueshift đã có bài diễn thuyết dài tại Viện Vật lý Lý thuyết Perimeter với tựa đề "Huấn luyện Cát Biết Suy nghĩ: Trí tuệ Nhân tạo Phổ quát và Tương lai của Vật lý", thu hút sự chú ý rộng rãi. Trong bài phát biểu này, ông kể lại việc mình chứng kiến AI từ trình độ "mẫu giáo" tăng tốc chóng mặt lên trình độ tiến sĩ, và từ đó suy diễn: nếu xu hướng này tiếp tục, vật lý sẽ trở thành gì.
Tiêu đề bài nói chuyện: Training Sand to Think: Artificial General Intelligence & Future of Physics
Địa chỉ bài nói chuyện: https://www.youtube.com/watch?v=Mw60FH5iflI&t=3s
Bài phát biểu này còn nhận được sự giới thiệu nhiệt liệt từ Geoffrey Hinton, người đoạt giải Nobel Vật lý và giải Turing, ngợi khen nó "tuyệt vời một cách đáng kinh ngạc (amazingly good)".

Trước khi giới thiệu bài phát biểu tuyệt vời này, cần thiết phải giới thiệu về diễn giả Adam Brown.

Lý lịch của Brown có thể coi là một mẫu mực về "một nhà vật lý lý thuyết bị thay đổi số phận bởi AI". Ông học bằng kép Vật lý và Triết học tại Đại học Oxford, sau đó lấy bằng tiến sĩ tại Đại học Columbia, và lần lượt giảng dạy tại khoa Vật lý của Đại học Princeton và Đại học Stanford. Tại Stanford, ông giảng dạy thuyết tương đối rộng của Einstein, phạm vi nghiên cứu từ Vụ Nổ Lớn, lạm phát vũ trụ, đa vũ trụ, hố đen, máy tính lượng tử, đến những tình tiết nghe như trong tiểu thuyết khoa học viễn tưởng như "thang máy vũ trụ" và "bong bóng hư vô (bubbles of nothing)", cũng như số phận cuối cùng của vũ trụ, đồng thời ông cũng luôn quan tâm đến mối liên hệ sâu sắc giữa vật lý và khoa học máy tính.
Năm 2018, Brown gia nhập Google. Hiện ông lãnh đạo một nhóm có tên Blueshift trong DeepMind, chuyên nâng cao khả năng khoa học và lập luận của AI, đồng thời cũng là một trong những người đóng góp cốt lõi cho mô hình lớn Gemini.
Trong phần mở đầu bài phát biểu, ông đề cập rằng trong sự nghiệp của mình, ông đã viết khoảng bốn mươi bài báo vật lý lý thuyết, nhưng gần đây đã ngừng viết, không còn tự tay viết bài báo, nhưng lý do không phải là không viết được, mà là vì ông cảm thấy viết từng bài báo bằng tay giống như một "thú vui tội lỗi", bởi điều ông thực sự nên làm lúc này là tham gia chế tạo một cỗ máy có thể sản xuất tri thức "ở quy mô công nghiệp".
Lời mở đầu như vậy cũng đặt ra tông điệu cho toàn bộ bài phát biểu: một người đang ở trung tâm của cơn bão công nghệ "AI + Khoa học", cố gắng mô tả hình dạng thực sự của cơn bão cho các đồng nghiệp.
Chúng tôi cũng đã tóm tắt bài phát biểu tuyệt vời này của Brown với sự hỗ trợ của AI.
Từ hạt cát đến cỗ máy biết suy nghĩ
Brown dùng một câu để tóm tắt vị trí đặc biệt mà nền văn minh nhân loại đang ở vào lúc này: Chúng ta đã học được cách tinh chế cát thành silicon, biến silicon thành chip, lắp ráp chip thành mạng nơ-ron, và giờ lại học được cách huấn luyện những mạng nơ-ron này để chúng biết suy nghĩ.
Ông đặc biệt nhấn mạnh, lần này khác hoàn toàn với bất kỳ loại "công cụ tính toán" nào trước đây. Từ bàn tính đến máy tính bỏ túi, con người từ lâu đã có các công cụ hỗ trợ nghiên cứu khoa học, nhưng những thứ đó chỉ là công cụ đơn điểm, chỉ có thể giúp bạn hoàn thành một bước nào đó trong quy trình, phần còn lại vẫn cần con người làm.
Mô hình ngôn ngữ lớn (LLM) thì khác, nó có tiềm năng hoàn thành toàn bộ quy trình công việc của một nhà vật lý lý thuyết, đây chính là ý nghĩa của cụm từ "trí thông minh phổ quát" (general intelligence). Brown phán đoán rằng, LLM rất có thể chính là chất nền cơ bản mà con người dùng để xây dựng trí tuệ nhân tạo phổ quát.
Ông nhắc nhở người nghe rằng, mọi người có thể đã dùng qua các chatbot như ChatGPT, Gemini hay Claude, nhưng chưa chắc đã nhận ra một sự thật diễn ra lặng lẽ: những hệ thống này đã vượt qua bài kiểm tra Turing từ vài năm trước, và hầu như không có ai tổ chức lễ kỷ niệm đặc biệt cho điều đó.

Mạng nơ-ron được "nuôi dưỡng", không phải được "lập trình"
Để hiểu tại sao mô hình lớn hoàn toàn khác với chương trình máy tính truyền thống, Brown đưa ra một phép ẩn dụ cốt lõi: LLM không phải được program (lập trình) ra, mà là được grow (nuôi lớn) lên, tức chúng giống như được nuôi dưỡng trưởng thành hơn là được viết ra.

Quá trình cụ thể được chia thành hai giai đoạn.
Giai đoạn đầu tiên gọi là "tiền huấn luyện". Các kỹ sư bắt đầu từ một tập hợp các nơ-ron nhân tạo được kết nối ngẫu nhiên, gần như nói nhảm, để nó liên tục thử dự đoán "từ tiếp theo" trong một đoạn văn bản sẽ là gì. Đoán đúng, thì củng cố đường dẫn thần kinh tương ứng; đoán sai, thì làm suy yếu nó. Quá trình này cực kỳ dài: khi xem qua một triệu từ, những gì mô hình nói ra về cơ bản vẫn là nhảm nhí; sau khi đọc vài chục triệu đến vài tỷ từ, nó đã có thể viết những câu ngữ pháp chính xác nhưng hơi cứng nhắc; cho đến khi đọc hết toàn bộ internet (vài chục nghìn tỷ từ), nó mới có thể trò chuyện trôi chảy, mạch lạc về hầu hết mọi chủ đề.
Giai đoạn thứ hai gọi là "hậu huấn luyện", Brown ví von đây là việc đưa mô hình "vào trường dạy lễ nghi". Mô hình vừa kết thúc tiền huấn luyện chỉ biết dự đoán từ tiếp theo một cách máy móc, nói năng thô lỗ và không chịu nghe lời, nhiệm vụ của hậu huấn luyện là dạy nó trở nên lịch sự, sẵn sàng hợp tác với người dùng, chứ không chỉ đơn thuần chơi trò chơi nối chữ. Hiện nay, số lượng tham số của các mô hình lớn chủ đạo đã tăng từ cấp tỷ cách đây mười năm lên đến cấp nghìn tỷ, mặc dù vẫn còn xa so với quy mô khoảng một trăm nghìn tỷ kết nối synap của não người, nhưng quy mô này đã đủ để phép màu xảy ra.
Nhà vật lý làm việc không đúng chuyên môn: Scaling Law đã châm ngòi cho cuộc cách mạng này
Brown đặc biệt đề cập rằng, các nhà vật lý đã đóng một vai trò bất ngờ tại điểm khởi đầu của cuộc cách mạng AI: mang đến tư duy "Scaling Law".
Các nhà vật lý vốn bị ám ảnh bởi việc tìm kiếm các mối quan hệ luỹ thừa đơn giản: nhân đôi chiều cao của Alice, diện tích bề mặt cơ thể cô ấy sẽ gấp bốn lần, trọng lượng sẽ gấp tám lần, đây là phân tích thứ nguyên đơn giản nhất; còn mối quan hệ luỹ thừa giữa tỷ lệ trao đổi chất của động vật và trọng lượng cơ thể được Kleiber phát hiện gần một trăm năm trước, là một ví dụ tinh tế hơn - mãi nhiều năm sau, các nhà vật lý mới giải thích được nguyên lý đằng sau nó bằng chiều phân hình của hệ thống mạch máu.

Chưa kể đến định luật Moore nổi tiếng:

Năm 2020, một số nhà nghiên cứu có nền tảng vật lý đã áp dụng cách tư duy này vào mạng nơ-ron và phát hiện ra rằng chỉ cần mở rộng quy mô sức mạnh tính toán, lượng dữ liệu và quy mô mô hình theo tỷ lệ, hiệu suất của mô hình trong nhiệm vụ "dự đoán từ tiếp theo" sẽ tăng lên ổn định dọc theo một đường thẳng trong hệ tọa độ log-log.

Đường cong này sau đó đã được mở rộng tới tận tám bậc độ lớn, và vẫn đúng.
Brown bông đùa rằng, bức ảnh này "đơn giản đến mức ngay cả nhà đầu tư mạo hiểm cũng có thể hiểu được", và nó có thể trực tiếp nói với thị trường vốn rằng: đầu tư tiền (tức là sức mạnh tính toán) vào, sẽ đổi lại được một mô hình mạnh hơn.
Đường cong đơn giản này chính là điểm khởi đầu của Thời đại Scaling trong sáu năm qua.
Nhưng Brown cũng chỉ ra rằng, việc đổ sức mạnh tính toán chỉ là một phần của câu chuyện. Mười năm qua, sức mạnh tính toán tiêu thụ để huấn luyện AI tiên tiến tăng khoảng bốn lần mỗi năm, số vốn đầu tư cho huấn luyện tăng khoảng 2,7 lần mỗi năm.

Hiện tại, sức mạnh tính toán cần thiết cho một lần huấn luyện hàng đầu ước tính tiêu tốn vài trăm triệu đô la, trong khi GDP hàng năm của Mỹ gần 30 nghìn tỷ đô la, điều này có nghĩa là đường cong này vẫn còn rất nhiều không gian để tăng trưởng.

Nhưng quan trọng hơn việc đổ sức mạnh tính toán, là việc con người liên tục mài giũa ở cấp độ thuật toán: các nhà nghiên cứu không ngừng tìm ra các khâu kém hiệu quả trong quy trình huấn luyện và cải thiện chúng, đây mới là "động cơ thứ nhất" thực sự đằng sau sự tiến bộ của AI trong thập kỷ qua.
Lịch sử "ngắn ngủi" của kiểm tra chuẩn: Từ mẫu giáo đến tiến sĩ
Nếu Scaling Law giải thích "tại sao AI trở nên mạnh hơn", thì sự hưng suy của một loạt bài kiểm tra chuẩn đã ghi lại "AI thực sự đã mạnh đến mức nào". Brown dùng một loạt điểm số kiểm tra để vẽ ra một đường cong khiến người ta chóng mặt.
Bốn năm trước, một bài kiểm tra chuẩn toán học cấp trung học tên là MATH ra đời. Các nhà nghiên cứu mời một nghiên cứu sinh tiến sĩ khoa học máy tính không giỏi toán lắm làm bài, đạt khoảng 40%; lại mời một thí sinh ba lần đoạt huy chương vàng Olympic Toán học Quốc tế, đạt 90%. Còn mô hình lớn tiên tiến nhất lúc đó chỉ đạt được 6% - gần như không khác gì đoán mò, vì mô hình thậm chí còn không đọc hiểu đề bài hỏi gì.
Thị trường dự đoán năm đó cho rằng, đến năm 2025 mô hình có thể đạt 50% đã là "lạc quan một cách ngạo mạn", chính người tạo ra bài kiểm tra chuẩn này đã công khai tuyên bố, nếu thực sự có mô hình nào làm được điều đó, ông sẽ cảm thấy "khá sốc".

Kết quả là, mốc 50% này gần như ngay lập tức bị một hệ thống tên là Minerva vượt qua. Đến giữa năm 2024, hệ thống của nhóm Brown đã đạt 90% trên bài kiểm chuẩn này. Họ thậm chí còn tổ chức riêng một bữa tiệc disco trượt patin phong cách những năm 90 để ăn mừng. Thế nhưng chỉ sáu tháng sau, các mô hình lớn có sẵn trên thị trường đã giải quyết gần như trọn vẹn bộ đề này. Bài kiểm tra chuẩn MATH từ đó "chết", và nó đã chuyển thẳng từ "quá khó" sang "quá dễ", gần như không có điểm dừng ở giữa.

Tiếp theo là bài kiểm tra GPQA dành cho nghiên cứu sinh, mô phỏng độ khó của kỳ thi tuyển chọn năm thứ nhất tiến sĩ, điểm trung bình của chuyên gia con người khoảng 70%. Mô hình bắt đầu từ mức gần như đoán ngẫu nhiên, trong khoảng thời gian 2024 đến 2025 đã vượt qua trình độ chuyên gia, và hiện nay gần như đạt điểm tuyệt đối. Để loại trừ khả năng "mô hình chỉ học thuộc đáp án", nhóm Brown đã thiết kế riêng những đề mới cùng phân phối nhưng chưa xuất hiện trên internet, kết quả là hiệu suất của mô hình gần như không giảm.

Brown thậm chí còn đưa ra bài thi cuối kỳ dành cho nghiên cứu sinh về thuyết tương đối rộng và cơ học lượng tử mà chính tay ông chấm tại Stanford (những đề này chưa từng lên mạng), kết quả mô hình cũng đạt điểm tuyệt đối trong vòng một năm rưỡi. Ông nửa đùa nửa thật nói, vậy là ngay cả đề thi do chính ông ra, cũng "không may tử trận" rồi.

Sau đó, danh sách các bài kiểm tra chuẩn "đổ" ngày càng dài, bao gồm cả bài kiểm tra tổng hợp siêu khó từng được gọi là "Kỳ thi Cuối cùng của Nhân loại" (Humanity's Last Exam).

Và lần vượt qua mang tính biểu tượng nhất, xảy ra tại Olympic Toán học Quốc tế.
Vượt qua ngưỡng cửa Olympic Toán
Chỉ hơn một năm trước, một người đoạt giải Turing đã trực tiếp nói với Brown rằng, mô hình lớn sẽ không bao giờ giải được các bài toán cấp độ Olympic Toán học Quốc tế (IMO), bởi vì điều đó đòi hỏi sự sáng tạo thực sự, không thể lừa được bằng cách học thuộc lòng. Đề thi IMO nổi tiếng với câu "những bài toán khó nhất trong phạm vi toán học trung học": những thiếu niên thông minh nhất thế giới phải luyện tập một hai năm mới có thể lên sân khấu, trong sáu bài, việc giành được huy chương vàng đã thuộc hàng hiếm có.

Mùa hè năm ngoái, ngưỡng cửa này đã bị vượt qua. Hệ thống của nhóm Brown trong bài kiểm tra cấp độ IMO đã làm đúng năm trong sáu bài, đạt trình độ huy chương vàng. Hơn nữa, hệ thống này không phải dựa vào việc chất đống một chuỗi dài các chứng minh hình thức hóa không ai hiểu nổi để lừa qua. Chủ tịch IMO trong đánh giá công khai cho biết, những lời giải này "đáng ngạc nhiên ở nhiều mặt", giám khảo cho rằng chúng rõ ràng, chính xác, phần lớn dễ hiểu, sử dụng cách thức trừu tượng hóa toán học tương tự như con người.
Brown cũng thẳng thắn trình bày "hiện trường lật kèo" của mô hình lớn.

Một câu đố mẹo kinh điển là: Cha con gặp tai nạn xe hơi, người cha tử vong, đứa trẻ được đưa vào phòng phẫu thuật, bác sĩ phẫu thuật chính nhìn thấy cậu bé và nói "Tôi không thể phẫu thuật cho cậu bé, cậu bé là con trai tôi", hỏi chuyện gì đang xảy ra (đáp án chuẩn là bác sĩ là mẹ của cậu bé). Câu hỏi này kiểm tra xem người đọc có mặc định bác sĩ phẫu thuật nhất định là nam giới không. Mô hình lớn trả lời câu hỏi "gây bão mạng" này một cách dễ dàng, vì nó đã thấy hàng nghìn lần trong dữ liệu huấn luyện. Nhưng khi Brown đảo ngược đề bài: người mẹ tử vong, bác sĩ được đặc biệt ghi chú là "cha của cậu bé", rồi hỏi lại câu hỏi tương tự, mô hình hoàn toàn không nhận ra đề bài đã bị đảo ngược, mà máy móc áp dụng đáp án chuẩn "bác sĩ là người phụ huynh còn lại".
Brown nói, điều này phơi bày một "sở thích" đặc trưng do cách thức huấn luyện mô hình để lại.
Hợp tác Nhân-Mã: AI viết ra chứng minh mà các nhà toán học sẵn sàng đồng tác giả
Mười tháng sau khi vượt qua ngưỡng cửa IMO, nhóm Brown đã hoàn thành một công việc mà ông cho là có ý nghĩa lớn hơn: nghiên cứu toán học thực sự, chưa từng có ai biết đáp án trước đó.
Tháng Chín năm ngoái, nhóm Brown hợp tác với một số nhà toán học chuyên nghiệp, áp dụng mô hình hợp tác mà ông gọi là "kiểu Nhân Mã" (Centaur) - Nhân Mã là sinh vật nửa người nửa ngựa trong thần thoại Hy Lạp, và ở đây, "phần không phải người" được thay thế bằng LLM.

Toàn bộ quá trình là một cuộc đối thoại liên tục: mô hình đề xuất các ý tưởng chứng minh ứng viên, chuyên gia con người đánh giá những ý nào có giá trị, hướng dẫn mô hình tiếp tục đi sâu, cuối cùng hoàn thành một bài báo toán học hoàn chỉnh dưới sự hướng dẫn của con người. Một trong những người đồng tác giả bài báo, là Giáo sư Đại học Stanford, Chủ tịch đương nhiệm của Hội Toán học Hoa Kỳ. Vị giáo sư này đưa ra đánh giá rằng, lập luận mà Gemini đề xuất tuyệt đối không phải là sự đóng gói lại đơn giản các chứng minh hiện có, mà là một cái nhìn sâu sắc mà chính ông cũng sẽ tự hào.
Brown nhấn mạnh, điều này vào thời điểm đó (cuối năm ngoái) đã là trình độ cao nhất mà mô hình lớn có thể đạt được trong lĩnh vực toán học. Nhưng ông ngay lập tức bổ sung thêm: so với hàm lượng thực sự của "trình độ cao nhất", điều này vẫn còn kém xa.
Bước ngoặt thực sự: AI độc lập đánh bại giả thuyết bị lãng quên tám mươi năm
Bước vào năm 2026, tình hình đã chuyển biến nhanh chóng, hoặc nói là đã tiến lên nhanh chóng. Brown mở đầu bằng một câu nói đùa gần như khiêu khích: "Chỉ tuần trước thôi, LLM vẫn chưa từng có đột phá toán học thực sự lớn nào." Giờ đây, câu nói này không còn đúng nữa.

Sự kiện lớn này nhiều người đã nghe nói đến. Giả thuyết "khoảng cách đơn vị" do Erdős đề xuất năm 1946, trong tám mươi năm qua được giới toán học phổ biến cho rằng cấu hình lưới hình vuông đã là lời giải tối ưu đã biết. Một mô hình lớn nội bộ của OpenAI đã độc lập đưa ra một phản ví dụ, dựa vào công cụ trong lý thuyết số đại số, xây dựng một loạt tập hợp điểm, số lượng cặp điểm có khoảng cách đơn vị vượt quá giới hạn trên được công nhận trước đó. Điều này tương đương với việc bác bỏ giả thuyết lâu nay bị tin là đúng này.

Đáng chú ý là, đề này không hề lạnh nhạt, trước đó nhiều người đã thử, nhưng đó là một bài toán khó mà các nhà toán học đã bỏ nhiều công sức, nhưng vẫn loanh quanh ở hướng "chứng minh" chứ không phải "phản chứng". Brown đặc biệt đề cập rằng, người đoạt giải Fields Terence Tao đã tham gia xem xét lại kết quả này và đưa ra đánh giá cao.
Brown phán đoán, đây là đột phá lớn thực sự đầu tiên mà mô hình lớn đạt được trong lĩnh vực toán học, và ông cho rằng đây chắc chắn không phải là cái cuối cùng - "cánh cổng đã mở", khi sức mạnh của mô hình liên tục vượt qua "ngưỡng cần thiết để tạo ra đột phá", ông dự đoán sẽ có nhiều thành tựu tương tự xuất hiện liên tiếp.
Ông nửa đùa bổ sung, nhìn lại thì lý do bài toán này bị đánh bại đầu tiên, có lẽ là vì cấu trúc đề bài của nó vô tình rơi vào "vùng an toàn" của mô hình lớn; tiếp theo, mô hình sẽ giải quyết những bài toán khó "thân thiện với AI" trước, rồi từ từ đánh bại những bài toán khó "không thân thiện lắm".
Lời tiên tri từ cờ vua
Để thuyết phục người nghe tin rằng đường cong này sẽ tiếp tục đi lên, Brown đưa ra một biểu đồ đường cong trông như vẽ bừa thoạt nhìn: một đường thẳng liên tục leo dốc. Dĩ nhiên, biểu đồ này không phải ông vẽ bừa đâu, mà là trực tiếp lấy từ dữ liệu thực về sức mạnh máy tính cờ vua thay đổi theo thời gian, trục tung là điểm xếp hạng Elo đo sức mạnh cờ, trục hoành là năm.

Brown tổng kết bốn giai đoạn trong lịch sử AI cờ vua:
Ban đầu là "thời đồ chơi", để máy tính đi một nước cờ hợp lý đã coi như kỳ tích;
Tiếp theo là "thời công cụ", máy tính chỉ có thể phát huy tác dụng trong các khâu cụ thể như tính toán tàn cuộc hoặc ghi nhớ khai cuộc;
Sau đó là "thời Nhân Mã", lúc đó tổ hợp sức cờ mạnh nhất toàn vũ trụ, là sự hợp tác giữa đại kiện tướng và khả năng tìm kiếm sâu của máy tính;
Và hiện nay, con người đã bước vào "thời Siêu nhân" toàn diện: khi các kỳ thủ đỉnh cao hợp tác với máy tính, chiến lược tối ưu là buông tay để máy tính tự đánh.
Brown cho rằng, bốn giai đoạn này trong lĩnh vực nghiên cứu khoa học hầu như có thể tương ứng lần lượt.

Quy luật đầu tiên là: ở cùng tổng thể lực, máy tính vượt trội con người về chiến thuật, tốc độ tìm kiếm, nhưng vẫn yếu hơn trong việc phán đoán chiến lược, "gu". Đây cũng chính là đặc điểm mà các mô hình lớn hiện tại bộc lộ trong nghiên cứu toán và vật lý: chúng giỏi áp dụng các bổ đề và kỹ thuật hiện có, không giỏi phán đoán "hướng đi tổng thể nên đi đâu", nhưng điểm yếu này đang thu hẹp nhanh chóng.
Quy luật thứ hai là: số lượng ván cờ mà AI cần "trải qua" để huấn luyện chơi cờ vua vượt xa tổng số ván cờ mà một đời người có thể chơi, nhưng vì máy móc có thể tự đấu với tốc độ cao không biết mệt mỏi, nên "thời gian theo lịch" thực tế cần thiết lại ngắn hơn rất nhiều so với việc đào tạo một kỳ thủ con người.
Quy luật thứ ba là, một khi sức cờ máy tính vượt qua trình độ đỉnh cao của con người, nó không bao giờ dừng lại, xét cho cùng không có lý do vật lý hay logic nào khiến nó dừng lại đúng ở mức gần với trình độ con người.
Sự thật đáng an ủi thứ tư là: sự trỗi dậy của AI cờ vua ngược lại đã nâng cao trình độ tổng thể của các kỳ thủ con người, kỳ thủ con người mạnh nhất ngày nay mạnh hơn bất kỳ thời kỳ nào trong lịch sử, một phần chính là nhờ học hỏi từ AI siêu mạnh; mà bản thân môn thể thao cờ vua, cũng chưa bao giờ phổ biến như ngày nay.
Hàm ý của Brown rất rõ ràng: nếu nghiên cứu khoa học lặp lại quỹ đạo này, nhân loại rất có thể sẽ đón nhận "nhà khoa học AI" hoàn toàn tự chủ trước, sau đó là một "AI Einstein" nào đó theo nghĩa nào đó... Còn sau đó sẽ xảy ra điều gì, ông thừa nhận đã vượt quá phạm vi dự đoán của ông.

Dù tiến bộ có dừng lại tại đây, vật lý cũng đã được tái định hình
Brown cũng đưa ra một "giả định bi quan" đáng cảnh giác: nếu khả năng của mô hình lớn hoàn toàn ngừng tiến bộ kể từ hôm nay, điều gì sẽ xảy ra?

Ông thẳng thắn nói, cách dùng thực sự "không hiệu quả" hiện nay, là trực tiếp nói với mô hình rằng "hãy phát minh cho tôi một lý thuyết hấp dẫn lượng tử hoàn toàn mới", câu trả lời nhận được có lẽ chỉ là thứ "nhảm nhí AI" vô giá trị, đọc vào buồn ngủ.
Nói chung hơn, mô hình lớn hiện tại vẫn tồn tại bốn điểm yếu rõ ràng: tính tự chủ thấp, tốc độ học chậm, khả năng lập kế hoạch kém, khả năng sửa lỗi yếu.

Brown thừa nhận, bốn điểm yếu này trong năm qua đều có cải thiện đáng kể, nhưng không có điểm nào được giải quyết triệt để, và do đó một hệ thống có thể đạt điểm tuyệt đối trong kỳ thi nghiên cứu sinh của mỗi ngành học, lại lâu rồi vẫn chưa đưa ra được thành tựu có thể được gọi là "đột phá lớn".
Khi chuẩn bị bài phát biểu này, ông thậm chí còn chuyên biệt vẽ điều này thành một "đường cong phẳng" có đánh dấu hỏi chấm, tự giễu thừa nhận đây có lẽ là bức ảnh duy nhất trong toàn bài phát biểu "không tăng liên tục". Nhưng ông cũng bổ sung rằng, chưa đợi đến hết năm 2026, mọi người e rằng đã bắt đầu tranh luận từ "đột phá lớn" rốt cuộc nên định nghĩa thế nào. Sự thật chứng minh, ngày này đến còn nhanh hơn chính ông dự đoán.
Tuy nhiên, ngay cả khi tiến bộ thực sự dừng lại ở thời điểm này, Brown cho rằng mô hình lớn cũng đã đủ để thay đổi hoàn toàn diện mạo nghiên cứu vật lý.
Ông liệt kê một số cách dùng đã chín muồi, và vẫn đang tiếp tục tiến bộ:
Làm một "gia sư riêng không phán xét", có thể giải đáp những lỗ hổng kiến thức ngay cả nhà vật lý cũng không nói rõ được vào lúc ba giờ sáng, mà không cần đánh thức chuyên gia đẳng cấp thế giới dậy;
Làm trợ lý lập trình, hiện nay đã mạnh đến mức "bị gọi là trợ lý lập trình đều có vẻ hơi xúc phạm", nhiều vấn đề vật lý trước đây bị coi là "không phải vấn đề lập trình", giờ đây đều có thể được diễn đạt lại thành vấn đề mã để giải;
Làm công cụ tra cứu tài liệu, có thể đọc hết thư viện bài báo của cả một lĩnh vực, trực tiếp nói cho bạn biết một ý tưởng nào đó đã có người làm chưa; ngoài ra còn có thể đóng vai trò là đối tác động não.
Brown tổng kết, lợi thế cốt lõi của mô hình lớn nằm ở chỗ: nó nhanh, phủ rộng, không biết mệt mỏi, và có thể được sao chép vô hạn. Đào tạo một nhà vật lý mất vài chục năm, mà một khi huấn luyện được một mô hình mạnh, có thể chạy hàng nghìn hàng vạn bản sao cùng lúc - điều này đã đủ để "thay đổi hoàn toàn" môn học này rồi.
Kết luận: Thời đại hoàng kim của vật lý
Ở phần cuối bài phát biểu, Brown đưa ra phán đoán của ông về "tại sao tiến bộ sẽ không dừng lại".

Xét từ góc độ kinh tế vĩ mô, tỷ lệ vốn đầu tư vào huấn luyện so với GDP toàn cầu hiện nay vẫn còn rất nhỏ, không gian tăng trưởng để lại còn rất dồi dào; xét từ bên trong kỹ thuật, phương pháp huấn luyện mô hình lớn hiện tại "xa mới tinh tế như trông thấy". Nhiều ý tưởng cải tiến hiển nhiên, nhưng chưa được thử nghiệm nghiêm túc vẫn còn chờ khai phá, chồng chất thêm nhân tài và sức mạnh tính toán liên tục đổ vào lĩnh vực này, Brown phán đoán kiến trúc mô hình và quy mô sức mạnh tính toán hiện tại đã đủ để dẫn đến trí tuệ nhân tạo phổ quát, ngay cả khi không có đột phá lý thuyết hoàn toàn mới.
Ông cũng phản hồi một luận điệu bi quan lưu truyền lâu nay, rằng mô hình lớn chỉ biết "khớp mẫu", không thể tạo ra ý tưởng mới thực sự.

Quan điểm của Brown là, nếu kéo mức độ trừu tượng lên đủ cao, hầu như tất cả những sáng tạo của con người trông như "đột phá lớn", về bản chất cũng là một dạng khớp mẫu ở chiều cao hơn nào đó. Một câu nói cửa miệng được xác nhận lặp đi lặp lại trong lĩnh vực này là: "Những mô hình này chính là muốn học", bất kể về lý thuyết có bao nhiêu lý do có vẻ hợp lý nói rằng chúng nên học không tốt, biểu hiện của chúng luôn vượt quá mong đợi.
Kết luận của Brown là, vài năm tới, chúng ta sẽ đón thời đại hoàng kim "Nhân Mã" hợp tác giữa con người và AI: những công cụ này sẽ được trao vào tay các nhà vật lý, nhà toán học và chuyên gia các lĩnh vực khác của con người, cùng nhau mở ra một thời kỳ Phục hưng mới trong lĩnh vực khoa học và toán học.
Sau đó nữa, nếu việc "tạo ra một AI Einstein" thực sự thành hiện thực, do việc sao chép một mô hình đã được huấn luyện hầu như không cần chi phí thêm, rất có thể nhân loại sẽ sớm sở hữu hàng chục tỷ "AI Einstein cấp Siêu nhân" vận hành đồng thời. Điều này nghe như tiểu thuyết khoa học viễn tưởng, nhưng đang diễn ra.

Brown nói, về lâu dài, AI rốt cuộc sẽ đưa vật lý đi về đâu, ông cũng như tất cả mọi người đều khó dự đoán. Ông thậm chí cho rằng, khả năng của AI liên tục được nâng cao đang khiến tương lai của cả thế giới trở nên khó dự đoán hơn. Nhưng có một điều ông dám khẳng định: vài năm tới, sẽ là quãng thời gian hào hứng nhất trong lịch sử vật lý. Những vấn đề đã làm phiền ông trong cả sự nghiệp, ông dự đoán sẽ trong tương lai không xa, lần lượt được giải đáp.
Bài viết này từ tài khoản công chúng WeChat "Trái tim Máy móc" (ID:almosthuman2014), tác giả: Quan tâm AI






