Tác giả: Michael Burry
Biên dịch: Deep Tide TechFlow
The New York Times, Thứ Bảy, ngày 19 tháng 6 năm 1880
Chào mừng bạn đến với loạt bài "Lịch sử luôn có vần điệu". Trong loạt bài này, tôi xuất phát từ những góc nhìn then chốt của quá khứ xa xôi để soi rọi những sự kiện đang diễn ra trong hiện tại.
Vào một ngày Thứ Bảy yên tĩnh, như thường lệ, tôi lật giở những tờ báo cũ - đây là một sở thích của tôi - và tình cờ phát hiện một bài báo ngày 19 tháng 6 năm 1880, có sự tương đồng đáng kinh ngạc với những lo lắng về AI ngày nay.
Đây là câu chuyện của Melville Ballard. Từ nhỏ, ông không có ngôn ngữ, nhưng đã dùng mắt nhìn chằm chằm vào một gốc cây và tự hỏi một câu hỏi: Người đầu tiên, có phải đã mọc lên từ đây không?
Trường hợp cách đây 144 năm này - được công bố chính thức tại Viện Smithsonian - đặt ra một chất vấn có thể là chí mạng đối với các mô hình ngôn ngữ lớn (LLM) và số vốn khổng lồ đằng sau chúng. Thông qua câu chuyện của một người bình thường, nó tuyên bố một cách mạnh mẽ: Tư duy phức tạp, được sinh ra từ sự im lặng trước ngôn ngữ.
Ngày nay, trong thế kỷ 21, chúng ta đặt ngôn ngữ lên trước năng lực lý trí, không phải đang xây dựng trí tuệ - chúng ta chỉ đang tạo ra một tấm gương ngày càng tinh xảo.
Trong tờ báo cũ đó, có hai bài báo đáng chú ý. Hãy bắt đầu với bài ở giữa trang ba, có tiêu đề: Tư duy không cần ngôn ngữ.
Dĩ nhiên, các mô hình ngôn ngữ lớn, mô hình ngôn ngữ nhỏ và khả năng suy luận là những chủ đề nóng nhất hiện nay.
Tiêu đề đầy đủ của bài báo đó là: Tư duy không cần ngôn ngữ - Tự thuật của một người câm điếc: Những suy nghĩ và trải nghiệm đầu tiên của ông. Bài báo ban đầu được đăng trên Washington Star vào ngày 12 tháng 6 năm 1880.
Nhân vật chính là Giáo sư Samuel Porter từ Trường Đại học Quốc gia cho Người Câm điếc Kendall Green, ông đã trình bày một bài luận tại Viện Smithsonian với tiêu đề Có thể có tư duy mà không có ngôn ngữ không? Trường hợp của một người câm điếc.
Bài luận bắt đầu bằng việc thảo luận về hoạt động tinh thần của người câm điếc và trẻ em khi không có hình thức ngôn ngữ, với cách diễn đạt các khái niệm đã lỗi thời so với ngày nay, tôi định bỏ qua.
Nhưng trường hợp được nêu là về một giáo viên tại Trường Cao đẳng Sư phạm cho Người Câm điếc Columbia - Melville Ballard, bản thân ông cũng là một người câm điếc, và cũng là cựu sinh viên của Trường Đại học Quốc gia cho Người Câm điếc.
Ballard nói rằng thời thơ ấu, ông giao tiếp với cha mẹ và anh em thông qua cử chỉ tự nhiên hoặc kịch câm. Người cha tin rằng quan sát sẽ phát triển trí tuệ của con trai nên thường xuyên dẫn cậu đi dạo.
Ông tiếp tục: Vào khoảng hai hoặc ba năm trước khi chính thức được giới thiệu những điều cơ bản của ngôn ngữ viết, trong một lần đi dạo, cậu bé bắt đầu tự hỏi: "Thế giới này đến từ đâu?" Cậu cảm thấy tò mò mãnh liệt về nguồn gốc của sự sống con người, sự xuất hiện ban đầu, lý do tồn tại của trái đất, mặt trời, mặt trăng và các vì sao.
Một lần, cậu nhìn thấy một gốc cây to và nảy ra một câu hỏi trong đầu: "Có khả năng nào người đầu tiên đến thế giới này đã mọc lên từ gốc cây đó không?" Nhưng ngay lập tức cậu nghĩ, gốc cây đó chỉ là tàn dư của một cái cây từng hùng vĩ; vậy cái cây đó đến từ đâu? Nó từ từ mọc lên từ đất, giống như những cây non nhỏ bé trước mắt - và cậu lập tức cho rằng việc liên hệ nguồn gốc con người với một gốc cây già mục nát là lố bịch, và gạt bỏ ý nghĩ đó.
Cậu không biết điều gì đã kích hoạt những câu hỏi của mình về nguồn gốc vạn vật, nhưng cậu đã hình thành các khái niệm về sự truyền thừa cha-con, sự sinh sản của động vật, thực vật mọc từ hạt giống.
Câu hỏi thực sự lởn vởn trong đầu cậu là: Vào điểm khởi đầu xa xôi nhất của thời gian, khi chưa có con người, không động vật, không thực vật, thì con người đầu tiên, con vật đầu tiên, cây cối đầu tiên, rốt cuộc đến từ đâu? Cậu suy nghĩ nhiều nhất về con người và trái đất, tin rằng con người rồi sẽ diệt vong, và sau khi chết sẽ không có sự phục sinh.
Khoảng 5 tuổi, cậu bắt đầu hiểu khái niệm truyền thừa cha-con; từ 8 đến 9 tuổi, cậu bắt đầu đặt câu hỏi về nguồn gốc vũ trụ. Về hình dạng trái đất, từ một tấm bản đồ hai bán cầu, cậu suy luận rằng: đó là hai đĩa vật chất khổng lồ, nằm cạnh nhau; mặt trời và mặt trăng là hai tấm phẳng phát sáng hình tròn, cậu cảm thấy một sự kính sợ nào đó với chúng, và từ việc chúng mọc và lặn, cậu suy luận rằng phải có thứ gì đó có sức mạnh chi phối quỹ đạo di chuyển của chúng.
Cậu cho rằng mặt trời chui vào một cái lỗ ở phía tây, và chui ra từ một cái lỗ khác ở phía đông, đi qua một đường ống khổng lồ bên trong lòng đất, dọc theo cùng một đường cong mà nó vạch ra trên bầu trời. Những ngôi sao trong mắt cậu là những điểm sáng lấp lánh được gắn trên tấm màn trời. Cậu mô tả mình đã suy nghĩ vô vọng về tất cả những điều này như thế nào cho đến năm 11 tuổi khi vào trường học.
Trước đó, mẹ cậu đã nói với cậu rằng trên trời có một sinh thể thần bí, nhưng khi bà không thể trả lời những câu hỏi truy vấn của cậu, cậu chỉ có thể tuyệt vọng từ bỏ, lòng đầy buồn bã, vì không thể đạt được bất kỳ nhận thức chắc chắn nào về sinh mệnh thần bí trên trời đó.
Năm đầu tiên đi học, mỗi Chủ nhật cậu chỉ học vài câu, mặc dù nghiên cứu những từ đơn giản này, cậu chưa bao giờ thực sự hiểu ý nghĩa của chúng. Cậu tham dự lễ, nhưng do không thành thạo ngôn ngữ ký hiệu, cậu hầu như không hiểu gì. Năm thứ hai, cậu có một cuốn Giáo lý hỏi đáp nhỏ, bao gồm một loạt câu hỏi và câu trả lời.
Sự kết hợp giữa ngôn ngữ và năng lực lý trí, như vậy đã thúc đẩy sự phát triển của năng lực thấu hiểu.
Sau đó, cậu đã có thể hiểu ngôn ngữ ký hiệu mà các giáo viên sử dụng. Có người có thể nói, bản tính tò mò của cậu lẽ ra nên được thỏa mãn. Sự thật không phải vậy - khi hiểu được rằng vũ trụ được tạo ra bởi Linh hồn Chủ thể Vĩ đại, cậu lại bắt đầu truy vấn: Vậy Đấng Sáng tạo đến từ đâu? Cậu tiếp tục truy tìm bản chất và nguồn gốc của Đấng Chủ thể đó. Khi suy nghĩ về vấn đề này, cậu tự hỏi: "Sau khi chúng ta bước vào Vương quốc của Chúa, liệu chúng ta có thể nhận biết bản chất của Chúa và hiểu được sự vô hạn của Ngài không?" Liệu cậu có nên như vị tiên tổ đó mà nói: "Ngươi có thể dò xét thấu suốt Chúa được chăng?"
Giáo sư Porter sau đó đã trình bày luận điểm cốt lõi của mình trước thính giả của Viện Smithsonian năm 1880.
Ông nói, động vật có thể hiểu một số từ ngữ, phân biệt một số vật thể. Nhưng ông chỉ ra:
"Ngay cả khi tính đến mọi khả năng mà động vật sở hữu, chẳng phải là hiển nhiên sao - con người sở hữu một số năng lực mà chúng ta không thể cho rằng chúng phát triển từ bất cứ thứ gì con người và động vật bậc thấp cùng sở hữu, cũng không thể cho rằng chúng chỉ là sự nâng cao về mức độ của những đặc tính chung đó."
"... Dù cách thức hình thành ấn tượng hoặc cấu trúc của cơ quan có giống nhau đến đâu, dù mức độ phụ thuộc vào hoạt động hữu cơ như thế nào - nghĩa là, dù liên hệ về mặt sinh lý có chặt chẽ đến đâu - với tư cách là cảm giác hoặc tri giác, nhận thức của mắt tự bản chất đã khác với nhận thức của tai, đầu hoặc lưỡi, và ngụ ý một năng khiếu hoặc năng lực đặc biệt, mà năng lực này không nằm trong những thứ kia. Hành động lý trí và hoạt động của các năng lực thấp hơn hơn thì không như vậy."
"... Việc cả hai cùng sở hữu một số yếu tố, không chứng minh được chúng thuộc cùng một trật tự, cũng không khiến cho việc một bên phát triển thành bên kia trở nên khả thi. Nếu con mắt của linh hồn - thứ lý trí cao hơn, giúp chúng ta thấu suốt vũ trụ của vạn vật - không thể nhìn vào bên trong chính nó, phân biệt rõ ràng bản chất và quá trình vận hành của chính nó, thì chúng ta không nên vì thế mà quên mất công dụng của nó, phủ nhận sự ưu việt về bản chất của nó, đánh đồng nó với những năng lực thấp kém hơn mà chúng ta có thể dùng nó để xem xét. Thứ giúp chúng ta hiểu được vạn vật, về bản chất, phải ưu việt hơn bất cứ thứ gì được nó thấu hiểu."
Một khán giả có mặt đặc biệt đề cập rằng, ánh mắt của Ballard ở trên tất cả, đã truyền tải ý nghĩa một cách hoàn hảo, không chút hiểu lầm:
"Cảnh tượng thú vị nhất của buổi họp này, là việc ông Ballard dùng cử chỉ diễn tả mẹ ông đã nói với ông thế nào về việc ông sắp đến một ngôi trường xa xôi, ở đó ông sẽ đọc sách từ những cuốn sách, viết thư gấp lại gửi cho bà; và dùng kịch câm diễn tả một thợ săn sau khi bắn chết một con sóc, đã vô ý bắn chết chính mình. Cử chỉ và hành động của ông Ballard, cùng với ánh mắt và biểu cảm khuôn mặt, đã truyền tải ý nghĩa một cách hoàn hảo đến thính giả. Dùng lời của một thành viên, sự biểu đạt của ánh mắt là một thứ ngôn ngữ không thể bị hiểu lầm."
Xin hãy xem hai câu này:
- "Thứ giúp chúng ta hiểu được vạn vật, về bản chất, phải ưu việt hơn bất cứ thứ gì được nó thấu hiểu."
- "Sự biểu đạt của ánh mắt, là một thứ ngôn ngữ không thể bị hiểu lầm."
Tóm lại:
- Ngôn ngữ không có năng lực lý trí, không thể đạt được sự thấu hiểu
- Chỉ khi năng lực lý trí tồn tại, ngôn ngữ mới có thể mở khóa sự thấu hiểu
- Sự thấu hiểu được thực hiện đầy đủ, vượt ra ngoài bản thân ngôn ngữ
Các mô hình ngôn ngữ lớn đặt ngôn ngữ lên hàng đầu, thuần túy xây dựng nên một dạng thức nguyên thủy của lý trí thông qua suy luận logic. Nhưng thứ lý trí này đã được chứng minh là có khiếm khuyết, dễ tạo ra ảo tưởng (hallucination) ở nhiều ranh giới thô ráp của tri thức.
Năng lực lý trí thực sự chưa bao giờ thực sự tồn tại. Do đó, ngôn ngữ không thể thông qua lý trí mà thăng hoa thành sự thấu hiểu.
Giáo sư trong công việc của mình với người câm điếc phát hiện ra: Năng lực lý trí thực sự phải tồn tại trước ngôn ngữ, thì ngôn ngữ mới có thể mở khóa sự thấu hiểu - thấu hiểu là kết quả được tạo ra bởi năng lực lý trí thực sự và ngôn ngữ cùng nhau.
"Sự biểu đạt của ánh mắt, là ngôn ngữ không thể bị hiểu lầm."
Nói cách khác, sự biểu đạt của ánh mắt chính là hình ảnh của sự thấu hiểu hoàn hảo - không cần sự trợ giúp của ngôn ngữ.
Các mô hình ngôn ngữ lớn đặt ngôn ngữ lên trước năng lực lý trí thực sự, sẽ không bao giờ có thể đạt đến sự thấu hiểu.
Nếu sự thấu hiểu thực sự vượt ra ngoài ngôn ngữ - như buổi nói chuyện tại Viện Smithsonian 144 năm trước đã tiết lộ - thì ngày nay chúng ta không khó khăn gì để tìm thấy minh chứng.
Bản thân tôi có thể cảm nhận điều này từ việc học tập và thực hành y khoa. Trong suốt các khóa học dự bị y khoa đại học và phần lớn việc học ở trường y, logic diễn dịch là công cụ sinh viên dùng để tổ chức hệ thống kiến thức y khoa khổng lồ. Bước vào giai đoạn lâm sàng, tính nghệ thuật của y học - các dấu hiệu, cảm xúc, chuyên môn nhân văn - mới được phát triển. Sau đó, tại một thời điểm nào đó trong giai đoạn bác sĩ nội trú hoặc đầu sự nghiệp hành nghề, với sự tích lũy của một khối lượng lớn kinh nghiệm nêu trên, sự thấu hiểu cuối cùng cũng đến. Tất cả các phần kết nối với nhau trong một mạng lưới to lớn và phức tạp, cho phép bác sĩ giàu kinh nghiệm cung cấp sự chăm sóc bệnh nhân toàn diện.
Hai bác sĩ phẫu thuật khi xử lý một ca ung thư đầu cổ phức tạp hoặc chấn thương, hoặc các y tá làm việc cùng họ, đôi khi chỉ cần ánh mắt là có thể giao tiếp - sự thấu hiểu hoàn chỉnh được truyền đạt, hành động được kích hoạt, bởi tất cả những người có mặt đều đã đạt đến sự thấu hiểu, vượt qua các suy luận logic và các hình thức lập luận nguyên thủy kiểu ghi nhớ và ghép hình trong giáo dục y khoa đầu.
Ánh mắt do đó cung cấp sự nắm bắt trực giác về thực tại, sự nắm bắt này được xây dựng dựa trên sự thấu hiểu chung, mà sự thấu hiểu chung lại bắt nguồn từ sự hiện diện của năng lực lý trí cùng với ngôn ngữ.
Các mô hình ngôn ngữ lớn - và cả mô hình ngôn ngữ nhỏ - vĩnh viễn mắc kẹt ở vùng trung gian. Nó có thể mô phỏng suy luận, nhưng không có năng lực lý trí thực sự, không có mắt, không có sự thấu hiểu.
Bài kiểm tra Ballard: Một thực thể, phải thể hiện được lý trí mà không có ngôn ngữ, mới thực sự có năng lực thấu hiểu.
Đây là một khiếm khuyết đã biết, một điểm khởi đầu tồi. Hướng đi ban đầu của nghiên cứu AI là tạo ra năng lực lý trí thực sự trước, nhưng điều này chưa bao giờ đạt được, nên lĩnh vực này chuyển hướng sang ưu tiên ngôn ngữ - vì điều đó dễ làm hơn.
"Điểm khởi đầu tồi" này dẫn đến một "cái bẫy tham số": việc xử lý ngôn ngữ bằng sức mạnh brute force được vận hành bởi vô số chip ngốn điện, đã trở thành một nút thắt cực kỳ mỉa mai.
Như cuộc đối thoại của tôi với nhà sáng lập Klarna, Sebastian Siemiatkowski, đã nhấn mạnh, lối thoát trong tương lai nằm ở sự nén (compression) - ưu tiên tận dụng suy luận "Hệ thống 2" (System 2 reasoning), tiêu hóa sự dư thừa thông tin và tập hợp truy vấn tương đối hữu hạn do con người tạo ra, từ đó giảm đáng kể nhu cầu về năng lực tính toán.
Lộ trình mới này từ chối con đường theo đuổi điểm kỳ dị (singularity) thông qua việc các mô hình ngôn ngữ nói chuyện với nhau trong sự phản chiếu vô hạn - đó là một sự lãng phí tài nguyên không có định hướng, và vì thiếu sự hỗ trợ của thực tế kinh tế, nó chắc chắn là không thể đạt được.
Các nghiên cứu tiên phong như AlphaGeometry của Google và Coconut của Meta đang chuyển hướng sang kiến trúc "ưu tiên lý trí" này, nhưng về bản chất, chúng chỉ đang tái khám phá những điều Viện Smithsonian đã trình bày cách đây 144 năm: Ngôn ngữ là đầu ra của sự thấu hiểu, chứ không phải là động cơ của lý trí.
Cuộc "chạy đua sức mạnh tính toán" trị giá hàng nghìn tỷ đô la này, có lẽ sẽ bị phá vỡ bởi một sự trở về - trở về với sự im lặng của lý trí tiền ngôn ngữ. Đó là sự trở về của năng lực lý trí toàn diện của người câm điếc, những suy nghĩ im lặng của họ, trước khi tìm thấy những từ ngữ để diễn đạt chúng, đã vươn đến những vì sao trên bầu trời.
Thung lũng Silicon
Như đã đề cập trước đó, trên cùng trang báo còn có một bài báo khác đáng chú ý. Mức độ liên quan đến bài đầu tiên, có lẽ đã vượt quá tưởng tượng của bất kỳ ai vào những năm 1880.
Bài báo này có tên: Tài sản của San Francisco: Một thành phố đầy những nhà đầu cơ giàu nhanh.
Bài báo được viết tại San Francisco vào ngày 1 tháng 6 năm 1880, và mãi đến ngày 19 tháng 6 mới được đăng trên The New York Times.
Có một câu nói trong tiếng Pháp: "Plus ça change, plus c'est la même chose" (Mọi thứ càng thay đổi, chúng càng giống nhau). Lúc này nó thật đúng.
" 'Thời kỳ khó khăn' mà San Francisco nói đến, ở các thành phố phía Đông có thể có nghĩa là 'những ngày khá dư dả', ý nói về việc không có sự chi tiêu hoang phí và xa xỉ, chứ không phải là nghèo khó và thiếu thốn."
California thời đó là thiên đường cho những người chơi vốn nhỏ. Để thỏa mãn ham muốn đầu cơ, một hệ thống đấu giá công khai độc đáo đã ra đời: chỉ với 50 đô la, bạn có thể mua một cổ phần của một mỏ, với giá một đô la một cổ, hoặc năm mươi xu cho hai cổ, hoặc bất kỳ số lượng nào với các mức giá khác nhau.
Khi một cổ phiếu nào đó "bùng nổ", dường như nó chỉ kích thích mong muốn "một lần nữa" của mọi người. Nó đã châm ngòi cho cùng một nhiệt huyết đầu cơ ở San Francisco, mọi người tranh nhau đuổi theo những cơ hội bị bỏ lỡ của các tập đoàn giàu nhanh; "sự bùng nổ" đi kèm với tổn thất thị trường, "sự bùng nổ" tan biến, giá cổ phiếu trở lại bình thường.
Phần kết của bài báo, đánh mạnh vào thực tế ngày nay:
Người dân San Francisco dường như đã quen với ý nghĩ rằng: sự giàu có phải đến ngay lập tức, và sau khi giấc mơ giàu nhanh lớn ở Thành phố Virginia (Virginia City) của họ tan vỡ, họ dường như cũng không muốn phấn chấn lên để tìm kiếm của cải ở các hướng khác như sản xuất, thương mại và nông nghiệp. Gần như toàn thành phố tràn ngập nhiệt huyết đầu cơ, nếu một mỏ giàu mới lớn như Nevada được phát hiện ở đây hoặc gần đó, giá cổ phiếu sẽ một lần nữa tăng vọt đến mức phi lý, San Francisco sẽ một lần nữa trải qua những năm tháng giàu nhanh đó, và rồi một lần nữa gánh chịu tất cả những gì nó đã phải chịu trong hai năm qua.
Trong bài viết Dấu hiệu cốt lõi của bong bóng: Lòng tham từ phía cung, tôi đã điểm lại khuynh hướng đáng kinh ngạc bắt nguồn từ Vùng Vịnh San Francisco này: đầu cơ không ngừng nóng lên, thúc đẩy đầu tư vượt xa quy mô mà bất kỳ nhu cầu cuối cùng nào có thể dự kiến tiêu thụ được trong bất kỳ khung thời gian hợp lý nào.
Lật giở những tờ báo cũ như vậy, cho phép chúng ta diễn giải các sự kiện ngày nay bằng một góc nhìn khác biệt. Liệu Thung lũng Silicon có "một lần nữa trải qua những năm tháng giàu nhanh đó, và rồi một lần nữa gánh chịu tất cả", giống như nó đã từng trải qua nhiều lần, hay sẽ phá vỡ khuôn mẫu - điều này không ai dám chắc. Hy vọng bài viết này có ích cho bạn.
Cuối cùng, tôi muốn giới thiệu với độc giả Midjourney, một công cụ dùng để tạo hình ảnh và video.
Nó thực sự rất thú vị, và khiến người ta suy ngẫm. Hãy sáng tạo nhé!
Hẹn gặp lại lần sau!









