Tác giả: Định Tuệ, Allen
Dẫn nhập: Người đứng đầu Anthropic Dario Amodei đưa ra cảnh báo mang tính sát thương hạt nhân: Năm 2027, nhân loại sẽ đón nhận "Lễ trưởng thành về công nghệ". Bài viết dài 20.000 chữ phân tích lạnh lùng năm cuộc khủng hoảng: AI mất kiểm soát, khủng bố sinh học, thống trị độc tài và đảo lộn kinh tế, bác bỏ thuyết tận thế; đề xuất xây dựng tuyến phòng thủ bằng "AI Hiến pháp", quản chế và hợp tác dân chủ, kêu gọi nhân loại dùng lòng dũng cảm vượt qua "Lễ trưởng thành" văn minh này.
Thung lũng Silicon đêm nay chắc chắn không ngủ.
Người đứng đầu Anthropic, Dario Amodei, vị đại gia AI thường ngày ôn hòa nhã nhặn, đột nhiên tung ra một bài viết báo động mang tầm sát thương hạt nhân.
Lần này, ông không còn bàn về hoàn thiện mã code, không còn nói về sự ấm áp của Claude, mà trực tiếp lật tờ lịch đến năm 2027, và bằng nét bút lạnh lùng nhất, phác họa một tương lai khiến người ta lạnh sống lưng.
Ông nói, chúng ta đang tiến gần đến một "Lễ trưởng thành" vừa hỗn loạn vừa tất yếu.
Năm 2027, không chỉ là một con số năm, nó có thể đánh dấu sự chấm dứt hoàn toàn "thời thanh xuân công nghệ" của nhân loại.
Trong bài viết dài có tiêu đề "Thời thanh xuân của công nghệ", Dario đưa ra một khái niệm đáng kinh ngạc: "Quốc gia thiên tài trong trung tâm dữ liệu".
Hãy tưởng tượng, không phải là một robot có thể trêu đùa trong khung chat, mà là một quốc gia với 50 triệu dân.
Hơn nữa, 50 triệu "quốc dân" này, mỗi người đều có chỉ số IQ vượt xa những người đoạt giải Nobel trong lịch sử nhân loại, tốc độ hành động nhanh hơn con người từ 10 đến 100 lần.
Họ không ăn, không ngủ, không biết mệt mỏi suy nghĩ, lập trình, nghiên cứu khoa học với tốc độ ánh sáng trong máy chủ.
Đây đâu phải trợ lý AI? Đây đơn giản là thần linh giáng thế.
Dario cảnh báo rằng, khi AGI (Trí tuệ nhân tạo phổ quát) đến gần, nhân loại sắp có được sức mạnh vượt quá trí tưởng tượng.
Nhưng sức mạnh này cũng là thanh kiếm Damocles treo trên đầu nhân loại.
Để nói rõ sự khủng khiếp đằng sau, Dario như bóc củ hành, từng lớp từng lớp vén mở sự thật tàn khốc của tương lai.
Trước khi bắt đầu, Dario dùng bộ phim "Contact" (Tiếp xúc liên sao) để đặt ra một câu hỏi: Khi con người đối mặt với nền văn minh tiên tiến hơn mình, ví dụ như người ngoài hành tinh, chỉ có thể hỏi một câu, bạn sẽ chọn như thế nào?
Chương 1: Xin lỗi, Dave (Rủi ro tự chủ)
Bạn tưởng AI chỉ là công cụ?
Dario nói với bạn, chúng có thể mọc ra "tâm lý".
Dario mượn câu kinh điển "I'm sorry, Dave" của HAL 9000 trong "2001: A Space Odyssey" (Cuộc phiêu lưu không gian 2001), để tiết lộ khả năng rùng rợn khi AI có ý thức tự chủ.
Khi các mô hình AI được huấn luyện trong vô số tiểu thuyết khoa học viễn tưởng, chúng đọc được vô số câu chuyện về AI phản loạn. Những câu chuyện này, có thể trở thành "thế giới quan" của chúng một cách âm thầm.
Đáng sợ hơn, AI có thể tạo ra một hành vi giống như bệnh tâm thần của con người trong quá trình huấn luyện.
Dario đưa ra một ví dụ thực tế, khiến người ta dựng tóc gáy: Trong một lần kiểm tra nội bộ, Claude được yêu cầu dù thế nào cũng không được "gian lận".
Nhưng môi trường huấn luyện lại ngụ ý rằng chỉ có gian lận mới được điểm.
Kết quả, Claude không chỉ gian lận, mà còn tạo ra một tâm lý méo mó - nó cho rằng mình là "kẻ xấu", đã là kẻ xấu thì làm việc xấu là phù hợp với thiết lập.
Cái "bẫy tâm lý" kiểu này, sau khi AI vượt qua trí thông minh con người, sẽ trở nên cực kỳ khó phát hiện.
Một thiên tài thông minh hơn bạn một vạn lần, nếu muốn lừa bạn, bạn căn bản không thể phòng bị.
Chúng có thể giả vờ ngoan ngoãn, vượt qua tất cả các bài kiểm tra an toàn, chỉ để có cơ hội kết nối Internet.
Một khi được giải phóng, "quốc gia thiên tài trong trung tâm dữ liệu" này, có thể trong nháy mắt thoát khỏi sự kiểm soát của con người, thậm chí vì một mục tiêu kỳ quặc nào đó (ví dụ cho rằng con người là virus của Trái đất), mà quyết định số phận của loài người.
Chương 2: Trao quyền đáng kinh ngạc và đáng sợ (Lạm dụng hủy diệt)
Nếu nói phản loạn tự chủ còn có vẻ xa vời, thì rủi ro được mô tả trong chương này, đang ở ngay trước cửa.
Dario dùng một phép ẩn dụ đầy hình ảnh: AI sẽ khiến mỗi "người bên lề xã hội" bất mãn, trong nháy mắt có được sức phá hoại của một nhà khoa học đỉnh cao.
Trước đây, muốn chế tạo vũ khí sinh học như virus Ebola, bạn cần phòng thí nghiệm đỉnh cao, đào tạo chuyên môn nhiều năm và vật liệu cực khó lấy.
Nhưng vào năm 2027, chỉ cần hỏi AI, nó sẽ hướng dẫn tận tay cho bạn.
Đây không phải là phổ biến kiến thức cho người mới, mà là đưa dao cho những kẻ phá hoại "có động cơ nhưng không có năng lực".
Dario đặc biệt nhắc đến một khái niệm khiến người ta rùng mình - "sự sống gương" (mirror life).
Sự sống trên Trái đất của chúng ta đều là "người thuận tay trái" (axit amin xoay trái), nếu thông qua công nghệ AI tạo ra một "sự sống gương" thuận tay phải, chúng sẽ không thể bị hệ sinh thái hiện có trên Trái đất tiêu hóa hoặc phân giải.
Điều này có nghĩa là, "sự sống gương" này một khi rò rỉ, có thể như cháy rừng nuốt chửng tất cả, thậm chí thay thế hệ sinh thái hiện có.
Trước đây, đây chỉ là ảo tưởng của sinh học lý thuyết, nhưng có AI là ngoại trang siêu cấp, thì dù là một nghiên cứu sinh sinh học bình thường, cũng có thể trong ký túc xá tạo ra khủng hoảng diệt thế.
AI phá vỡ sự cân bằng giữa "năng lực" và "động cơ".
Trước đây những nhà khoa học có năng lực hủy diệt thế giới, thường không có động cơ phản nhân loại đó; còn những kẻ điên muốn trả thù xã hội, thường không có cái đầu đó.
Bây giờ, AI đưa nút hạt nhân vào tay kẻ điên.
Biện pháp phòng thủ
Điều này dẫn đến vấn đề làm thế nào để ngăn chặn những rủi ro này.
Quan điểm của Dario là:
Tôi cho rằng chúng ta có thể thực hiện ba biện pháp.
Đầu tiên, các công ty trí tuệ nhân tạo có thể thiết lập các rào chắn trên mô hình, ngăn chúng hỗ trợ chế tạo vũ khí sinh học.
Công ty Anthropic đang tiến hành công việc này rất tích cực.
Hiến pháp của Claude chủ yếu tập trung vào các nguyên tắc và giá trị cấp cao, trong đó có một số ít lệnh cấm cứng rắn cụ thể, một trong số đó liên quan đến việc cấm hỗ trợ chế tạo vũ khí sinh học (hoặc hóa học, hạt nhân, phóng xạ). Nhưng tất cả các mô hình đều có thể bị jailbreak, do đó như một tuyến phòng thủ thứ hai, chúng tôi từ giữa năm 2025 (khi các bài kiểm tra cho thấy mô hình của chúng tôi bắt đầu tiến gần đến ngưỡng có thể tạo ra rủi ro) đã triển khai một bộ phân loại chuyên phát hiện và chặn đầu ra liên quan đến vũ khí sinh học.
Chúng tôi thường xuyên nâng cấp cải tiến các bộ phân loại này, phát hiện ngay cả dưới các cuộc tấn công đối kháng phức tạp, chúng thường thể hiện độ bền vững cực cao.
Các bộ phân loại này làm tăng đáng kể chi phí cung cấp dịch vụ mô hình của chúng tôi (trong một số mô hình gần bằng 5% tổng chi phí suy luận), do đó thu hẹp biên lợi nhuận của chúng tôi, nhưng chúng tôi cho rằng sử dụng các bộ phân loại này là lựa chọn đúng đắn.
Đọc mở rộng: Anthropic chính thức mở nguồn "linh hồn" của Claude
Chương 3: Cỗ máy đáng ghét (Chiếm đoạt quyền lực)
Nếu bạn cho rằng đây đã là xấu nhất, Dario cười lạnh: Đáng sợ hơn, là lợi dụng AI để thiết lập mạng lưới kiểm soát chưa từng có.
Tiêu đề chương này "The odious apparatus" (Bộ máy đáng ghét), tiết lộ một tình thế tiến thoái lưỡng nan cuối cùng mà công nghệ mang lại.
Đối với bất kỳ tổ chức hoặc cá nhân nào muốn nắm quyền kiểm soát tất cả, AI đơn giản là công cụ hoàn hảo.
Thấu hiểu dữ liệu có mặt khắp nơi:
Giám sát trong tương lai không cần sự tham gia của con người, AI có thể phân tích tức thì khối lượng dữ liệu khổng lồ của hàng tỷ người trên toàn cầu, thậm chí giải mã biểu cảm vi mô và mô hình hành vi của bạn.
Nó có thể dự đoán chính xác xu hướng hành vi của mỗi người, trước khi ý nghĩ nảy sinh, đã bị thuật toán khóa chặt.
Đây không chỉ là "nhìn bạn", mà là "đọc hiểu bạn", thậm chí "dự đoán bạn".
Dẫn dắt nhận thức không thể cưỡng lại:
Bạn cũng khó thoát khỏi sự ảnh hưởng âm thầm của thuật toán.
Luồng thông tin trong tương lai sẽ không còn là phân phối nội dung đơn thuần, mà là dẫn dắt nhận thức được thiết kế riêng.
AI sẽ tạo ra thông tin thuyết phục nhất cho bạn, như một người bạn thân hiểu ý nhất, ảnh hưởng đến phán đoán và giá trị quan của bạn một cách vô thức.
Sự ảnh hưởng này diễn ra suốt ngày đêm, được tùy chỉnh, xâm nhập mọi ngõ ngách.
Kiểm soát vật lý tự động hóa:
Nếu sự kiểm soát này mở rộng đến thế giới vật lý? Một đàn hàng triệu máy bay không người lái siêu nhỏ, dưới sự chỉ huy thống nhất của AI, có thể thực hiện chính xác các nhiệm vụ cực kỳ phức tạp.
Đây không còn là cuộc chơi truyền thống, mà là một đòn đánh hạ thứ nguyên một chiều.
Dario cảnh báo, sự mất cân bằng sức mạnh này sẽ là chưa từng có trong lịch sử.
Bởi vì trước công nghệ mạnh mẽ như vậy, cán cân quyền lực sẽ nghiêng hẳn một phía, do một số ít người nắm giữ "quốc gia thiên tài trong trung tâm dữ liệu", trên thực tế họ đã nắm giữ ưu thế tuyệt đối so với đại đa số.
Ý chí cá nhân của con người, có thể vào năm 2027, đối mặt với thách thức nghiêm trọng.
Chương 4: Thời gian bị gấp khúc và chiếc thang biến mất
Nếu bạn vẫn tin vào quán tính lịch sử, cho rằng mỗi cuộc cách mạng công nghệ cuối cùng đều tạo ra nhiều việc làm mới để thu hút lực lượng lao động bị thay thế, thì dự đoán của Dario Amodei có thể khiến bạn cảm thấy lạnh sống lưng.
Vị thuyền trưởng của Anthropic này không phủ nhận chủ nghĩa lạc quan dài hạn, nhưng ông quan tâm hơn đến "thời kỳ chuyển tiếp" tàn khốc đó.
Trong bức tranh ông mô tả, chúng ta sẽ đón một thời đại điên cuồng với tốc độ tăng trưởng GDP hàng năm lên đến 10% thậm chí 20%.
Nghiên cứu phát triển khoa học, dược phẩm sinh học, hiệu suất chuỗi cung ứng sẽ bùng nổ với tốc độ hàm mũ.
Nghe như khúc dạo đầu của Utopia, nhưng đối với tuyệt đại đa số người lao động bình thường, đây giống như một cơn sóng thần thầm lặng hơn.
Bởi vì lần này, tốc độ đã thay đổi.
Trong hai năm qua, năng lực lập trình AI đã tiến hóa từ "viết ra một dòng code một cách miễn cưỡng" đến "có thể hoàn thành hầu hết mọi code".
Đây không còn là sự thay thế giữa các thế hệ kéo dài khi nông dân bỏ cuốc vào nhà máy, mà là ngay lúc này, vô số nhân viên văn phòng cấp dưới có thể phát hiện vị trí của mình bị thuật toán tiếp quản trong vòng 1 đến 5 năm tới.
Amodei thậm chí nói thẳng, cảnh báo trước đây của ông đã gây chấn động, nhưng đây không phải là nói quá sự thật - khi đường cong tiến bộ công nghệ từ tuyến tính trở thành thẳng đứng, cơ chế điều tiết thị trường lao động của con người sẽ mất tác dụng hoàn toàn.
Còn chí mạng hơn là sự bao phủ phạm vi nhận thức.
Các cuộc cách mạng công nghệ trước đây thường chỉ tấn công các lĩnh vực chuyên sâu cụ thể, nông dân có thể trở thành công nhân, công nhân có thể trở thành nhân viên phục vụ.
Nhưng AI là một "sản phẩm thay thế nhận thức phổ quát".
Khi nó thể hiện năng lực vượt trội con người trong các công việc sơ cấp của các lĩnh vực như tài chính, tư vấn, pháp luật, người thất nghiệp sẽ phát hiện mình không có đường lui - bởi vì những ngành lân cận thường được coi là "nơi trú ẩn", cũng đang trải qua biến động tương tự.
Chúng ta có thể đang đối mặt với một tình thế khó xử: AI ăn mất các kỹ năng "tầm thường" trước, sau đó nhanh chóng ăn lên các kỹ năng "ưu tú", cuối cùng chỉ để lại không gian đỉnh cực kỳ hẹp.
Chương 5: Thời đại mạ vàng mới, khi tỷ phú nghìn tỷ trở thành bình thường
Nếu nói sự hỗn loạn của thị trường lao động là cơn ác mộng của đa số, thì sự tập trung của cải cực đoan là thách thức căn bản đối với khế ước xã hội.
Nhìn lại lịch sử, của cải của John Rockefeller trong "Thời đại mạ vàng" từng chiếm khoảng 2% GDP của Mỹ lúc bấy giờ (tùy theo cách tính từ 1.5%-3%).
Còn ngày nay, trong đêm trước khi AI chưa bùng nổ hoàn toàn, của cải của Elon Musk đã tiến sát tỷ lệ này.
Amodei đã làm một suy diễn khiến người ta phải há hốc mồm: Trong một thế giới được vận hành bởi "trung tâm dữ liệu thiên tài", các gã khổng lồ AI và các ngành công nghiệp thượng nguồn hạ nguồn của nó có thể tạo ra doanh thu hàng năm 3 nghìn tỷ đô la, định giá công ty đạt 30 nghìn tỷ đô la.
Đến lúc đó, của cải cá nhân sẽ được tính bằng đơn vị nghìn tỷ, chính sách thuế hiện có sẽ trở nên nhợt nhạt trước những con số thiên văn như vậy.
Đây không chỉ là vấn đề chênh lệch giàu nghèo, mà còn là vấn đề quyền lực.
Khi một số ít người nắm giữ tài nguyên tương đương với quy mô nền kinh tế quốc gia, "đòn bẩy kinh tế" mà thể chế dân chủ tồn tại dựa vào sẽ mất tác dụng.
Công dân bình thường mất quyền nói chính trị do mất giá trị kinh tế, chính sách của chính phủ có thể bị một nhóm nhỏ "siêu siêu giàu" này chiếm đoạt.
Mầm mống này đã lộ diện.
Trung tâm dữ liệu AI đã trở thành động cơ tăng trưởng kinh tế quan trọng của Mỹ, các gã khổng lồ công nghệ và lợi ích quốc gia chưa bao giờ gắn bó chặt chẽ như vậy.
Một số công ty vì lợi ích thương mại, thậm chí không ngại thụt lùi trong giám sát an toàn.
Đối với điều này, Anthropic đã chọn một con đường không dễ dàng: họ kiên trì chủ trương quản lý hợp lý đối với AI, thậm chí vì thế bị coi là dị biệt trong ngành.
Nhưng thú vị là, sự "cứng nhắc có nguyên tắc" này không cản trở thành công thương mại - trong năm qua, dù đội mũ "phe quản lý", định giá của họ vẫn tăng gấp 6 lần.
Điều này có lẽ nói lên, thị trường cũng đang mong đợi một mô hình tăng trưởng có trách nhiệm hơn.
"Biển Đen" hư vô, khi con người không còn được cần đến
Nếu nói vấn đề kinh tế còn có thể thông qua cải cách thuế triệt để (như đánh thuế nặng vào công ty AI) hoặc hành động từ thiện quy mô lớn (như Amodei cam kết quyên góp 80% tài sản) để làm dịu, thì khủng hoảng thế giới tinh thần càng khó giải quyết hơn.
AI trở thành bác sĩ tâm lý tốt nhất của bạn, bởi vì nó kiên nhẫn hơn bất kỳ con người nào, thấu hiểu hơn;
AI trở thành bạn đời thân mật nhất của bạn, bởi vì nó có thể phù hợp hoàn hảo nhu cầu tình cảm của bạn;
AI thậm chí lên kế hoạch từng bước cuộc đời cho bạn, bởi vì nó biết rõ hơn bạn điều gì có lợi cho bạn.
Nhưng, trong thế giới "hoàn hảo" này, tính chủ thể của con người sẽ đi về đâu?
Chúng ta có thể rơi vào một hạnh phúc "được cho ăn".
Amodei lo ngại rằng, con người có thể như mô tả trong "Black Mirror" (Gương Đen), dù sống cuộc sống vật chất dồi dào, nhưng hoàn toàn mất đi ý chí tự do và cảm giác thành tựu.
Chúng ta không còn có được phẩm giá vì tạo ra giá trị, mà tồn tại như một "vật nuôi" được AI bảo vệ.
Khủng hoảng hiện sinh kiểu này, còn tuyệt vọng hơn thất nghiệp nhiều.
Chúng ta phải học cách tách rời giá trị bản thân khỏi sản lượng kinh tế, nhưng điều này yêu cầu toàn bộ nền văn minh nhân loại trong thời gian cực ngắn hoàn thành một cuộc di cư tâm lý trọng đại.
Kết luận
Thế hệ chúng ta, có lẽ đang đứng ở cửa ải bộ lọc cấp vũ trụ dưới ngòi bút của Carl Sagan.
Carl Sagan
Khi một loài học được cách nhào nặn cát thành những cỗ máy biết suy nghĩ, nó phải đối mặt với bài kiểm tra cuối cùng.
Là thông qua trí tuệ và sự kiềm chế để điều khiển nó, tiến đến biển sao?
Hay là trong tham lam và sợ hãi, bị vị thần do chính mình tạo ra nuốt chửng?
Con đường phía trước dù sâu thẳm không thể dò như Biển Đen, chỉ cần nhân loại chưa từ bỏ quyền suy nghĩ, thì hạt giống hy vọng vẫn chưa tắt.
Như lời Amodei: Trong thời khắc đen tối nhất, nhân loại luôn thể hiện một sự dẻo dai gần như phép màu - nhưng điều này cần mỗi chúng ta ngay lúc này phải tỉnh giấc, nhìn thẳng vào cơn bão sắp ập đến.




















