Tác giả: Wang Jianshuo
Ngày 6 tháng 3 năm 2023, ChatGPT vừa ra mắt chưa lâu, GPT-4 chưa được công bố, tôi và Sarah đã có một cuộc phỏng vấn về ChatGPT – số thứ ba trong loạt Traders' Talk "Nói chuyện đơn giản" (Podcast Nói chuyện đơn giản về ChatGPT đã phát hành, mời mọi người cùng nghe).
Lúc đó, ChatGPT mới ra mắt được một thời gian ngắn, số người thực sự sử dụng nó còn rất ít. Cuộc phỏng vấn kéo dài ba giờ đồng hồ đó sau này luôn đứng đầu trong danh mục ChatGPT trên nền tảng Xiaoyuzhou. Trong đó, tôi đã đưa ra khoảng hơn hai mươi nhận định và dự đoán dựa hoàn toàn vào trực giác và thông tin hạn chế, không có nhiều dữ liệu. Bản ghi chép chi tiết đầy đủ của cuộc phỏng vấn đó vẫn còn trên tài khoản công khai.
Bây giờ là cuối tháng 5 năm 2026, ba năm đã trôi qua, AI đã phát triển thành một thứ mà năm xưa không thể tưởng tượng nổi.
Tôi muốn làm một việc: Lấy ra từng điều trong hai mươi nhận định năm đó, dùng dữ liệu mới nhất có thể tìm được ngày hôm nay để đối chiếu một cách khách quan. Để nhìn rõ thế giới đã thực sự thay đổi như thế nào trong ba năm, cũng như nhìn rõ bản thân tôi ba năm trước, chỗ nào đã nhìn đúng, chỗ nào đã nhìn lệch.
Để cố gắng không thiên vị, lần đối chiếu này tôi giao cho AI làm: Ném bản ghi chép phỏng vấn năm đó vào một workflow, để nó điều phối 41 agent Opus 4.8, đầu tiên tách rời hai mươi nhận định ra từng điều, sau đó từng cái một tìm kiếm dữ liệu mới nhất trên mạng, kiểm chứng chéo từng điều, cuối cùng cho điểm Wang Jianshuo ba năm trước. Nhóm agent này mất khoảng 20 phút, đốt hết 1.4 triệu token (tương đương khoảng 35 đô la), và tạo ra báo cáo dưới đây. Các nhận định đều đến từ chúng, không phải tôi. Ngày cơ sở được định vào tháng 5 năm 2026.
Một, Bảng điểm
Ký hiệu phán quyết: ✅ Đúng · 🟢 Cơ bản đúng · 🟡 Một phần đúng · ❌ Sai
Nhìn sơ qua, phần lớn phương hướng lớn của Wang Jianshuo năm đó đã đứng vững, chỉ có một điều duy nhất thực sự sai cứng – truyền rằng GPT-4 có 100T tham số. Nhưng quỷ ẩn trong chi tiết: Đằng sau hầu hết mỗi điều "đúng", đều có một cái đuôi mà năm đó chưa nói chuẩn. Trong hai mươi điều, không có điều nào thuần túy "vẫn chưa chắc chắn", ba năm đủ dài, hầu hết sự việc đã có câu trả lời thiên về hướng nào đó. Dưới đây sẽ nói chi tiết theo nhóm.
Hai, Những điều nhìn đúng
Điểm chung của nhóm này là: Phương hướng, cơ chế, thậm chí nhịp độ thời gian mà Wang Jianshuo dự đoán năm đó đều trúng, nếu có sai thì chỉ sai ở "mức độ" và "cách diễn đạt tuyệt đối hóa".
RAG và Kiến trúc Truy xuất (Quan điểm 2, 3)
> Năm 2023, Wang Jianshuo nói: Phương pháp chính để giải quyết kiến thức và ảo giác không phải là sửa mô hình, mà là sử dụng truy xuất vector để bơm kiến thức vào làm "phao cứu sinh"; kiến trúc đúng là công cụ tìm kiếm thực hiện truy xuất, rồi đưa kết quả cho LLM.
Đây chính là tiêu chuẩn thực tế của tất cả sản phẩm AI ngày nay. RAG đã trở thành kiến trúc mặc định cho AI doanh nghiệp; OpenAI, Google, Anthropic đều đã biến nó thành khả năng cấp nền tảng; ChatGPT Search đúng nghĩa đen là "trước tiên dùng Bing index để truy xuất, đưa kết quả cho GPT, rồi mới tạo ra câu trả lời có trích dẫn". Google AI Overviews sử dụng grounding đạt khoảng 2 tỷ người dùng hoạt động hàng tháng, Perplexity, một công ty chỉ dựa vào kiến trúc này, định giá đã tăng lên khoảng 200 tỷ đô la.
Vào thời điểm GPT-4 chưa ra mắt, ngành công nghiệp mặc định "dựa vào fine-tuning để truyền kiến thức", ông ấy đã đặt cược vào "không động đến tham số mô hình, treo ngoài truy xuất", cả cơ chế lẫn thời gian đều đúng.
Cần thành thật rằng: Ông ấy hình dung là "truy xuất tĩnh một lần", nhưng thực tế phức tạp hơn – ngữ cảnh dài, GraphRAG, agentic retrieval đều đến để tăng cường. Cuộc tranh luận "RAG đã chết" năm 2026, lại càng chứng minh phương hướng lớn không chết, nó phủ định chỉ là "truy xuất ngây thơ một lần", kết luận là nâng cấp thành truy xuất hỗn hợp, chứ không phải quay lại sửa tham số mô hình. Còn một điểm: Thuật ngữ RAG đã được đề cập trong bài báo của Meta năm 2020, không phải ông ấy sáng tạo – ông ấy chỉ đặt cược đúng thời điểm nó sẽ trở thành chủ đạo.
LUI là Lục địa Mới (Quan điểm 7)
> Năm 2023, Wang Jianshuo nói: Điều vĩ đại nhất của ChatGPT không phải là AIGC, mà là mở ra LUI (Giao diện Người dùng Ngôn ngữ Tự nhiên), sẽ tái cấu trúc tương tác người-máy như GUI năm xưa, thúc đẩy một ngành mới lớn hơn nhiều so với bản thân việc "làm mô hình lớn".
Phần "lục địa mới" này gần như trúng toàn bộ. Ngôn ngữ tự nhiên đã trở thành lớp tương tác chủ đạo của đại chúng (ChatGPT 900 triệu người dùng hoạt động hàng tuần), và thúc đẩy một ngành công nghiệp mới độc lập – agent, coding agent, lớp giao thức đều đã được hiện thực hóa. Câu nói cụ thể nhất "lớn hơn nhiều so với bản thân làm mô hình" đã được xác nhận mạnh mẽ: giao thức MCP đã trở thành "tiêu chuẩn hệ điều hành" thời đại LUI, năm 2025 được OpenAI, Google, Microsoft toàn diện chấp nhận, cuối năm chuyển sang Linux Foundation; riêng sản phẩm Claude Code đã đạt doanh thu hàng năm khoảng 2.5 tỷ đô la.
Nhưng ông ấy đã dùng cách diễn đạt mạnh như "tái cấu trúc, thay thế GUI", ba năm sau nhìn lại là chồng lấn cùng tồn tại, chứ không phải thay thế. Ba phản ví dụ rất rõ ràng: Báo cáo của MIT cho thấy 95% thí điểm GenAI doanh nghiệp không có ROI có thể đo lường được; computer-use agent thao tác trực tiếp giao diện trên tập kiểm thử, mô hình hàng đầu mới chỉ khoảng 78%, vừa chạm đến mức cơ bản của con người; phần cứng ngôn ngữ thuần túy không có màn hình gần như thất bại toàn bộ (Humane Pin năm 2025 ngừng hoạt động vĩnh viễn). Cách nói chính xác hơn là: LUI là lớp tương tác mới chồng lên trên GUI.
Mạng lưới Robot và Định vị Mới (Quan điểm 9)
> Năm 2023, Wang Jianshuo nói: Khoảng mười năm nữa sẽ xuất hiện "mạng lưới robot" – các agent dùng ngôn ngữ tự nhiên tự động bắt tay, gọi nhau, không cần API truyền thống; sẽ sinh ra một hệ thống định vị tên miền mới hoàn toàn. Hệ thống này "hai ba năm là có thể làm xong".
Phương hướng trúng một cách đáng kinh ngạc. MCP, A2A (đã hiến tặng cho Linux Foundation, 150+ tổ chức ủng hộ) giải quyết việc các agent gọi lẫn nhau; Agent Network Protocol trực tiếp dựa trên DID của W3C để làm "định vị agent không có thẩm quyền trung tâm", mục tiêu là "mạng lưới hợp tác hàng tỷ agent" – điều này rất đồng cấu trúc với "hệ thống tên miền mới" mà ông ấy nói.
Có hai chỗ cần chỉnh sửa: Một là "không cần API" không thành lập, giao thức chủ đạo dưới đáy là schema có cấu trúc, bản chất là chồng một lớp tiêu chuẩn lên trên API; Hai là "hai ba năm làm xong" chưa thực hiện, dữ liệu của Gartner cho thấy tính đến năm 2026 chỉ khoảng 17% tổ chức thực sự triển khai agent. Thú vị là, năm đó ông ấy thực ra đã chia lời nói thành hai tầng – nguyên mẫu "hai ba năm", trưởng thành "khoảng mười năm". Nhịp độ của nguyên mẫu trúng rất chuẩn, chu kỳ trưởng thành cũng thực sự là cấp mười năm. Tách hai tầng ra xem, chất lượng của điều này cao hơn vẻ bên ngoài.
Trung Quốc nhất định làm được mô hình lớn khả dụng (Quan điểm 10, 20)
> Năm 2023, Wang Jianshuo nói: Trung Quốc nhất định có thể làm ra mô hình lớn khả dụng, khoảng cách với đỉnh cao sẽ thu hẹp nhanh chóng trong khoảng ba năm (tương tự như trình duyệt Hồng Kỳ đuổi theo Netscape).
Đường thời gian của điều này trùng khớp một cách bất ngờ. Stanford AI Index 2026 thực nghiệm, khoảng cách chuẩn giữa các mô hình hàng đầu Trung-Mỹ từ tháng 5/2023 là 17.5–31.6 điểm phần trăm, đã thu hẹp còn 2.7%; trong khi đầu tư AI tư nhân của Mỹ gấp khoảng 23 lần Trung Quốc – dùng đầu tư nhỏ hơn nhiều để đạt được sự thu hẹp. DeepSeek, Qwen, Kimi, GLM đã trở thành chủ đạo toàn cầu, hệ sinh thái mã nguồn mở thậm chí dẫn đầu.
Nhưng hai chữ "nhanh chóng" hơi lạc quan – sự trưởng thành thực sự xảy ra sau khoảng 14 tháng, chứ không phải "vài tháng". Và đây là bắt kịp tính khả dụng, không phải định nghĩa tiền tuyến: Tính đến đầu năm 2026 vẫn không có mô hình Trung Quốc nào vượt qua OpenAI o3. Trong quan điểm 20, ông ấy sai rõ ràng: Nhận định "cánh cửa mở ra rồi sẽ không đóng lại" bị OpenAI chủ động cắt API với Trung Quốc vào tháng 7/2024 trực tiếp bác bỏ, cánh cửa bị phía cung cấp đóng lại; Wenxin Yiyan mà ông ấy chỉ tên dẫn đầu ngược lại bị tụt lại, thực sự tiếp sức là DeepSeek, Doubao, Qianwen vốn năm đó còn không đáng chú ý.
Không có ý thức, Kiểm tra Turing chỉ kiểm tra biểu hiện (Quan điểm 13)
> Năm 2023, Wang Jianshuo nói: ChatGPT không có ý thức, là "người nói vô tình, người nghe có ý" tự làm khổ mình; Kiểm tra Turing vốn chỉ kiểm tra "liệu có khiến bạn nghĩ rằng nó có hay không", chứ không phải nó thực sự có.
Nhận định cốt lõi "kiểm tra biểu hiện" này đứng rất vững, còn bị một thí nghiệm châm biếm xác nhận: Trong bài kiểm tra Turing năm 2025 của UC San Diego, GPT-4.5 dưới gợi ý "đóng vai con người" bị phán là con người với tỷ lệ cao tới 73%, cao hơn cả người thật, nhưng hoàn toàn dựa vào kỹ năng diễn xuất – đây chính là chú thích tốt nhất cho "chỉ kiểm tra liệu có khiến bạn nghĩ rằng nó có hay không".
Cần bổ sung rằng: "Máy móc nhất định không có ý thức" là luận điểm mạnh tuyệt đối hóa, trong ba năm đã được đẩy vào vùng xám. Anthropic đã thiết lập vị trí nghiên cứu "phúc lợi mô hình", đưa ra xác suất ý thức khoảng 15%–20%, còn thêm cho Claude chức năng "chủ động kết thúc cuộc hội thoại bị lạm dụng". Những điều này biến "tuyệt đối không" thành "xác suất thấp nhưng không thể loại trừ". Tuy nhiên, tất cả đều dựa trên "có thể, nên giả định" chứ không phải "đã được chứng minh", hạt nhân không bị lật đổ, chỉ là năm đó ngữ khí quá đầy.
Các điều nhìn đúng còn lại (Quan điểm 6, 11, 12, 16, 18, 19)
- Không phải AGI nhưng đã tiến một bước lớn
: Cả hai đầu đều đứng vững. Chính Altman thời GPT-5 vẫn nói "không phải AGI, thiếu học tập liên tục"; đồng thời huy chương vàng IMO, ARC-AGI từ gần 0 tăng lên 85%, "tiến một bước lớn" không có tranh cãi. - Không có làn sóng thất nghiệp
: Tháng 4/2026 tỷ lệ thất nghiệp Mỹ chỉ 4.3%. Điểm mù là "phân bố" – nghiên cứu Stanford cho thấy, chính xác bị rút đi là những người mới trẻ tuổi 22–25 ở cấp thang nghề nghiệp đầu tiên, cơ chế "hút thuận lợi" ở họ thất bại. - Không bị chìm trong rác AI
: Phúc lợi ròng đúng hướng, nhưng ông ấy đánh giá thấp nghiêm trọng về quy mô – nội dung AI đã chiếm khoảng 52% trang web mới tăng, "AI slop" trở thành từ của năm. - Năm lớn khởi nghiệp
: Bắt đúng điểm ngoặt của làn sóng, xAI (thành lập tháng 3/2023) đã đạt định giá 2300 tỷ. Nhưng ông ấy khóa "công ty vĩ đại" vào năm 2023 quá hẹp – những công ty thực sự nghìn tỷ như OpenAI, Anthropic đều thành lập sớm hơn. - Khoảnh khắc trình duyệt 1994
: Sắp xếp tương đối đã thành hiện thực, OpenAI năm 2025 thực sự cho ra mắt trình duyệt Atlas, biến phép ẩn dụ thành hiện thực đúng nghĩa đen. Chỉ là ChatGPT lan truyền mạnh hơn trình duyệt, phép ẩn dụ hơi bảo thủ. - Prompt bơm thêm sự thật giảm ảo giác
: Hướng được xác nhận, GPT-5 không kết nối mạng không truy xuất thì tỷ lệ ảo giác tăng vọt lên 47%, ngược lại xác nhận "sự thật" là biến số then chốt. Chỉ đánh giá thấp nguyên nhân gốc rễ là động lực huấn luyện, không phải prompt.
Ba, Những điều nhìn sai, nhìn lệch
GPT-4 có 100T tham số (Quan điểm 4) – Sai hoàn toàn
> Năm 2023, Wang Jianshuo nói: (Tin đồn) GPT-4 có 100T tham số, gấp khoảng 600 lần GPT-3 (175B).
Cả hai con số đều sai. GPT-3 là 175B, ước tính tốt nhất bị rò rỉ tháng 7/2023 là GPT-4 khoảng 1.8T, 16 chuyên gia MoE, chỉ khoảng 10 lần. 100T và thực tế chênh lệch khoảng 55 lần về quy mô. Nguồn duy nhất của "100T", là CEO Cerebras năm 2021 một câu nói "khoảng" truyền miệng, Sam Altman đã từ tháng 1/2023 trực tiếp gọi bảng so sánh đó là "complete bullshit".
Ông ấy nguyên văn đã đánh dấu "tin đồn", giữ lại tính không chắc chắn. Sâu hơn một tầng, khuôn khổ "dùng bội số tham số để đánh giá thế hệ" này bản thân đã lỗi thời: GPT-4.5, GPT-5 sau này của OpenAI đơn giản không công bố số lượng tham số nữa. Đây là điều duy nhất vừa sai số vừa lỗi thời góc nhìn.
Toán LLM (Quan điểm 1) – Chẩn đoán đúng, kết luận chặn đầu sai
> Năm 2023, Wang Jianshuo nói: Toán LLM kém là bản chất, để nó tự học toán vừa không thể vừa không cần thiết, cách làm đúng là treo ngoài công cụ.
"Chẩn đoán cộng con đường công cụ" đúng toàn bộ – nguyên nhân gốc chính là sinh token từng cái dẫn đến nhớ không đáng tin (bài báo cơ chế năm 2025 xác nhận chính xác trực giác "chữ số cuối thường đúng, chữ số giữa sai"); công cụ treo ngoài cải thiện cũng rất lớn (o4-mini cho phép dùng Python, AIME 2025 đạt 99.5%).
Sai ở cách diễn đạt chặn đầu kiểu "không thể, không cần thiết". "Không thể" bị bác bỏ – tháng 7/2025 Gemini Deep Think và mô hình OpenAI trong IMO dùng ngôn ngữ tự nhiên thuần túy, không công cụ đạt huy chương vàng. Bước ngoặt then chốt là "mô hình suy luận" xuất hiện năm 2024–2025, điều này vào tháng 3/2023 không thể dự đoán – vì vậy đối với dự đoán này nên khoan dung đánh giá hướng, chứ không nên trách thời điểm.
Nắm bắt giá trị (Quan điểm 8) – Được một nửa, luận điểm cốt lõi ngược
> Năm 2023, Wang Jianshuo nói: Giá trị cuối cùng sẽ rơi vào lớp ứng dụng, kết cục của công ty mở ra lớp cơ sở (làm mô hình) chưa chắc kiếm được tiền.
Tiền thực sự bắt đầu chảy về lớp ứng dụng (Cursor ba năm đạt doanh thu hàng năm 2 tỷ) – nửa này đúng. Nhưng "làm lớp cơ sở không kiếm tiền" bị NVIDIA trực tiếp bác bỏ: FY2026 lợi nhuận ròng khoảng 120 tỷ đô la, giá trị vốn hóa 5 nghìn tỷ+, là người duy nhất trên toàn thị trường rõ ràng có lợi nhuận lớn. Còn lớp mô hình mà ông ấy ngụ ý sẽ thắng (OpenAI năm 2026 dự lỗ khoảng 14 tỷ) ngược lại giống nhất với "lớp cơ sở đốt tiền không kiếm tiền" mà ông ấy nói.
Ông ấy không phân biệt "lớp cơ sở tính toán" và "lớp cơ sở mô hình", cũng không phân biệt "doanh thu" và "lợi nhuận". Giá trị năm 2026 so với 2023 càng cực đoan hơn khi bị lớp tính toán nắm bắt, chứ không phải chuyển dịch về lớp ứng dụng. Cần bổ sung một câu: Lỗ tiền là nhà cung cấp đám mây mua chip, không phải NVIDIA bán chip – đây chính là chỗ lệch của phép loại suy "xây dựng đường sắt quá mức" của ông ấy.
Bản quyền (Quan điểm 14) – Đăng ký đúng, tránh xâm phạm sai
> Năm 2023, Wang Jianshuo nói: Nội dung AI tạo ra có thể tránh bản quyền (bảo vệ biểu đạt không bảo vệ ý tưởng); vật tạo ra có thể vừa không xâm phạm, cũng không thể đăng ký.
"Không thể đăng ký" đã trở thành sự thật pháp lý đã định (năm 2025 Văn phòng Bản quyền Mỹ rõ ràng "chỉ nhập từ khóa gợi ý không đủ để yêu sách tác giả"). Nhưng "tránh xâm phạm" sai rõ ràng: Tòa án nhiều lần xác định đầu ra AI nếu tương tự bản chất với tác phẩm gốc vẫn cấu thành xâm phạm; Anthropic vì dữ liệu ngôn ngữ lậu hòa giải với 1.5 tỷ đô la, là khoản bồi thường bản quyền lớn nhất lịch sử Mỹ. AI không những không "tránh" bản quyền, mà ngược lại trả giá lớn nhất lịch sử.
Thế giới đại đồng (Quan điểm 15) – Cơ chế đúng, xu hướng đặt cược ngược
> Năm 2023, Wang Jianshuo nói: ChatGPT làm "bình quân gia quyền" quan điểm con người, có thể chống lại kén thông tin kiểu TikTok, cho khả năng "thế giới đại đồng".
Lớp cơ chế đúng – năm 2025 nhiều nghiên cứu xác thực chứng thực LLM ép quan điểm về số đông, đánh giá thấp có hệ thống thiểu số. Nhưng lớp phán đoán xã hội đặt cược ngược: Chính ông ấy thêm "ít nhất bây giờ không phải ngàn người ngàn vẻ", trong ba năm đã bị lật đổ – OpenAI từ tháng 4/2025 đưa trí nhớ xuyên hội thoại và cá nhân hóa làm thành khả năng mặc định, AI đang tiến về ngàn người ngàn vẻ với tốc độ cao. Quan trọng hơn, ông ấy tưởng tượng "bình quân gia quyền" là mẫu số chung trung lập của thế giới, nhưng thực nghiệm nó là lệch hướng, còn chồng lấn xu nịnh, có thể dùng để thao túng lập trường chủ động – điều này hướng tới "tạo kén mới", chứ không phải "giải cực đoan".
Chiến tranh cục bộ và Chi phí (Quan điểm 17) – Tính chất đúng toàn bộ, số lượng bác bỏ
> Năm 2023, Wang Jianshuo nói: Làm mô hình lớn tiếp sẽ nhanh chóng trở thành "chiến tranh cục bộ", chi phí có thể biết (bỏ đường vòng khoảng 5-10 tỷ đô la chặn đầu), sẽ có nhiều người chơi tham gia.
Tính chất đúng một cách đáng kinh ngạc – nhiều người chơi ồ ạt tham gia, nhanh chóng hàng hóa hóa, mã nguồn mở bắt kịp mã đóng, toàn bộ đã hiện thực hóa. Nhưng con số cứng "5-10 tỷ chặn đầu" sai cả hai đầu: Đầu tiền tuyến bị đánh giá thấp nghiêm trọng (cấp GPT-5 năm 2026 đạt 2-5 tỷ đô la huấn luyện, chồng lấp trung tâm dữ liệu nghìn tỷ và Stargate 5000 tỷ); đầu sao chép lại bị đánh giá cao (DeepSeek ép chi phí huấn luyện biên tế xuống cấp triệu đô la). Cùng một mô hình "chi phí" theo khẩu độ có thể chênh 200 lần, duy nhất không nằm trong khoảng ông ấy đưa ra.
Khả năng xuất hiện (Quan điểm 5) – Hướng đúng, số và khung sai
> Năm 2023, Wang Jianshuo nói: Khoảng 60B tham số trở lên xuất hiện khả năng mới không có trong dữ liệu ngôn ngữ gốc, nhà nghiên cứu cũng không thể giải thích.
Trực giác phương hướng thành lập, nhưng hai chỗ diễn đạt không đứng vững: Thứ nhất, không tồn tại "ngưỡng 60B" thống nhất – ngưỡng thực tế của chuỗi suy nghĩ khoảng 100B, khả năng khác nhau xuất hiện ở quy mô khác nhau từ 13B đến 540B; Thứ hai, "không thể giải thích" cuối năm 2023 đã bị một bài báo xuất sắc NeurIPS thách thức – nhiều "đột biến" là ảo tượng do lựa chọn chỉ số đánh giá tạo ra, sau khi thay chỉ số liên tục đường cong trơn tru có thể dự đoán. Công bằng mà nói, năm đó ông ấy thuật lại là tường thuật tuyệt đối chủ đạo, thực sự có thể sửa chữa là lấy "60B" làm ngưỡng cứng, lấy "không thể giải thích" làm kết luận tính chất.
Bốn, Nhìn lại ba năm, mấy quy luật
Từng điều đối chiếu xong, lùi một bước nhìn, hai mươi nhận định này của Wang Jianshuo ẩn chứa vài quy luật đáng ghi nhớ hơn bất kỳ điều riêng lẻ nào.
Một, Phương hướng đáng tin cậy hơn nhiều so với số và mức độ. Trong hai mươi điều, phàm là nhận định cơ chế và phương hướng (RAG, LUI, mạng lưới robot, kiểm tra Turing), gần như trúng toàn bộ; phàm là đưa ra số cụ thể hoặc cách diễn đạt chặn đầu (100T tham số, ngưỡng 60B, chi phí 5-10 tỷ, toán "không thể"), gần như sai toàn bộ. Đối với lĩnh vực biến đổi nhanh, đặt cược phương hướng, cơ chế, ít đặt cược số chính xác, càng phải cảnh giác những từ nói đầy kiểu "không thể, nhất định, chặn đầu, tuyệt đối không" – chúng là khu vực dễ bị thời gian tát vào mặt.
Hai, Về thời gian, ông ấy có xu hướng đánh giá cao tốc độ, đánh giá thấp mức độ. Phàm là nói "nhanh chóng, hai ba năm làm xong", thời kỳ trưởng thành phổ biến chậm hơn; nhưng đối với trần nhảy vọt của năng lực lại đánh giá thấp – toán có thể từ "không thể" đến huy chương vàng IMO, chi phí tiền tuyến có thể tăng lên quy mô năm đó không tưởng tượng nổi. Một câu: Ngắn hạn quá lạc quan, dài hạn quá bảo thủ.
Ba, Sai ẩn nhất, lặp lại xuất hiện trên "phân bố". Không phải phương hướng sai, mà là chỉ nhìn tổng lượng, bỏ qua phân bố. "Không có làn sóng thất nghiệp" đúng, nhưng tổn thương tập trung cao độ ở người mới trẻ tuổi; "Giá trị rơi vào lớp ứng dụng" đúng một nửa, nhưng không phân biệt lớp tính toán và lớp mô hình. Tổng lượng đúng, che lấp thảm họa phân bố – đây là bài học cần bổ sung nhất.
Bốn, Những chỗ để lại khoảng trống trong lời nói, ba năm sau đều chịu được kiểm nghiệm. "Tin đồn" "ít nhất bây giờ" "giảm mạnh chứ không loại bỏ" "nguyên mẫu hai ba năm, trưởng thành khoảng mười năm" – phàm là nhận định năm đó có từ hạn định, chia tầng, hôm nay nhìn lại đều đứng vững hơn. Ngược lại, những câu tuyệt đối tuôn ra miệng, dễ bị lật đổ nhất. Sự thành thật của dự đoán, một nửa ở dám nói, nửa còn lại ở dám đánh dấu sự không chắc chắn của mình.
Năm, Một số vấn đề, ba năm căn bản không đủ. Giá trị cuối cùng quy về ai, xuất hiện có phải chân tướng biến đổi, máy móc rốt cuộc có một chút ý thức hay không, ngữ cảnh dài có ăn RAG không – những tranh luận năm đó, đến năm 2026 vẫn là tranh luận. Có thể phân biệt "đã có câu trả lời" và "còn phải tiếp tục đợi", quan trọng hơn là vội vàng đưa ra kết luận cho mỗi sự việc.
Wang Jianshuo ba năm trước, dựa vào trực giác trong sương mù GPT-4 chưa ra đời chỉ hai mươi phương hướng. Hôm nay đối chiếu xong, câu nên nhớ nhất có lẽ là: Nhìn đúng phương hướng lớn thực ra không khó lắm, khó là thừa nhận mình trên số, tốc độ và phân bố một lần nữa nghĩ đương nhiên. Hai mươi điều đối chiếu này, thay vì nói là cho điểm quá khứ, không bằng nói là đặt mấy quy củ cho ba năm tới. Ba năm tiếp theo, năm 2029 lại đối chiếu một lần.










