Ba năm sau: Nhìn lại những dự đoán của tôi về ChatGPT năm 2023

链捕手Xuất bản vào 2026-05-31Cập nhật gần nhất vào 2026-05-31

Tóm tắt

**Tóm tắt: Nhìn lại 20 dự đoán về ChatGPT năm 2023 sau 3 năm** Vào tháng 3/2023, khi ChatGPT mới xuất hiện và GPT-4 chưa ra mắt, tác giả Vương Kiến Thạc đã đưa ra 20 nhận định về tương lai của AI. Giờ đây, vào cuối tháng 5/2026, một hệ thống AI gồm 41 agent đã được sử dụng để kiểm chứng lại từng dự đoán đó dựa trên dữ liệu thực tế. **Kết quả kiểm chứng (Tính đến 5/2026):** * **Đúng/Bản chất đúng (✅/🟢):** 13/20 dự đoán. * **Một phần đúng (🟡):** 6/20 dự đoán. * **Sai (❌):** 1/20 dự đoán. **Những điểm dự đoán chính xác nổi bật:** 1. **Kiến trúc RAG & Tìm kiếm:** Dự đoán việc bổ sung kiến thức thông qua cơ chế truy xuất bên ngoài (như vector search) thay vì chỉ fine-tune model đã trở thành tiêu chuẩn. 2. **Giao diện ngôn ngữ tự nhiên (LUI):** Nhận định ChatGPT mở ra kỷ nguyên LUI, tạo ra một hệ sinh thái rộng lớn hơn cả việc phát triển model cơ bản, đã được chứng minh. 3. **Mô hình lớn Trung Quốc:** Dự báo khoảng cách về khả năng giữa các mô hình Trung Quốc và đỉnh cao thế giới sẽ thu hẹp nhanh chóng trong khoảng 3 năm đã thành hiện thực. 4. **Ý thức và Kiểm tra Turing:** Quan điểm cho rằng ChatGPT không có ý thức và bài kiểm tra Turing chỉ đánh giá biểu hiện bề ngoài vẫn vững vàng. **Những điểm dự đoán chưa chính xác hoặc sai lệch:** 1. **Tham số GPT-4 (❌):** Thông tin GPT-4 có 100 nghìn tỷ tham số là hoàn toàn sai. 2. **Khả năng toán học của LLM:** Mặc dù đúng khi cho rằng cần công cụ bổ trợ, nhưng khẳng định LLM "không thể" tự học toán thuần túy đã bị bác bỏ ...

Tác giả: Wang Jianshuo

Ngày 6 tháng 3 năm 2023, ChatGPT vừa ra mắt chưa lâu, GPT-4 chưa được công bố, tôi và Sarah đã có một cuộc phỏng vấn về ChatGPT – số thứ ba trong loạt Traders' Talk "Nói chuyện đơn giản" (Podcast Nói chuyện đơn giản về ChatGPT đã phát hành, mời mọi người cùng nghe).

Lúc đó, ChatGPT mới ra mắt được một thời gian ngắn, số người thực sự sử dụng nó còn rất ít. Cuộc phỏng vấn kéo dài ba giờ đồng hồ đó sau này luôn đứng đầu trong danh mục ChatGPT trên nền tảng Xiaoyuzhou. Trong đó, tôi đã đưa ra khoảng hơn hai mươi nhận định và dự đoán dựa hoàn toàn vào trực giác và thông tin hạn chế, không có nhiều dữ liệu. Bản ghi chép chi tiết đầy đủ của cuộc phỏng vấn đó vẫn còn trên tài khoản công khai.

Bây giờ là cuối tháng 5 năm 2026, ba năm đã trôi qua, AI đã phát triển thành một thứ mà năm xưa không thể tưởng tượng nổi.

Tôi muốn làm một việc: Lấy ra từng điều trong hai mươi nhận định năm đó, dùng dữ liệu mới nhất có thể tìm được ngày hôm nay để đối chiếu một cách khách quan. Để nhìn rõ thế giới đã thực sự thay đổi như thế nào trong ba năm, cũng như nhìn rõ bản thân tôi ba năm trước, chỗ nào đã nhìn đúng, chỗ nào đã nhìn lệch.

Để cố gắng không thiên vị, lần đối chiếu này tôi giao cho AI làm: Ném bản ghi chép phỏng vấn năm đó vào một workflow, để nó điều phối 41 agent Opus 4.8, đầu tiên tách rời hai mươi nhận định ra từng điều, sau đó từng cái một tìm kiếm dữ liệu mới nhất trên mạng, kiểm chứng chéo từng điều, cuối cùng cho điểm Wang Jianshuo ba năm trước. Nhóm agent này mất khoảng 20 phút, đốt hết 1.4 triệu token (tương đương khoảng 35 đô la), và tạo ra báo cáo dưới đây. Các nhận định đều đến từ chúng, không phải tôi. Ngày cơ sở được định vào tháng 5 năm 2026.

Một, Bảng điểm

Ký hiệu phán quyết: ✅ Đúng · 🟢 Cơ bản đúng · 🟡 Một phần đúng · ❌ Sai

Nhìn sơ qua, phần lớn phương hướng lớn của Wang Jianshuo năm đó đã đứng vững, chỉ có một điều duy nhất thực sự sai cứng – truyền rằng GPT-4 có 100T tham số. Nhưng quỷ ẩn trong chi tiết: Đằng sau hầu hết mỗi điều "đúng", đều có một cái đuôi mà năm đó chưa nói chuẩn. Trong hai mươi điều, không có điều nào thuần túy "vẫn chưa chắc chắn", ba năm đủ dài, hầu hết sự việc đã có câu trả lời thiên về hướng nào đó. Dưới đây sẽ nói chi tiết theo nhóm.

Hai, Những điều nhìn đúng

Điểm chung của nhóm này là: Phương hướng, cơ chế, thậm chí nhịp độ thời gian mà Wang Jianshuo dự đoán năm đó đều trúng, nếu có sai thì chỉ sai ở "mức độ" và "cách diễn đạt tuyệt đối hóa".

RAG và Kiến trúc Truy xuất (Quan điểm 2, 3)

> Năm 2023, Wang Jianshuo nói: Phương pháp chính để giải quyết kiến thức và ảo giác không phải là sửa mô hình, mà là sử dụng truy xuất vector để bơm kiến thức vào làm "phao cứu sinh"; kiến trúc đúng là công cụ tìm kiếm thực hiện truy xuất, rồi đưa kết quả cho LLM.

Đây chính là tiêu chuẩn thực tế của tất cả sản phẩm AI ngày nay. RAG đã trở thành kiến trúc mặc định cho AI doanh nghiệp; OpenAI, Google, Anthropic đều đã biến nó thành khả năng cấp nền tảng; ChatGPT Search đúng nghĩa đen là "trước tiên dùng Bing index để truy xuất, đưa kết quả cho GPT, rồi mới tạo ra câu trả lời có trích dẫn". Google AI Overviews sử dụng grounding đạt khoảng 2 tỷ người dùng hoạt động hàng tháng, Perplexity, một công ty chỉ dựa vào kiến trúc này, định giá đã tăng lên khoảng 200 tỷ đô la.

Vào thời điểm GPT-4 chưa ra mắt, ngành công nghiệp mặc định "dựa vào fine-tuning để truyền kiến thức", ông ấy đã đặt cược vào "không động đến tham số mô hình, treo ngoài truy xuất", cả cơ chế lẫn thời gian đều đúng.

Cần thành thật rằng: Ông ấy hình dung là "truy xuất tĩnh một lần", nhưng thực tế phức tạp hơn – ngữ cảnh dài, GraphRAG, agentic retrieval đều đến để tăng cường. Cuộc tranh luận "RAG đã chết" năm 2026, lại càng chứng minh phương hướng lớn không chết, nó phủ định chỉ là "truy xuất ngây thơ một lần", kết luận là nâng cấp thành truy xuất hỗn hợp, chứ không phải quay lại sửa tham số mô hình. Còn một điểm: Thuật ngữ RAG đã được đề cập trong bài báo của Meta năm 2020, không phải ông ấy sáng tạo – ông ấy chỉ đặt cược đúng thời điểm nó sẽ trở thành chủ đạo.

LUI là Lục địa Mới (Quan điểm 7)

> Năm 2023, Wang Jianshuo nói: Điều vĩ đại nhất của ChatGPT không phải là AIGC, mà là mở ra LUI (Giao diện Người dùng Ngôn ngữ Tự nhiên), sẽ tái cấu trúc tương tác người-máy như GUI năm xưa, thúc đẩy một ngành mới lớn hơn nhiều so với bản thân việc "làm mô hình lớn".

Phần "lục địa mới" này gần như trúng toàn bộ. Ngôn ngữ tự nhiên đã trở thành lớp tương tác chủ đạo của đại chúng (ChatGPT 900 triệu người dùng hoạt động hàng tuần), và thúc đẩy một ngành công nghiệp mới độc lập – agent, coding agent, lớp giao thức đều đã được hiện thực hóa. Câu nói cụ thể nhất "lớn hơn nhiều so với bản thân làm mô hình" đã được xác nhận mạnh mẽ: giao thức MCP đã trở thành "tiêu chuẩn hệ điều hành" thời đại LUI, năm 2025 được OpenAI, Google, Microsoft toàn diện chấp nhận, cuối năm chuyển sang Linux Foundation; riêng sản phẩm Claude Code đã đạt doanh thu hàng năm khoảng 2.5 tỷ đô la.

Nhưng ông ấy đã dùng cách diễn đạt mạnh như "tái cấu trúc, thay thế GUI", ba năm sau nhìn lại là chồng lấn cùng tồn tại, chứ không phải thay thế. Ba phản ví dụ rất rõ ràng: Báo cáo của MIT cho thấy 95% thí điểm GenAI doanh nghiệp không có ROI có thể đo lường được; computer-use agent thao tác trực tiếp giao diện trên tập kiểm thử, mô hình hàng đầu mới chỉ khoảng 78%, vừa chạm đến mức cơ bản của con người; phần cứng ngôn ngữ thuần túy không có màn hình gần như thất bại toàn bộ (Humane Pin năm 2025 ngừng hoạt động vĩnh viễn). Cách nói chính xác hơn là: LUI là lớp tương tác mới chồng lên trên GUI.

Mạng lưới Robot và Định vị Mới (Quan điểm 9)

> Năm 2023, Wang Jianshuo nói: Khoảng mười năm nữa sẽ xuất hiện "mạng lưới robot" – các agent dùng ngôn ngữ tự nhiên tự động bắt tay, gọi nhau, không cần API truyền thống; sẽ sinh ra một hệ thống định vị tên miền mới hoàn toàn. Hệ thống này "hai ba năm là có thể làm xong".

Phương hướng trúng một cách đáng kinh ngạc. MCP, A2A (đã hiến tặng cho Linux Foundation, 150+ tổ chức ủng hộ) giải quyết việc các agent gọi lẫn nhau; Agent Network Protocol trực tiếp dựa trên DID của W3C để làm "định vị agent không có thẩm quyền trung tâm", mục tiêu là "mạng lưới hợp tác hàng tỷ agent" – điều này rất đồng cấu trúc với "hệ thống tên miền mới" mà ông ấy nói.

Có hai chỗ cần chỉnh sửa: Một là "không cần API" không thành lập, giao thức chủ đạo dưới đáy là schema có cấu trúc, bản chất là chồng một lớp tiêu chuẩn lên trên API; Hai là "hai ba năm làm xong" chưa thực hiện, dữ liệu của Gartner cho thấy tính đến năm 2026 chỉ khoảng 17% tổ chức thực sự triển khai agent. Thú vị là, năm đó ông ấy thực ra đã chia lời nói thành hai tầng – nguyên mẫu "hai ba năm", trưởng thành "khoảng mười năm". Nhịp độ của nguyên mẫu trúng rất chuẩn, chu kỳ trưởng thành cũng thực sự là cấp mười năm. Tách hai tầng ra xem, chất lượng của điều này cao hơn vẻ bên ngoài.

Trung Quốc nhất định làm được mô hình lớn khả dụng (Quan điểm 10, 20)

> Năm 2023, Wang Jianshuo nói: Trung Quốc nhất định có thể làm ra mô hình lớn khả dụng, khoảng cách với đỉnh cao sẽ thu hẹp nhanh chóng trong khoảng ba năm (tương tự như trình duyệt Hồng Kỳ đuổi theo Netscape).

Đường thời gian của điều này trùng khớp một cách bất ngờ. Stanford AI Index 2026 thực nghiệm, khoảng cách chuẩn giữa các mô hình hàng đầu Trung-Mỹ từ tháng 5/2023 là 17.5–31.6 điểm phần trăm, đã thu hẹp còn 2.7%; trong khi đầu tư AI tư nhân của Mỹ gấp khoảng 23 lần Trung Quốc – dùng đầu tư nhỏ hơn nhiều để đạt được sự thu hẹp. DeepSeek, Qwen, Kimi, GLM đã trở thành chủ đạo toàn cầu, hệ sinh thái mã nguồn mở thậm chí dẫn đầu.

Nhưng hai chữ "nhanh chóng" hơi lạc quan – sự trưởng thành thực sự xảy ra sau khoảng 14 tháng, chứ không phải "vài tháng". Và đây là bắt kịp tính khả dụng, không phải định nghĩa tiền tuyến: Tính đến đầu năm 2026 vẫn không có mô hình Trung Quốc nào vượt qua OpenAI o3. Trong quan điểm 20, ông ấy sai rõ ràng: Nhận định "cánh cửa mở ra rồi sẽ không đóng lại" bị OpenAI chủ động cắt API với Trung Quốc vào tháng 7/2024 trực tiếp bác bỏ, cánh cửa bị phía cung cấp đóng lại; Wenxin Yiyan mà ông ấy chỉ tên dẫn đầu ngược lại bị tụt lại, thực sự tiếp sức là DeepSeek, Doubao, Qianwen vốn năm đó còn không đáng chú ý.

Không có ý thức, Kiểm tra Turing chỉ kiểm tra biểu hiện (Quan điểm 13)

> Năm 2023, Wang Jianshuo nói: ChatGPT không có ý thức, là "người nói vô tình, người nghe có ý" tự làm khổ mình; Kiểm tra Turing vốn chỉ kiểm tra "liệu có khiến bạn nghĩ rằng nó có hay không", chứ không phải nó thực sự có.

Nhận định cốt lõi "kiểm tra biểu hiện" này đứng rất vững, còn bị một thí nghiệm châm biếm xác nhận: Trong bài kiểm tra Turing năm 2025 của UC San Diego, GPT-4.5 dưới gợi ý "đóng vai con người" bị phán là con người với tỷ lệ cao tới 73%, cao hơn cả người thật, nhưng hoàn toàn dựa vào kỹ năng diễn xuất – đây chính là chú thích tốt nhất cho "chỉ kiểm tra liệu có khiến bạn nghĩ rằng nó có hay không".

Cần bổ sung rằng: "Máy móc nhất định không có ý thức" là luận điểm mạnh tuyệt đối hóa, trong ba năm đã được đẩy vào vùng xám. Anthropic đã thiết lập vị trí nghiên cứu "phúc lợi mô hình", đưa ra xác suất ý thức khoảng 15%–20%, còn thêm cho Claude chức năng "chủ động kết thúc cuộc hội thoại bị lạm dụng". Những điều này biến "tuyệt đối không" thành "xác suất thấp nhưng không thể loại trừ". Tuy nhiên, tất cả đều dựa trên "có thể, nên giả định" chứ không phải "đã được chứng minh", hạt nhân không bị lật đổ, chỉ là năm đó ngữ khí quá đầy.

Các điều nhìn đúng còn lại (Quan điểm 6, 11, 12, 16, 18, 19)

  • Không phải AGI nhưng đã tiến một bước lớn
    : Cả hai đầu đều đứng vững. Chính Altman thời GPT-5 vẫn nói "không phải AGI, thiếu học tập liên tục"; đồng thời huy chương vàng IMO, ARC-AGI từ gần 0 tăng lên 85%, "tiến một bước lớn" không có tranh cãi.
  • Không có làn sóng thất nghiệp
    : Tháng 4/2026 tỷ lệ thất nghiệp Mỹ chỉ 4.3%. Điểm mù là "phân bố" – nghiên cứu Stanford cho thấy, chính xác bị rút đi là những người mới trẻ tuổi 22–25 ở cấp thang nghề nghiệp đầu tiên, cơ chế "hút thuận lợi" ở họ thất bại.
  • Không bị chìm trong rác AI
    : Phúc lợi ròng đúng hướng, nhưng ông ấy đánh giá thấp nghiêm trọng về quy mô – nội dung AI đã chiếm khoảng 52% trang web mới tăng, "AI slop" trở thành từ của năm.
  • Năm lớn khởi nghiệp
    : Bắt đúng điểm ngoặt của làn sóng, xAI (thành lập tháng 3/2023) đã đạt định giá 2300 tỷ. Nhưng ông ấy khóa "công ty vĩ đại" vào năm 2023 quá hẹp – những công ty thực sự nghìn tỷ như OpenAI, Anthropic đều thành lập sớm hơn.
  • Khoảnh khắc trình duyệt 1994
    : Sắp xếp tương đối đã thành hiện thực, OpenAI năm 2025 thực sự cho ra mắt trình duyệt Atlas, biến phép ẩn dụ thành hiện thực đúng nghĩa đen. Chỉ là ChatGPT lan truyền mạnh hơn trình duyệt, phép ẩn dụ hơi bảo thủ.
  • Prompt bơm thêm sự thật giảm ảo giác
    : Hướng được xác nhận, GPT-5 không kết nối mạng không truy xuất thì tỷ lệ ảo giác tăng vọt lên 47%, ngược lại xác nhận "sự thật" là biến số then chốt. Chỉ đánh giá thấp nguyên nhân gốc rễ là động lực huấn luyện, không phải prompt.

Ba, Những điều nhìn sai, nhìn lệch

GPT-4 có 100T tham số (Quan điểm 4) – Sai hoàn toàn

> Năm 2023, Wang Jianshuo nói: (Tin đồn) GPT-4 có 100T tham số, gấp khoảng 600 lần GPT-3 (175B).

Cả hai con số đều sai. GPT-3 là 175B, ước tính tốt nhất bị rò rỉ tháng 7/2023 là GPT-4 khoảng 1.8T, 16 chuyên gia MoE, chỉ khoảng 10 lần. 100T và thực tế chênh lệch khoảng 55 lần về quy mô. Nguồn duy nhất của "100T", là CEO Cerebras năm 2021 một câu nói "khoảng" truyền miệng, Sam Altman đã từ tháng 1/2023 trực tiếp gọi bảng so sánh đó là "complete bullshit".

Ông ấy nguyên văn đã đánh dấu "tin đồn", giữ lại tính không chắc chắn. Sâu hơn một tầng, khuôn khổ "dùng bội số tham số để đánh giá thế hệ" này bản thân đã lỗi thời: GPT-4.5, GPT-5 sau này của OpenAI đơn giản không công bố số lượng tham số nữa. Đây là điều duy nhất vừa sai số vừa lỗi thời góc nhìn.

Toán LLM (Quan điểm 1) – Chẩn đoán đúng, kết luận chặn đầu sai

> Năm 2023, Wang Jianshuo nói: Toán LLM kém là bản chất, để nó tự học toán vừa không thể vừa không cần thiết, cách làm đúng là treo ngoài công cụ.

"Chẩn đoán cộng con đường công cụ" đúng toàn bộ – nguyên nhân gốc chính là sinh token từng cái dẫn đến nhớ không đáng tin (bài báo cơ chế năm 2025 xác nhận chính xác trực giác "chữ số cuối thường đúng, chữ số giữa sai"); công cụ treo ngoài cải thiện cũng rất lớn (o4-mini cho phép dùng Python, AIME 2025 đạt 99.5%).

Sai ở cách diễn đạt chặn đầu kiểu "không thể, không cần thiết". "Không thể" bị bác bỏ – tháng 7/2025 Gemini Deep Think và mô hình OpenAI trong IMO dùng ngôn ngữ tự nhiên thuần túy, không công cụ đạt huy chương vàng. Bước ngoặt then chốt là "mô hình suy luận" xuất hiện năm 2024–2025, điều này vào tháng 3/2023 không thể dự đoán – vì vậy đối với dự đoán này nên khoan dung đánh giá hướng, chứ không nên trách thời điểm.

Nắm bắt giá trị (Quan điểm 8) – Được một nửa, luận điểm cốt lõi ngược

> Năm 2023, Wang Jianshuo nói: Giá trị cuối cùng sẽ rơi vào lớp ứng dụng, kết cục của công ty mở ra lớp cơ sở (làm mô hình) chưa chắc kiếm được tiền.

Tiền thực sự bắt đầu chảy về lớp ứng dụng (Cursor ba năm đạt doanh thu hàng năm 2 tỷ) – nửa này đúng. Nhưng "làm lớp cơ sở không kiếm tiền" bị NVIDIA trực tiếp bác bỏ: FY2026 lợi nhuận ròng khoảng 120 tỷ đô la, giá trị vốn hóa 5 nghìn tỷ+, là người duy nhất trên toàn thị trường rõ ràng có lợi nhuận lớn. Còn lớp mô hình mà ông ấy ngụ ý sẽ thắng (OpenAI năm 2026 dự lỗ khoảng 14 tỷ) ngược lại giống nhất với "lớp cơ sở đốt tiền không kiếm tiền" mà ông ấy nói.

Ông ấy không phân biệt "lớp cơ sở tính toán" và "lớp cơ sở mô hình", cũng không phân biệt "doanh thu" và "lợi nhuận". Giá trị năm 2026 so với 2023 càng cực đoan hơn khi bị lớp tính toán nắm bắt, chứ không phải chuyển dịch về lớp ứng dụng. Cần bổ sung một câu: Lỗ tiền là nhà cung cấp đám mây mua chip, không phải NVIDIA bán chip – đây chính là chỗ lệch của phép loại suy "xây dựng đường sắt quá mức" của ông ấy.

Bản quyền (Quan điểm 14) – Đăng ký đúng, tránh xâm phạm sai

> Năm 2023, Wang Jianshuo nói: Nội dung AI tạo ra có thể tránh bản quyền (bảo vệ biểu đạt không bảo vệ ý tưởng); vật tạo ra có thể vừa không xâm phạm, cũng không thể đăng ký.

"Không thể đăng ký" đã trở thành sự thật pháp lý đã định (năm 2025 Văn phòng Bản quyền Mỹ rõ ràng "chỉ nhập từ khóa gợi ý không đủ để yêu sách tác giả"). Nhưng "tránh xâm phạm" sai rõ ràng: Tòa án nhiều lần xác định đầu ra AI nếu tương tự bản chất với tác phẩm gốc vẫn cấu thành xâm phạm; Anthropic vì dữ liệu ngôn ngữ lậu hòa giải với 1.5 tỷ đô la, là khoản bồi thường bản quyền lớn nhất lịch sử Mỹ. AI không những không "tránh" bản quyền, mà ngược lại trả giá lớn nhất lịch sử.

Thế giới đại đồng (Quan điểm 15) – Cơ chế đúng, xu hướng đặt cược ngược

> Năm 2023, Wang Jianshuo nói: ChatGPT làm "bình quân gia quyền" quan điểm con người, có thể chống lại kén thông tin kiểu TikTok, cho khả năng "thế giới đại đồng".

Lớp cơ chế đúng – năm 2025 nhiều nghiên cứu xác thực chứng thực LLM ép quan điểm về số đông, đánh giá thấp có hệ thống thiểu số. Nhưng lớp phán đoán xã hội đặt cược ngược: Chính ông ấy thêm "ít nhất bây giờ không phải ngàn người ngàn vẻ", trong ba năm đã bị lật đổ – OpenAI từ tháng 4/2025 đưa trí nhớ xuyên hội thoại và cá nhân hóa làm thành khả năng mặc định, AI đang tiến về ngàn người ngàn vẻ với tốc độ cao. Quan trọng hơn, ông ấy tưởng tượng "bình quân gia quyền" là mẫu số chung trung lập của thế giới, nhưng thực nghiệm nó là lệch hướng, còn chồng lấn xu nịnh, có thể dùng để thao túng lập trường chủ động – điều này hướng tới "tạo kén mới", chứ không phải "giải cực đoan".

Chiến tranh cục bộ và Chi phí (Quan điểm 17) – Tính chất đúng toàn bộ, số lượng bác bỏ

> Năm 2023, Wang Jianshuo nói: Làm mô hình lớn tiếp sẽ nhanh chóng trở thành "chiến tranh cục bộ", chi phí có thể biết (bỏ đường vòng khoảng 5-10 tỷ đô la chặn đầu), sẽ có nhiều người chơi tham gia.

Tính chất đúng một cách đáng kinh ngạc – nhiều người chơi ồ ạt tham gia, nhanh chóng hàng hóa hóa, mã nguồn mở bắt kịp mã đóng, toàn bộ đã hiện thực hóa. Nhưng con số cứng "5-10 tỷ chặn đầu" sai cả hai đầu: Đầu tiền tuyến bị đánh giá thấp nghiêm trọng (cấp GPT-5 năm 2026 đạt 2-5 tỷ đô la huấn luyện, chồng lấp trung tâm dữ liệu nghìn tỷ và Stargate 5000 tỷ); đầu sao chép lại bị đánh giá cao (DeepSeek ép chi phí huấn luyện biên tế xuống cấp triệu đô la). Cùng một mô hình "chi phí" theo khẩu độ có thể chênh 200 lần, duy nhất không nằm trong khoảng ông ấy đưa ra.

Khả năng xuất hiện (Quan điểm 5) – Hướng đúng, số và khung sai

> Năm 2023, Wang Jianshuo nói: Khoảng 60B tham số trở lên xuất hiện khả năng mới không có trong dữ liệu ngôn ngữ gốc, nhà nghiên cứu cũng không thể giải thích.

Trực giác phương hướng thành lập, nhưng hai chỗ diễn đạt không đứng vững: Thứ nhất, không tồn tại "ngưỡng 60B" thống nhất – ngưỡng thực tế của chuỗi suy nghĩ khoảng 100B, khả năng khác nhau xuất hiện ở quy mô khác nhau từ 13B đến 540B; Thứ hai, "không thể giải thích" cuối năm 2023 đã bị một bài báo xuất sắc NeurIPS thách thức – nhiều "đột biến" là ảo tượng do lựa chọn chỉ số đánh giá tạo ra, sau khi thay chỉ số liên tục đường cong trơn tru có thể dự đoán. Công bằng mà nói, năm đó ông ấy thuật lại là tường thuật tuyệt đối chủ đạo, thực sự có thể sửa chữa là lấy "60B" làm ngưỡng cứng, lấy "không thể giải thích" làm kết luận tính chất.

Bốn, Nhìn lại ba năm, mấy quy luật

Từng điều đối chiếu xong, lùi một bước nhìn, hai mươi nhận định này của Wang Jianshuo ẩn chứa vài quy luật đáng ghi nhớ hơn bất kỳ điều riêng lẻ nào.

Một, Phương hướng đáng tin cậy hơn nhiều so với số và mức độ. Trong hai mươi điều, phàm là nhận định cơ chế và phương hướng (RAG, LUI, mạng lưới robot, kiểm tra Turing), gần như trúng toàn bộ; phàm là đưa ra số cụ thể hoặc cách diễn đạt chặn đầu (100T tham số, ngưỡng 60B, chi phí 5-10 tỷ, toán "không thể"), gần như sai toàn bộ. Đối với lĩnh vực biến đổi nhanh, đặt cược phương hướng, cơ chế, ít đặt cược số chính xác, càng phải cảnh giác những từ nói đầy kiểu "không thể, nhất định, chặn đầu, tuyệt đối không" – chúng là khu vực dễ bị thời gian tát vào mặt.

Hai, Về thời gian, ông ấy có xu hướng đánh giá cao tốc độ, đánh giá thấp mức độ. Phàm là nói "nhanh chóng, hai ba năm làm xong", thời kỳ trưởng thành phổ biến chậm hơn; nhưng đối với trần nhảy vọt của năng lực lại đánh giá thấp – toán có thể từ "không thể" đến huy chương vàng IMO, chi phí tiền tuyến có thể tăng lên quy mô năm đó không tưởng tượng nổi. Một câu: Ngắn hạn quá lạc quan, dài hạn quá bảo thủ.

Ba, Sai ẩn nhất, lặp lại xuất hiện trên "phân bố". Không phải phương hướng sai, mà là chỉ nhìn tổng lượng, bỏ qua phân bố. "Không có làn sóng thất nghiệp" đúng, nhưng tổn thương tập trung cao độ ở người mới trẻ tuổi; "Giá trị rơi vào lớp ứng dụng" đúng một nửa, nhưng không phân biệt lớp tính toán và lớp mô hình. Tổng lượng đúng, che lấp thảm họa phân bố – đây là bài học cần bổ sung nhất.

Bốn, Những chỗ để lại khoảng trống trong lời nói, ba năm sau đều chịu được kiểm nghiệm. "Tin đồn" "ít nhất bây giờ" "giảm mạnh chứ không loại bỏ" "nguyên mẫu hai ba năm, trưởng thành khoảng mười năm" – phàm là nhận định năm đó có từ hạn định, chia tầng, hôm nay nhìn lại đều đứng vững hơn. Ngược lại, những câu tuyệt đối tuôn ra miệng, dễ bị lật đổ nhất. Sự thành thật của dự đoán, một nửa ở dám nói, nửa còn lại ở dám đánh dấu sự không chắc chắn của mình.

Năm, Một số vấn đề, ba năm căn bản không đủ. Giá trị cuối cùng quy về ai, xuất hiện có phải chân tướng biến đổi, máy móc rốt cuộc có một chút ý thức hay không, ngữ cảnh dài có ăn RAG không – những tranh luận năm đó, đến năm 2026 vẫn là tranh luận. Có thể phân biệt "đã có câu trả lời" và "còn phải tiếp tục đợi", quan trọng hơn là vội vàng đưa ra kết luận cho mỗi sự việc.

Wang Jianshuo ba năm trước, dựa vào trực giác trong sương mù GPT-4 chưa ra đời chỉ hai mươi phương hướng. Hôm nay đối chiếu xong, câu nên nhớ nhất có lẽ là: Nhìn đúng phương hướng lớn thực ra không khó lắm, khó là thừa nhận mình trên số, tốc độ và phân bố một lần nữa nghĩ đương nhiên. Hai mươi điều đối chiếu này, thay vì nói là cho điểm quá khứ, không bằng nói là đặt mấy quy củ cho ba năm tới. Ba năm tiếp theo, năm 2029 lại đối chiếu một lần.

Câu hỏi Liên quan

QBa năm sau, tác giả đánh giá thế nào về những dự đoán của mình về ChatGPT năm 2023?

ATác giả nhận thấy hầu hết các dự đoán về cơ chế và hướng phát triển (như RAG, LUI, mạng lưới agent) là chính xác, nhưng các dự đoán về con số cụ thể (như tham số mô hình, chi phí) hoặc các kết luận tuyệt đối (như 'không thể', 'tất cả') thường sai. Ông thừa nhận mình có xu hướng lạc quan thái quá về tốc độ, nhưng lại đánh giá thấp mức độ thay đổi.

QDự đoán nào của tác giả năm 2023 được xem là chính xác nhất?

ADự đoán chính xác nhất là về việc RAG (Retrieval-Augmented Generation) và kiến trúc kết hợp tìm kiếm sẽ trở thành phương pháp chính để giải quyết kiến thức và ảo giác cho LLM, thay vì chỉ chỉnh sửa tham số mô hình. Điều này đã trở thành tiêu chuẩn thực tế trong ngành AI.

QDự đoán nào của tác giả hoàn toàn sai, và tại sao?

ADự đoán hoàn toàn sai là về việc GPT-4 có 100 nghìn tỷ tham số. Thực tế, GPT-4 ước tính chỉ có khoảng 1.8 nghìn tỷ tham số. Dự đoán này sai cả về con số lẫn quan điểm lỗi thời khi đánh giá thế hệ mô hình chỉ dựa trên hệ số nhân tham số.

QBáo cáo 'đối chiếu' này được tạo ra bằng cách nào?

ABáo cáo được tạo ra một cách khách quan bởi một workflow AI, điều phối 41 agent Opus 4.8. Các agent này tự động phân tách 20 dự đoán, tìm kiếm thông tin cập nhật nhất trên mạng để kiểm chứng chéo, và cuối cùng đưa ra đánh giá cho từng dự đoán. Quá trình này tiêu tốn khoảng 20 phút và 1.4 triệu token.

QBài viết rút ra những quy luật hay bài học gì từ việc nhìn lại các dự đoán?

ABài viết rút ra 5 quy luật/bài học chính: 1) Dự đoán về hướng đi và cơ chế đáng tin cậy hơn nhiều so với con số cụ thể. 2) Có xu hướng đánh giá quá cao tốc độ thay đổi trong ngắn hạn, nhưng đánh giá thấp mức độ thay đổi trong dài hạn. 3) Sai sót thường nằm ở việc bỏ qua sự phân bố không đồng đều, chỉ nhìn vào tổng thể. 4) Những dự đoán có từ ngữ thận trọng, để ngỏ thường chính xác hơn. 5) Ba năm là chưa đủ để có câu trả lời cho một số vấn đề cốt lõi.

Nội dung Liên quan

Sau khi đốt cháy hàng chục tỷ USD cho Token, các ông lớn ở Thung lũng Silicon bắt đầu hạn chế lượng Token nhân viên sử dụng

Vài ngày trước, Microsoft đã dừng cấp phép Claude Code cho phần lớn nhân viên. Đây không phải là trường hợp duy nhất, khi các công ty lớn ở Thung lũng Silicon đang chuyển hướng sang hạn chế và giám sát việc nhân viên sử dụng AI, sau một thời gian thúc đẩy sử dụng tối đa token. Hiện tượng "tokenmaxxing" (tối đa hóa token) bắt đầu phổ biến từ 2025, xuất phát từ quan niệm rằng nhân viên càng dùng nhiều AI thì càng chuyển đổi số tốt. Hậu quả là nhiều người dùng mô hình AI doanh nghiệp đắt tiền cho các tác vụ không quan trọng. Nghiên cứu chỉ ra cứ mỗi đô la chi cho token AI thì có 0.44 đô la dùng để sửa lỗi do AI tạo ra và 0.27 đô la để viết lại mã code từ AI. Cuộc khủng hoảng chi phí đã bùng nổ. Báo cáo của JPMorgan cảnh báo "Chi phí Token AI đang ăn mòn lợi nhuận Internet". Chỉ 14% CFO thấy được lợi tức đầu tư (ROI) rõ ràng từ AI. Vấn đề cốt lõi là tăng hiệu suất cá nhân không đồng nghĩa với tăng trưởng doanh thu cho công ty. Các lãnh đạo như Andrew Macdonald của Uber thừa nhận khó liên kết việc tăng năng suất cá nhân với tác động kinh doanh tổng thể. Sophia Velastegui, cựu Giám đốc AI của Microsoft, nhận xét các công ty thường tự động hóa những công việc nhân viên "ghét" thay vì những việc "tạo ra tiền". Để đối phó, các công ty như Salesforce đang tìm kiếm giải pháp như "bộ định tuyến thông minh" để phân bổ tác vụ cho mô hình phù hợp, tối ưu chi phí. Trên thị trường, các công cụ quản lý chi phí AI như của Harness và CloudZero đang xuất hiện. Một số nhà cung cấp như HubSpot cũng chuyển đổi mô hình định giá từ tính phí theo token sang tính phí theo kết quả (như số cuộc hội thoại giải quyết được). Đây được coi là cơn đau chuyển đổi cần thiết cho ngành công nghiệp AI. Tuy nhiên, bài học lớn hơn là các công ty cần tái thiết kế quy trình làm việc và mô hình kinh doanh xung quanh AI, thay vì chỉ dùng nó để thực hiện công việc cũ một cách nhanh hơn. Nếu không, hóa đơn token sẽ tiếp tục là gánh nặng.

marsbit17 phút trước

Sau khi đốt cháy hàng chục tỷ USD cho Token, các ông lớn ở Thung lũng Silicon bắt đầu hạn chế lượng Token nhân viên sử dụng

marsbit17 phút trước

Gate chính thức ra mắt giao dịch cổ phiếu thực, mở ra kênh kết nối tài sản mã hóa với thị trường tài chính truyền thống

Gate đã chính thức ra mắt dịch vụ giao dịch cổ phiếu thực, cho phép người dùng trực tiếp sử dụng USDT để giao dịch các cổ phiếu và ETF từ các thị trường chứng khoán chính của Hoa Kỳ. Khác với mô hình mã thông báo hóa (tokenization) hay RWA, dịch vụ này kết nối trực tiếp với thị trường thông qua các công ty môi giới (như Alpaca) có giấy phép Broker-Dealer và là thành viên của SIPC, nhấn mạnh khả năng tiếp cận thị trường thực và tính tuân thủ. Dịch vụ hỗ trợ hơn 10,000 mã cổ phiếu và ETF từ các sàn giao dịch như NYSE, Nasdaq, cung cấp lựa chọn đầu tư toàn diện. Người dùng có thể sử dụng tài khoản Gate hiện có và USDT để giao dịch một cách liền mạch thông qua ứng dụng di động, tích hợp trong mục TradFi. Giao dịch là giao dịch spot thực, không liên quan đến CFD, phí qua đêm hay phí financing, phù hợp cho đầu tư nắm giữ dài hạn. Tính năng hiện hỗ trợ giao dịch trong giờ (intraday), với kế hoạch mở rộng sang giao dịch 24/7. Các chức năng như giao dịch ký quỹ (margin) và chuyển chứng khoán liền mạch sẽ được bổ sung sau. Bước tiến này đánh dấu việc Gate mở rộng từ một nền tảng tài sản số thành cơ sở hạ tầng giao dịch đa tài sản, kết nối thị trường vốn truyền thống và tiền mã hóa.

链捕手38 phút trước

Gate chính thức ra mắt giao dịch cổ phiếu thực, mở ra kênh kết nối tài sản mã hóa với thị trường tài chính truyền thống

链捕手38 phút trước

Tôi đã làm VC trong Web3 chín năm: Các quỹ châu Á đang trải qua 'Chế độ địa ngục'

Tác giả, một nhà đầu tư mạo hiểm (VC) với 9 năm kinh nghiệm trong Web3, chia sẻ góc nhìn về sự thay đổi khắc nghiệt của thị trường Crypto, đặc biệt là với các quỹ VC châu Á. Nhiều quỹ Châu Á đã biến mất, các nhà đầu tư chuyển sang AI hoặc ngừng hoạt động, trái ngược với sự sôi động cực độ của các năm 2021-2024. Jocy, người sáng lập IOSG Ventures, trải qua ba chu kỳ thăng trầm, nhận thấy logic đầu tư đã thay đổi cơ bản. IOSG điều chỉnh chiến lược, giảm tỷ trọng đầu tư giai đoạn sớm, tăng cường vào các dự án Post-TGE và OTC để tìm kiếm cơ hội định giá sai và quản lý thanh khoản tốt hơn. Ông nhận định 20% quỹ hàng đầu, có thể chứng minh đường thoát vốn rõ ràng, sẽ thu hút 80% tiền trên thị trường. Thị trường hiện nay rất lạnh nhạt, các dự án chất lượng khan hiếm. Đây lại là cơ hội cấu trúc cho các quỹ nghiên cứu sâu, khi họ có thời gian thẩm định kỹ lưỡng thay vì chạy đua định giá. Trong khi các quỹ Mỹ vẫn còn nhiều lựa chọn, các quỹ châu Á đang ở trong "chế độ địa ngục", buộc phải bắn thật chính xác với nguồn vốn hạn hẹp. Một vấn đề cốt lõi của ngành được chỉ ra: sự tách rời lâu dài giữa Token và giá trị thực. Nhiều dự án trong quá khứ dùng token chỉ như công cụ gọi vốn, trong khi lợi nhuận thật nằm ở công ty pháp lý truyền thống. Xu hướng mới đòi hỏi token phải gắn liền với giá trị thực của giao thức, như cơ chế chia sẻ doanh thu hoặc mua lại token minh bạch, như các ví dụ từ Uniswap, Hyperliquid hay Morpho. Cuối cùng, tác giả tin rằng những dự án vĩ đại thường ra đời trong giai đoạn bi quan nhất. IOSG hiện tập trung vào hai hướng: 1) Hạ tầng tài chính với dòng tiền thực (stablecoin, thanh toán, tín dụng on-chain), và 2) Giao thoa giữa AI và Crypto, tập trung vào cơ sở hạ tầng AI nguyên bản cho blockchain. Sự sàng lọc khốc liệt này buộc các VC phải quay trở lại với các nguyên tắc kinh doanh cơ bản và tìm kiếm giá trị thực sự.

marsbit42 phút trước

Tôi đã làm VC trong Web3 chín năm: Các quỹ châu Á đang trải qua 'Chế độ địa ngục'

marsbit42 phút trước

Lợi suất trái phiếu kho bạc 30 năm Mỹ lần nữa vượt 5%, kỷ nguyên 'tất cả đều rẻ' đã khép lại

Lợi suất trái phiếu Kho bạc Mỹ kỳ hạn 30 năm một lần nữa vượt ngưỡng 5%, đánh dấu một phản ứng thị trường khác biệt so với năm 2023. Các nhà đầu tư đang bắt đầu chấp nhận thực tế rằng lãi suất cao có thể sẽ kéo dài. Sự thay đổi này phản ánh một chuyển dịch cấu trúc sâu sắc hơn: ba trụ cột từng hỗ trợ nền kinh tế Mỹ với lạm phát và lãi suất thấp trong nửa thế kỷ qua – vốn rẻ, lao động rẻ và năng lượng rẻ – đang đồng thời suy yếu. **Sự kết thúc của kỷ nguyên "mọi thứ đều rẻ":** * **Vốn:** Toàn cầu hóa đảo ngược và tái thiết chuỗi cung ứng đẩy giá cả, trong khi sức mua trái phiếu từ các nhà đầu tư quốc tế giảm. * **Lao động:** Tình trạng thiếu hụt lao động, làn sóng đình công và hạn chế nhập cư đang tạo áp lực tăng lương. * **Năng lượng:** Căng thẳng địa chính trị và sự xói mòn của hệ thống petrodollar đe dọa nguồn cung năng lượng ổn định và rẻ. Các yếu tố "biến động chậm" như nợ công tăng, căng thẳng địa chính trị và chủ nghĩa dân túy cũng khiến các chủ nợ yêu cầu mức bù rủi ro cao hơn, đẩy lãi suất dài hạn lên. **AI: Yếu tố bất định lớn** Tương lai của Trí tuệ nhân tạo (AI) là ẩn số lớn nhất đối với lạm phát: * **Kịch bản lạc quan:** AI thúc đẩy năng suất lan rộng, tạo việc làm mới và giảm nợ cùng lạm phát. * **Kịch bản bi quan:** AI chủ yếu được dùng để cắt giảm chi phí và sa thải, trong khi chính cơ sở hạ tầng AI (tiêu thụ chip, đất, nước, điện khổng lồ) lại tạo ra áp lực lạm phát mới. Hiện tại, các gã khổng lồ AI đang đẩy giá các nguồn lực này. Kết quả cuối cùng vẫn chưa rõ ràng. **Thách thức cho nhà đầu tư** Bài học then chốt là phần lớn thị trường đã quen với môi trường lãi suất thấp. "Quán tính kỳ vọng" khiến việc điều chỉnh tư duy và mô hình đầu tư trở nên khó khăn, nhưng sự thay đổi cấu trúc này đang thực sự diễn ra.

marsbit50 phút trước

Lợi suất trái phiếu kho bạc 30 năm Mỹ lần nữa vượt 5%, kỷ nguyên 'tất cả đều rẻ' đã khép lại

marsbit50 phút trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片