Ba năm sau: Nhìn lại những dự đoán của tôi về ChatGPT năm 2023

链捕手Xuất bản vào 2026-05-31Cập nhật gần nhất vào 2026-05-31

Tóm tắt

**Tóm tắt: Nhìn lại 20 dự đoán về ChatGPT năm 2023 sau 3 năm** Vào tháng 3/2023, khi ChatGPT mới xuất hiện và GPT-4 chưa ra mắt, tác giả Vương Kiến Thạc đã đưa ra 20 nhận định về tương lai của AI. Giờ đây, vào cuối tháng 5/2026, một hệ thống AI gồm 41 agent đã được sử dụng để kiểm chứng lại từng dự đoán đó dựa trên dữ liệu thực tế. **Kết quả kiểm chứng (Tính đến 5/2026):** * **Đúng/Bản chất đúng (✅/🟢):** 13/20 dự đoán. * **Một phần đúng (🟡):** 6/20 dự đoán. * **Sai (❌):** 1/20 dự đoán. **Những điểm dự đoán chính xác nổi bật:** 1. **Kiến trúc RAG & Tìm kiếm:** Dự đoán việc bổ sung kiến thức thông qua cơ chế truy xuất bên ngoài (như vector search) thay vì chỉ fine-tune model đã trở thành tiêu chuẩn. 2. **Giao diện ngôn ngữ tự nhiên (LUI):** Nhận định ChatGPT mở ra kỷ nguyên LUI, tạo ra một hệ sinh thái rộng lớn hơn cả việc phát triển model cơ bản, đã được chứng minh. 3. **Mô hình lớn Trung Quốc:** Dự báo khoảng cách về khả năng giữa các mô hình Trung Quốc và đỉnh cao thế giới sẽ thu hẹp nhanh chóng trong khoảng 3 năm đã thành hiện thực. 4. **Ý thức và Kiểm tra Turing:** Quan điểm cho rằng ChatGPT không có ý thức và bài kiểm tra Turing chỉ đánh giá biểu hiện bề ngoài vẫn vững vàng. **Những điểm dự đoán chưa chính xác hoặc sai lệch:** 1. **Tham số GPT-4 (❌):** Thông tin GPT-4 có 100 nghìn tỷ tham số là hoàn toàn sai. 2. **Khả năng toán học của LLM:** Mặc dù đúng khi cho rằng cần công cụ bổ trợ, nhưng khẳng định LLM "không thể" tự học toán thuần túy đã bị bác bỏ ...

Tác giả: Wang Jianshuo

Ngày 6 tháng 3 năm 2023, ChatGPT vừa ra mắt chưa lâu, GPT-4 chưa được công bố, tôi và Sarah đã có một cuộc phỏng vấn về ChatGPT – số thứ ba trong loạt Traders' Talk "Nói chuyện đơn giản" (Podcast Nói chuyện đơn giản về ChatGPT đã phát hành, mời mọi người cùng nghe).

Lúc đó, ChatGPT mới ra mắt được một thời gian ngắn, số người thực sự sử dụng nó còn rất ít. Cuộc phỏng vấn kéo dài ba giờ đồng hồ đó sau này luôn đứng đầu trong danh mục ChatGPT trên nền tảng Xiaoyuzhou. Trong đó, tôi đã đưa ra khoảng hơn hai mươi nhận định và dự đoán dựa hoàn toàn vào trực giác và thông tin hạn chế, không có nhiều dữ liệu. Bản ghi chép chi tiết đầy đủ của cuộc phỏng vấn đó vẫn còn trên tài khoản công khai.

Bây giờ là cuối tháng 5 năm 2026, ba năm đã trôi qua, AI đã phát triển thành một thứ mà năm xưa không thể tưởng tượng nổi.

Tôi muốn làm một việc: Lấy ra từng điều trong hai mươi nhận định năm đó, dùng dữ liệu mới nhất có thể tìm được ngày hôm nay để đối chiếu một cách khách quan. Để nhìn rõ thế giới đã thực sự thay đổi như thế nào trong ba năm, cũng như nhìn rõ bản thân tôi ba năm trước, chỗ nào đã nhìn đúng, chỗ nào đã nhìn lệch.

Để cố gắng không thiên vị, lần đối chiếu này tôi giao cho AI làm: Ném bản ghi chép phỏng vấn năm đó vào một workflow, để nó điều phối 41 agent Opus 4.8, đầu tiên tách rời hai mươi nhận định ra từng điều, sau đó từng cái một tìm kiếm dữ liệu mới nhất trên mạng, kiểm chứng chéo từng điều, cuối cùng cho điểm Wang Jianshuo ba năm trước. Nhóm agent này mất khoảng 20 phút, đốt hết 1.4 triệu token (tương đương khoảng 35 đô la), và tạo ra báo cáo dưới đây. Các nhận định đều đến từ chúng, không phải tôi. Ngày cơ sở được định vào tháng 5 năm 2026.

Một, Bảng điểm

Ký hiệu phán quyết: ✅ Đúng · 🟢 Cơ bản đúng · 🟡 Một phần đúng · ❌ Sai

Nhìn sơ qua, phần lớn phương hướng lớn của Wang Jianshuo năm đó đã đứng vững, chỉ có một điều duy nhất thực sự sai cứng – truyền rằng GPT-4 có 100T tham số. Nhưng quỷ ẩn trong chi tiết: Đằng sau hầu hết mỗi điều "đúng", đều có một cái đuôi mà năm đó chưa nói chuẩn. Trong hai mươi điều, không có điều nào thuần túy "vẫn chưa chắc chắn", ba năm đủ dài, hầu hết sự việc đã có câu trả lời thiên về hướng nào đó. Dưới đây sẽ nói chi tiết theo nhóm.

Hai, Những điều nhìn đúng

Điểm chung của nhóm này là: Phương hướng, cơ chế, thậm chí nhịp độ thời gian mà Wang Jianshuo dự đoán năm đó đều trúng, nếu có sai thì chỉ sai ở "mức độ" và "cách diễn đạt tuyệt đối hóa".

RAG và Kiến trúc Truy xuất (Quan điểm 2, 3)

> Năm 2023, Wang Jianshuo nói: Phương pháp chính để giải quyết kiến thức và ảo giác không phải là sửa mô hình, mà là sử dụng truy xuất vector để bơm kiến thức vào làm "phao cứu sinh"; kiến trúc đúng là công cụ tìm kiếm thực hiện truy xuất, rồi đưa kết quả cho LLM.

Đây chính là tiêu chuẩn thực tế của tất cả sản phẩm AI ngày nay. RAG đã trở thành kiến trúc mặc định cho AI doanh nghiệp; OpenAI, Google, Anthropic đều đã biến nó thành khả năng cấp nền tảng; ChatGPT Search đúng nghĩa đen là "trước tiên dùng Bing index để truy xuất, đưa kết quả cho GPT, rồi mới tạo ra câu trả lời có trích dẫn". Google AI Overviews sử dụng grounding đạt khoảng 2 tỷ người dùng hoạt động hàng tháng, Perplexity, một công ty chỉ dựa vào kiến trúc này, định giá đã tăng lên khoảng 200 tỷ đô la.

Vào thời điểm GPT-4 chưa ra mắt, ngành công nghiệp mặc định "dựa vào fine-tuning để truyền kiến thức", ông ấy đã đặt cược vào "không động đến tham số mô hình, treo ngoài truy xuất", cả cơ chế lẫn thời gian đều đúng.

Cần thành thật rằng: Ông ấy hình dung là "truy xuất tĩnh một lần", nhưng thực tế phức tạp hơn – ngữ cảnh dài, GraphRAG, agentic retrieval đều đến để tăng cường. Cuộc tranh luận "RAG đã chết" năm 2026, lại càng chứng minh phương hướng lớn không chết, nó phủ định chỉ là "truy xuất ngây thơ một lần", kết luận là nâng cấp thành truy xuất hỗn hợp, chứ không phải quay lại sửa tham số mô hình. Còn một điểm: Thuật ngữ RAG đã được đề cập trong bài báo của Meta năm 2020, không phải ông ấy sáng tạo – ông ấy chỉ đặt cược đúng thời điểm nó sẽ trở thành chủ đạo.

LUI là Lục địa Mới (Quan điểm 7)

> Năm 2023, Wang Jianshuo nói: Điều vĩ đại nhất của ChatGPT không phải là AIGC, mà là mở ra LUI (Giao diện Người dùng Ngôn ngữ Tự nhiên), sẽ tái cấu trúc tương tác người-máy như GUI năm xưa, thúc đẩy một ngành mới lớn hơn nhiều so với bản thân việc "làm mô hình lớn".

Phần "lục địa mới" này gần như trúng toàn bộ. Ngôn ngữ tự nhiên đã trở thành lớp tương tác chủ đạo của đại chúng (ChatGPT 900 triệu người dùng hoạt động hàng tuần), và thúc đẩy một ngành công nghiệp mới độc lập – agent, coding agent, lớp giao thức đều đã được hiện thực hóa. Câu nói cụ thể nhất "lớn hơn nhiều so với bản thân làm mô hình" đã được xác nhận mạnh mẽ: giao thức MCP đã trở thành "tiêu chuẩn hệ điều hành" thời đại LUI, năm 2025 được OpenAI, Google, Microsoft toàn diện chấp nhận, cuối năm chuyển sang Linux Foundation; riêng sản phẩm Claude Code đã đạt doanh thu hàng năm khoảng 2.5 tỷ đô la.

Nhưng ông ấy đã dùng cách diễn đạt mạnh như "tái cấu trúc, thay thế GUI", ba năm sau nhìn lại là chồng lấn cùng tồn tại, chứ không phải thay thế. Ba phản ví dụ rất rõ ràng: Báo cáo của MIT cho thấy 95% thí điểm GenAI doanh nghiệp không có ROI có thể đo lường được; computer-use agent thao tác trực tiếp giao diện trên tập kiểm thử, mô hình hàng đầu mới chỉ khoảng 78%, vừa chạm đến mức cơ bản của con người; phần cứng ngôn ngữ thuần túy không có màn hình gần như thất bại toàn bộ (Humane Pin năm 2025 ngừng hoạt động vĩnh viễn). Cách nói chính xác hơn là: LUI là lớp tương tác mới chồng lên trên GUI.

Mạng lưới Robot và Định vị Mới (Quan điểm 9)

> Năm 2023, Wang Jianshuo nói: Khoảng mười năm nữa sẽ xuất hiện "mạng lưới robot" – các agent dùng ngôn ngữ tự nhiên tự động bắt tay, gọi nhau, không cần API truyền thống; sẽ sinh ra một hệ thống định vị tên miền mới hoàn toàn. Hệ thống này "hai ba năm là có thể làm xong".

Phương hướng trúng một cách đáng kinh ngạc. MCP, A2A (đã hiến tặng cho Linux Foundation, 150+ tổ chức ủng hộ) giải quyết việc các agent gọi lẫn nhau; Agent Network Protocol trực tiếp dựa trên DID của W3C để làm "định vị agent không có thẩm quyền trung tâm", mục tiêu là "mạng lưới hợp tác hàng tỷ agent" – điều này rất đồng cấu trúc với "hệ thống tên miền mới" mà ông ấy nói.

Có hai chỗ cần chỉnh sửa: Một là "không cần API" không thành lập, giao thức chủ đạo dưới đáy là schema có cấu trúc, bản chất là chồng một lớp tiêu chuẩn lên trên API; Hai là "hai ba năm làm xong" chưa thực hiện, dữ liệu của Gartner cho thấy tính đến năm 2026 chỉ khoảng 17% tổ chức thực sự triển khai agent. Thú vị là, năm đó ông ấy thực ra đã chia lời nói thành hai tầng – nguyên mẫu "hai ba năm", trưởng thành "khoảng mười năm". Nhịp độ của nguyên mẫu trúng rất chuẩn, chu kỳ trưởng thành cũng thực sự là cấp mười năm. Tách hai tầng ra xem, chất lượng của điều này cao hơn vẻ bên ngoài.

Trung Quốc nhất định làm được mô hình lớn khả dụng (Quan điểm 10, 20)

> Năm 2023, Wang Jianshuo nói: Trung Quốc nhất định có thể làm ra mô hình lớn khả dụng, khoảng cách với đỉnh cao sẽ thu hẹp nhanh chóng trong khoảng ba năm (tương tự như trình duyệt Hồng Kỳ đuổi theo Netscape).

Đường thời gian của điều này trùng khớp một cách bất ngờ. Stanford AI Index 2026 thực nghiệm, khoảng cách chuẩn giữa các mô hình hàng đầu Trung-Mỹ từ tháng 5/2023 là 17.5–31.6 điểm phần trăm, đã thu hẹp còn 2.7%; trong khi đầu tư AI tư nhân của Mỹ gấp khoảng 23 lần Trung Quốc – dùng đầu tư nhỏ hơn nhiều để đạt được sự thu hẹp. DeepSeek, Qwen, Kimi, GLM đã trở thành chủ đạo toàn cầu, hệ sinh thái mã nguồn mở thậm chí dẫn đầu.

Nhưng hai chữ "nhanh chóng" hơi lạc quan – sự trưởng thành thực sự xảy ra sau khoảng 14 tháng, chứ không phải "vài tháng". Và đây là bắt kịp tính khả dụng, không phải định nghĩa tiền tuyến: Tính đến đầu năm 2026 vẫn không có mô hình Trung Quốc nào vượt qua OpenAI o3. Trong quan điểm 20, ông ấy sai rõ ràng: Nhận định "cánh cửa mở ra rồi sẽ không đóng lại" bị OpenAI chủ động cắt API với Trung Quốc vào tháng 7/2024 trực tiếp bác bỏ, cánh cửa bị phía cung cấp đóng lại; Wenxin Yiyan mà ông ấy chỉ tên dẫn đầu ngược lại bị tụt lại, thực sự tiếp sức là DeepSeek, Doubao, Qianwen vốn năm đó còn không đáng chú ý.

Không có ý thức, Kiểm tra Turing chỉ kiểm tra biểu hiện (Quan điểm 13)

> Năm 2023, Wang Jianshuo nói: ChatGPT không có ý thức, là "người nói vô tình, người nghe có ý" tự làm khổ mình; Kiểm tra Turing vốn chỉ kiểm tra "liệu có khiến bạn nghĩ rằng nó có hay không", chứ không phải nó thực sự có.

Nhận định cốt lõi "kiểm tra biểu hiện" này đứng rất vững, còn bị một thí nghiệm châm biếm xác nhận: Trong bài kiểm tra Turing năm 2025 của UC San Diego, GPT-4.5 dưới gợi ý "đóng vai con người" bị phán là con người với tỷ lệ cao tới 73%, cao hơn cả người thật, nhưng hoàn toàn dựa vào kỹ năng diễn xuất – đây chính là chú thích tốt nhất cho "chỉ kiểm tra liệu có khiến bạn nghĩ rằng nó có hay không".

Cần bổ sung rằng: "Máy móc nhất định không có ý thức" là luận điểm mạnh tuyệt đối hóa, trong ba năm đã được đẩy vào vùng xám. Anthropic đã thiết lập vị trí nghiên cứu "phúc lợi mô hình", đưa ra xác suất ý thức khoảng 15%–20%, còn thêm cho Claude chức năng "chủ động kết thúc cuộc hội thoại bị lạm dụng". Những điều này biến "tuyệt đối không" thành "xác suất thấp nhưng không thể loại trừ". Tuy nhiên, tất cả đều dựa trên "có thể, nên giả định" chứ không phải "đã được chứng minh", hạt nhân không bị lật đổ, chỉ là năm đó ngữ khí quá đầy.

Các điều nhìn đúng còn lại (Quan điểm 6, 11, 12, 16, 18, 19)

  • Không phải AGI nhưng đã tiến một bước lớn
    : Cả hai đầu đều đứng vững. Chính Altman thời GPT-5 vẫn nói "không phải AGI, thiếu học tập liên tục"; đồng thời huy chương vàng IMO, ARC-AGI từ gần 0 tăng lên 85%, "tiến một bước lớn" không có tranh cãi.
  • Không có làn sóng thất nghiệp
    : Tháng 4/2026 tỷ lệ thất nghiệp Mỹ chỉ 4.3%. Điểm mù là "phân bố" – nghiên cứu Stanford cho thấy, chính xác bị rút đi là những người mới trẻ tuổi 22–25 ở cấp thang nghề nghiệp đầu tiên, cơ chế "hút thuận lợi" ở họ thất bại.
  • Không bị chìm trong rác AI
    : Phúc lợi ròng đúng hướng, nhưng ông ấy đánh giá thấp nghiêm trọng về quy mô – nội dung AI đã chiếm khoảng 52% trang web mới tăng, "AI slop" trở thành từ của năm.
  • Năm lớn khởi nghiệp
    : Bắt đúng điểm ngoặt của làn sóng, xAI (thành lập tháng 3/2023) đã đạt định giá 2300 tỷ. Nhưng ông ấy khóa "công ty vĩ đại" vào năm 2023 quá hẹp – những công ty thực sự nghìn tỷ như OpenAI, Anthropic đều thành lập sớm hơn.
  • Khoảnh khắc trình duyệt 1994
    : Sắp xếp tương đối đã thành hiện thực, OpenAI năm 2025 thực sự cho ra mắt trình duyệt Atlas, biến phép ẩn dụ thành hiện thực đúng nghĩa đen. Chỉ là ChatGPT lan truyền mạnh hơn trình duyệt, phép ẩn dụ hơi bảo thủ.
  • Prompt bơm thêm sự thật giảm ảo giác
    : Hướng được xác nhận, GPT-5 không kết nối mạng không truy xuất thì tỷ lệ ảo giác tăng vọt lên 47%, ngược lại xác nhận "sự thật" là biến số then chốt. Chỉ đánh giá thấp nguyên nhân gốc rễ là động lực huấn luyện, không phải prompt.

Ba, Những điều nhìn sai, nhìn lệch

GPT-4 có 100T tham số (Quan điểm 4) – Sai hoàn toàn

> Năm 2023, Wang Jianshuo nói: (Tin đồn) GPT-4 có 100T tham số, gấp khoảng 600 lần GPT-3 (175B).

Cả hai con số đều sai. GPT-3 là 175B, ước tính tốt nhất bị rò rỉ tháng 7/2023 là GPT-4 khoảng 1.8T, 16 chuyên gia MoE, chỉ khoảng 10 lần. 100T và thực tế chênh lệch khoảng 55 lần về quy mô. Nguồn duy nhất của "100T", là CEO Cerebras năm 2021 một câu nói "khoảng" truyền miệng, Sam Altman đã từ tháng 1/2023 trực tiếp gọi bảng so sánh đó là "complete bullshit".

Ông ấy nguyên văn đã đánh dấu "tin đồn", giữ lại tính không chắc chắn. Sâu hơn một tầng, khuôn khổ "dùng bội số tham số để đánh giá thế hệ" này bản thân đã lỗi thời: GPT-4.5, GPT-5 sau này của OpenAI đơn giản không công bố số lượng tham số nữa. Đây là điều duy nhất vừa sai số vừa lỗi thời góc nhìn.

Toán LLM (Quan điểm 1) – Chẩn đoán đúng, kết luận chặn đầu sai

> Năm 2023, Wang Jianshuo nói: Toán LLM kém là bản chất, để nó tự học toán vừa không thể vừa không cần thiết, cách làm đúng là treo ngoài công cụ.

"Chẩn đoán cộng con đường công cụ" đúng toàn bộ – nguyên nhân gốc chính là sinh token từng cái dẫn đến nhớ không đáng tin (bài báo cơ chế năm 2025 xác nhận chính xác trực giác "chữ số cuối thường đúng, chữ số giữa sai"); công cụ treo ngoài cải thiện cũng rất lớn (o4-mini cho phép dùng Python, AIME 2025 đạt 99.5%).

Sai ở cách diễn đạt chặn đầu kiểu "không thể, không cần thiết". "Không thể" bị bác bỏ – tháng 7/2025 Gemini Deep Think và mô hình OpenAI trong IMO dùng ngôn ngữ tự nhiên thuần túy, không công cụ đạt huy chương vàng. Bước ngoặt then chốt là "mô hình suy luận" xuất hiện năm 2024–2025, điều này vào tháng 3/2023 không thể dự đoán – vì vậy đối với dự đoán này nên khoan dung đánh giá hướng, chứ không nên trách thời điểm.

Nắm bắt giá trị (Quan điểm 8) – Được một nửa, luận điểm cốt lõi ngược

> Năm 2023, Wang Jianshuo nói: Giá trị cuối cùng sẽ rơi vào lớp ứng dụng, kết cục của công ty mở ra lớp cơ sở (làm mô hình) chưa chắc kiếm được tiền.

Tiền thực sự bắt đầu chảy về lớp ứng dụng (Cursor ba năm đạt doanh thu hàng năm 2 tỷ) – nửa này đúng. Nhưng "làm lớp cơ sở không kiếm tiền" bị NVIDIA trực tiếp bác bỏ: FY2026 lợi nhuận ròng khoảng 120 tỷ đô la, giá trị vốn hóa 5 nghìn tỷ+, là người duy nhất trên toàn thị trường rõ ràng có lợi nhuận lớn. Còn lớp mô hình mà ông ấy ngụ ý sẽ thắng (OpenAI năm 2026 dự lỗ khoảng 14 tỷ) ngược lại giống nhất với "lớp cơ sở đốt tiền không kiếm tiền" mà ông ấy nói.

Ông ấy không phân biệt "lớp cơ sở tính toán" và "lớp cơ sở mô hình", cũng không phân biệt "doanh thu" và "lợi nhuận". Giá trị năm 2026 so với 2023 càng cực đoan hơn khi bị lớp tính toán nắm bắt, chứ không phải chuyển dịch về lớp ứng dụng. Cần bổ sung một câu: Lỗ tiền là nhà cung cấp đám mây mua chip, không phải NVIDIA bán chip – đây chính là chỗ lệch của phép loại suy "xây dựng đường sắt quá mức" của ông ấy.

Bản quyền (Quan điểm 14) – Đăng ký đúng, tránh xâm phạm sai

> Năm 2023, Wang Jianshuo nói: Nội dung AI tạo ra có thể tránh bản quyền (bảo vệ biểu đạt không bảo vệ ý tưởng); vật tạo ra có thể vừa không xâm phạm, cũng không thể đăng ký.

"Không thể đăng ký" đã trở thành sự thật pháp lý đã định (năm 2025 Văn phòng Bản quyền Mỹ rõ ràng "chỉ nhập từ khóa gợi ý không đủ để yêu sách tác giả"). Nhưng "tránh xâm phạm" sai rõ ràng: Tòa án nhiều lần xác định đầu ra AI nếu tương tự bản chất với tác phẩm gốc vẫn cấu thành xâm phạm; Anthropic vì dữ liệu ngôn ngữ lậu hòa giải với 1.5 tỷ đô la, là khoản bồi thường bản quyền lớn nhất lịch sử Mỹ. AI không những không "tránh" bản quyền, mà ngược lại trả giá lớn nhất lịch sử.

Thế giới đại đồng (Quan điểm 15) – Cơ chế đúng, xu hướng đặt cược ngược

> Năm 2023, Wang Jianshuo nói: ChatGPT làm "bình quân gia quyền" quan điểm con người, có thể chống lại kén thông tin kiểu TikTok, cho khả năng "thế giới đại đồng".

Lớp cơ chế đúng – năm 2025 nhiều nghiên cứu xác thực chứng thực LLM ép quan điểm về số đông, đánh giá thấp có hệ thống thiểu số. Nhưng lớp phán đoán xã hội đặt cược ngược: Chính ông ấy thêm "ít nhất bây giờ không phải ngàn người ngàn vẻ", trong ba năm đã bị lật đổ – OpenAI từ tháng 4/2025 đưa trí nhớ xuyên hội thoại và cá nhân hóa làm thành khả năng mặc định, AI đang tiến về ngàn người ngàn vẻ với tốc độ cao. Quan trọng hơn, ông ấy tưởng tượng "bình quân gia quyền" là mẫu số chung trung lập của thế giới, nhưng thực nghiệm nó là lệch hướng, còn chồng lấn xu nịnh, có thể dùng để thao túng lập trường chủ động – điều này hướng tới "tạo kén mới", chứ không phải "giải cực đoan".

Chiến tranh cục bộ và Chi phí (Quan điểm 17) – Tính chất đúng toàn bộ, số lượng bác bỏ

> Năm 2023, Wang Jianshuo nói: Làm mô hình lớn tiếp sẽ nhanh chóng trở thành "chiến tranh cục bộ", chi phí có thể biết (bỏ đường vòng khoảng 5-10 tỷ đô la chặn đầu), sẽ có nhiều người chơi tham gia.

Tính chất đúng một cách đáng kinh ngạc – nhiều người chơi ồ ạt tham gia, nhanh chóng hàng hóa hóa, mã nguồn mở bắt kịp mã đóng, toàn bộ đã hiện thực hóa. Nhưng con số cứng "5-10 tỷ chặn đầu" sai cả hai đầu: Đầu tiền tuyến bị đánh giá thấp nghiêm trọng (cấp GPT-5 năm 2026 đạt 2-5 tỷ đô la huấn luyện, chồng lấp trung tâm dữ liệu nghìn tỷ và Stargate 5000 tỷ); đầu sao chép lại bị đánh giá cao (DeepSeek ép chi phí huấn luyện biên tế xuống cấp triệu đô la). Cùng một mô hình "chi phí" theo khẩu độ có thể chênh 200 lần, duy nhất không nằm trong khoảng ông ấy đưa ra.

Khả năng xuất hiện (Quan điểm 5) – Hướng đúng, số và khung sai

> Năm 2023, Wang Jianshuo nói: Khoảng 60B tham số trở lên xuất hiện khả năng mới không có trong dữ liệu ngôn ngữ gốc, nhà nghiên cứu cũng không thể giải thích.

Trực giác phương hướng thành lập, nhưng hai chỗ diễn đạt không đứng vững: Thứ nhất, không tồn tại "ngưỡng 60B" thống nhất – ngưỡng thực tế của chuỗi suy nghĩ khoảng 100B, khả năng khác nhau xuất hiện ở quy mô khác nhau từ 13B đến 540B; Thứ hai, "không thể giải thích" cuối năm 2023 đã bị một bài báo xuất sắc NeurIPS thách thức – nhiều "đột biến" là ảo tượng do lựa chọn chỉ số đánh giá tạo ra, sau khi thay chỉ số liên tục đường cong trơn tru có thể dự đoán. Công bằng mà nói, năm đó ông ấy thuật lại là tường thuật tuyệt đối chủ đạo, thực sự có thể sửa chữa là lấy "60B" làm ngưỡng cứng, lấy "không thể giải thích" làm kết luận tính chất.

Bốn, Nhìn lại ba năm, mấy quy luật

Từng điều đối chiếu xong, lùi một bước nhìn, hai mươi nhận định này của Wang Jianshuo ẩn chứa vài quy luật đáng ghi nhớ hơn bất kỳ điều riêng lẻ nào.

Một, Phương hướng đáng tin cậy hơn nhiều so với số và mức độ. Trong hai mươi điều, phàm là nhận định cơ chế và phương hướng (RAG, LUI, mạng lưới robot, kiểm tra Turing), gần như trúng toàn bộ; phàm là đưa ra số cụ thể hoặc cách diễn đạt chặn đầu (100T tham số, ngưỡng 60B, chi phí 5-10 tỷ, toán "không thể"), gần như sai toàn bộ. Đối với lĩnh vực biến đổi nhanh, đặt cược phương hướng, cơ chế, ít đặt cược số chính xác, càng phải cảnh giác những từ nói đầy kiểu "không thể, nhất định, chặn đầu, tuyệt đối không" – chúng là khu vực dễ bị thời gian tát vào mặt.

Hai, Về thời gian, ông ấy có xu hướng đánh giá cao tốc độ, đánh giá thấp mức độ. Phàm là nói "nhanh chóng, hai ba năm làm xong", thời kỳ trưởng thành phổ biến chậm hơn; nhưng đối với trần nhảy vọt của năng lực lại đánh giá thấp – toán có thể từ "không thể" đến huy chương vàng IMO, chi phí tiền tuyến có thể tăng lên quy mô năm đó không tưởng tượng nổi. Một câu: Ngắn hạn quá lạc quan, dài hạn quá bảo thủ.

Ba, Sai ẩn nhất, lặp lại xuất hiện trên "phân bố". Không phải phương hướng sai, mà là chỉ nhìn tổng lượng, bỏ qua phân bố. "Không có làn sóng thất nghiệp" đúng, nhưng tổn thương tập trung cao độ ở người mới trẻ tuổi; "Giá trị rơi vào lớp ứng dụng" đúng một nửa, nhưng không phân biệt lớp tính toán và lớp mô hình. Tổng lượng đúng, che lấp thảm họa phân bố – đây là bài học cần bổ sung nhất.

Bốn, Những chỗ để lại khoảng trống trong lời nói, ba năm sau đều chịu được kiểm nghiệm. "Tin đồn" "ít nhất bây giờ" "giảm mạnh chứ không loại bỏ" "nguyên mẫu hai ba năm, trưởng thành khoảng mười năm" – phàm là nhận định năm đó có từ hạn định, chia tầng, hôm nay nhìn lại đều đứng vững hơn. Ngược lại, những câu tuyệt đối tuôn ra miệng, dễ bị lật đổ nhất. Sự thành thật của dự đoán, một nửa ở dám nói, nửa còn lại ở dám đánh dấu sự không chắc chắn của mình.

Năm, Một số vấn đề, ba năm căn bản không đủ. Giá trị cuối cùng quy về ai, xuất hiện có phải chân tướng biến đổi, máy móc rốt cuộc có một chút ý thức hay không, ngữ cảnh dài có ăn RAG không – những tranh luận năm đó, đến năm 2026 vẫn là tranh luận. Có thể phân biệt "đã có câu trả lời" và "còn phải tiếp tục đợi", quan trọng hơn là vội vàng đưa ra kết luận cho mỗi sự việc.

Wang Jianshuo ba năm trước, dựa vào trực giác trong sương mù GPT-4 chưa ra đời chỉ hai mươi phương hướng. Hôm nay đối chiếu xong, câu nên nhớ nhất có lẽ là: Nhìn đúng phương hướng lớn thực ra không khó lắm, khó là thừa nhận mình trên số, tốc độ và phân bố một lần nữa nghĩ đương nhiên. Hai mươi điều đối chiếu này, thay vì nói là cho điểm quá khứ, không bằng nói là đặt mấy quy củ cho ba năm tới. Ba năm tiếp theo, năm 2029 lại đối chiếu một lần.

Câu hỏi Liên quan

QBa năm sau, tác giả đánh giá thế nào về những dự đoán của mình về ChatGPT năm 2023?

ATác giả nhận thấy hầu hết các dự đoán về cơ chế và hướng phát triển (như RAG, LUI, mạng lưới agent) là chính xác, nhưng các dự đoán về con số cụ thể (như tham số mô hình, chi phí) hoặc các kết luận tuyệt đối (như 'không thể', 'tất cả') thường sai. Ông thừa nhận mình có xu hướng lạc quan thái quá về tốc độ, nhưng lại đánh giá thấp mức độ thay đổi.

QDự đoán nào của tác giả năm 2023 được xem là chính xác nhất?

ADự đoán chính xác nhất là về việc RAG (Retrieval-Augmented Generation) và kiến trúc kết hợp tìm kiếm sẽ trở thành phương pháp chính để giải quyết kiến thức và ảo giác cho LLM, thay vì chỉ chỉnh sửa tham số mô hình. Điều này đã trở thành tiêu chuẩn thực tế trong ngành AI.

QDự đoán nào của tác giả hoàn toàn sai, và tại sao?

ADự đoán hoàn toàn sai là về việc GPT-4 có 100 nghìn tỷ tham số. Thực tế, GPT-4 ước tính chỉ có khoảng 1.8 nghìn tỷ tham số. Dự đoán này sai cả về con số lẫn quan điểm lỗi thời khi đánh giá thế hệ mô hình chỉ dựa trên hệ số nhân tham số.

QBáo cáo 'đối chiếu' này được tạo ra bằng cách nào?

ABáo cáo được tạo ra một cách khách quan bởi một workflow AI, điều phối 41 agent Opus 4.8. Các agent này tự động phân tách 20 dự đoán, tìm kiếm thông tin cập nhật nhất trên mạng để kiểm chứng chéo, và cuối cùng đưa ra đánh giá cho từng dự đoán. Quá trình này tiêu tốn khoảng 20 phút và 1.4 triệu token.

QBài viết rút ra những quy luật hay bài học gì từ việc nhìn lại các dự đoán?

ABài viết rút ra 5 quy luật/bài học chính: 1) Dự đoán về hướng đi và cơ chế đáng tin cậy hơn nhiều so với con số cụ thể. 2) Có xu hướng đánh giá quá cao tốc độ thay đổi trong ngắn hạn, nhưng đánh giá thấp mức độ thay đổi trong dài hạn. 3) Sai sót thường nằm ở việc bỏ qua sự phân bố không đồng đều, chỉ nhìn vào tổng thể. 4) Những dự đoán có từ ngữ thận trọng, để ngỏ thường chính xác hơn. 5) Ba năm là chưa đủ để có câu trả lời cho một số vấn đề cốt lõi.

Nội dung Liên quan

Tại sao nhiều AI Agent hơn không đồng nghĩa với năng suất cao hơn?

Biên tập viên: Khi AI Agent ngày càng rẻ và dễ gọi, phát triển phần mềm đang bước vào giai đoạn mới. Vấn đề không còn là có thể chạy nhiều Agent hơn hay không, mà là liệu con người có đủ sự chú ý để quản lý, đánh giá và hợp nhất đầu ra của chúng hay không. Bài viết giới thiệu khái niệm "thuế điều phối". Chi phí khởi chạy Agent rất thấp, chỉ cần một Prompt hoặc một cú nhấp chuột. Nhưng các bước tiếp theo mới thực sự đắt đỏ: kiểm tra kết quả, hiểu tác động đến kiến trúc hệ thống, xử lý xung đột giữa các Agent, và quyết định mã nào được đưa vào nhánh chính. Những công việc này không thể song song hóa đơn giản, mà vẫn phải quay về một tài nguyên tuần tự duy nhất: khả năng phán đoán của con người. Tác giả ví nhà phát triển như "GIL" trong hệ thống AI Agent - khóa luồng đơn hạn chế thông lượng cuối cùng của hệ thống đồng thời. Nhiều Agent có thể chạy cùng lúc, nhưng một khi bước vào giai đoạn đánh giá kiến trúc, xem xét mã và hợp nhất xung đột, chúng phải đi qua bộ não của nhà phát triển. Do đó, càng nhiều Agent không nhất thiết có nghĩa là sản lượng cao hơn, mà có thể chỉ làm cho hàng đợi công việc chờ xem xét dài hơn, khiến nhà phát triển mệt mỏi vì chuyển đổi ngữ cảnh liên tục. Điều dễ bị bỏ qua trong cơn sốt công cụ lập trình AI hiện nay là cảm giác hiệu quả không phải lúc nào cũng đồng nghĩa với năng suất thực. Một bảng điều khiển đầy Agent đang chạy tạo ra ảo giác "năng suất cao", nhưng nếu nhà phát triển không thực sự hiểu, xem xét và tích hợp các thay đổi, hệ thống cuối cùng tích lũy có thể là nợ kỹ thuật và nợ nhận thức. Vì vậy, bài viết thảo luận về "cách thiết kế lại quy trình làm việc xoay quanh sự chú ý của con người". Trong thời đại Agent, năng lực then chốt không chỉ là biết đặt câu hỏi và phân công nhiệm vụ, mà là biết nhiệm vụ nào có thể giao cho máy móc xử lý song song, nhiệm vụ nào phải dành cho con người đánh giá; khi nào nên xem xét hàng loạt, khi nào nên dừng điều phối để tập trung lại vào một vấn đề cốt lõi. AI đang mở rộng khả năng xử lý đồng thời trong sản xuất phần mềm, nhưng sự chú ý của con người vẫn là tài nguyên khan hiếm và không thể nhân bản nhất trong hệ thống. Một quy trình làm việc với Agent thực sự trưởng thành không phải là ném mọi nhiệm vụ cho máy móc, mà là thiết kế kiến trúc sự chú ý của chính mình một cách cẩn thận, giống như thiết kế một hệ thống sản xuất.

marsbit34 phút trước

Tại sao nhiều AI Agent hơn không đồng nghĩa với năng suất cao hơn?

marsbit34 phút trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

**Tóm tắt tiếng Việt:** Năm 2026, tác giả Vương Kiến Thạc nhìn lại 20 dự đoán của mình về ChatGPT từ năm 2023, sử dụng AI (41 agent Opus 4.8) để đối chiếu với dữ liệu thực tế. **Kết quả chính:** Phần lớn các dự đoán về **cơ chế và xu hướng** là đúng: * **Đúng:** Kiến trúc RAG + tìm kiếm trở thành chuẩn để giảm ảo giác. LUI (Giao diện ngôn ngữ tự nhiên) tạo ra một "lục địa mới" cho tương tác máy tính. Mạng lưới agent với giao thức kết nối mới đang hình thành. Trung Quốc thu hẹp khoảng cách về mô hình lớn có thể sử dụng. ChatGPT không có ý thức, vượt qua bài kiểm tra Turing nhờ biểu diễn. Nó là bước tiến lớn nhưng chưa phải AGI, chưa gây ra làn sóng thất nghiệp hàng loạt. * **Sai/Sai một phần:** Dự đoán cụ thể **GPT-4 có 100 nghìn tỷ tham số** là sai hoàn toàn (thực tế ~1.8 nghìn tỷ). Nhận định **LLM không thể tự học toán** bị bác bỏ khi các mô hình giành huy chương IMO. **Giá trị sẽ thuộc về lớp ứng dụng** bị chứng minh ngược lại khi lợi nhuận khổng lồ thuộc về lớp nền tảng tính toán (như NVIDIA). **AI có thể né tránh vấn đề bản quyền** là sai, với các vụ kiện và khoản bồi thường lớn. Dự đoán **chi phí đào tạo mô hình lớn chỉ 5-10 tỷ USD** là quá thấp so với thực tế. **Bài học rút ra:** 1. **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể hay mức độ tuyệt đối.** 2. **Có xu hướng đánh giá quá cao tốc độ thay đổi trong ngắn hạn, nhưng lại đánh giá thấp mức độ thay đổi trong dài hạn.** 3. **Sai lầm tinh vi thường nằm ở "sự phân bố":** tổng thể đúng nhưng tác động không đồng đều (ví dụ: việc làm). 4. **Những phát biểu có giới hạn, thận trọng thường đứng vững theo thời gian.** 5. **Ba năm là chưa đủ để kết luận cho một số vấn đề sâu xa** (như ý thức máy móc, sự xuất hiện năng lực). Bài viết kết luận rằng việc nhìn đúng hướng đi lớn không quá khó, nhưng thừa nhận những sai lầm trong ước tính chi tiết, tốc độ và phân bố mới là điều đáng ghi nhớ cho những dự đoán trong tương lai.

marsbit7 giờ trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

marsbit7 giờ trước

Cảnh báo bong bóng AI: Đầu tư vào AI mang lại lợi nhuận âm cho hầu hết các gã khổng lồ công nghệ

Bài viết cảnh báo về bong bóng đầu tư AI khi phân tích chỉ ra rằng hầu hết các gã khổng lồ công nghệ như Microsoft, Alphabet, Meta, Oracle (trừ Amazon) có thể nhận tỷ suất lợi nhuận âm từ các khoản đầu tư hàng nghìn tỷ USD vào trung tâm dữ liệu AI. Dựa trên kỳ vọng của nhà phân tích về doanh thu và chi tiêu vốn giai đoạn 2025-2030, tốc độ tăng đầu tư (~20%/năm) vượt xa tốc độ tăng doanh thu dự kiến (~15%/năm). Tác giả nhấn mạnh, đầu tư công nghệ hiện giải thích 93% tăng trưởng GDP Mỹ. Nếu các công ty cắt giảm chi tiêu, không chỉ chuỗi cung ứng (Nvidia, TSMC, ASML) bị ảnh hưởng mà nền kinh tế Mỹ có thể suy thoái, kéo theo thị trường chứng khoán lao dốc. Các IPO của OpenAI, Anthropic được xem như cách chuyển giao rủi ro từ nhà đầu tư ban đầu sang các nhà đầu tư tổ chức và cá nhân. Dù cơn sốt có thể kéo dài đến 2026 nhờ IPO, nhưng thực tế toán học khắc nghiệt (cần thêm 2-5 nghìn tỷ USD doanh thu để đạt lợi nhuận 10%) khiến việc điều chỉnh là không tránh khỏi vào 2027-2028, tương tự bong bóng dot-com những năm 2000. Câu hỏi then chốt: ai sẽ trả giá cho cuộc chạy đua cơ sở hạ tầng đắt đỏ này?

marsbit10 giờ trước

Cảnh báo bong bóng AI: Đầu tư vào AI mang lại lợi nhuận âm cho hầu hết các gã khổng lồ công nghệ

marsbit10 giờ trước

Từ Token đến Lao động Máy móc: AI đang chuyển từ Công cụ thành 'Người lao động'

Từ công cụ thành "công nhân": AI đang trở thành lực lượng lao động máy móc Bài viết phân tích sự chuyển dịch trong thị trường AI: từ việc bán token hay giờ GPU đơn thuần, sang một thị trường "lao động máy móc" mới, nơi chính công việc được hoàn thành bởi phần mềm trở thành đối tượng được định giá và giao dịch. Tác giả dự đoán cơ chế định giá AI sẽ phát triển qua bốn giai đoạn: token thô -> thị trường năng lực LLM tiêu chuẩn hóa -> thị trường lao động theo ngành -> thị trường kết quả có thể lập trình. Trong tương lai, doanh nghiệp có thể không còn quan tâm công việc do model hay GPU cụ thể nào thực hiện, mà chỉ quan tâm liệu nó có được giao đúng tiêu chuẩn về độ trễ, độ chính xác, độ tin cậy và chi phí hay không. Điều này cũng làm thay đổi vai trò của con người, chuyển sang giám sát, chịu trách nhiệm, quản lý ngữ cảnh và đưa ra phán quyết cuối cùng - những yếu tố có thể trở nên có giá trị hơn. Bài viết nhấn mạnh AI không chỉ đơn thuần thay thế lao động mà mở rộng thị trường tổng thể. Khi chi phí công việc giảm, nhu cầu có thể tăng lên, tạo ra những loại hình công việc và dịch vụ mới khả thi về mặt kinh tế. Thị trường lao động máy móc sẽ bắt đầu từ những công việc có thể được xác định rõ ràng và đo lường được, hướng tới việc biến lao động máy móc thành một yếu tố sản xuất mới có thể được thu mua, thanh toán và giao dịch.

marsbit10 giờ trước

Từ Token đến Lao động Máy móc: AI đang chuyển từ Công cụ thành 'Người lao động'

marsbit10 giờ trước

Việc giảm giá 99% của Xiaomi MiMo không phải là chiêu trò marketing! Luo Fuli đăng X để phản bác những kẻ bi quan

Trong bài viết, tác giả phân tích động thái giảm giá API lên tới 99% cho dòng MiMo-V2.5 của Xiaomi và phản bác các ý kiến cho rằng đây chỉ là chiến lược marketing hay "bán lỗ cướp thị trường". Lộ Phúc Lợi, người đứng đầu MiMo, đã công bố một blog kỹ thuật dài 5000 chữ để giải thích cơ sở kỹ thuật của mức giá mới. Bài viết mô tả sáu trụ cột công nghệ chính cho phép mức giảm giá này: 1. **Kiến trúc Hybrid SWA (Sliding Window Attention):** Giảm dung lượng bộ nhớ tạm (KVCache) xuống còn 1/7 so với Full Attention truyền thống. 2. **Quản lý KVCache hai bể riêng biệt:** Tối ưu hóa việc phân bổ bộ nhớ để triệt để tận dụng lợi thế của SWA, tăng gấp 5 lần số lượng người dùng đồng thời. 3. **Hệ thống tiền tố cache được cải tiến:** Đảm bảo an toàn và nâng cao tỷ lệ trúng cache lên tới 93-95%, khiến phần lớn yêu cầu đọc lặp lại hầu như không cần tính toán lại. 4. **Hệ thống lưu trữ phân tán GCache:** Triển khai trực tiếp trên ổ SSD của máy GPU, giảm chi phí lưu trữ xuống gần bằng 0. 5. **Hệ thống điều phối LLM-Router:** Tối ưu định tuyến và lập lịch, ưu tiên các yêu cầu có cache, tăng hiệu suất tổng thể. 6. **Dự đoán đa token (MTP):** Giảm chi phí tạo văn bản (output), hoàn thiện vòng tròn giảm chi phí cho toàn bộ quá trình xử lý. Những cải tiến này, khi kết hợp, tạo ra một chuỗi tối ưu toàn diện làm giảm đáng kể chi phí tính toán và lưu trữ cho mỗi yêu cầu. Bài viết kết luận rằng mức giảm 99% không phải là con số tiếp thị, mà là kết quả có thể chứng minh của một hệ thống kỹ thuật hoàn chỉnh, một phương pháp giảm chi phí đáng để ngành tham khảo.

marsbit12 giờ trước

Việc giảm giá 99% của Xiaomi MiMo không phải là chiêu trò marketing! Luo Fuli đăng X để phản bác những kẻ bi quan

marsbit12 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片