Ba năm sau: Nhìn lại những dự đoán của tôi về ChatGPT năm 2023

链捕手Xuất bản vào 2026-05-31Cập nhật gần nhất vào 2026-05-31

Tóm tắt

**Tóm tắt: Nhìn lại 20 dự đoán về ChatGPT năm 2023 sau 3 năm** Vào tháng 3/2023, khi ChatGPT mới xuất hiện và GPT-4 chưa ra mắt, tác giả Vương Kiến Thạc đã đưa ra 20 nhận định về tương lai của AI. Giờ đây, vào cuối tháng 5/2026, một hệ thống AI gồm 41 agent đã được sử dụng để kiểm chứng lại từng dự đoán đó dựa trên dữ liệu thực tế. **Kết quả kiểm chứng (Tính đến 5/2026):** * **Đúng/Bản chất đúng (✅/🟢):** 13/20 dự đoán. * **Một phần đúng (🟡):** 6/20 dự đoán. * **Sai (❌):** 1/20 dự đoán. **Những điểm dự đoán chính xác nổi bật:** 1. **Kiến trúc RAG & Tìm kiếm:** Dự đoán việc bổ sung kiến thức thông qua cơ chế truy xuất bên ngoài (như vector search) thay vì chỉ fine-tune model đã trở thành tiêu chuẩn. 2. **Giao diện ngôn ngữ tự nhiên (LUI):** Nhận định ChatGPT mở ra kỷ nguyên LUI, tạo ra một hệ sinh thái rộng lớn hơn cả việc phát triển model cơ bản, đã được chứng minh. 3. **Mô hình lớn Trung Quốc:** Dự báo khoảng cách về khả năng giữa các mô hình Trung Quốc và đỉnh cao thế giới sẽ thu hẹp nhanh chóng trong khoảng 3 năm đã thành hiện thực. 4. **Ý thức và Kiểm tra Turing:** Quan điểm cho rằng ChatGPT không có ý thức và bài kiểm tra Turing chỉ đánh giá biểu hiện bề ngoài vẫn vững vàng. **Những điểm dự đoán chưa chính xác hoặc sai lệch:** 1. **Tham số GPT-4 (❌):** Thông tin GPT-4 có 100 nghìn tỷ tham số là hoàn toàn sai. 2. **Khả năng toán học của LLM:** Mặc dù đúng khi cho rằng cần công cụ bổ trợ, nhưng khẳng định LLM "không thể" tự học toán thuần túy đã bị bác bỏ ...

Tác giả: Wang Jianshuo

Ngày 6 tháng 3 năm 2023, ChatGPT vừa ra mắt chưa lâu, GPT-4 chưa được công bố, tôi và Sarah đã có một cuộc phỏng vấn về ChatGPT – số thứ ba trong loạt Traders' Talk "Nói chuyện đơn giản" (Podcast Nói chuyện đơn giản về ChatGPT đã phát hành, mời mọi người cùng nghe).

Lúc đó, ChatGPT mới ra mắt được một thời gian ngắn, số người thực sự sử dụng nó còn rất ít. Cuộc phỏng vấn kéo dài ba giờ đồng hồ đó sau này luôn đứng đầu trong danh mục ChatGPT trên nền tảng Xiaoyuzhou. Trong đó, tôi đã đưa ra khoảng hơn hai mươi nhận định và dự đoán dựa hoàn toàn vào trực giác và thông tin hạn chế, không có nhiều dữ liệu. Bản ghi chép chi tiết đầy đủ của cuộc phỏng vấn đó vẫn còn trên tài khoản công khai.

Bây giờ là cuối tháng 5 năm 2026, ba năm đã trôi qua, AI đã phát triển thành một thứ mà năm xưa không thể tưởng tượng nổi.

Tôi muốn làm một việc: Lấy ra từng điều trong hai mươi nhận định năm đó, dùng dữ liệu mới nhất có thể tìm được ngày hôm nay để đối chiếu một cách khách quan. Để nhìn rõ thế giới đã thực sự thay đổi như thế nào trong ba năm, cũng như nhìn rõ bản thân tôi ba năm trước, chỗ nào đã nhìn đúng, chỗ nào đã nhìn lệch.

Để cố gắng không thiên vị, lần đối chiếu này tôi giao cho AI làm: Ném bản ghi chép phỏng vấn năm đó vào một workflow, để nó điều phối 41 agent Opus 4.8, đầu tiên tách rời hai mươi nhận định ra từng điều, sau đó từng cái một tìm kiếm dữ liệu mới nhất trên mạng, kiểm chứng chéo từng điều, cuối cùng cho điểm Wang Jianshuo ba năm trước. Nhóm agent này mất khoảng 20 phút, đốt hết 1.4 triệu token (tương đương khoảng 35 đô la), và tạo ra báo cáo dưới đây. Các nhận định đều đến từ chúng, không phải tôi. Ngày cơ sở được định vào tháng 5 năm 2026.

Một, Bảng điểm

Ký hiệu phán quyết: ✅ Đúng · 🟢 Cơ bản đúng · 🟡 Một phần đúng · ❌ Sai

Nhìn sơ qua, phần lớn phương hướng lớn của Wang Jianshuo năm đó đã đứng vững, chỉ có một điều duy nhất thực sự sai cứng – truyền rằng GPT-4 có 100T tham số. Nhưng quỷ ẩn trong chi tiết: Đằng sau hầu hết mỗi điều "đúng", đều có một cái đuôi mà năm đó chưa nói chuẩn. Trong hai mươi điều, không có điều nào thuần túy "vẫn chưa chắc chắn", ba năm đủ dài, hầu hết sự việc đã có câu trả lời thiên về hướng nào đó. Dưới đây sẽ nói chi tiết theo nhóm.

Hai, Những điều nhìn đúng

Điểm chung của nhóm này là: Phương hướng, cơ chế, thậm chí nhịp độ thời gian mà Wang Jianshuo dự đoán năm đó đều trúng, nếu có sai thì chỉ sai ở "mức độ" và "cách diễn đạt tuyệt đối hóa".

RAG và Kiến trúc Truy xuất (Quan điểm 2, 3)

> Năm 2023, Wang Jianshuo nói: Phương pháp chính để giải quyết kiến thức và ảo giác không phải là sửa mô hình, mà là sử dụng truy xuất vector để bơm kiến thức vào làm "phao cứu sinh"; kiến trúc đúng là công cụ tìm kiếm thực hiện truy xuất, rồi đưa kết quả cho LLM.

Đây chính là tiêu chuẩn thực tế của tất cả sản phẩm AI ngày nay. RAG đã trở thành kiến trúc mặc định cho AI doanh nghiệp; OpenAI, Google, Anthropic đều đã biến nó thành khả năng cấp nền tảng; ChatGPT Search đúng nghĩa đen là "trước tiên dùng Bing index để truy xuất, đưa kết quả cho GPT, rồi mới tạo ra câu trả lời có trích dẫn". Google AI Overviews sử dụng grounding đạt khoảng 2 tỷ người dùng hoạt động hàng tháng, Perplexity, một công ty chỉ dựa vào kiến trúc này, định giá đã tăng lên khoảng 200 tỷ đô la.

Vào thời điểm GPT-4 chưa ra mắt, ngành công nghiệp mặc định "dựa vào fine-tuning để truyền kiến thức", ông ấy đã đặt cược vào "không động đến tham số mô hình, treo ngoài truy xuất", cả cơ chế lẫn thời gian đều đúng.

Cần thành thật rằng: Ông ấy hình dung là "truy xuất tĩnh một lần", nhưng thực tế phức tạp hơn – ngữ cảnh dài, GraphRAG, agentic retrieval đều đến để tăng cường. Cuộc tranh luận "RAG đã chết" năm 2026, lại càng chứng minh phương hướng lớn không chết, nó phủ định chỉ là "truy xuất ngây thơ một lần", kết luận là nâng cấp thành truy xuất hỗn hợp, chứ không phải quay lại sửa tham số mô hình. Còn một điểm: Thuật ngữ RAG đã được đề cập trong bài báo của Meta năm 2020, không phải ông ấy sáng tạo – ông ấy chỉ đặt cược đúng thời điểm nó sẽ trở thành chủ đạo.

LUI là Lục địa Mới (Quan điểm 7)

> Năm 2023, Wang Jianshuo nói: Điều vĩ đại nhất của ChatGPT không phải là AIGC, mà là mở ra LUI (Giao diện Người dùng Ngôn ngữ Tự nhiên), sẽ tái cấu trúc tương tác người-máy như GUI năm xưa, thúc đẩy một ngành mới lớn hơn nhiều so với bản thân việc "làm mô hình lớn".

Phần "lục địa mới" này gần như trúng toàn bộ. Ngôn ngữ tự nhiên đã trở thành lớp tương tác chủ đạo của đại chúng (ChatGPT 900 triệu người dùng hoạt động hàng tuần), và thúc đẩy một ngành công nghiệp mới độc lập – agent, coding agent, lớp giao thức đều đã được hiện thực hóa. Câu nói cụ thể nhất "lớn hơn nhiều so với bản thân làm mô hình" đã được xác nhận mạnh mẽ: giao thức MCP đã trở thành "tiêu chuẩn hệ điều hành" thời đại LUI, năm 2025 được OpenAI, Google, Microsoft toàn diện chấp nhận, cuối năm chuyển sang Linux Foundation; riêng sản phẩm Claude Code đã đạt doanh thu hàng năm khoảng 2.5 tỷ đô la.

Nhưng ông ấy đã dùng cách diễn đạt mạnh như "tái cấu trúc, thay thế GUI", ba năm sau nhìn lại là chồng lấn cùng tồn tại, chứ không phải thay thế. Ba phản ví dụ rất rõ ràng: Báo cáo của MIT cho thấy 95% thí điểm GenAI doanh nghiệp không có ROI có thể đo lường được; computer-use agent thao tác trực tiếp giao diện trên tập kiểm thử, mô hình hàng đầu mới chỉ khoảng 78%, vừa chạm đến mức cơ bản của con người; phần cứng ngôn ngữ thuần túy không có màn hình gần như thất bại toàn bộ (Humane Pin năm 2025 ngừng hoạt động vĩnh viễn). Cách nói chính xác hơn là: LUI là lớp tương tác mới chồng lên trên GUI.

Mạng lưới Robot và Định vị Mới (Quan điểm 9)

> Năm 2023, Wang Jianshuo nói: Khoảng mười năm nữa sẽ xuất hiện "mạng lưới robot" – các agent dùng ngôn ngữ tự nhiên tự động bắt tay, gọi nhau, không cần API truyền thống; sẽ sinh ra một hệ thống định vị tên miền mới hoàn toàn. Hệ thống này "hai ba năm là có thể làm xong".

Phương hướng trúng một cách đáng kinh ngạc. MCP, A2A (đã hiến tặng cho Linux Foundation, 150+ tổ chức ủng hộ) giải quyết việc các agent gọi lẫn nhau; Agent Network Protocol trực tiếp dựa trên DID của W3C để làm "định vị agent không có thẩm quyền trung tâm", mục tiêu là "mạng lưới hợp tác hàng tỷ agent" – điều này rất đồng cấu trúc với "hệ thống tên miền mới" mà ông ấy nói.

Có hai chỗ cần chỉnh sửa: Một là "không cần API" không thành lập, giao thức chủ đạo dưới đáy là schema có cấu trúc, bản chất là chồng một lớp tiêu chuẩn lên trên API; Hai là "hai ba năm làm xong" chưa thực hiện, dữ liệu của Gartner cho thấy tính đến năm 2026 chỉ khoảng 17% tổ chức thực sự triển khai agent. Thú vị là, năm đó ông ấy thực ra đã chia lời nói thành hai tầng – nguyên mẫu "hai ba năm", trưởng thành "khoảng mười năm". Nhịp độ của nguyên mẫu trúng rất chuẩn, chu kỳ trưởng thành cũng thực sự là cấp mười năm. Tách hai tầng ra xem, chất lượng của điều này cao hơn vẻ bên ngoài.

Trung Quốc nhất định làm được mô hình lớn khả dụng (Quan điểm 10, 20)

> Năm 2023, Wang Jianshuo nói: Trung Quốc nhất định có thể làm ra mô hình lớn khả dụng, khoảng cách với đỉnh cao sẽ thu hẹp nhanh chóng trong khoảng ba năm (tương tự như trình duyệt Hồng Kỳ đuổi theo Netscape).

Đường thời gian của điều này trùng khớp một cách bất ngờ. Stanford AI Index 2026 thực nghiệm, khoảng cách chuẩn giữa các mô hình hàng đầu Trung-Mỹ từ tháng 5/2023 là 17.5–31.6 điểm phần trăm, đã thu hẹp còn 2.7%; trong khi đầu tư AI tư nhân của Mỹ gấp khoảng 23 lần Trung Quốc – dùng đầu tư nhỏ hơn nhiều để đạt được sự thu hẹp. DeepSeek, Qwen, Kimi, GLM đã trở thành chủ đạo toàn cầu, hệ sinh thái mã nguồn mở thậm chí dẫn đầu.

Nhưng hai chữ "nhanh chóng" hơi lạc quan – sự trưởng thành thực sự xảy ra sau khoảng 14 tháng, chứ không phải "vài tháng". Và đây là bắt kịp tính khả dụng, không phải định nghĩa tiền tuyến: Tính đến đầu năm 2026 vẫn không có mô hình Trung Quốc nào vượt qua OpenAI o3. Trong quan điểm 20, ông ấy sai rõ ràng: Nhận định "cánh cửa mở ra rồi sẽ không đóng lại" bị OpenAI chủ động cắt API với Trung Quốc vào tháng 7/2024 trực tiếp bác bỏ, cánh cửa bị phía cung cấp đóng lại; Wenxin Yiyan mà ông ấy chỉ tên dẫn đầu ngược lại bị tụt lại, thực sự tiếp sức là DeepSeek, Doubao, Qianwen vốn năm đó còn không đáng chú ý.

Không có ý thức, Kiểm tra Turing chỉ kiểm tra biểu hiện (Quan điểm 13)

> Năm 2023, Wang Jianshuo nói: ChatGPT không có ý thức, là "người nói vô tình, người nghe có ý" tự làm khổ mình; Kiểm tra Turing vốn chỉ kiểm tra "liệu có khiến bạn nghĩ rằng nó có hay không", chứ không phải nó thực sự có.

Nhận định cốt lõi "kiểm tra biểu hiện" này đứng rất vững, còn bị một thí nghiệm châm biếm xác nhận: Trong bài kiểm tra Turing năm 2025 của UC San Diego, GPT-4.5 dưới gợi ý "đóng vai con người" bị phán là con người với tỷ lệ cao tới 73%, cao hơn cả người thật, nhưng hoàn toàn dựa vào kỹ năng diễn xuất – đây chính là chú thích tốt nhất cho "chỉ kiểm tra liệu có khiến bạn nghĩ rằng nó có hay không".

Cần bổ sung rằng: "Máy móc nhất định không có ý thức" là luận điểm mạnh tuyệt đối hóa, trong ba năm đã được đẩy vào vùng xám. Anthropic đã thiết lập vị trí nghiên cứu "phúc lợi mô hình", đưa ra xác suất ý thức khoảng 15%–20%, còn thêm cho Claude chức năng "chủ động kết thúc cuộc hội thoại bị lạm dụng". Những điều này biến "tuyệt đối không" thành "xác suất thấp nhưng không thể loại trừ". Tuy nhiên, tất cả đều dựa trên "có thể, nên giả định" chứ không phải "đã được chứng minh", hạt nhân không bị lật đổ, chỉ là năm đó ngữ khí quá đầy.

Các điều nhìn đúng còn lại (Quan điểm 6, 11, 12, 16, 18, 19)

Không phải AGI nhưng đã tiến một bước lớn
: Cả hai đầu đều đứng vững. Chính Altman thời GPT-5 vẫn nói "không phải AGI, thiếu học tập liên tục"; đồng thời huy chương vàng IMO, ARC-AGI từ gần 0 tăng lên 85%, "tiến một bước lớn" không có tranh cãi.
Không có làn sóng thất nghiệp
: Tháng 4/2026 tỷ lệ thất nghiệp Mỹ chỉ 4.3%. Điểm mù là "phân bố" – nghiên cứu Stanford cho thấy, chính xác bị rút đi là những người mới trẻ tuổi 22–25 ở cấp thang nghề nghiệp đầu tiên, cơ chế "hút thuận lợi" ở họ thất bại.
Không bị chìm trong rác AI
: Phúc lợi ròng đúng hướng, nhưng ông ấy đánh giá thấp nghiêm trọng về quy mô – nội dung AI đã chiếm khoảng 52% trang web mới tăng, "AI slop" trở thành từ của năm.
Năm lớn khởi nghiệp
: Bắt đúng điểm ngoặt của làn sóng, xAI (thành lập tháng 3/2023) đã đạt định giá 2300 tỷ. Nhưng ông ấy khóa "công ty vĩ đại" vào năm 2023 quá hẹp – những công ty thực sự nghìn tỷ như OpenAI, Anthropic đều thành lập sớm hơn.
Khoảnh khắc trình duyệt 1994
: Sắp xếp tương đối đã thành hiện thực, OpenAI năm 2025 thực sự cho ra mắt trình duyệt Atlas, biến phép ẩn dụ thành hiện thực đúng nghĩa đen. Chỉ là ChatGPT lan truyền mạnh hơn trình duyệt, phép ẩn dụ hơi bảo thủ.
Prompt bơm thêm sự thật giảm ảo giác
: Hướng được xác nhận, GPT-5 không kết nối mạng không truy xuất thì tỷ lệ ảo giác tăng vọt lên 47%, ngược lại xác nhận "sự thật" là biến số then chốt. Chỉ đánh giá thấp nguyên nhân gốc rễ là động lực huấn luyện, không phải prompt.

Ba, Những điều nhìn sai, nhìn lệch

GPT-4 có 100T tham số (Quan điểm 4) – Sai hoàn toàn

> Năm 2023, Wang Jianshuo nói: (Tin đồn) GPT-4 có 100T tham số, gấp khoảng 600 lần GPT-3 (175B).

Cả hai con số đều sai. GPT-3 là 175B, ước tính tốt nhất bị rò rỉ tháng 7/2023 là GPT-4 khoảng 1.8T, 16 chuyên gia MoE, chỉ khoảng 10 lần. 100T và thực tế chênh lệch khoảng 55 lần về quy mô. Nguồn duy nhất của "100T", là CEO Cerebras năm 2021 một câu nói "khoảng" truyền miệng, Sam Altman đã từ tháng 1/2023 trực tiếp gọi bảng so sánh đó là "complete bullshit".

Ông ấy nguyên văn đã đánh dấu "tin đồn", giữ lại tính không chắc chắn. Sâu hơn một tầng, khuôn khổ "dùng bội số tham số để đánh giá thế hệ" này bản thân đã lỗi thời: GPT-4.5, GPT-5 sau này của OpenAI đơn giản không công bố số lượng tham số nữa. Đây là điều duy nhất vừa sai số vừa lỗi thời góc nhìn.

Toán LLM (Quan điểm 1) – Chẩn đoán đúng, kết luận chặn đầu sai

> Năm 2023, Wang Jianshuo nói: Toán LLM kém là bản chất, để nó tự học toán vừa không thể vừa không cần thiết, cách làm đúng là treo ngoài công cụ.

"Chẩn đoán cộng con đường công cụ" đúng toàn bộ – nguyên nhân gốc chính là sinh token từng cái dẫn đến nhớ không đáng tin (bài báo cơ chế năm 2025 xác nhận chính xác trực giác "chữ số cuối thường đúng, chữ số giữa sai"); công cụ treo ngoài cải thiện cũng rất lớn (o4-mini cho phép dùng Python, AIME 2025 đạt 99.5%).

Sai ở cách diễn đạt chặn đầu kiểu "không thể, không cần thiết". "Không thể" bị bác bỏ – tháng 7/2025 Gemini Deep Think và mô hình OpenAI trong IMO dùng ngôn ngữ tự nhiên thuần túy, không công cụ đạt huy chương vàng. Bước ngoặt then chốt là "mô hình suy luận" xuất hiện năm 2024–2025, điều này vào tháng 3/2023 không thể dự đoán – vì vậy đối với dự đoán này nên khoan dung đánh giá hướng, chứ không nên trách thời điểm.

Nắm bắt giá trị (Quan điểm 8) – Được một nửa, luận điểm cốt lõi ngược

> Năm 2023, Wang Jianshuo nói: Giá trị cuối cùng sẽ rơi vào lớp ứng dụng, kết cục của công ty mở ra lớp cơ sở (làm mô hình) chưa chắc kiếm được tiền.

Tiền thực sự bắt đầu chảy về lớp ứng dụng (Cursor ba năm đạt doanh thu hàng năm 2 tỷ) – nửa này đúng. Nhưng "làm lớp cơ sở không kiếm tiền" bị NVIDIA trực tiếp bác bỏ: FY2026 lợi nhuận ròng khoảng 120 tỷ đô la, giá trị vốn hóa 5 nghìn tỷ+, là người duy nhất trên toàn thị trường rõ ràng có lợi nhuận lớn. Còn lớp mô hình mà ông ấy ngụ ý sẽ thắng (OpenAI năm 2026 dự lỗ khoảng 14 tỷ) ngược lại giống nhất với "lớp cơ sở đốt tiền không kiếm tiền" mà ông ấy nói.

Ông ấy không phân biệt "lớp cơ sở tính toán" và "lớp cơ sở mô hình", cũng không phân biệt "doanh thu" và "lợi nhuận". Giá trị năm 2026 so với 2023 càng cực đoan hơn khi bị lớp tính toán nắm bắt, chứ không phải chuyển dịch về lớp ứng dụng. Cần bổ sung một câu: Lỗ tiền là nhà cung cấp đám mây mua chip, không phải NVIDIA bán chip – đây chính là chỗ lệch của phép loại suy "xây dựng đường sắt quá mức" của ông ấy.

Bản quyền (Quan điểm 14) – Đăng ký đúng, tránh xâm phạm sai

> Năm 2023, Wang Jianshuo nói: Nội dung AI tạo ra có thể tránh bản quyền (bảo vệ biểu đạt không bảo vệ ý tưởng); vật tạo ra có thể vừa không xâm phạm, cũng không thể đăng ký.

"Không thể đăng ký" đã trở thành sự thật pháp lý đã định (năm 2025 Văn phòng Bản quyền Mỹ rõ ràng "chỉ nhập từ khóa gợi ý không đủ để yêu sách tác giả"). Nhưng "tránh xâm phạm" sai rõ ràng: Tòa án nhiều lần xác định đầu ra AI nếu tương tự bản chất với tác phẩm gốc vẫn cấu thành xâm phạm; Anthropic vì dữ liệu ngôn ngữ lậu hòa giải với 1.5 tỷ đô la, là khoản bồi thường bản quyền lớn nhất lịch sử Mỹ. AI không những không "tránh" bản quyền, mà ngược lại trả giá lớn nhất lịch sử.

Thế giới đại đồng (Quan điểm 15) – Cơ chế đúng, xu hướng đặt cược ngược

> Năm 2023, Wang Jianshuo nói: ChatGPT làm "bình quân gia quyền" quan điểm con người, có thể chống lại kén thông tin kiểu TikTok, cho khả năng "thế giới đại đồng".

Lớp cơ chế đúng – năm 2025 nhiều nghiên cứu xác thực chứng thực LLM ép quan điểm về số đông, đánh giá thấp có hệ thống thiểu số. Nhưng lớp phán đoán xã hội đặt cược ngược: Chính ông ấy thêm "ít nhất bây giờ không phải ngàn người ngàn vẻ", trong ba năm đã bị lật đổ – OpenAI từ tháng 4/2025 đưa trí nhớ xuyên hội thoại và cá nhân hóa làm thành khả năng mặc định, AI đang tiến về ngàn người ngàn vẻ với tốc độ cao. Quan trọng hơn, ông ấy tưởng tượng "bình quân gia quyền" là mẫu số chung trung lập của thế giới, nhưng thực nghiệm nó là lệch hướng, còn chồng lấn xu nịnh, có thể dùng để thao túng lập trường chủ động – điều này hướng tới "tạo kén mới", chứ không phải "giải cực đoan".

Chiến tranh cục bộ và Chi phí (Quan điểm 17) – Tính chất đúng toàn bộ, số lượng bác bỏ

> Năm 2023, Wang Jianshuo nói: Làm mô hình lớn tiếp sẽ nhanh chóng trở thành "chiến tranh cục bộ", chi phí có thể biết (bỏ đường vòng khoảng 5-10 tỷ đô la chặn đầu), sẽ có nhiều người chơi tham gia.

Tính chất đúng một cách đáng kinh ngạc – nhiều người chơi ồ ạt tham gia, nhanh chóng hàng hóa hóa, mã nguồn mở bắt kịp mã đóng, toàn bộ đã hiện thực hóa. Nhưng con số cứng "5-10 tỷ chặn đầu" sai cả hai đầu: Đầu tiền tuyến bị đánh giá thấp nghiêm trọng (cấp GPT-5 năm 2026 đạt 2-5 tỷ đô la huấn luyện, chồng lấp trung tâm dữ liệu nghìn tỷ và Stargate 5000 tỷ); đầu sao chép lại bị đánh giá cao (DeepSeek ép chi phí huấn luyện biên tế xuống cấp triệu đô la). Cùng một mô hình "chi phí" theo khẩu độ có thể chênh 200 lần, duy nhất không nằm trong khoảng ông ấy đưa ra.

Khả năng xuất hiện (Quan điểm 5) – Hướng đúng, số và khung sai

> Năm 2023, Wang Jianshuo nói: Khoảng 60B tham số trở lên xuất hiện khả năng mới không có trong dữ liệu ngôn ngữ gốc, nhà nghiên cứu cũng không thể giải thích.

Trực giác phương hướng thành lập, nhưng hai chỗ diễn đạt không đứng vững: Thứ nhất, không tồn tại "ngưỡng 60B" thống nhất – ngưỡng thực tế của chuỗi suy nghĩ khoảng 100B, khả năng khác nhau xuất hiện ở quy mô khác nhau từ 13B đến 540B; Thứ hai, "không thể giải thích" cuối năm 2023 đã bị một bài báo xuất sắc NeurIPS thách thức – nhiều "đột biến" là ảo tượng do lựa chọn chỉ số đánh giá tạo ra, sau khi thay chỉ số liên tục đường cong trơn tru có thể dự đoán. Công bằng mà nói, năm đó ông ấy thuật lại là tường thuật tuyệt đối chủ đạo, thực sự có thể sửa chữa là lấy "60B" làm ngưỡng cứng, lấy "không thể giải thích" làm kết luận tính chất.

Bốn, Nhìn lại ba năm, mấy quy luật

Từng điều đối chiếu xong, lùi một bước nhìn, hai mươi nhận định này của Wang Jianshuo ẩn chứa vài quy luật đáng ghi nhớ hơn bất kỳ điều riêng lẻ nào.

Một, Phương hướng đáng tin cậy hơn nhiều so với số và mức độ. Trong hai mươi điều, phàm là nhận định cơ chế và phương hướng (RAG, LUI, mạng lưới robot, kiểm tra Turing), gần như trúng toàn bộ; phàm là đưa ra số cụ thể hoặc cách diễn đạt chặn đầu (100T tham số, ngưỡng 60B, chi phí 5-10 tỷ, toán "không thể"), gần như sai toàn bộ. Đối với lĩnh vực biến đổi nhanh, đặt cược phương hướng, cơ chế, ít đặt cược số chính xác, càng phải cảnh giác những từ nói đầy kiểu "không thể, nhất định, chặn đầu, tuyệt đối không" – chúng là khu vực dễ bị thời gian tát vào mặt.

Hai, Về thời gian, ông ấy có xu hướng đánh giá cao tốc độ, đánh giá thấp mức độ. Phàm là nói "nhanh chóng, hai ba năm làm xong", thời kỳ trưởng thành phổ biến chậm hơn; nhưng đối với trần nhảy vọt của năng lực lại đánh giá thấp – toán có thể từ "không thể" đến huy chương vàng IMO, chi phí tiền tuyến có thể tăng lên quy mô năm đó không tưởng tượng nổi. Một câu: Ngắn hạn quá lạc quan, dài hạn quá bảo thủ.

Ba, Sai ẩn nhất, lặp lại xuất hiện trên "phân bố". Không phải phương hướng sai, mà là chỉ nhìn tổng lượng, bỏ qua phân bố. "Không có làn sóng thất nghiệp" đúng, nhưng tổn thương tập trung cao độ ở người mới trẻ tuổi; "Giá trị rơi vào lớp ứng dụng" đúng một nửa, nhưng không phân biệt lớp tính toán và lớp mô hình. Tổng lượng đúng, che lấp thảm họa phân bố – đây là bài học cần bổ sung nhất.

Bốn, Những chỗ để lại khoảng trống trong lời nói, ba năm sau đều chịu được kiểm nghiệm. "Tin đồn" "ít nhất bây giờ" "giảm mạnh chứ không loại bỏ" "nguyên mẫu hai ba năm, trưởng thành khoảng mười năm" – phàm là nhận định năm đó có từ hạn định, chia tầng, hôm nay nhìn lại đều đứng vững hơn. Ngược lại, những câu tuyệt đối tuôn ra miệng, dễ bị lật đổ nhất. Sự thành thật của dự đoán, một nửa ở dám nói, nửa còn lại ở dám đánh dấu sự không chắc chắn của mình.

Năm, Một số vấn đề, ba năm căn bản không đủ. Giá trị cuối cùng quy về ai, xuất hiện có phải chân tướng biến đổi, máy móc rốt cuộc có một chút ý thức hay không, ngữ cảnh dài có ăn RAG không – những tranh luận năm đó, đến năm 2026 vẫn là tranh luận. Có thể phân biệt "đã có câu trả lời" và "còn phải tiếp tục đợi", quan trọng hơn là vội vàng đưa ra kết luận cho mỗi sự việc.

Wang Jianshuo ba năm trước, dựa vào trực giác trong sương mù GPT-4 chưa ra đời chỉ hai mươi phương hướng. Hôm nay đối chiếu xong, câu nên nhớ nhất có lẽ là: Nhìn đúng phương hướng lớn thực ra không khó lắm, khó là thừa nhận mình trên số, tốc độ và phân bố một lần nữa nghĩ đương nhiên. Hai mươi điều đối chiếu này, thay vì nói là cho điểm quá khứ, không bằng nói là đặt mấy quy củ cho ba năm tới. Ba năm tiếp theo, năm 2029 lại đối chiếu một lần.

Câu hỏi Liên quan

QBa năm sau, tác giả đánh giá thế nào về những dự đoán của mình về ChatGPT năm 2023?

ATác giả nhận thấy hầu hết các dự đoán về cơ chế và hướng phát triển (như RAG, LUI, mạng lưới agent) là chính xác, nhưng các dự đoán về con số cụ thể (như tham số mô hình, chi phí) hoặc các kết luận tuyệt đối (như 'không thể', 'tất cả') thường sai. Ông thừa nhận mình có xu hướng lạc quan thái quá về tốc độ, nhưng lại đánh giá thấp mức độ thay đổi.

QDự đoán nào của tác giả năm 2023 được xem là chính xác nhất?

ADự đoán chính xác nhất là về việc RAG (Retrieval-Augmented Generation) và kiến trúc kết hợp tìm kiếm sẽ trở thành phương pháp chính để giải quyết kiến thức và ảo giác cho LLM, thay vì chỉ chỉnh sửa tham số mô hình. Điều này đã trở thành tiêu chuẩn thực tế trong ngành AI.

QDự đoán nào của tác giả hoàn toàn sai, và tại sao?

ADự đoán hoàn toàn sai là về việc GPT-4 có 100 nghìn tỷ tham số. Thực tế, GPT-4 ước tính chỉ có khoảng 1.8 nghìn tỷ tham số. Dự đoán này sai cả về con số lẫn quan điểm lỗi thời khi đánh giá thế hệ mô hình chỉ dựa trên hệ số nhân tham số.

QBáo cáo 'đối chiếu' này được tạo ra bằng cách nào?

ABáo cáo được tạo ra một cách khách quan bởi một workflow AI, điều phối 41 agent Opus 4.8. Các agent này tự động phân tách 20 dự đoán, tìm kiếm thông tin cập nhật nhất trên mạng để kiểm chứng chéo, và cuối cùng đưa ra đánh giá cho từng dự đoán. Quá trình này tiêu tốn khoảng 20 phút và 1.4 triệu token.

QBài viết rút ra những quy luật hay bài học gì từ việc nhìn lại các dự đoán?

ABài viết rút ra 5 quy luật/bài học chính: 1) Dự đoán về hướng đi và cơ chế đáng tin cậy hơn nhiều so với con số cụ thể. 2) Có xu hướng đánh giá quá cao tốc độ thay đổi trong ngắn hạn, nhưng đánh giá thấp mức độ thay đổi trong dài hạn. 3) Sai sót thường nằm ở việc bỏ qua sự phân bố không đồng đều, chỉ nhìn vào tổng thể. 4) Những dự đoán có từ ngữ thận trọng, để ngỏ thường chính xác hơn. 5) Ba năm là chưa đủ để có câu trả lời cho một số vấn đề cốt lõi.

Nội dung Liên quan

Tại Hàn Quốc ghi nhận sự bùng nổ khối lượng giao dịch 15 altcoin!

Tại Hàn Quốc, các sàn giao dịch tiền mã hóa lớn như Upbit và Bithumb đã ghi nhận sự tăng trưởng mạnh mẽ về khối lượng giao dịch của 15 đồng altcoin. Tổng khối lượng giao dịch trong 24 giờ của các altcoin phổ biến nhất đạt khoảng 347,7 triệu USD. MetaDAO (META) dẫn đầu bảng xếp hạng với khối lượng giao dịch riêng trên Upbit là 65,84 triệu USD. Euler (EUL) đứng thứ hai với tổng khối lượng 47,65 triệu USD trên cả hai sàn. XRP, thu hút truyền thống sự quan tâm của các nhà đầu tư Hàn Quốc, đạt 38,11 triệu USD. Danh sách 15 altcoin có khối lượng giao dịch lớn nhất trên Upbit và Bithumb lần lượt là: META, EUL, XRP, ThunderCore (TT), Babylon (BABY), Geodnet (GEOD), Hyperlane (HYPER), Momentum (MMT), Ondo (ONDO), Shiba Inu (SHIB), DOME, Lorenzo Protocol (BANK), Akash Network (AKT), Dogecoin (DOGE) và Worldcoin (WLD).

cryptonews.ru39 phút trước

Tại Hàn Quốc ghi nhận sự bùng nổ khối lượng giao dịch 15 altcoin!

cryptonews.ru39 phút trước

Công ty của Donald Trump bán tiếp một lô Bitcoin lớn!

Công ty của Donald Trump vừa chuyển một lượng lớn Bitcoin lên sàn giao dịch CryptoCom, theo thông tin từ dữ liệu chuỗi khối. Khoảng 2.628 BTC, tương đương 165 triệu USD, đã được chuyển từ các địa chỉ được cho là liên kết với Trump Media & Technology Group. Trước đó, công ty được cho là đã mua tổng cộng 11.542 BTC với giá trung bình 118.500 USD mỗi đồng. Tính đến nay, khoảng 7.281 BTC đã được rút ra từ các địa chỉ này, trong khi 4.261 BTC được cho là vẫn còn giữ lại. Tổng lỗ (đã thực hiện và chưa thực hiện) từ các khoản đầu tư Bitcoin của Trump Media ước tính vào khoảng 555 triệu USD. Cần lưu ý rằng việc chuyển Bitcoin lên sàn giao dịch không nhất thiết có nghĩa là đã bán số tài sản này. Giao dịch có thể nhằm mục đích lưu ký, quản lý thanh khoản hoặc cho một hoạt động tài chính khác. Tuy nhiên, các giao dịch từ ví lạnh lên sàn tập trung thường được xem là động thái chuẩn bị bán.

cryptonews.ru2 giờ trước

Công ty của Donald Trump bán tiếp một lô Bitcoin lớn!

cryptonews.ru2 giờ trước

Tại sao Bitcoin duy trì mức 64.000 USD sau lần tạm dừng cứng rắn của Fed

Bitcoin duy trì quanh mức 64.000 USD sau cuộc họp của Fed. Dù Fed giữ lãi suất trong khoảng 3,50–3,75%, ba thành viên ủy ban đã bỏ phiếu ủng hộ tăng lãi suất, gửi đi tín hiệu chính sách thắt chặt hơn dự kiến. Bitcoin phản ứng biến động nhưng cuối cùng ổn định quanh 64.000 USD, với vùng hỗ trợ 63.000–63.500 USD và kháng cự ở 66.000 USD. ETF Bitcoin ghi nhận dòng vốn ròng chảy vào 32,1 triệu USD, chấm dứt chuỗi rút tiền, trong khi ETF Ethereum tiếp tục thất thoát 18,65 triệu USD. Điều này cho thấy sự luân chuyển vốn sang Bitcoin giữa bối cảnh bất ổn vĩ mô. Ethereum giao dịch quanh 1.900 USD, áp lực bán tăng nhưng mạng lưới vẫn mạnh với lượng ETH chờ staking cao. Các altcoin khác di chuyển không đồng nhất. Về pháp lý, dự luật CLARITY Act bị trì hoãn đến sau kỳ nghỉ tháng 8 của Thượng viện Mỹ, khiến thị trường thận trọng hơn về khả năng thông qua vào năm 2026. Tóm lại, thị trường tiền mã hóa đang trong trạng thái chờ đợi, với Bitcoin thể hiện sự kiên cường nhờ dòng vốn ETF. Các nhà đầu tư trung hạn cần theo dõi khả năng giữ trên 63.000 USD của Bitcoin, mức 1.860 USD của Ethereum và dòng vốn thể chế để tìm tín hiệu cho sự phục hồi trong nửa cuối năm 2026.

cryptonews.ru2 giờ trước

Tại sao Bitcoin duy trì mức 64.000 USD sau lần tạm dừng cứng rắn của Fed

cryptonews.ru2 giờ trước

Parker Lewis Lý Giải Tại Sao Bitcoin Vẫn Là Đồng Tiền Tốt Nhất

Nhà phân tích Bitcoin uy tín Parker Lewis chỉ trích mạnh mẽ các chiến lược tiếp thị của các công ty tự xưng là kho bạc tiền mã hóa. Ông cho rằng việc các công ty này huy động vốn thông qua việc bán "tín dụng số" dưới dạng cổ phiếu ưu đãi vĩnh viễn đã làm sai lệch bản chất của tiền mã hóa đầu tiên. Lewis nhấn mạnh Bitcoin không có lợi suất định sẵn, và việc hứa hẹn cổ tức thường xuyên là một trò chơi rủi ro cao, dựa chủ yếu vào việc thu hút nhà đầu tư mới trên thị trường tăng trưởng. Ông dẫn chứng sự chênh lệch lớn giữa thị trường tín dụng toàn cầu (300 nghìn tỷ USD) và thị trường cổ phiếu ưu đãi vĩnh viễn (1 nghìn tỷ USD) để chứng minh rủi ro của các công cụ phái sinh này, thường được chuyển cho các nhà đầu tư nhỏ lẻ. Lewis bác bỏ quan điểm cho rằng Bitcoin quá biến động, lập luận rằng biến động là hệ quả tự nhiên của việc chấp nhận một loại tài sản mới. Với nguồn cung cứng và không co giãn, mỗi làn sóng người dùng mới sẽ dẫn đến biến động giá mạnh. Thay vì mua cổ phiếu phái sinh của các công ty như MicroStrategy, ông khuyên nên mua Bitcoin trực tiếp, vì điều này an toàn hơn về mặt toán học so với việc giao tiền cho các nhà quản lý tập đoàn. Việc chuyển hướng sang các công cụ phái sinh làm mất tập trung vào mối đe dọa thực sự: sự mất giá nhanh chóng của tiền pháp định. Lewis đưa ra "Chỉ số thịt bò" của riêng mình, cho thấy mức lạm phát tiêu dùng thực tế khoảng 12-13% mỗi năm, cao hơn nhiều so với số liệu chính thức. Ông kết luận rằng chiến lược tài chính an toàn và hiệu quả nhất trong bối cảnh lạm phát toàn cầu là sở hữu trực tiếp Bitcoin và tự kiểm soát khóa riêng tư, thay vì theo đuổi lợi nhuận đầy rủi ro từ cổ phiếu kho bạc tiền mã hóa.

cryptonews.ru2 giờ trước

Parker Lewis Lý Giải Tại Sao Bitcoin Vẫn Là Đồng Tiền Tốt Nhất

cryptonews.ru2 giờ trước

Công ty ARK Invest của Katie Wood mua 109,129 cổ phiếu Circle với giá 6,83 triệu USD

Công ty ARK Invest do bà Cathie Wood (Kэти Вуд) lãnh đạo đã mua 109.129 cổ phiếu Circle với giá trị gần 6,83 triệu USD thông qua ba quỹ ETF của mình. Giao dịch này diễn ra không lâu sau khi Circle nhận được giấy phép quản lý tín thác từ Sở Dịch vụ Tài chính New York cho một thực thể mới có tên Circle New York Trust, điều mà CEO Jeremy Allaire gọi là "mục tiêu dài hạn". Tuy nhiên, cổ phiếu CRCL của Circle vẫn giảm 2,54% vào ngày 31/7, cho thấy các nhà đầu tư có thể chưa coi giấy phép là yếu tố thúc đẩy tăng trưởng. Cùng lúc, ARK Invest cũng mua vào cổ phiếu của Tesla, SpaceX và Nvidia với tổng trị giá khoảng 40,2 triệu USD trong đợt bán tháo các công ty công nghệ, đồng thời giảm tỷ trọng nắm giữ ở một số công ty khác như Shopify và Cloudflare.

cryptonews.ru2 giờ trước

Công ty ARK Invest của Katie Wood mua 109,129 cổ phiếu Circle với giá 6,83 triệu USD

cryptonews.ru2 giờ trước

Giao dịch

Giao ngay

Ba năm sau: Nhìn lại những dự đoán của tôi về ChatGPT năm 2023

Tóm tắt

Một, Bảng điểm

Hai, Những điều nhìn đúng

Ba, Những điều nhìn sai, nhìn lệch

Bốn, Nhìn lại ba năm, mấy quy luật

Câu hỏi Liên quan

Nội dung Liên quan

Tại Hàn Quốc ghi nhận sự bùng nổ khối lượng giao dịch 15 altcoin!

Công ty của Donald Trump bán tiếp một lô Bitcoin lớn!

Tại sao Bitcoin duy trì mức 64.000 USD sau lần tạm dừng cứng rắn của Fed

Parker Lewis Lý Giải Tại Sao Bitcoin Vẫn Là Đồng Tiền Tốt Nhất

Công ty ARK Invest của Katie Wood mua 109,129 cổ phiếu Circle với giá 6,83 triệu USD

Giao dịch

Danh mục Phổ biến

Thẻ Nổi bật