Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

marsbitXuất bản vào 2026-05-31Cập nhật gần nhất vào 2026-05-31

Tóm tắt

**Tóm tắt tiếng Việt:** Năm 2026, tác giả Vương Kiến Thạc nhìn lại 20 dự đoán của mình về ChatGPT từ năm 2023, sử dụng AI (41 agent Opus 4.8) để đối chiếu với dữ liệu thực tế. **Kết quả chính:** Phần lớn các dự đoán về **cơ chế và xu hướng** là đúng: * **Đúng:** Kiến trúc RAG + tìm kiếm trở thành chuẩn để giảm ảo giác. LUI (Giao diện ngôn ngữ tự nhiên) tạo ra một "lục địa mới" cho tương tác máy tính. Mạng lưới agent với giao thức kết nối mới đang hình thành. Trung Quốc thu hẹp khoảng cách về mô hình lớn có thể sử dụng. ChatGPT không có ý thức, vượt qua bài kiểm tra Turing nhờ biểu diễn. Nó là bước tiến lớn nhưng chưa phải AGI, chưa gây ra làn sóng thất nghiệp hàng loạt. * **Sai/Sai một phần:** Dự đoán cụ thể **GPT-4 có 100 nghìn tỷ tham số** là sai hoàn toàn (thực tế ~1.8 nghìn tỷ). Nhận định **LLM không thể tự học toán** bị bác bỏ khi các mô hình giành huy chương IMO. **Giá trị sẽ thuộc về lớp ứng dụng** bị chứng minh ngược lại khi lợi nhuận khổng lồ thuộc về lớp nền tảng tính toán (như NVIDIA). **AI có thể né tránh vấn đề bản quyền** là sai, với các vụ kiện và khoản bồi thường lớn. Dự đoán **chi phí đào tạo mô hình lớn chỉ 5-10 tỷ USD** là quá thấp so với thực tế. **Bài học rút ra:** 1. **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể hay mức độ tuyệt đối.** 2. **Có xu hướng đánh giá quá cao tốc độ thay đổi trong ngắn hạn, nhưng lại đánh giá thấp mức độ thay đổi trong dài hạn.** 3. **Sai lầm tinh vi thường nằm ở "sự phân bố":** tổng thể...

Tác giả: Wang Jianshuo

Ngày 6 tháng 3 năm 2023, ChatGPT vừa mới ra mắt, GPT-4 chưa được công bố, tôi và Sarah đã có một cuộc phỏng vấn về ChatGPT – tập thứ ba trong loạt "Traders' Talk 'Bạch thoại'" (Podcast Bạch thoại nói về ChatGPT đã phát hành, chào mừng lắng nghe).

Lúc đó ChatGPT mới ra mắt chưa lâu, số người thực sự sử dụng còn rất ít, cuộc phỏng vấn dài ba giờ này sau đó luôn đứng đầu danh mục ChatGPT trên tiểu vũ trụ. Trong đó, tôi đã đưa ra hơn hai mươi nhận định và dự đoán liên tục, hoàn toàn dựa trên trực giác và thông tin hạn chế, không có nhiều dữ liệu. Toàn bộ bản ghi chữ của cuộc phỏng vấn đó vẫn còn trên tài khoản công chúng.

Bây giờ là cuối tháng 5 năm 2026, ba năm đã trôi qua, AI đã phát triển thành một hình dạng mà năm đó không thể tưởng tượng được.

Tôi muốn làm một việc: lấy ra từng ý trong hai mươi nhận định năm đó, sử dụng dữ liệu mới nhất có thể tra cứu được ngày hôm nay, để đối chiếu một cách khách quan. Xem rõ thế giới đã thực sự thay đổi như thế nào trong ba năm, và cũng xem rõ chính tôi ba năm trước, những điểm nào đã nhìn đúng, những điểm nào đã nhìn lệch.

Để cố gắng không thiên vị, lần đối chiếu này tôi quyết định giao cho AI làm: ném bản ghi chữ của cuộc phỏng vấn năm đó vào một workflow, để nó điều phối 41 agent Opus 4.8, đầu tiên tách hai mươi nhận định ra từng ý, sau đó tự mình tìm kiếm dữ liệu mới nhất trên mạng, kiểm chứng chéo từng ý, cuối cùng cho điểm Wang Jianshuo ba năm trước. Nhóm agent này mất khoảng 20 phút, đốt khoảng 1.4 triệu token (tương đương khoảng 35 đô la), chạy ra báo cáo dưới đây. Tất cả nhận định đều đến từ chúng, không phải tôi. Ngày cơ sở được xác định là tháng 5 năm 2026.

一、Bảng điểm

Ký hiệu phán quyết: ✅ Đúng · 🟢 Cơ bản đúng · 🟡 Một phần đúng · ❌ Sai

Nhìn tổng quan, hướng lớn của Wang Jianshuo năm đó hầu hết đều đứng vững, thực sự chỉ có một nhận định sai cứng – truyền rằng GPT-4 có 100T tham số. Nhưng ma quỷ ẩn giấu trong chi tiết: phía sau hầu hết mỗi nhận định "đúng", đều đè lên một cái đuôi không nói chính xác năm đó. Trong hai mươi nhận định không có nhận định nào hoàn toàn "vẫn chưa xác định", ba năm đủ dài, hầu hết mọi việc đều có xu hướng câu trả lời. Dưới đây sẽ nói chi tiết theo nhóm.

二、Nhìn đúng

Đặc điểm chung của nhóm này là: Hướng, cơ chế, thậm chí nhịp độ thời gian mà Wang Jianshuo đánh giá năm đó đều trúng, sai chỉ sai ở "mức độ" và "cách diễn đạt tuyệt đối hóa".

RAG và kiến trúc truy xuất (Quan điểm 2, 3)

> Năm 2023, Wang Jianshuo nói: Phương pháp chính để giải quyết kiến thức và ảo giác không phải là sửa mô hình, mà là dùng truy xuất vector để đổ kiến thức vào làm "phao cứu sinh"; kiến trúc đúng là công cụ tìm kiếm làm truy xuất, đưa kết quả cho LLM.

Đây chính là tiêu chuẩn thực tế của tất cả sản phẩm AI ngày nay. RAG đã trở thành kiến trúc mặc định cho doanh nghiệp AI, OpenAI, Google, Anthropic đều biến nó thành năng lực cấp nền tảng; ChatGPT Search về mặt chữ nghĩa chính là "dùng chỉ mục Bing để truy xuất trước, đưa kết quả cho GPT, rồi sinh ra câu trả lời có trích dẫn". Google AI Overviews dùng grounding để đạt khoảng 2 tỷ người dùng hoạt động hàng tháng, Perplexity một công ty thuần túy dựa vào kiến trúc này định giá vọt lên khoảng 200 tỷ đô la.

Vào thời điểm GPT-4 chưa được công bố, ngành công nghiệp mặc định là "dựa vào tinh chỉnh để đưa kiến thức vào", ông ấy đánh cược vào "không động tham số mô hình, gắn ngoài truy xuất", cơ chế và thời gian đều đúng.

Cần thành thật rằng: Ông ấy hình dung là "truy xuất một lần tĩnh", nhưng thực tế phức tạp hơn – ngữ cảnh dài, GraphRAG, agentic retrieval đều đến để bổ sung mạnh mẽ. Cuộc tranh luận "RAG đã chết" năm 2026, chính là chứng minh hướng lớn không chết, nó phủ định chỉ là "truy xuất đơn giản một lần", kết luận là nâng cấp thành truy xuất hỗn hợp, chứ không phải quay lại sửa tham số mô hình. Còn một điểm: Thuật ngữ RAG đã được đề xuất trong bài luận của Meta năm 2020, không phải ông ấy sáng tạo – ông ấy chỉ trong cửa sổ thời gian đã đánh cược trúng nó sẽ trở thành chủ lưu.

LUI là lục địa mới (Quan điểm 7)

> Năm 2023, Wang Jianshuo nói: Điểm vĩ đại nhất của ChatGPT không phải là AIGC, mà là mở ra LUI (giao diện người dùng ngôn ngữ tự nhiên), sẽ như GUI ngày xưa tái cấu trúc tương tác giữa người và máy, thúc đẩy một ngành công nghiệp mới lớn hơn nhiều so với "làm mô hình lớn" bản thân.

Phần "lục địa mới" này gần như hoàn toàn trúng. Ngôn ngữ tự nhiên đã trở thành lớp tương tác chủ đạo của đại chúng (ChatGPT 900 triệu người dùng hoạt động hàng tuần), và thúc đẩy một ngành công nghiệp mới độc lập – agent, coding agent, lớp giao thức tất cả đều thực hiện. Câu nói cụ thể nhất "lớn hơn nhiều so với làm mô hình bản thân" được xác nhận mạnh mẽ: giao thức MCP trở thành "tiêu chuẩn hệ điều hành" thời đại LUI, năm 2025 được OpenAI, Google, Microsoft toàn diện chấp nhận, cuối năm chuyển vào Linux Foundation; chỉ riêng sản phẩm Claude Code đã đạt doanh thu năm hóa khoảng 2.5 tỷ đô la.

Nhưng ông ấy đã dùng cách diễn đạt mạnh như "tái cấu trúc, thay thế GUI", ba năm sau nhìn lại là chồng lấp cùng tồn tại, chứ không phải thay thế. Ba ví dụ phản chứng rất cứng: Báo cáo MIT cho thấy 95% dự án thử nghiệm GenAI của doanh nghiệp không có ROI có thể đo lường được; computer-use agent thao tác trực tiếp giao diện trên tập kiểm tra mô hình đỉnh mới khoảng 78%, vừa chạm đến đường cơ sở con người; phần cứng ngôn ngữ thuần túy bỏ màn hình hầu như toàn bộ thất bại (Humane Pin năm 2025 ngừng phục vụ vĩnh viễn). Cách nói chính xác hơn là: LUI là lớp tương tác mới chồng lên trên GUI.

Mạng lưới robot và định vị mới (Quan điểm 9)

> Năm 2023, Wang Jianshuo nói: Khoảng mười năm tới sẽ xuất hiện "mạng lưới robot" – agent giữa chúng dùng ngôn ngữ tự nhiên tự động bắt tay, gọi lẫn nhau, không cần API truyền thống nữa; sẽ sinh ra một hệ thống định vị tên miền hoàn toàn mới. Bộ thứ này "hai ba năm là có thể làm xong".

Hướng đánh trúng đến kinh ngạc. MCP, A2A (đã quyên góp cho Linux Foundation, hơn 150 tổ chức hỗ trợ) giải quyết việc gọi lẫn nhau giữa agent; Agent Network Protocol trực tiếp dựa trên DID của W3C để làm "định vị agent không có trung tâm quyền lực", mục tiêu là "mạng lưới hợp tác hàng tỷ agent" – điều này đồng cấu trúc cao độ với "hệ thống tên miền hoàn toàn mới" mà ông ấy nói.

Hai chỗ cần sửa: Một là "không cần API" không thành lập, giao thức chủ lưu đáy là schema có cấu trúc, bản chất là chồng một lớp tiêu chuẩn lên trên API; hai là "hai ba năm làm xong" không thực hiện, dữ liệu Gartner cho thấy tính đến năm 2026 chỉ khoảng 17% tổ chức thực sự triển khai agent. Thú vị là, năm đó ông ấy thực sự chia lời nói thành tầng – hình thái ban đầu "hai ba năm", trưởng thành "khoảng mười năm". Nhịp độ hình thái ban đầu đánh trúng rất chuẩn, chu kỳ trưởng thành cũng thực sự là cấp mười năm. Tách hai tầng ra xem, chất lượng của điều này cao hơn so với nhìn bề ngoài.

Trung Quốc nhất định có thể làm ra mô hình lớn dùng được (Quan điểm 10, 20)

> Năm 2023, Wang Jianshuo nói: Trung Quốc nhất định có thể làm ra mô hình lớn dùng được, khoảng cách với đỉnh cao sẽ nhanh chóng thu hẹp trong khoảng ba năm (so sánh trình duyệt Hồng kỳ đuổi Netscape).

Đường thời gian của điều này trùng khớp đến bất ngờ. Stanford 2026 AI Index đo thực tế, khoảng cách chuẩn giữa mô hình Trung-Mỹ đỉnh cao từ tháng 5 năm 2023 là 17.5–31.6 điểm phần trăm, thu hẹp xuống 2.7%; trong khi đầu tư AI tư nhân của Mỹ gấp khoảng 23 lần Trung Quốc – dùng đầu vào nhỏ hơn nhiều để thực hiện sự thu hẹp. DeepSeek, Qwen, Kimi, GLM trở thành chủ lưu toàn cầu, hệ sinh thái mã nguồn mở thậm chí dẫn đầu.

Nhưng hai từ "nhanh chóng" lạc quan quá – trưởng thành thực sự xảy ra khoảng 14 tháng sau, chứ không phải "vài tháng". Và đây là đuổi kịp tính dùng được, không phải định nghĩa tiền tuyến: tính đến đầu năm 2026 vẫn không có mô hình Trung Quốc nào vượt qua OpenAI o3. Trong quan điểm 20, ông ấy sai rõ ràng: nhận định "cửa mở ra sẽ không đóng lại", bị OpenAI vào tháng 7 năm 2024 chủ động cắt API đối với Trung Quốc trực tiếp lật đổ, cửa bị phía cung cấp đóng lại; Wenxin Yiyan mà ông ấy nêu tên dẫn đầu ngược lại tụt hậu, thực sự tiếp sức là DeepSeek, Doubao, Qianwen năm đó còn không đáng kể.

Không có ý thức, bài kiểm tra Turing chỉ kiểm tra bề ngoài (Quan điểm 13)

> Năm 2023, Wang Jianshuo nói: ChatGPT không có ý thức, là "người nói vô ý, người nghe có lòng" tự mình đa tình; bài kiểm tra Turing vốn chỉ kiểm tra "có làm bạn nghĩ rằng nó có hay không", chứ không phải nó thực sự có.

Nhận định cốt lõi "kiểm tra bề ngoài" này đứng rất vững, còn được một thí nghiệm phản châm biếm xác thực: trong bài kiểm tra Turing UC San Diego năm 2025, GPT-4.5 dưới gợi ý "đóng vai nhân vật" bị phán là con người tỷ lệ cao đến 73%, cao hơn cả người thật, nhưng dựa hoàn toàn vào kỹ năng diễn xuất – đây chính là chú thích tốt nhất cho "chỉ kiểm tra có làm bạn nghĩ rằng nó có hay không".

Cần bổ sung là: "máy nhất định không có ý thức" cái luận đoán mạnh tuyệt đối hóa này, trong ba năm bị đẩy vào vùng xám. Anthropic đặt vị trí nghiên cứu "phúc lợi mô hình", đưa ra xác suất ý thức khoảng 15%–20%, còn cho Claude thêm chức năng "chủ động kết thúc hội thoại bị lạm dụng". Những điều này biến "tuyệt đối không có" thành "xác suất thấp nhưng không thể loại trừ". Tuy nhiên tất cả dựa trên "có thể, nên giả định" chứ không phải "đã chứng thực", hạt nhân không bị lật đổ, chỉ là giọng điệu năm đó xuống quá đầy.

Các nhận định đúng khác (Quan điểm 6, 11, 12, 16, 18, 19)

  • Không phải AGI nhưng tiến một bước lớn
    : Cả hai đầu đều đứng vững. Chính Altman trong thời đại GPT-5 vẫn nói "không phải AGI, thiếu học tập liên tục"; đồng thời IMO huy chương vàng, ARC-AGI từ gần 0 vọt lên 85%, "tiến một bước lớn" không tranh cãi.
  • Không có làn sóng thất nghiệp
    : Tháng 4 năm 2026 tỷ lệ thất nghiệp Mỹ chỉ 4.3%. Điểm mù ở "phân bố" – nghiên cứu Stanford cho thấy, chính những người mới trẻ 22–25 tuổi ở cấp thang nghề nghiệp thứ nhất bị hút đi, cơ chế "hút trôi chảy" trên người họ thất bại.
  • Không bị chìm đắm trong rác AI
    : Hướng phúc lợi ròng đúng, nhưng ông ấy đánh giá thấp nghiêm trọng quy mô – nội dung AI đã chiếm khoảng 52% trang web mới tăng, "AI slop" trở thành từ của năm.
  • Năm khởi nghiệp lớn
    : Điểm rẽ của làn sóng nắm đúng, xAI (thành lập tháng 3 năm 2023) đã đạt định giá 2300 tỷ. Nhưng ông ấy khóa "công ty vĩ đại" vào năm 2023 quá hẹp – OpenAI, Anthropic thực sự có lượng tỷ đô đều thành lập sớm hơn.
  • Thời khắc trình duyệt 1994
    : Sắp xếp tương đối xác thực, OpenAI năm 2025 thực sự ra mắt trình duyệt Atlas, biến phép ẩn dụ thành hiện thực chữ nghĩa. Chỉ là ChatGPT lan truyền mạnh hơn trình duyệt, phép ẩn dụ bảo thủ quá.
  • Prompt cộng đổ sự thật giảm ảo giác
    : Hướng được xác nhận, GPT-5 ngắt mạng không truy xuất thời điểm tỷ lệ ảo giác vọt lên 47%, ngược lại xác thực "sự thật" là biến số then chốt. Chỉ đánh giá thấp nguyên nhân gốc ở khuyến khích huấn luyện, không phải prompt.

三、Nhìn sai, nhìn lệch

GPT-4 là 100T tham số (Quan điểm 4) – Sai hoàn toàn

> Năm 2023, Wang Jianshuo nói: (Tin đồn) GPT-4 là 100T tham số, so với GPT-3 175B khoảng 600 lần.

Hai con số đều sai. GPT-3 là 175B, tháng 7 năm 2023 ước tính tốt nhất bị rò rỉ là GPT-4 khoảng 1.8T, 16 chuyên gia MoE, chỉ khoảng 10 lần. 100T và thực tế chênh lệch khoảng 55 lần quy mô. Nguồn duy nhất của "100T", là CEO Cerebras năm 2021 một câu nói "khoảng" được chuyển thuật lại lần hai, Sam Altman ngay tháng 1 năm 2023 đã trực tiếp mắng bức ảnh so sánh đó là "complete bullshit".

Lời nói gốc của ông ấy đánh dấu "tin đồn", giữ lại sự không chắc chắn. Sâu hơn một tầng, khung "dùng bội số tham số để đo lường thế hệ" này bản thân đã lỗi thời: GPT-4.5, GPT-5 sau này của OpenAI thẳng thừng không công khai lượng tham số nữa. Đây là nhận định cứng duy nhất sai số, góc nhìn cũng lỗi thời.

Toán học LLM (Quan điểm 1) – Chẩn đoán đúng, kết luận khóa trần sai

> Năm 2023, Wang Jianshuo nói: Toán học LLM kém là bản chất, để nó tự học toán vừa không thể vừa không cần thiết, cách làm đúng là gắn ngoài công cụ.

"Chẩn đoán cộng lộ trình công cụ" toàn bộ đúng – nguyên nhân gốc chính là sinh token từng cái dẫn đến nhớ không đáng tin cậy (bài luận cơ chế năm 2025 xác thực chính xác trực giác "chữ số cuối thường đúng, chữ số giữa sai"); công cụ gắn ngoài nâng cao cũng khổng lồ (o4-mini cho phép dùng Python thời điểm, AIME 2025 đạt 99.5%).

Sai ở cách diễn đạt khóa trần như "không thể, không cần thiết". "Không thể" bị chứng minh sai – tháng 7 năm 2025 Gemini Deep Think và mô hình OpenAI trong IMO dùng thuần ngôn ngữ tự nhiên, không công cụ nhận huy chương vàng. Bước ngoặt then chốt là "mô hình suy luận" xuất hiện mới năm 2024–2025, điều này vào tháng 3 năm 2023 không thể dự kiến – vì vậy đối với dự đoán này nên khoan dung đánh giá hướng, chứ không nên trách móc thời điểm.

Nắm bắt giá trị (Quan điểm 8) – Đánh cược đúng một nửa, luận đoán cốt lõi ngược

> Năm 2023, Wang Jianshuo nói: Giá trị cuối cùng sẽ rơi vào lớp ứng dụng, công ty khai sáng lớp cơ sở (người làm mô hình) kết cục chưa chắc kiếm tiền.

Tiền thực sự bắt đầu chảy về lớp ứng dụng (Cursor ba năm đạt doanh thu năm hóa 2 tỷ) – nửa này đúng. Nhưng "làm lớp cơ sở không kiếm tiền" bị NVIDIA trực tiếp chứng minh sai: FY2026 lợi nhuận ròng khoảng 120 tỷ đô la, giá trị vốn hóa 5 nghìn tỷ+, là người duy nhất trên toàn thị trường rõ ràng có lợi nhuận lớn. Còn lớp mô hình ông ấy ngụ ý sẽ thắng (OpenAI năm 2026 dự lỗ khoảng 14 tỷ) ngược lại giống nhất cái ông ấy nói "lớp cơ sở đốt tiền không kiếm tiền".

Ông ấy không phân biệt "lớp cơ sở sức mạnh tính toán" và "lớp cơ sở mô hình", cũng không phân biệt "doanh thu" và "lợi nhuận". Giá trị năm 2026 so với năm 2023 càng cực đoan bị lớp sức mạnh tính toán nắm bắt, chứ không phải chuyển dịch về lớp ứng dụng. Cần bổ sung một câu: thua lỗ là nhà máy điện toán đám mây mua chip, không phải NVIDIA bán chip – đây chính là chỗ sai vị của ông ấy trong phép so sánh "xây dựng quá mức đường sắt".

Bản quyền (Quan điểm 14) – Đăng ký đúng, né tránh vi phạm sai

> Năm 2023, Wang Jianshuo nói: Nội dung sinh ra bởi AI có thể né tránh bản quyền (bảo vệ biểu đạt không bảo vệ tư tưởng); vật sinh ra có thể vừa không vi phạm, cũng không thể đăng ký.

"Không thể đăng ký" trở thành sự thật pháp lý đã định (năm 2025 Cục Bản quyền Mỹ rõ ràng "chỉ nhập từ gợi ý không đủ để chủ trương tác giả"). Nhưng "né tránh vi phạm" sai rõ ràng: tòa án nhiều lần xác định đầu ra AI nếu tương tự bản chất với tác phẩm gốc vẫn cấu thành vi phạm; Anthropic vì ngữ liệu ăn cắp dùng 1.5 tỷ đô la hòa giải, là bồi thường bản quyền lớn nhất lịch sử Mỹ. AI không những không "né tránh" bản quyền, ngược lại trả giá lớn nhất lịch sử.

Đại đồng thế giới (Quan điểm 15) – Cơ chế đúng, xu hướng đánh cược ngược

> Năm 2023, Wang Jianshuo nói: ChatGPT đưa quan điểm con người làm "bình quân gia quyền", có thể chống lại kén thông tin kiểu TikTok, cho "đại đồng thế giới" khả năng.

Tầng cơ chế đúng – năm 2025 nhiều nghiên cứu xác thực rõ ràng LLM đè quan điểm về số đông, đánh giá thấp có hệ thống thiểu số phái. Nhưng tầng phán đoán xã hội đánh cược ngược: chính ông ấy thêm "ít nhất hiện tại không phải nghìn người nghìn mặt", trong ba năm bị lật đổ – OpenAI từ tháng 4 năm 2025 đưa ký ức xuyên hội thoại và cá nhân hóa làm thành năng lực mặc định, AI đang đi với tốc độ cao đến nghìn người nghìn mặt. Quan trọng hơn, ông ấy tưởng tượng "bình quân gia quyền" là trung lập ước số chung thế giới, nhưng đo thực tế nó là dịch chuyển có hướng, còn chồng lấp xu nịnh, có thể dùng để chủ động thao túng lập trường – điều này hướng đến "chế tạo kén mới", chứ không phải "tiêu giải phân cực".

Chiến tranh cục bộ và chi phí (Quan điểm 17) – Tính chất toàn bộ trúng, định lượng chứng minh sai

> Năm 2023, Wang Jianshuo nói: Làm mô hình lớn nữa sẽ nhanh chóng trở thành "chiến tranh cục bộ", chi phí có thể biết (bỏ đường vòng khoảng 5-10 tỷ đô la khóa trần), sẽ có nhiều người chơi vào.

Hướng tính chất đúng đến kinh ngạc – nhiều người chơi vào, nhanh chóng hàng hóa hóa, mã nguồn mở đuổi kịp mã nguồn đóng, toàn bộ thực hiện. Nhưng "5-10 tỷ khóa trần" con số cứng này hai đầu đều sai: đầu tiền tuyến bị đánh giá thấp nghiêm trọng (cấp GPT-5 năm 2026 đạt 2-5 tỷ đô la huấn luyện, chồng lấp trung tâm dữ liệu nghìn tỷ và 5000 tỷ Stargate); đầu phục chế lại bị đánh giá cao (DeepSeek đè chi phí huấn luyện biên xuống cấp triệu đô la). Cùng một mô hình "chi phí" theo khẩu độ có thể chênh 200 lần, duy nhất không ở trong khoảng ông ấy cho.

Năng lực xuất hiện (Quan điểm 5) – Hướng đúng, số và khung định sai

> Năm 2023, Wang Jianshuo nói: Khoảng 60B tham số trở lên xuất hiện năng lực mới không có trong ngữ liệu gốc, nhà nghiên cứu cũng không thể giải thích.

Trực giác hướng tính thành lập, nhưng hai chỗ diễn đạt không đứng vững: một, không tồn tại "ngưỡng 60B" thống nhất – ngưỡng thực tế của chuỗi suy nghĩ khoảng 100B, năng lực khác nhau xuất hiện trên quy mô không bằng nhau từ 13B đến 540B; hai, "không thể giải thích" cuối năm 2023 bị một bài luận xuất sắc NeurIPS thách thức – nhiều "đột biến" là hiện tượng giả do lựa chọn chỉ số đánh giá tạo thành, đổi chỉ số liên tục sau đường cong trơn tru có thể dự đoán. Công bằng mà nói, năm đó ông ấy thuật lại là tự sự chủ lưu tuyệt đối, thực sự có thể sửa chính là lấy "60B" làm ngưỡng cứng, lấy "không thể giải thích" làm kết luận tính chất.

四、Nhìn lại ba năm, vài quy luật

Đối chiếu từng ý xong, lùi lại một bước nhìn, trong hai mươi nhận định của Wang Jianshuo này ẩn giấu vài quy luật đáng ghi nhớ hơn bất kỳ nhận định đơn lẻ nào.

一、Hướng xa đáng tin hơn số và mức độ. Trong hai mươi nhận định, phàm là phán đoán cơ chế và hướng (RAG, LUI, mạng lưới robot, bài kiểm tra Turing), gần như toàn bộ trúng; phàm là cho số cụ thể hoặc cách diễn đạt khóa trần (100T tham số, ngưỡng 60B, chi phí 5-10 tỷ, toán học "không thể"), gần như toàn bộ sai. Đối với lĩnh vực thay đổi nhanh, đánh cược hướng, đánh cược cơ chế, ít đánh cược số chính xác, càng cần cảnh giác loại từ nói đầy như "không thể, nhất định, khóa trần, tuyệt đối không có" – chúng là khu vực phát sinh cao bị thời gian tát vào mặt.

二、Về thời gian, ông ấy có xu hướng đánh giá cao tốc độ, đánh giá thấp mức độ. Phàm là nói "nhanh chóng, hai ba năm làm xong", thời kỳ trưởng thành phổ biến chậm hơn; nhưng đối với trần nhảy vọt năng lực lại đánh giá thấp – toán học có thể từ "không thể" đến huy chương vàng IMO, chi phí tiền tuyến có thể tăng đến quy mô năm đó không tưởng tượng được. Một câu: ngắn hạn quá lạc quan, dài hạn quá bảo thủ.

三、Sai ẩn giấu nhất, lặp lại xuất hiện ở "phân bố". Không phải hướng sai, mà là chỉ nhìn tổng lượng, bỏ qua phân bố. "Không có làn sóng thất nghiệp" đúng, nhưng tổn thương tập trung cao độ ở người mới trẻ; "giá trị rơi lớp ứng dụng" đúng một nửa, nhưng không phân biệt lớp sức mạnh tính toán và lớp mô hình. Tổng lượng đúng, che lấp thảm họa phân bố – đây là bài học đáng bổ sung nhất.

四、Chỗ để lời nói có dư địa, ba năm sau đều chịu được kiểm nghiệm. "Tin đồn" "ít nhất hiện tại" "giảm mạnh chứ không loại bỏ" "hình thái ban đầu hai ba năm, trưởng thành khoảng mười năm" – phàm là nhận định năm đó mang từ giới hạn, chia tầng lớp, hôm nay nhìn lại đều đứng vững hơn. Ngược lại câu tuyệt đối tuôn ra, dễ lật đổ nhất. Thành thật của dự đoán, một nửa ở dám nói, nửa kia ở dám đánh dấu sự không chắc chắn của mình.

五、Có một số vấn đề, ba năm căn bản không đủ. Giá trị cuối cùng quy về ai, xuất hiện có phải sự thật biến, máy cuối cùng có một chút ý thức không, ngữ cảnh dài có ăn mất RAG không – những tranh luận năm đó, đến năm 2026 vẫn là tranh luận. Có thể phân biệt "đã có câu trả lời" và "còn phải tiếp tục đợi", quan trọng hơn việc vội vàng đưa ra kết luận cho mỗi sự việc.

Wang Jianshuo ba năm trước, dựa vào trực giác trong sương mù GPT-4 chưa ra chỉ hai mươi hướng. Hôm nay đối chiếu xong, câu đáng ghi nhớ nhất có lẽ là: nhìn đúng hướng lớn thực ra không khó như vậy, khó là thừa nhận mình ở số, tốc độ và phân bố lần này đến lần khác suy nghĩ đương nhiên. Hai mươi nhận định này, thay vì nói là cho điểm quá khứ, không bằng nói là đặt vài quy tắc cho ba năm tới. Ba năm tiếp theo, năm 2029 lại đến đối một lần nữa.

Câu hỏi Liên quan

QTheo bài viết, đánh giá nào của Vương Kiến Thạc từ năm 2023 được coi là hoàn toàn chính xác trong phần 'RAG và kiến trúc truy xuất'?

AĐánh giá về hướng giải quyết tri thức và ảo giác bằng cách không sửa mô hình mà sử dụng phương pháp truy xuất vector để 'nhồi' tri thức làm 'phao cứu sinh', cùng với kiến trúc đúng là công cụ tìm kiếm thực hiện truy xuất rồi đưa kết quả cho LLM. Điều này đã trở thành tiêu chuẩn thực tế cho các sản phẩm AI, với RAG là kiến trúc mặc định cho AI doanh nghiệp.

QDự đoán nào của Vương Kiến Thạc về 'Mạng lưới robot và định vị mới' (quan điểm 9) được xác nhận là đúng về mặt xu hướng, nhưng cần điều chỉnh ở điểm nào?

AXu hướng về 'mạng lưới robot' nơi các agent tự động giao tiếp và gọi lẫn nhau bằng ngôn ngữ tự nhiên, cùng sự ra đời của một hệ thống định vị tên miền mới là đúng. Tuy nhiên, cần điều chỉnh hai điểm: (1) 'Không cần API' là không chính xác, vì các giao thức chính vẫn dựa trên schema có cấu trúc, về bản chất là một lớp tiêu chuẩn phủ trên API. (2) 'Hoàn thành trong 2-3 năm' chưa thành hiện thực; theo Gartner, đến 2026 chỉ khoảng 17% tổ chức triển khai agent thực sự.

QTrong số các đánh giá bị coi là 'sai' hoặc 'sai lệch', dự đoán nào về 'Giá trị nắm bắt' (quan điểm 8) đã bị NVIDIA chứng minh là ngược lại?

ANhận định rằng giá trị cuối cùng sẽ thuộc về tầng ứng dụng và các công ty sáng lập tầng cơ sở (làm mô hình) chưa chắc đã kiếm được lợi nhuận. Điều này bị NVIDIA chứng minh là ngược lại. NVIDIA (tầng cơ sở tính toán) có lợi nhuận ròng năm tài chính 2026 khoảng 1200 tỷ USD và định giá thị trường trên 5 nghìn tỷ, là bên thu lợi nhuận lớn duy nhất. Trong khi đó, tầng mô hình như OpenAI (dự kiến lỗ 140 tỷ năm 2026) lại giống với mô tả 'tầng cơ sở đốt tiền' của ông hơn.

QBài viết chỉ ra rằng Vương Kiến Thạc có xu hướng đánh giá quá cao tốc độ nhưng đánh giá thấp mức độ. Hãy nêu một ví dụ về việc đánh giá thấp mức độ thay đổi của khả năng AI.

AMột ví dụ điển hình là dự đoán về khả năng toán học của LLM (quan điểm 1). Ông cho rằng 'LLM học toán là không thể và cũng không cần thiết'. Tuy nhiên, đến năm 2025, các mô hình như Gemini Deep Think và OpenAI đã giành huy chương vàng IMO chỉ sử dụng ngôn ngữ tự nhiên thuần túy, không cần công cụ bên ngoài. Điều này cho thấy ông đã đánh giá thấp đáng kể mức độ tiến bộ và trần khả năng của AI trong lĩnh vực này.

QBài viết rút ra bài học gì từ việc phân tích 20 dự đoán, liên quan đến sự khác biệt giữa 'phương hướng' và 'số liệu/cường độ'?

ABài học chính là: Phương hướng và cơ chế luôn đáng tin cậy hơn nhiều so với các con số cụ thể và mức độ. Hầu hết các dự đoán về cơ chế và xu hướng (như RAG, LUI, mạng lưới robot) đều đúng. Ngược lại, những dự đoán đưa ra con số chính xác (như 100T tham số, ngưỡng 60B, chi phí 5-10 tỷ) hoặc sử dụng từ ngữ khẳng định tuyệt đối ('không thể', 'nhất định', 'tối đa') hầu như đều sai. Trong các lĩnh vực thay đổi nhanh, nên tập trung vào xu hướng và cơ chế, tránh đưa ra các con số chính xác và cảnh giác với những từ ngữ khẳng định chắc chắn.

Nội dung Liên quan

Nghiên cứu mới nhất của BIS: Stablecoin và Tương lai của Cục diện Tiền tệ Toàn cầu

BIS: Tương lai của Stablecoin và Cục diện Tiền tệ Toàn cầu Nghiên cứu mới nhất của Ngân hàng Thanh toán Quốc tế (BIS) phân tích sâu sắc tác động của stablecoin đối với hệ thống tiền tệ quốc tế. Thị trường stablecoin đã phát triển nhanh chóng, với tổng vốn hóa vượt 3000 tỷ USD vào năm 2026, bị chi phối bởi các stablecoin neo theo USD như USDT và USDC. Báo cáo nhận định stablecoin hoạt động như một hình thức trái quyền tư nhân phi tập trung của USD, mở rộng tính thanh khoản đồng đô la ra toàn cầu. Về ngắn hạn, chúng có khả năng củng cố vị thế thống trị của đồng USD. Đối với các nền kinh tế mới nổi và đang phát triển (EMDEs), stablecoin USD trở thành kênh "đô la hóa kỹ thuật số", cho phép người dân trữ giá trị và thực hiện thanh toán xuyên biên giới, từ đó có thể làm xói mòn chủ quyền tiền tệ, làm giảm hiệu quả chính sách tiền tệ và khiến các biện pháp kiểm soát vốn trở nên kém hiệu quả. Báo cáo đưa ra ba viễn cảnh tương lai: 1. **Áp dụng hạn chế (Kịch bản cơ sở):** Stablecoin chủ yếu tồn tại trong hệ sinh thái tiền mã hóa. 2. **Đô la hóa kỹ thuật số (Kịch bản rủi ro cao):** Stablecoin USD trở thành phương tiện thanh toán và dự trữ giá trị phổ biến tại các EMDEs, gây ra rủi ro nghiêm trọng cho ổn định tài chính. 3. **Tích hợp stablecoin nội tệ (Kịch bản lý tưởng):** Các EMDEs phát triển stablecoin neo theo đồng nội tệ được quản lý chặt chẽ, kết nối với hệ thống thanh toán trong nước và CBDC để tăng hiệu quả mà vẫn giữ được chủ quyền. Để quản lý những thách thức này, báo cáo nhấn mạnh sự cần thiết của việc **hài hòa tiêu chuẩn quản lý toàn cầu**, **tăng cường hợp tác xuyên biên giới**, **nâng cấp khả năng phòng thủ trong nước** (như phát triển CBDC và hệ thống thanh toán hiệu quả), và **kiểm soát các hoạt động bất hợp pháp**. Tương lai sẽ là sự cạnh tranh giữa tiền tệ pháp định, CBDC và stablecoin tư nhân, đòi hỏi sự phối hợp quốc tế để đón nhận lợi ích công nghệ trong khi vẫn bảo vệ được an toàn tài chính và chủ quyền tiền tệ.

链捕手7 phút trước

Nghiên cứu mới nhất của BIS: Stablecoin và Tương lai của Cục diện Tiền tệ Toàn cầu

链捕手7 phút trước

"Công ty một người" bùng nổ: Người kiếm trăm triệu mỗi năm, kẻ thu nhập co lại 90%

"Mô hình 'công ty một người' (One Person Company - OPC) đang trở thành xu hướng trong thời đại AI, cho phép cá nhân khởi nghiệp độc lập với chi phí thấp. Năm 2026 được coi là năm khởi đầu, với hơn 16 triệu OPC tại Trung Quốc. Tuy nhiên, thành công không phải là điều đảm bảo, với hơn 52% có thu nhập dưới 7.000 tệ/tháng. Bài viết chia sẻ câu chuyện của bốn nhà sáng lập: • **Anh Zhang (lĩnh vực game):** Phát triển 6 game tương tác bullet chat (đạn màn hình) trong một năm, doanh thu ~200 triệu tệ, thu nhập cá nhân 80-100 triệu tệ. AI đảm nhận ~70% công việc đồ họa và hỗ trợ viết code, giúp giảm chi phí sản xuất từ 2 triệu tệ xuống còn 1.000-1.500 tệ/game và rút ngắn chu kỳ phát triển từ 2-4 tháng xuống còn 15 ngày. • **Chị October (nghiên cứu vật liệu tại Nhật Bản):** Thu nhập gấp ~3 lần mức lương văn phòng trung bình, đạt ~150 triệu yên/năm. AI được sử dụng cho mọi công đoạn như dịch thuật, tư vấn pháp lý, xử lý đơn hàng. Thị trường Nhật ít cạnh tranh khốc liệt nhưng rào cản ngành và yêu cầu tín dụng rất cao. • **Anh Xiao Tao (công nghệ sinh học):** Thu nhập tăng gấp đôi so với đi làm thuê. Anh sử dụng AI Agent (như DeepSeek, Claude) để tự động hóa ~80% công việc phân tích dữ liệu và báo cáo lặp đi lặp lại, tập trung vào 20% công việc đòi hỏi phán đoán chuyên môn và giao tiếp với khách hàng. • **Anh A Yuan (thương mại điện tử xuyên biên giới):** Chuyển từ vị trí vận hành tại tập đoàn lớn (thu nhập ~6 triệu tệ/năm) sang khởi nghiệp OPC ở thị trường Mexico. AI thay thế ~60% công việc như chọn sản phẩm, tạo nội dung. Tuy nhiên, sau 2 tháng, doanh thu chỉ đạt hơn 10.000 tệ, lợi nhuận khoảng 1.000 tệ, thu nhập giảm ~90%. Anh khuyên không nên khởi nghiệp bồng bột và nhấn mạnh giá trị học hỏi thực tế từ việc tự kinh doanh. Các câu chuyện cho thấy AI là công cụ đắc lực giảm chi phí, rút ngắn thời gian và tự động hóa, nhưng không đảm bảo thành công. Yếu tố then chốt vẫn là kinh nghiệm ngành, khả năng sáng tạo, quản lý, nguồn khách hàng và hiểu biết về thị trường cụ thể. Mô hình OPC phù hợp nhất với những người có chuyên môn sẵn và nguồn lực khách hàng, chứ không phải cho người mới bắt đầu hoàn toàn."

marsbit14 phút trước

"Công ty một người" bùng nổ: Người kiếm trăm triệu mỗi năm, kẻ thu nhập co lại 90%

marsbit14 phút trước

Giải mã báo cáo của Goldman Sachs: Thiếu hụt bộ nhớ kéo dài đến năm 2028, tiếp tục mua vào

Bài báo từ Goldman Sachs nhấn mạnh rằng chu kỳ tăng trưởng bộ nhớ bán dẫn (DRAM, NAND, HBM) hiện tại sẽ kéo dài hơn dự kiến, với tình trạng thiếu hụt kéo dài đến năm 2028 do nhu cầu từ máy chủ AI, nguồn cung hạn chế và các hợp đồng dài hạn. Báo cáo nâng mục tiêu giá cổ phiếu cho Samsung Electronics, SK Hynix và nâng hạng mua cho Kioxia. Các công ty khác trong chuỗi cung ứng AI cũng được đề xuất mua, bao gồm MediaTek (chuyển đổi sang chip AI), Eoptolink (mô-đun quang), Biren (chip AI Trung Quốc), Huaqin (gia công AI), Lenovo (AI PC), cùng các công ty như GDS và VNET. Báo cáo cũng đề cập đến các lĩnh vực khác như bất động sản Trung Quốc (trong kịch bản lạc quan), BYD (xe thông minh), thiết bị bán dẫn Nhật Bản và Panasonic. Một chủ đề vĩ mô được nêu bật là sự va chạm giữa đầu tư AI bùng nổ và khủng hoảng năng lượng, có lợi cho các nước xuất khẩu công nghệ. Lưu ý quan trọng: Tất cả xếp hạng và dự báo là quan điểm của nhà phân tích Goldman Sachs, không phải lời khuyên đầu tư. Độc giả nên tập trung vào logic tổng thể và các giả định đằng sau báo cáo.

marsbit49 phút trước

Giải mã báo cáo của Goldman Sachs: Thiếu hụt bộ nhớ kéo dài đến năm 2028, tiếp tục mua vào

marsbit49 phút trước

Phân Tích Chi Tiết Chiến Thuật Đầu Tư Thần Thánh Của Mộc Đầu Tỷ Vào Circle

Bài viết phân tích chiến lược đầu tư xuất sắc của Cathie Wood (còn gọi là "chị gỗ") vào cổ phiếu Circle (CRCL), một công ty phát hành stablecoin USDC. Chiến lược bao gồm ba bước chính: (1) **Mua cổ phần với giá phát hành (IPO)** - ARK đã đăng ký mua trước, sở hữu 4.49 triệu cổ phiếu với giá 31 USD/CP trước khi niêm yết, hưởng lợi từ việc giá tăng vọt 168% trong ngày đầu giao dịch. (2) **Bán ra ở vùng giá cao** - Khi giá tăng lên khoảng 210 USD nhờ tin tức về dự luật stablecoin (GENIUS Act), ARK đã bán khoảng 1.7 triệu cổ phiếu để chốt lời, một phần do kỷ luật tái cân bằng danh mục. (3) **Mua lại ở vùng giá thấp** - Khi giá giảm mạnh (từ đỉnh 299 USD xuống dưới 90 USD) do áp lực từ việc cổ phiếu được giải tỏa và lo ngại về lãi suất, ARK đã mua lại dần, khôi phục vị thế về khoảng 4.5 triệu cổ phiếu. Bài học chính: Chiến lược thành công dựa trên **niềm tin vững chắc vào mô hình kinh doanh dài hạn** của Circle, **thực hiện giao dịch theo từng đợt** (không cố bắt đỉnh/đáy), và tuân thủ **kỷ luật quản lý danh mục** nghiêm ngặt (như quy tắc tái cân bằng khi một cổ phiếu vượt 10%). Đối với nhà đầu tư cá nhân, việc "đuổi theo" đợt tăng giá mạnh lúc IPO thường rất rủi ro.

marsbit51 phút trước

Phân Tích Chi Tiết Chiến Thuật Đầu Tư Thần Thánh Của Mộc Đầu Tỷ Vào Circle

marsbit51 phút trước

Báo Buổi Sáng | Michael Saylor Cập Nhật Thông Tin Bitcoin Tracker; Aave Công Bố Điều Tra Sự Kiện Tấn Công Cầu Kelp rsETH; Gravity Bridge Tạm Ngừng Dịch Vụ Sau Khi Bị Tấn Công

Dưới đây là tóm tắt những tin tức chính về tiền điện tử và blockchain trong 24 giờ qua: **Tin tức quan trọng:** * **Quy định & Chấp thuận:** Công ty tài sản số Laser Digital nhận được phê chuẩn có điều kiện từ OCC để thành lập một ngân hàng ủy thác liên bang. Việt Nam đang xem xét cho phép doanh nghiệp vừa và nhỏ dùng tài sản số, tài sản ảo làm tài sản thế chấp cho vay ngân hàng. * **Sự cố bảo mật:** Gravity Bridge thuộc hệ sinh thái Cosmos đã bị tấn công và tạm dừng dịch vụ. Aave đã công bố báo cáo điều tra sau sự cố tấn công vào cầu Kelp rsETH, nhấn mạnh lỗ hổng nằm ở cơ sở hạ tầng cầu của bên thứ ba. * **Thị trường & Cá nhân:** Chủ tịch Ủy ban Chứng khoán Hồng Kông cho biết khối lượng giao dịch trên 12 nền tảng tài sản ảo được cấp phép trong quý I/2026 tăng gần gấp ba lần. Michael Saylor tiếp tục đăng thông tin về Bitcoin Tracker, dự kiến công bố dữ liệu mua vào trong tuần tới. * **Quan điểm & Pháp lý:** Cố vấn Cục Dự trữ Liên bang Mỹ (Fed) Christopher Waller nhận định sự phổ biến của stablecoin có thể khuếch đại tầm ảnh hưởng chính sách của Fed. Một vụ án tại Trung Quốc xác định Bitcoin là tài sản có giá trị và kết án tù một đối tượng vì đánh cắp 107 BTC. SEC Mỹ đã khởi kiện người sáng lập Privvy về một vụ lừa đảo tiền điện tử trị giá 12,3 triệu USD. * **Phân tích thị trường:** Santiment chỉ ra tỷ lệ Long/Short Bitcoin đạt mức cao nhất trong năm, cảnh báo có thể điều chỉnh ngắn hạn. Tâm lý thị trường xung quanh Ethereum đã chuyển từ FOMO sang FUD. **Meme Token nổi bật (24h):** * **Ethereum:** HEX, SHIB, LINK, PEPE, UNI. * **Solana:** TROLL, WORLDCUP, neet, Buttcoin, PBTC. * **Base:** toby, ELSA, cbETH, CYPR, ALB. **Bài viết đáng chú ý:** Một bài viết nhìn lại các dự đoán về ChatGPT từ năm 2023 sau ba năm phát triển của AI.

链捕手1 giờ trước

Báo Buổi Sáng | Michael Saylor Cập Nhật Thông Tin Bitcoin Tracker; Aave Công Bố Điều Tra Sự Kiện Tấn Công Cầu Kelp rsETH; Gravity Bridge Tạm Ngừng Dịch Vụ Sau Khi Bị Tấn Công

链捕手1 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片