Nguồn tin nội bộ: DeepSeek đang thành lập nhóm Harness, đối đầu với Claude Code

链捕手Xuất bản vào 2026-05-22Cập nhật gần nhất vào 2026-05-22

Tóm tắt

Theo nguồn tin thân cận với DeepSeek, công ty này đang tổ chức một đội ngũ mới có tên "Harness" để phát triển sản phẩm trợ lý mã nguồn thông minh, trực tiếp đối đầu với Claude Code của Anthropic. Thông tin được xác nhận bởi nhà nghiên cứu kỳ cựu Trần Đức Lý thông qua mạng xã hội. DeepSeek đang tuyển dụng hai vị trí then chốt: Quản lý sản phẩm Harness và Kỹ sư phát triển Harness tại Bắc Kinh. Điều đáng chú ý là họ định nghĩa công thức cốt lõi: "Mô hình + Harness = Tác tử (Agent)". Điều này cho thấy DeepSeek không chỉ đơn thuần tạo một plugin trợ lý mã nguồn, mà đang bổ sung lớp trung gian kết nối mô hình với quy trình công việc thực tế, bao gồm quản lý ngữ cảnh, gọi công cụ, lập kế hoạch, đọc/ghi tệp và thực thi lệnh. Bài viết phân tích rằng cuộc cạnh tranh AI trong lập trình đang chuyển từ khả năng mô hình sang việc chiếm lĩnh luồng công việc của nhà phát triển. Mặc dù DeepSeek đã có nền tảng mô hình mã nguồn mạnh (DeepSeek-Coder), họ cần một sản phẩm chính thức tích hợp sâu vào quy trình làm việc. Sự nổi lên của dự án cộng đồng DeepSeek-TUI - một tác tử mã nguồn chạy trên terminal - chứng tỏ nhu cầu thị trường và sự thiếu vắng một giải pháp Harness chính thức. Harness chính thức từ DeepSeek sẽ có lợi thế mà dự án cộng đồng không có: khả năng cộng tác với đội ngũ mô hình, thiết kế giao diện, vòng lặp dữ liệu huấn luyện khép kín và tiếp cận các tình huống công việc thực tế. Động thái này đánh dấu việc DeepSeek chính thức tham gia vào "cuộc chiến Tác tử", trang bị cho mô hìn...

Tác giả | Vương Bác, Giáp Tử Quang Niên

"Giáp Tử Quang Niên" nhận được thông tin từ nguồn tin gần gũi với DeepSeek, rằng DeepSeek đang tổ chức nội bộ một nhóm Harness mới, hướng đến sản phẩm trí tuệ nhân tạo về mã nguồn, đối đầu nội bộ với Claude Code của Anthropic.

Nhà nghiên cứu kỳ cựu của DeepSeek, Trần Đức Lý, gần đây cũng đăng thông tin trên mạng xã hội xác nhận sự việc này, anh ấy nói "DeepSeek đang tổ chức một nhóm Harness mới để làm sản phẩm và nghiên cứu về hướng Harness", và thẳng thắn nói "Nói đơn giản là đối đầu với Claude Code, làm DeepSeek Code Harness".

Đây không phải là một đợt tuyển dụng thông thường.

Thông tin tuyển dụng cho thấy, DeepSeek lần này mở ra hai vị trí then chốt: Quản lý sản phẩm HarnessKỹ sư phát triển Harness, địa điểm làm việc hiện tại chỉ giới hạn ở Bắc Kinh. Văn phòng của DeepSeek ở Bắc Kinh nằm tại Trung tâm Thông tin Rongke, quận Hải Điện, rất gần với Đại học Bắc Kinh và Đại học Thanh Hoa. Trong cách nói chính thức, nơi đây nằm ở "Vành đai đổi mới AI Bắc Kinh - Trương Gia Khẩu trăm năm", còn trong cách nói dân gian, nơi đây cũng nằm trong khu vực "Vương Huệ Văn" đang rất nổi gần đây.

Định nghĩa cốt lõi: Model + Harness = Agent

Trong mô tả vị trí, một công thức cốt lõi được đặt ở vị trí nổi bật nhất:

Câu nói này gần như có thể coi là định nghĩa nội bộ của DeepSeek về con đường sản phẩm hóa giai đoạn tiếp theo: bản thân mô hình chỉ là nền tảng của Agent, phần ngoài mô hình như quản lý ngữ cảnh, gọi công cụ, lập kế hoạch nhiệm vụ, đọc ghi tệp, sửa đổi mã, thực thi terminal, thu hồi phản hồi, vòng lặp đánh giá, mới là phần then chốt để Agent thực sự có thể đi vào quy trình công việc.

Thông tin tuyển dụng viết thêm: "Chúng tôi đang chuyển hóa khả năng mô hình tiên phong của DeepSeek thành sản phẩm Agent hàng đầu. Tất cả công việc ngoài bản thân mô hình đều thuộc phạm vi của Harness." Ngoài ra, vị trí này sẽ tham gia toàn bộ quá trình của "sản phẩm Agent phiên bản desktop của DeepSeek" và "định nghĩa sự hiểu biết của DeepSeek về Harness".

"Giáp Tử Quang Niên" phân tích, DeepSeek không đơn giản muốn làm một plugin trợ lý viết mã, mà là đang bổ sung lớp trung gian để mô hình thông suốt đến quy trình công việc thực tế.

Một năm qua, ngành công nghiệp đã chứng minh: khả năng về mã mạnh, không có nghĩa là nhà phát triển sẽ thực sự sử dụng; mô hình có thể viết mã, cũng không có nghĩa là nó có thể liên tục hoàn thành một nhiệm vụ kỹ thuật.

Thứ thực sự thay đổi cách làm việc của nhà phát triển, không phải là mô hình Claude riêng lẻ, mà là Claude Code; không phải là mô hình GPT riêng lẻ, mà là Codex; không phải là một câu trả lời mã trong khung chat, mà là một trí tuệ nhân tạo kỹ thuật có thể đi vào terminal, hiểu dự án, đọc ghi tệp, chạy lệnh, sửa lỗi, quản lý Git, gọi công cụ.

Trước đây, DeepSeek mạnh nhất là về mô hình. Bây giờ, nó bắt đầu bổ sung lớp "tay" trên mô hình đó.

Một. Tại sao DeepSeek nhấn mạnh Harness?

Trong ngữ cảnh sản phẩm AI truyền thống, "trợ lý viết mã" thường có nghĩa là hai loại sản phẩm: một là plugin tự động hoàn thành trong IDE, hai là hỏi đáp mã trong khung chat.

Nhưng từ lặp đi lặp lại trong đợt tuyển dụng này của DeepSeek không phải là Code Assistant, mà là Harness.

Harness vốn trong ngữ cảnh kỹ thuật chỉ "khung kiểm tra" hoặc "khung chạy", đặt trong ngữ cảnh Agent, nó gần giống hơn với một hệ thống bên ngoài giúp mô hình thực sự hành động. Mô hình chịu trách nhiệm hiểu, suy luận và tạo ra, Harness chịu trách nhiệm kết nối những khả năng này vào môi trường thực tế.

Mô tả vị trí đề cập, vai trò này cần lập kế hoạch lộ trình sản phẩm Harness của DeepSeek, kết nối nhà nghiên cứu, kỹ sư, cộng đồng mã nguồn mở với người dùng cuối, và giao tiếp sâu với nhà nghiên cứu của nhóm huấn luyện mô hình, thực hiện sự tiến hóa chung của mô hình và Harness.

Câu nói này rất quan trọng.

Nó cho thấy những gì DeepSeek muốn làm không chỉ là bọc một lớp vỏ cho mô hình hiện có, mà là biến bản thân sản phẩm Agent thành một phần của quá trình tiến hóa mô hình. Trước đây, logic sản phẩm phổ biến của các công ty mô hình lớn là: nhóm nghiên cứu trước tiên huấn luyện một mô hình, nhóm sản phẩm sau đó dựa trên khả năng mô hình để làm ứng dụng. Nhưng trong thời đại Agent, trình tự này đang bị phá vỡ. Sản phẩm không còn chỉ là đầu ra của khả năng mô hình, mà là nơi huấn luyện khả năng mô hình.

Một Agent mã trong dự án thực tế thất bại, có thể không phải là vấn đề tương tác sản phẩm, mà là cách thức nén ngữ cảnh dài của mô hình không đúng; có thể không phải là vấn đề chuỗi gọi công cụ, mà là chiến lược phân giải nhiệm vụ của mô hình không ổn định; cũng có thể không phải là khả năng mã không đủ, mà là nó thiếu sự hiểu biết liên tục về ràng buộc kỹ thuật, phản hồi kiểm tra và ý định người dùng.

Vì vậy, giá trị của nhóm Harness không chỉ là "làm sản phẩm", mà là biến nhiệm vụ phát triển thực tế thành nguồn phản hồi cho sự tiến hóa liên tục của mô hình.

Hai. Tại sao DeepSeek phải bổ sung Code Harness?

DeepSeek đã sớm đặt cược vào khả năng về mã. Từ DeepSeek-Coder đến DeepSeek-Coder-V2, sự đầu tư của DeepSeek vào mô hình mã liên tục được tăng cường, hỗ trợ ngôn ngữ, độ dài ngữ cảnh và khả năng nhiệm vụ phức tạp không ngừng được nâng cao. Vấn đề của nó không phải là không có khả năng về mã, mà là trước đây phần khả năng này chủ yếu dừng lại ở lớp mô hình, chưa biến thành sản phẩm tần suất cao trong quy trình công việc hàng ngày của nhà phát triển.

Sự nổi tiếng của Claude Code đã chứng minh một điều: Cạnh tranh AI Coding đang chuyển từ cạnh tranh khả năng mô hình, sang cạnh tranh cửa ngõ vào quy trình công việc của nhà phát triển.

Đây cũng là bài học mà DeepSeek hiện tại phải bổ sung. Tinh tế hơn, trước khi DeepSeek chính thức ra tay, cộng đồng nhà phát triển đã thay nó làm một phiên bản "Claude Code phiên bản DeepSeek".

Một dự án mã nguồn mở tên là DeepSeek-TUI trước đó đã nổi tiếng trong cộng đồng nhà phát triển. Nó là một coding agent chạy trong terminal, có thể đọc ghi tệp, thực thi lệnh Shell, tìm kiếm web, quản lý Git, và thông qua giao diện TUI để phối hợp các sub-agent.

Sự nổi tiếng của DeepSeek-TUI nói lên hai vấn đề:

  1. Tâm trí cơ bản đã trưởng thành: Mô hình DeepSeek trong tâm trí nhà phát triển đã có nền tảng để làm Agent mã. Nếu không cộng đồng sẽ không tự nhiên mọc ra sản phẩm kiểu Claude Code xung quanh nó.

  2. Sự thiếu hụt ở cấp độ chính thức: DeepSeek thiếu không phải là sự chú ý về mô hình, mà là Harness chính thức.

Trong mắt nhà phát triển, sức hấp dẫn của DeepSeek-TUI rất trực tiếp: chi phí thấp, có thể sử dụng trong nước, ngữ cảnh dài, ngưỡng triển khai tương đối thấp. Nhiều nhà phát triển trong nước không phải không muốn dùng Claude Code, mà là bị hạn chế bởi giá cả, ổn định truy cập, hệ thống tài khoản và tuân thủ doanh nghiệp.

Nhưng dự án cộng đồng cũng có ranh giới tự nhiên:

  • Một dự án mã nguồn mở của bên thứ ba dù có tích cực đến đâu, cũng rất khó thực sự nắm bắt nhịp độ tiến hóa nội bộ của mô hình;

  • Nó có thể làm thích ứng xung quanh API, nhưng không thể quyết định ngược lại mô hình sẽ được huấn luyện như thế nào;

  • Nó có thể làm prompt, chuỗi công cụ và tối ưu hóa tương tác, nhưng rất khó đưa phản hồi nhiệm vụ thực tế với số lượng lớn vào cải tiến mô hình một cách có hệ thống.

Ý nghĩa của Harness chính thức nằm chính xác ở đây.

DeepSeek tự làm Code Harness, nó có một số lợi thế mà dự án cộng đồng không có: hợp tác nhóm mô hình, quyền thiết kế giao diện, vòng lặp dữ liệu huấn luyện, cảnh nhiệm vụ thực tế nội bộ, và khả năng vận hành lâu dài hệ sinh thái nhà phát triển.

Cộng đồng mã nguồn mở đã dọn đường trước: nhà phát triển thực sự cần một phiên bản Claude Code của DeepSeek. Bây giờ, DeepSeek muốn thu hồi con đường này, biến nó thành sản phẩm chính thức của mình.

Và việc DeepSeek chính thức bắt đầu tuyển người, có nghĩa là cuối cùng nó đã chuẩn bị tự mình xuống sân.

Trần Đức Lý vào tháng 11 năm ngoái tại Hội nghị Thế giới Internet Ô Trấn 2025 đã đề cập: "Một lợi thế cốt lõi của công ty chúng tôi là chủ nghĩa dài hạn, kiên trì làm chủ tuyến đột phá trí tuệ tiên phong. Trong quá trình này, chúng tôi cũng từ bỏ nhiều việc trên các tuyến phụ, không làm những việc ngắn hạn, nhanh chóng trên tuyến phụ."

Sau chiến tranh mô hình, cuộc chiến Agent thực sự đã bắt đầu. Lần này DeepSeek cần bổ sung là lớp then chốt nhất từ mô hình đến hành động - Harness.

DeepSeek đang lắp đôi tay cho mô hình của mình.

Câu hỏi Liên quan

QĐội ngũ Harness mà DeepSeek đang xây dựng có mục tiêu cụ thể là gì?

ADeepSeek đang xây dựng đội ngũ Harness mới với hướng phát triển sản phẩm tác nhân thông minh về mã nguồn (code agent), đối trực tiếp với Claude Code của Anthropic. Mục tiêu là biến khả năng mô hình tiên tiến thành sản phẩm Agent dẫn đầu, bổ sung lớp trung gian để mô hình có thể thâm nhập vào quy trình công việc thực tế của nhà phát triển.

QTại sao bài viết lại nhấn mạnh thuật ngữ 'Harness' thay vì 'Trợ lý mã nguồn' (Code Assistant)?

ABài viết nhấn mạnh 'Harness' vì nó không chỉ đơn thuần là một công cụ bổ trợ hoặc hộp chat trả lời code. Trong ngữ cảnh Agent, Harness ám chỉ một hệ thống bên ngoài giúp mô hình thực sự hành động - quản lý ngữ cảnh, gọi công cụ, lập kế hoạch tác vụ, đọc ghi file, sửa code, thực thi terminal, thu hồi phản hồi và đóng vòng đánh giá. Đây là phần then chốt biến một mô hình thành một tác nhân có thể vào quy trình làm việc.

QCông thức cốt lõi 'Model + Harness = Agent' được đề cập có ý nghĩa gì đối với chiến lược của DeepSeek?

ACông thức 'Model + Harness = Agent' được đặt ở vị trí nổi bật trong mô tả tuyển dụng, cho thấy định nghĩa nội bộ của DeepSeek về lộ trình sản phẩm hóa giai đoạn tới. Nó khẳng định mô hình chỉ là nền tảng của Agent, còn phần Harness (mọi công việc ngoài mô hình) mới là chìa khóa để Agent thâm nhập quy trình công việc. Điều này cho thấy DeepSeek không chỉ đơn giản đóng gói mô hình hiện có, mà muốn biến chính sản phẩm Agent thành một phần của quá trình tiến hóa mô hình, tạo ra vòng phản hồi đóng giữa sản phẩm và nghiên cứu.

QSự nổi lên của dự án cộng đồng DeepSeek-TUI cho thấy điều gì về nhu cầu thị trường và vị thế của DeepSeek?

ASự nổi lên của dự án cộng đồng mã nguồn mở DeepSeek-TUI (một phiên bản 'Claude Code' chạy trên terminal sử dụng mô hình DeepSeek) chứng tỏ hai điều: 1) Tâm trí nhà phát triển đã chấp nhận mô hình DeepSeek có đủ nền tảng để làm code agent. 2) Tồn tại khoảng trống ở cấp độ chính thức (official Harness). Điều này cho thấy nhu cầu rõ ràng cho một sản phẩm Code Harness chính thức từ DeepSeek, đáp ứng nhu cầu của thị trường trong nước về chi phí, khả năng truy cập, độ dài ngữ cảnh và sự phù hợp về quy định.

QLợi thế của một Harness chính thức từ DeepSeek so với các dự án cộng đồng là gì?

AHarness chính thức từ DeepSeek sở hữu nhiều lợi thế mà dự án cộng đồng khó đạt được: Khả năng hợp tác chặt chẽ với đội ngũ phát triển mô hình, quyền thiết kế giao diện lập trình ứng dụng (API), vòng lặp dữ liệu huấn luyện khép kín, tiếp cận các kịch bản tác vụ thực tế nội bộ, và năng lực vận hành lâu dài hệ sinh thái nhà phát triển. Điều này cho phép DeepSeek không chỉ tối ưu hóa prompt và công cụ, mà còn có thể đưa phản hồi từ hàng loạt tác vụ thực tế vào cải tiến mô hình một cách có hệ thống.

Nội dung Liên quan

PA Hình ảnh | Một hình ảnh hiểu rõ các sự kiện Web3 đáng chú ý trong tháng 6

Bản tóm tắt sự kiện Web3 đáng chú ý tháng 6: Thị trường tiền mã hóa tháng 6 tập trung vào các yếu tố chính: dữ liệu kinh tế vĩ mô của Mỹ (như CPI, phi nông nghiệp), quyết định lãi suất từ Cục Dự trữ Liên bang Mỹ (FOMC), Ngân hàng Trung ương Châu Âu và Ngân hàng Nhật Bản, tiếp tục ảnh hưởng đến kỳ vọng thanh khoản và tâm lý thị trường. Một số dự án như SUI, ENA sẽ có đợt mở khóa token, cần lưu ý rủi ro tiềm ẩn. Về tin tức sản phẩm, Coinbase dự kiến ra mắt hợp đồng tương lai chỉ số chứng khoán, trong khi CME Group lên kế hoạch cho hợp đồng tương lai chỉ số tiền mã hóa Nasdaq. Tình trạng thanh lý dự án vẫn tiếp diễn, với các dịch vụ như trình duyệt Bitcoin Ordinals (Ord.io) ngừng hoạt động, người dùng cần chú ý đến việc rút và di chuyển tài sản. Các sự kiện công nghệ và truyền thống đáng chú ý khác bao gồm World Cup, Hội nghị Nhà phát triển Toàn cầu của Apple (WWDC26), SpaceX lên sàn chứng khoán, và thượng hội IPO của công ty robot Unitree. Tóm lại, tháng 6 hứa hẹn tiếp tục là giai đoạn thị trường tìm kiếm phương hướng mới dưới tác động của kỳ vọng thanh khoản, biến động chính sách và sự luân chuyển trong hệ sinh thái.

marsbit1 giờ trước

PA Hình ảnh | Một hình ảnh hiểu rõ các sự kiện Web3 đáng chú ý trong tháng 6

marsbit1 giờ trước

Alibaba 'Bán Hàng', ByteDance 'Luyện Công'

Tuần cuối tháng 5, hai sự kiện AI liền kề đã phơi bày hai cách tiếp cận khác biệt của các gã khổng lồ công nghệ Trung Quốc. Alibaba tập trung vào tích hợp và thương mại hóa AI. Họ kết nối ứng dụng Qwen với Taobao, cho phép mua sắm và sử dụng các tính năng AI như thử đồ, so giá. Tổ chức được tái cấu trúc để tập trung vào AI, với động lực rõ ràng từ thị trường vốn. Doanh thu bên ngoài của Alibaba Cloud tăng 40%, cho thấy chiến lược "lắp AI vào quầy thu ngân" đang tạo ra dòng tiền. Tuy nhiên, cách tiếp cận thực dụng này có thể đi kèm rủi ro nếu có sự chênh lệch lớn về năng lực mô hình nền trong tương lai. Ngược lại, ByteDance theo đuổi giới hạn công nghệ thông qua bộ phận Seed. Họ đạt được thành tích đỉnh cao với mô hình tạo video Seedance 2.0 và đầu tư mạnh vào nghiên cứu cơ bản, thu hút nhân tài với các mục tiêu thuần túy học thuật. Ngân sách vốn (capex) của ByteDance được báo cáo là tăng vọt, lên tới 4700 tỷ NDT vào năm 2026, được tài trợ chủ yếu từ lợi nhuận. Lợi thế lớn của họ là không bị áp lực thị trường công khai, cho phép tập trung vào nghiên cứu dài hạn. Bài viết chỉ ra rằng sự khác biệt chiến lược này không chỉ là triết lý, mà chủ yếu bị chi phối bởi việc công ty có niêm yết hay không. Các công ty đại chúng như Alibaba chịu áp lực phải thể hiện kết quả tài chính ngắn hạn, dẫn đến chiến lược "bán AI". Các công ty chưa niêm yết như ByteDance có "sự xa xỉ" để "làm AI" và tập trung vào đột phá công nghệ. Tương lai của con đường nghiên cứu dài hạn tại ByteDance có thể được kiểm chứng nếu công ty này tiến hành IPO.

marsbit1 giờ trước

Alibaba 'Bán Hàng', ByteDance 'Luyện Công'

marsbit1 giờ trước

Tại sao nhiều AI Agent hơn không đồng nghĩa với năng suất cao hơn?

Biên tập viên: Khi AI Agent ngày càng rẻ và dễ gọi, phát triển phần mềm đang bước vào giai đoạn mới. Vấn đề không còn là có thể chạy nhiều Agent hơn hay không, mà là liệu con người có đủ sự chú ý để quản lý, đánh giá và hợp nhất đầu ra của chúng hay không. Bài viết giới thiệu khái niệm "thuế điều phối". Chi phí khởi chạy Agent rất thấp, chỉ cần một Prompt hoặc một cú nhấp chuột. Nhưng các bước tiếp theo mới thực sự đắt đỏ: kiểm tra kết quả, hiểu tác động đến kiến trúc hệ thống, xử lý xung đột giữa các Agent, và quyết định mã nào được đưa vào nhánh chính. Những công việc này không thể song song hóa đơn giản, mà vẫn phải quay về một tài nguyên tuần tự duy nhất: khả năng phán đoán của con người. Tác giả ví nhà phát triển như "GIL" trong hệ thống AI Agent - khóa luồng đơn hạn chế thông lượng cuối cùng của hệ thống đồng thời. Nhiều Agent có thể chạy cùng lúc, nhưng một khi bước vào giai đoạn đánh giá kiến trúc, xem xét mã và hợp nhất xung đột, chúng phải đi qua bộ não của nhà phát triển. Do đó, càng nhiều Agent không nhất thiết có nghĩa là sản lượng cao hơn, mà có thể chỉ làm cho hàng đợi công việc chờ xem xét dài hơn, khiến nhà phát triển mệt mỏi vì chuyển đổi ngữ cảnh liên tục. Điều dễ bị bỏ qua trong cơn sốt công cụ lập trình AI hiện nay là cảm giác hiệu quả không phải lúc nào cũng đồng nghĩa với năng suất thực. Một bảng điều khiển đầy Agent đang chạy tạo ra ảo giác "năng suất cao", nhưng nếu nhà phát triển không thực sự hiểu, xem xét và tích hợp các thay đổi, hệ thống cuối cùng tích lũy có thể là nợ kỹ thuật và nợ nhận thức. Vì vậy, bài viết thảo luận về "cách thiết kế lại quy trình làm việc xoay quanh sự chú ý của con người". Trong thời đại Agent, năng lực then chốt không chỉ là biết đặt câu hỏi và phân công nhiệm vụ, mà là biết nhiệm vụ nào có thể giao cho máy móc xử lý song song, nhiệm vụ nào phải dành cho con người đánh giá; khi nào nên xem xét hàng loạt, khi nào nên dừng điều phối để tập trung lại vào một vấn đề cốt lõi. AI đang mở rộng khả năng xử lý đồng thời trong sản xuất phần mềm, nhưng sự chú ý của con người vẫn là tài nguyên khan hiếm và không thể nhân bản nhất trong hệ thống. Một quy trình làm việc với Agent thực sự trưởng thành không phải là ném mọi nhiệm vụ cho máy móc, mà là thiết kế kiến trúc sự chú ý của chính mình một cách cẩn thận, giống như thiết kế một hệ thống sản xuất.

marsbit2 giờ trước

Tại sao nhiều AI Agent hơn không đồng nghĩa với năng suất cao hơn?

marsbit2 giờ trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

**Tóm tắt tiếng Việt:** Năm 2026, tác giả Vương Kiến Thạc nhìn lại 20 dự đoán của mình về ChatGPT từ năm 2023, sử dụng AI (41 agent Opus 4.8) để đối chiếu với dữ liệu thực tế. **Kết quả chính:** Phần lớn các dự đoán về **cơ chế và xu hướng** là đúng: * **Đúng:** Kiến trúc RAG + tìm kiếm trở thành chuẩn để giảm ảo giác. LUI (Giao diện ngôn ngữ tự nhiên) tạo ra một "lục địa mới" cho tương tác máy tính. Mạng lưới agent với giao thức kết nối mới đang hình thành. Trung Quốc thu hẹp khoảng cách về mô hình lớn có thể sử dụng. ChatGPT không có ý thức, vượt qua bài kiểm tra Turing nhờ biểu diễn. Nó là bước tiến lớn nhưng chưa phải AGI, chưa gây ra làn sóng thất nghiệp hàng loạt. * **Sai/Sai một phần:** Dự đoán cụ thể **GPT-4 có 100 nghìn tỷ tham số** là sai hoàn toàn (thực tế ~1.8 nghìn tỷ). Nhận định **LLM không thể tự học toán** bị bác bỏ khi các mô hình giành huy chương IMO. **Giá trị sẽ thuộc về lớp ứng dụng** bị chứng minh ngược lại khi lợi nhuận khổng lồ thuộc về lớp nền tảng tính toán (như NVIDIA). **AI có thể né tránh vấn đề bản quyền** là sai, với các vụ kiện và khoản bồi thường lớn. Dự đoán **chi phí đào tạo mô hình lớn chỉ 5-10 tỷ USD** là quá thấp so với thực tế. **Bài học rút ra:** 1. **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể hay mức độ tuyệt đối.** 2. **Có xu hướng đánh giá quá cao tốc độ thay đổi trong ngắn hạn, nhưng lại đánh giá thấp mức độ thay đổi trong dài hạn.** 3. **Sai lầm tinh vi thường nằm ở "sự phân bố":** tổng thể đúng nhưng tác động không đồng đều (ví dụ: việc làm). 4. **Những phát biểu có giới hạn, thận trọng thường đứng vững theo thời gian.** 5. **Ba năm là chưa đủ để kết luận cho một số vấn đề sâu xa** (như ý thức máy móc, sự xuất hiện năng lực). Bài viết kết luận rằng việc nhìn đúng hướng đi lớn không quá khó, nhưng thừa nhận những sai lầm trong ước tính chi tiết, tốc độ và phân bố mới là điều đáng ghi nhớ cho những dự đoán trong tương lai.

marsbit9 giờ trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

marsbit9 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片