Nguồn tin nội bộ: DeepSeek đang thành lập nhóm Harness, đối đầu với Claude Code

链捕手Xuất bản vào 2026-05-22Cập nhật gần nhất vào 2026-05-22

Tóm tắt

Theo nguồn tin thân cận với DeepSeek, công ty này đang tổ chức một đội ngũ mới có tên "Harness" để phát triển sản phẩm trợ lý mã nguồn thông minh, trực tiếp đối đầu với Claude Code của Anthropic. Thông tin được xác nhận bởi nhà nghiên cứu kỳ cựu Trần Đức Lý thông qua mạng xã hội. DeepSeek đang tuyển dụng hai vị trí then chốt: Quản lý sản phẩm Harness và Kỹ sư phát triển Harness tại Bắc Kinh. Điều đáng chú ý là họ định nghĩa công thức cốt lõi: "Mô hình + Harness = Tác tử (Agent)". Điều này cho thấy DeepSeek không chỉ đơn thuần tạo một plugin trợ lý mã nguồn, mà đang bổ sung lớp trung gian kết nối mô hình với quy trình công việc thực tế, bao gồm quản lý ngữ cảnh, gọi công cụ, lập kế hoạch, đọc/ghi tệp và thực thi lệnh. Bài viết phân tích rằng cuộc cạnh tranh AI trong lập trình đang chuyển từ khả năng mô hình sang việc chiếm lĩnh luồng công việc của nhà phát triển. Mặc dù DeepSeek đã có nền tảng mô hình mã nguồn mạnh (DeepSeek-Coder), họ cần một sản phẩm chính thức tích hợp sâu vào quy trình làm việc. Sự nổi lên của dự án cộng đồng DeepSeek-TUI - một tác tử mã nguồn chạy trên terminal - chứng tỏ nhu cầu thị trường và sự thiếu vắng một giải pháp Harness chính thức. Harness chính thức từ DeepSeek sẽ có lợi thế mà dự án cộng đồng không có: khả năng cộng tác với đội ngũ mô hình, thiết kế giao diện, vòng lặp dữ liệu huấn luyện khép kín và tiếp cận các tình huống công việc thực tế. Động thái này đánh dấu việc DeepSeek chính thức tham gia vào "cuộc chiến Tác tử", trang bị cho mô hìn...

Tác giả | Vương Bác, Giáp Tử Quang Niên

"Giáp Tử Quang Niên" nhận được thông tin từ nguồn tin gần gũi với DeepSeek, rằng DeepSeek đang tổ chức nội bộ một nhóm Harness mới, hướng đến sản phẩm trí tuệ nhân tạo về mã nguồn, đối đầu nội bộ với Claude Code của Anthropic.

Nhà nghiên cứu kỳ cựu của DeepSeek, Trần Đức Lý, gần đây cũng đăng thông tin trên mạng xã hội xác nhận sự việc này, anh ấy nói "DeepSeek đang tổ chức một nhóm Harness mới để làm sản phẩm và nghiên cứu về hướng Harness", và thẳng thắn nói "Nói đơn giản là đối đầu với Claude Code, làm DeepSeek Code Harness".

Đây không phải là một đợt tuyển dụng thông thường.

Thông tin tuyển dụng cho thấy, DeepSeek lần này mở ra hai vị trí then chốt: Quản lý sản phẩm HarnessKỹ sư phát triển Harness, địa điểm làm việc hiện tại chỉ giới hạn ở Bắc Kinh. Văn phòng của DeepSeek ở Bắc Kinh nằm tại Trung tâm Thông tin Rongke, quận Hải Điện, rất gần với Đại học Bắc Kinh và Đại học Thanh Hoa. Trong cách nói chính thức, nơi đây nằm ở "Vành đai đổi mới AI Bắc Kinh - Trương Gia Khẩu trăm năm", còn trong cách nói dân gian, nơi đây cũng nằm trong khu vực "Vương Huệ Văn" đang rất nổi gần đây.

Định nghĩa cốt lõi: Model + Harness = Agent

Trong mô tả vị trí, một công thức cốt lõi được đặt ở vị trí nổi bật nhất:

Câu nói này gần như có thể coi là định nghĩa nội bộ của DeepSeek về con đường sản phẩm hóa giai đoạn tiếp theo: bản thân mô hình chỉ là nền tảng của Agent, phần ngoài mô hình như quản lý ngữ cảnh, gọi công cụ, lập kế hoạch nhiệm vụ, đọc ghi tệp, sửa đổi mã, thực thi terminal, thu hồi phản hồi, vòng lặp đánh giá, mới là phần then chốt để Agent thực sự có thể đi vào quy trình công việc.

Thông tin tuyển dụng viết thêm: "Chúng tôi đang chuyển hóa khả năng mô hình tiên phong của DeepSeek thành sản phẩm Agent hàng đầu. Tất cả công việc ngoài bản thân mô hình đều thuộc phạm vi của Harness." Ngoài ra, vị trí này sẽ tham gia toàn bộ quá trình của "sản phẩm Agent phiên bản desktop của DeepSeek" và "định nghĩa sự hiểu biết của DeepSeek về Harness".

"Giáp Tử Quang Niên" phân tích, DeepSeek không đơn giản muốn làm một plugin trợ lý viết mã, mà là đang bổ sung lớp trung gian để mô hình thông suốt đến quy trình công việc thực tế.

Một năm qua, ngành công nghiệp đã chứng minh: khả năng về mã mạnh, không có nghĩa là nhà phát triển sẽ thực sự sử dụng; mô hình có thể viết mã, cũng không có nghĩa là nó có thể liên tục hoàn thành một nhiệm vụ kỹ thuật.

Thứ thực sự thay đổi cách làm việc của nhà phát triển, không phải là mô hình Claude riêng lẻ, mà là Claude Code; không phải là mô hình GPT riêng lẻ, mà là Codex; không phải là một câu trả lời mã trong khung chat, mà là một trí tuệ nhân tạo kỹ thuật có thể đi vào terminal, hiểu dự án, đọc ghi tệp, chạy lệnh, sửa lỗi, quản lý Git, gọi công cụ.

Trước đây, DeepSeek mạnh nhất là về mô hình. Bây giờ, nó bắt đầu bổ sung lớp "tay" trên mô hình đó.

Một. Tại sao DeepSeek nhấn mạnh Harness?

Trong ngữ cảnh sản phẩm AI truyền thống, "trợ lý viết mã" thường có nghĩa là hai loại sản phẩm: một là plugin tự động hoàn thành trong IDE, hai là hỏi đáp mã trong khung chat.

Nhưng từ lặp đi lặp lại trong đợt tuyển dụng này của DeepSeek không phải là Code Assistant, mà là Harness.

Harness vốn trong ngữ cảnh kỹ thuật chỉ "khung kiểm tra" hoặc "khung chạy", đặt trong ngữ cảnh Agent, nó gần giống hơn với một hệ thống bên ngoài giúp mô hình thực sự hành động. Mô hình chịu trách nhiệm hiểu, suy luận và tạo ra, Harness chịu trách nhiệm kết nối những khả năng này vào môi trường thực tế.

Mô tả vị trí đề cập, vai trò này cần lập kế hoạch lộ trình sản phẩm Harness của DeepSeek, kết nối nhà nghiên cứu, kỹ sư, cộng đồng mã nguồn mở với người dùng cuối, và giao tiếp sâu với nhà nghiên cứu của nhóm huấn luyện mô hình, thực hiện sự tiến hóa chung của mô hình và Harness.

Câu nói này rất quan trọng.

Nó cho thấy những gì DeepSeek muốn làm không chỉ là bọc một lớp vỏ cho mô hình hiện có, mà là biến bản thân sản phẩm Agent thành một phần của quá trình tiến hóa mô hình. Trước đây, logic sản phẩm phổ biến của các công ty mô hình lớn là: nhóm nghiên cứu trước tiên huấn luyện một mô hình, nhóm sản phẩm sau đó dựa trên khả năng mô hình để làm ứng dụng. Nhưng trong thời đại Agent, trình tự này đang bị phá vỡ. Sản phẩm không còn chỉ là đầu ra của khả năng mô hình, mà là nơi huấn luyện khả năng mô hình.

Một Agent mã trong dự án thực tế thất bại, có thể không phải là vấn đề tương tác sản phẩm, mà là cách thức nén ngữ cảnh dài của mô hình không đúng; có thể không phải là vấn đề chuỗi gọi công cụ, mà là chiến lược phân giải nhiệm vụ của mô hình không ổn định; cũng có thể không phải là khả năng mã không đủ, mà là nó thiếu sự hiểu biết liên tục về ràng buộc kỹ thuật, phản hồi kiểm tra và ý định người dùng.

Vì vậy, giá trị của nhóm Harness không chỉ là "làm sản phẩm", mà là biến nhiệm vụ phát triển thực tế thành nguồn phản hồi cho sự tiến hóa liên tục của mô hình.

Hai. Tại sao DeepSeek phải bổ sung Code Harness?

DeepSeek đã sớm đặt cược vào khả năng về mã. Từ DeepSeek-Coder đến DeepSeek-Coder-V2, sự đầu tư của DeepSeek vào mô hình mã liên tục được tăng cường, hỗ trợ ngôn ngữ, độ dài ngữ cảnh và khả năng nhiệm vụ phức tạp không ngừng được nâng cao. Vấn đề của nó không phải là không có khả năng về mã, mà là trước đây phần khả năng này chủ yếu dừng lại ở lớp mô hình, chưa biến thành sản phẩm tần suất cao trong quy trình công việc hàng ngày của nhà phát triển.

Sự nổi tiếng của Claude Code đã chứng minh một điều: Cạnh tranh AI Coding đang chuyển từ cạnh tranh khả năng mô hình, sang cạnh tranh cửa ngõ vào quy trình công việc của nhà phát triển.

Đây cũng là bài học mà DeepSeek hiện tại phải bổ sung. Tinh tế hơn, trước khi DeepSeek chính thức ra tay, cộng đồng nhà phát triển đã thay nó làm một phiên bản "Claude Code phiên bản DeepSeek".

Một dự án mã nguồn mở tên là DeepSeek-TUI trước đó đã nổi tiếng trong cộng đồng nhà phát triển. Nó là một coding agent chạy trong terminal, có thể đọc ghi tệp, thực thi lệnh Shell, tìm kiếm web, quản lý Git, và thông qua giao diện TUI để phối hợp các sub-agent.

Sự nổi tiếng của DeepSeek-TUI nói lên hai vấn đề:

  1. Tâm trí cơ bản đã trưởng thành: Mô hình DeepSeek trong tâm trí nhà phát triển đã có nền tảng để làm Agent mã. Nếu không cộng đồng sẽ không tự nhiên mọc ra sản phẩm kiểu Claude Code xung quanh nó.

  2. Sự thiếu hụt ở cấp độ chính thức: DeepSeek thiếu không phải là sự chú ý về mô hình, mà là Harness chính thức.

Trong mắt nhà phát triển, sức hấp dẫn của DeepSeek-TUI rất trực tiếp: chi phí thấp, có thể sử dụng trong nước, ngữ cảnh dài, ngưỡng triển khai tương đối thấp. Nhiều nhà phát triển trong nước không phải không muốn dùng Claude Code, mà là bị hạn chế bởi giá cả, ổn định truy cập, hệ thống tài khoản và tuân thủ doanh nghiệp.

Nhưng dự án cộng đồng cũng có ranh giới tự nhiên:

  • Một dự án mã nguồn mở của bên thứ ba dù có tích cực đến đâu, cũng rất khó thực sự nắm bắt nhịp độ tiến hóa nội bộ của mô hình;

  • Nó có thể làm thích ứng xung quanh API, nhưng không thể quyết định ngược lại mô hình sẽ được huấn luyện như thế nào;

  • Nó có thể làm prompt, chuỗi công cụ và tối ưu hóa tương tác, nhưng rất khó đưa phản hồi nhiệm vụ thực tế với số lượng lớn vào cải tiến mô hình một cách có hệ thống.

Ý nghĩa của Harness chính thức nằm chính xác ở đây.

DeepSeek tự làm Code Harness, nó có một số lợi thế mà dự án cộng đồng không có: hợp tác nhóm mô hình, quyền thiết kế giao diện, vòng lặp dữ liệu huấn luyện, cảnh nhiệm vụ thực tế nội bộ, và khả năng vận hành lâu dài hệ sinh thái nhà phát triển.

Cộng đồng mã nguồn mở đã dọn đường trước: nhà phát triển thực sự cần một phiên bản Claude Code của DeepSeek. Bây giờ, DeepSeek muốn thu hồi con đường này, biến nó thành sản phẩm chính thức của mình.

Và việc DeepSeek chính thức bắt đầu tuyển người, có nghĩa là cuối cùng nó đã chuẩn bị tự mình xuống sân.

Trần Đức Lý vào tháng 11 năm ngoái tại Hội nghị Thế giới Internet Ô Trấn 2025 đã đề cập: "Một lợi thế cốt lõi của công ty chúng tôi là chủ nghĩa dài hạn, kiên trì làm chủ tuyến đột phá trí tuệ tiên phong. Trong quá trình này, chúng tôi cũng từ bỏ nhiều việc trên các tuyến phụ, không làm những việc ngắn hạn, nhanh chóng trên tuyến phụ."

Sau chiến tranh mô hình, cuộc chiến Agent thực sự đã bắt đầu. Lần này DeepSeek cần bổ sung là lớp then chốt nhất từ mô hình đến hành động - Harness.

DeepSeek đang lắp đôi tay cho mô hình của mình.

Câu hỏi Liên quan

QĐội ngũ Harness mà DeepSeek đang xây dựng có mục tiêu cụ thể là gì?

ADeepSeek đang xây dựng đội ngũ Harness mới với hướng phát triển sản phẩm tác nhân thông minh về mã nguồn (code agent), đối trực tiếp với Claude Code của Anthropic. Mục tiêu là biến khả năng mô hình tiên tiến thành sản phẩm Agent dẫn đầu, bổ sung lớp trung gian để mô hình có thể thâm nhập vào quy trình công việc thực tế của nhà phát triển.

QTại sao bài viết lại nhấn mạnh thuật ngữ 'Harness' thay vì 'Trợ lý mã nguồn' (Code Assistant)?

ABài viết nhấn mạnh 'Harness' vì nó không chỉ đơn thuần là một công cụ bổ trợ hoặc hộp chat trả lời code. Trong ngữ cảnh Agent, Harness ám chỉ một hệ thống bên ngoài giúp mô hình thực sự hành động - quản lý ngữ cảnh, gọi công cụ, lập kế hoạch tác vụ, đọc ghi file, sửa code, thực thi terminal, thu hồi phản hồi và đóng vòng đánh giá. Đây là phần then chốt biến một mô hình thành một tác nhân có thể vào quy trình làm việc.

QCông thức cốt lõi 'Model + Harness = Agent' được đề cập có ý nghĩa gì đối với chiến lược của DeepSeek?

ACông thức 'Model + Harness = Agent' được đặt ở vị trí nổi bật trong mô tả tuyển dụng, cho thấy định nghĩa nội bộ của DeepSeek về lộ trình sản phẩm hóa giai đoạn tới. Nó khẳng định mô hình chỉ là nền tảng của Agent, còn phần Harness (mọi công việc ngoài mô hình) mới là chìa khóa để Agent thâm nhập quy trình công việc. Điều này cho thấy DeepSeek không chỉ đơn giản đóng gói mô hình hiện có, mà muốn biến chính sản phẩm Agent thành một phần của quá trình tiến hóa mô hình, tạo ra vòng phản hồi đóng giữa sản phẩm và nghiên cứu.

QSự nổi lên của dự án cộng đồng DeepSeek-TUI cho thấy điều gì về nhu cầu thị trường và vị thế của DeepSeek?

ASự nổi lên của dự án cộng đồng mã nguồn mở DeepSeek-TUI (một phiên bản 'Claude Code' chạy trên terminal sử dụng mô hình DeepSeek) chứng tỏ hai điều: 1) Tâm trí nhà phát triển đã chấp nhận mô hình DeepSeek có đủ nền tảng để làm code agent. 2) Tồn tại khoảng trống ở cấp độ chính thức (official Harness). Điều này cho thấy nhu cầu rõ ràng cho một sản phẩm Code Harness chính thức từ DeepSeek, đáp ứng nhu cầu của thị trường trong nước về chi phí, khả năng truy cập, độ dài ngữ cảnh và sự phù hợp về quy định.

QLợi thế của một Harness chính thức từ DeepSeek so với các dự án cộng đồng là gì?

AHarness chính thức từ DeepSeek sở hữu nhiều lợi thế mà dự án cộng đồng khó đạt được: Khả năng hợp tác chặt chẽ với đội ngũ phát triển mô hình, quyền thiết kế giao diện lập trình ứng dụng (API), vòng lặp dữ liệu huấn luyện khép kín, tiếp cận các kịch bản tác vụ thực tế nội bộ, và năng lực vận hành lâu dài hệ sinh thái nhà phát triển. Điều này cho phép DeepSeek không chỉ tối ưu hóa prompt và công cụ, mà còn có thể đưa phản hồi từ hàng loạt tác vụ thực tế vào cải tiến mô hình một cách có hệ thống.

Nội dung Liên quan

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

**Tóm tắt tiếng Việt:** Năm 2026, tác giả Vương Kiến Thạc nhìn lại 20 dự đoán của mình về ChatGPT từ năm 2023, sử dụng AI (41 agent Opus 4.8) để đối chiếu với dữ liệu thực tế. **Kết quả chính:** Phần lớn các dự đoán về **cơ chế và xu hướng** là đúng: * **Đúng:** Kiến trúc RAG + tìm kiếm trở thành chuẩn để giảm ảo giác. LUI (Giao diện ngôn ngữ tự nhiên) tạo ra một "lục địa mới" cho tương tác máy tính. Mạng lưới agent với giao thức kết nối mới đang hình thành. Trung Quốc thu hẹp khoảng cách về mô hình lớn có thể sử dụng. ChatGPT không có ý thức, vượt qua bài kiểm tra Turing nhờ biểu diễn. Nó là bước tiến lớn nhưng chưa phải AGI, chưa gây ra làn sóng thất nghiệp hàng loạt. * **Sai/Sai một phần:** Dự đoán cụ thể **GPT-4 có 100 nghìn tỷ tham số** là sai hoàn toàn (thực tế ~1.8 nghìn tỷ). Nhận định **LLM không thể tự học toán** bị bác bỏ khi các mô hình giành huy chương IMO. **Giá trị sẽ thuộc về lớp ứng dụng** bị chứng minh ngược lại khi lợi nhuận khổng lồ thuộc về lớp nền tảng tính toán (như NVIDIA). **AI có thể né tránh vấn đề bản quyền** là sai, với các vụ kiện và khoản bồi thường lớn. Dự đoán **chi phí đào tạo mô hình lớn chỉ 5-10 tỷ USD** là quá thấp so với thực tế. **Bài học rút ra:** 1. **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể hay mức độ tuyệt đối.** 2. **Có xu hướng đánh giá quá cao tốc độ thay đổi trong ngắn hạn, nhưng lại đánh giá thấp mức độ thay đổi trong dài hạn.** 3. **Sai lầm tinh vi thường nằm ở "sự phân bố":** tổng thể đúng nhưng tác động không đồng đều (ví dụ: việc làm). 4. **Những phát biểu có giới hạn, thận trọng thường đứng vững theo thời gian.** 5. **Ba năm là chưa đủ để kết luận cho một số vấn đề sâu xa** (như ý thức máy móc, sự xuất hiện năng lực). Bài viết kết luận rằng việc nhìn đúng hướng đi lớn không quá khó, nhưng thừa nhận những sai lầm trong ước tính chi tiết, tốc độ và phân bố mới là điều đáng ghi nhớ cho những dự đoán trong tương lai.

marsbit4 giờ trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

marsbit4 giờ trước

Ba năm sau: Nhìn lại những dự đoán của tôi về ChatGPT năm 2023

**Tóm tắt: Nhìn lại 20 dự đoán về ChatGPT năm 2023 sau 3 năm** Vào tháng 3/2023, khi ChatGPT mới xuất hiện và GPT-4 chưa ra mắt, tác giả Vương Kiến Thạc đã đưa ra 20 nhận định về tương lai của AI. Giờ đây, vào cuối tháng 5/2026, một hệ thống AI gồm 41 agent đã được sử dụng để kiểm chứng lại từng dự đoán đó dựa trên dữ liệu thực tế. **Kết quả kiểm chứng (Tính đến 5/2026):** * **Đúng/Bản chất đúng (✅/🟢):** 13/20 dự đoán. * **Một phần đúng (🟡):** 6/20 dự đoán. * **Sai (❌):** 1/20 dự đoán. **Những điểm dự đoán chính xác nổi bật:** 1. **Kiến trúc RAG & Tìm kiếm:** Dự đoán việc bổ sung kiến thức thông qua cơ chế truy xuất bên ngoài (như vector search) thay vì chỉ fine-tune model đã trở thành tiêu chuẩn. 2. **Giao diện ngôn ngữ tự nhiên (LUI):** Nhận định ChatGPT mở ra kỷ nguyên LUI, tạo ra một hệ sinh thái rộng lớn hơn cả việc phát triển model cơ bản, đã được chứng minh. 3. **Mô hình lớn Trung Quốc:** Dự báo khoảng cách về khả năng giữa các mô hình Trung Quốc và đỉnh cao thế giới sẽ thu hẹp nhanh chóng trong khoảng 3 năm đã thành hiện thực. 4. **Ý thức và Kiểm tra Turing:** Quan điểm cho rằng ChatGPT không có ý thức và bài kiểm tra Turing chỉ đánh giá biểu hiện bề ngoài vẫn vững vàng. **Những điểm dự đoán chưa chính xác hoặc sai lệch:** 1. **Tham số GPT-4 (❌):** Thông tin GPT-4 có 100 nghìn tỷ tham số là hoàn toàn sai. 2. **Khả năng toán học của LLM:** Mặc dù đúng khi cho rằng cần công cụ bổ trợ, nhưng khẳng định LLM "không thể" tự học toán thuần túy đã bị bác bỏ khi các model năm 2025 giành huy chương IMO. 3. **Nơi nắm giữ giá trị:** Dự đoán giá trị sẽ thuộc về tầng ứng dụng, còn các công ty làm model cơ bản có thể không sinh lời, đã không tính đến sự thống trị và lợi nhuận khổng lồ của NVIDIA ở tầng phần cứng tính toán. 4. **Bản quyền:** Nhận định AI có thể "né tránh" vi phạm bản quyền là sai, khi thực tế đã có những vụ kiện và dàn xếp bồi thường lớn nhất lịch sử liên quan đến dữ liệu huấn luyện. **Bài học rút ra sau 3 năm:** * **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể.** * Xu hướng chung: **Đánh giá quá lạc quan về tốc độ, nhưng lại đánh giá thấp mức độ phát triển** về lâu dài. * Sai lầm tinh vi thường nằm ở **sự phân bổ** (ví dụ: tác động việc làm lên nhóm người lao động trẻ), chứ không phải tổng thể. * **Những nhận định có giới hạn, điều kiện đi kèm thường chính xác hơn** những phát biểu tuyệt đối. * Một số câu hỏi lớn vẫn chưa có câu trả lời cuối cùng sau 3 năm. Bản tổng kết này không chỉ chấm điểm cho quá khứ, mà còn đặt ra những quy tắc cho việc dự đoán trong tương lai.

链捕手6 giờ trước

Ba năm sau: Nhìn lại những dự đoán của tôi về ChatGPT năm 2023

链捕手6 giờ trước

Cảnh báo bong bóng AI: Đầu tư vào AI mang lại lợi nhuận âm cho hầu hết các gã khổng lồ công nghệ

Bài viết cảnh báo về bong bóng đầu tư AI khi phân tích chỉ ra rằng hầu hết các gã khổng lồ công nghệ như Microsoft, Alphabet, Meta, Oracle (trừ Amazon) có thể nhận tỷ suất lợi nhuận âm từ các khoản đầu tư hàng nghìn tỷ USD vào trung tâm dữ liệu AI. Dựa trên kỳ vọng của nhà phân tích về doanh thu và chi tiêu vốn giai đoạn 2025-2030, tốc độ tăng đầu tư (~20%/năm) vượt xa tốc độ tăng doanh thu dự kiến (~15%/năm). Tác giả nhấn mạnh, đầu tư công nghệ hiện giải thích 93% tăng trưởng GDP Mỹ. Nếu các công ty cắt giảm chi tiêu, không chỉ chuỗi cung ứng (Nvidia, TSMC, ASML) bị ảnh hưởng mà nền kinh tế Mỹ có thể suy thoái, kéo theo thị trường chứng khoán lao dốc. Các IPO của OpenAI, Anthropic được xem như cách chuyển giao rủi ro từ nhà đầu tư ban đầu sang các nhà đầu tư tổ chức và cá nhân. Dù cơn sốt có thể kéo dài đến 2026 nhờ IPO, nhưng thực tế toán học khắc nghiệt (cần thêm 2-5 nghìn tỷ USD doanh thu để đạt lợi nhuận 10%) khiến việc điều chỉnh là không tránh khỏi vào 2027-2028, tương tự bong bóng dot-com những năm 2000. Câu hỏi then chốt: ai sẽ trả giá cho cuộc chạy đua cơ sở hạ tầng đắt đỏ này?

marsbit7 giờ trước

Cảnh báo bong bóng AI: Đầu tư vào AI mang lại lợi nhuận âm cho hầu hết các gã khổng lồ công nghệ

marsbit7 giờ trước

Từ Token đến Lao động Máy móc: AI đang chuyển từ Công cụ thành 'Người lao động'

Từ công cụ thành "công nhân": AI đang trở thành lực lượng lao động máy móc Bài viết phân tích sự chuyển dịch trong thị trường AI: từ việc bán token hay giờ GPU đơn thuần, sang một thị trường "lao động máy móc" mới, nơi chính công việc được hoàn thành bởi phần mềm trở thành đối tượng được định giá và giao dịch. Tác giả dự đoán cơ chế định giá AI sẽ phát triển qua bốn giai đoạn: token thô -> thị trường năng lực LLM tiêu chuẩn hóa -> thị trường lao động theo ngành -> thị trường kết quả có thể lập trình. Trong tương lai, doanh nghiệp có thể không còn quan tâm công việc do model hay GPU cụ thể nào thực hiện, mà chỉ quan tâm liệu nó có được giao đúng tiêu chuẩn về độ trễ, độ chính xác, độ tin cậy và chi phí hay không. Điều này cũng làm thay đổi vai trò của con người, chuyển sang giám sát, chịu trách nhiệm, quản lý ngữ cảnh và đưa ra phán quyết cuối cùng - những yếu tố có thể trở nên có giá trị hơn. Bài viết nhấn mạnh AI không chỉ đơn thuần thay thế lao động mà mở rộng thị trường tổng thể. Khi chi phí công việc giảm, nhu cầu có thể tăng lên, tạo ra những loại hình công việc và dịch vụ mới khả thi về mặt kinh tế. Thị trường lao động máy móc sẽ bắt đầu từ những công việc có thể được xác định rõ ràng và đo lường được, hướng tới việc biến lao động máy móc thành một yếu tố sản xuất mới có thể được thu mua, thanh toán và giao dịch.

marsbit7 giờ trước

Từ Token đến Lao động Máy móc: AI đang chuyển từ Công cụ thành 'Người lao động'

marsbit7 giờ trước

Việc giảm giá 99% của Xiaomi MiMo không phải là chiêu trò marketing! Luo Fuli đăng X để phản bác những kẻ bi quan

Trong bài viết, tác giả phân tích động thái giảm giá API lên tới 99% cho dòng MiMo-V2.5 của Xiaomi và phản bác các ý kiến cho rằng đây chỉ là chiến lược marketing hay "bán lỗ cướp thị trường". Lộ Phúc Lợi, người đứng đầu MiMo, đã công bố một blog kỹ thuật dài 5000 chữ để giải thích cơ sở kỹ thuật của mức giá mới. Bài viết mô tả sáu trụ cột công nghệ chính cho phép mức giảm giá này: 1. **Kiến trúc Hybrid SWA (Sliding Window Attention):** Giảm dung lượng bộ nhớ tạm (KVCache) xuống còn 1/7 so với Full Attention truyền thống. 2. **Quản lý KVCache hai bể riêng biệt:** Tối ưu hóa việc phân bổ bộ nhớ để triệt để tận dụng lợi thế của SWA, tăng gấp 5 lần số lượng người dùng đồng thời. 3. **Hệ thống tiền tố cache được cải tiến:** Đảm bảo an toàn và nâng cao tỷ lệ trúng cache lên tới 93-95%, khiến phần lớn yêu cầu đọc lặp lại hầu như không cần tính toán lại. 4. **Hệ thống lưu trữ phân tán GCache:** Triển khai trực tiếp trên ổ SSD của máy GPU, giảm chi phí lưu trữ xuống gần bằng 0. 5. **Hệ thống điều phối LLM-Router:** Tối ưu định tuyến và lập lịch, ưu tiên các yêu cầu có cache, tăng hiệu suất tổng thể. 6. **Dự đoán đa token (MTP):** Giảm chi phí tạo văn bản (output), hoàn thiện vòng tròn giảm chi phí cho toàn bộ quá trình xử lý. Những cải tiến này, khi kết hợp, tạo ra một chuỗi tối ưu toàn diện làm giảm đáng kể chi phí tính toán và lưu trữ cho mỗi yêu cầu. Bài viết kết luận rằng mức giảm 99% không phải là con số tiếp thị, mà là kết quả có thể chứng minh của một hệ thống kỹ thuật hoàn chỉnh, một phương pháp giảm chi phí đáng để ngành tham khảo.

marsbit9 giờ trước

Việc giảm giá 99% của Xiaomi MiMo không phải là chiêu trò marketing! Luo Fuli đăng X để phản bác những kẻ bi quan

marsbit9 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片