Ngoài Mô Hình Đều Là Harness: Deepseek Vào Cuộc, Chiến Trường Cạnh Tranh AI Trong Nước Tại Sao Lại Thay Đổi?

marsbitXuất bản vào 2026-06-22Cập nhật gần nhất vào 2026-06-22

Tóm tắt

Giữa tháng 5/2026, Deepseek thành lập nhóm Harness mới, tập trung phát triển sản phẩm trí tuệ nhân tạo (AI) cho mã nguồn, đối đầu trực tiếp với Claude Code của Anthropic. Điều này đánh dấu sự chuyển hướng của cuộc cạnh tranh AI trong nước từ "luyện mô hình lớn" sang "xây dựng công cụ và triển khai thực tế". Vậy Harness là gì? Theo công thức "Model + Harness = Agent" của Deepseek, nếu mô hình là "bộ não" thông minh, thì Harness chính là "hệ thống vận hành" cung cấp hướng dẫn công việc, công cụ, bảo mật và xử lý lỗi. Nó biến mô hình chỉ xử lý văn bản thành tác nhân có thể tương tác với thế giới bên ngoài. Deepseek tự phát triển Harness để nắm quyền kiểm soát thiết kế giao diện và vòng lặp dữ liệu huấn luyện, biến thất bại trong thực tế thành dữ liệu để cải thiện mô hình, tạo hiệu ứng bánh đà. Deepseek không đơn độc. Các đại gia công nghệ Trung Quốc đang tìm kiếm vị thế khác biệt thông qua công cụ: - **Tencent**: Tập trung vào kết nối doanh nghiệp với WorkBuddy, tích hợp sâu vào hệ sinh thái WeChat Work và Tencent Cloud để tự động hóa quy trình phức tạp. - **Alibaba**: Hướng đến thâm nhập giao diện web với framework PageAgent mã nguồn mở, giúp tự động hóa trên bất kỳ trang web nào chỉ bằng một dòng code. - **Deepseek**: Bắt đầu từ kịch bản mã hóa - nhu cầu cấp thiết của nhà phát triển. Xu hướng toàn cầu, đại diện bởi công ty Ba Lan Viktor (đạt 20 triệu USD doanh thu hàng năm), cho thấy doanh nghiệp sẵn sàng trả tiền cho AI có khả năng "tự chủ thực thi" các nhiệm vụ dài, phức ...

Vào giữa và cuối tháng 5 năm 2026, Deepseek đã thành lập nội bộ một đội ngũ Harness hoàn toàn mới, định hướng phát triển sản phẩm tác nhân thông minh về mã, đối trọng nội bộ với Claude Code của Anthropic. Thôi Thiên Nhất, kỹ sư định lượng nổi tiếng trước đây của Jane Street, đã gia nhập đội ngũ này vào tháng 3. Nhà nghiên cứu kỳ cựu Trần Đắc Lý đã xác nhận công khai và phụ trách tuyển dụng. Trong mô tả công việc (JD) tuyển dụng của Deepseek, rõ ràng ghi một công thức: "Model + Harness = Agent". Khi năng lực của các mô hình cơ bản dần san bằng, thời đại chỉ cạnh tranh về tham số đang qua đi. Việc Deepseek tự mình xuống sân thành lập đội ngũ công cụ, đánh dấu chiến trường cạnh tranh chính của AI trong nước đang chuyển từ "luyện mô hình lớn" sang "xây dựng công cụ và ứng dụng thực tế vào công việc".

Tại Sao Deepseek Tự Mình Xuống Sân Làm Harness?

Trong một thời gian dài, kỳ vọng của cộng đồng nhà phát triển dành cho Deepseek chỉ dừng lại ở việc mở mã nguồn các mô hình cơ sở mạnh hơn. Nhưng khả năng về mã mạnh không đồng nghĩa với việc các nhà phát triển sẽ sử dụng nó như một công cụ sản xuất. Thứ thực sự thay đổi cách làm việc không phải là câu trả lời mã trong hộp chat, mà là một tác nhân thông minh có thể đi vào terminal, hiểu dự án, đọc ghi file, chạy lệnh và sửa lỗi. Trước khi chính thức ra tay, cộng đồng nhà phát triển đã dựa trên mô hình Deepseek để tạo ra các tác nhân terminal mã nguồn mở đa dạng. Việc Deepseek lúc này thành lập đội ngũ Harness nhằm nắm quyền thiết kế giao diện và vòng lặp dữ liệu huấn luyện khép kín, biến những con đường mà cộng đồng đã khai phá thành sản phẩm chính thức của hãng.

Để hiểu ý đồ chiến lược này, trước tiên phải làm rõ Harness thực chất là gì. Với những độc giả không có nền tảng kỹ thuật, từ "Harness" có thể còn xa lạ. Trong công thức của Deepseek, mô hình phụ trách suy luận, còn Harness phụ trách mọi thứ khác. Harness vốn có nghĩa "dụng cụ kiểm soát" hoặc "dây an toàn" trong lĩnh vực kỹ thuật, khi mở rộng sang lĩnh vực AI, nó đề cập đến "cơ sở hạ tầng thời gian chạy" của Agent.

Để hiểu theo cách thông tục hơn, chúng ta có thể ví mô hình lớn như "bộ não" và "trí tuệ" của một người lao động có trí thông minh cao, còn Harness chính là "bản mô tả công việc, tiêu chuẩn đánh giá KPI, tường lửa văn phòng và hộp công cụ" của người lao động này. Nó không phải là "giàn giáo" lắp ráp trước khi chạy, cũng không phải là "khung" cung cấp các khối xây dựng, mà là một hệ thống chạy liên tục. Nó chịu trách nhiệm sắp xếp chu trình thực thi, phân phối các lệnh gọi công cụ, quản lý ngữ cảnh, thực hiện kiểm tra an toàn và chịu trách nhiệm khôi phục lỗi cũng như lưu trữ trạng thái. Bản thân mô hình lớn là không trạng thái, không có khả năng tương tác với môi trường, nó chỉ có thể nhận đầu vào văn bản và xuất ra văn bản. Harness bù đắp những thiếu sót này, cho phép mô hình thực sự tương tác với thế giới bên ngoài và thực hiện các nhiệm vụ cụ thể.

Tại sao công ty mô hình cơ sở phải tự nắm giữ thời gian chạy này? Cốt lõi nằm ở chỗ sản phẩm Agent không chỉ là đầu ra năng lực của mô hình, mà còn là sân tập luyện năng lực của mô hình. JD của Deepseek nhấn mạnh "thực hiện sự tiến hóa chung của mô hình và Harness". Trong các nhiệm vụ phức tạp thực tế, mô hình sẽ gặp phải nhiều thất bại do hạn chế môi trường, lỗi trả về từ công cụ. Harness ghi lại các lộ trình thất bại này, có thể bổ sung ngược lại cho quá trình huấn luyện mô hình, tạo thành hiệu ứng bánh xe lăn. Nếu để cộng đồng tự xây dựng thay, các hãng cung cấp mô hình sẽ mất đi phản hồi dữ liệu cốt lõi nhất ở tầng ứng dụng, và chỉ còn là nhà cung cấp năng lực tính toán và trọng số.

Từ góc độ kỹ thuật, tối ưu hóa Harness quyết định thành bại của Agent hơn là chỉ tối ưu hóa Prompt. Theo phân tích của chuyên gia kỹ thuật, trong quá trình chạy Agent, đầu ra công cụ chiếm 67.6% nội dung thực tế mà Agent thấy trong ngữ cảnh, trong khi prompt hệ thống chỉ chiếm 3.4%. Điều này có nghĩa là phần lớn "tầm nhìn" của mô hình bị chiếm bởi kết quả của các lệnh gọi công cụ. Nếu Harness xử lý định dạng đầu ra công cụ không đúng, hoặc không thể nén hiệu quả thông tin thừa, mô hình sẽ rơi vào tình trạng "ngữ cảnh bị hỏng", dẫn đến chất lượng suy luận tiếp theo giảm mạnh.

Nguy hiểm hơn là vấn đề lỗi phức hợp. Một quá trình Agent bao gồm 10 bước, mỗi bước có độ tin cậy 99%, thì tỷ lệ thành công end-to-end là khoảng 90%; khi độ phức tạp nhiệm vụ tăng lên 50 bước, tỷ lệ thành công giảm mạnh xuống còn 60%. Trong các tình huống bảo trì kho mã thực tế hoặc tự động hóa văn phòng doanh nghiệp, các thao tác liên tục hàng chục bước là bình thường. Lúc này, dù khả năng suy luận của mô hình mạnh đến đâu, cũng không thể bù đắp được sự hao hụt tích lũy về xác suất. Chỉ thông qua cơ chế xử lý và khôi phục lỗi trong Harness, mới có thể thử lại hoặc sửa đường đi khi một bước thất bại. Đây chính là giá trị kỹ thuật của Harness, và cũng là lý do Deepseek phải tự mình xuống sân.

Tencent Làm Connector, Alibaba Thâm Nhập Front-end: Các Con Đường Công Cụ Khác Biệt Của Ông Lớn

Sự chuyển hướng của Deepseek không phải là một trường hợp đơn lẻ. Theo các phương tiện truyền thông ngành, việc tăng cường năng lực Agent đã trở thành một hướng phát triển quan trọng của các mô hình cơ bản trong nước vào năm 2026. Mô hình cơ bản dần trở thành "hạ tầng cơ bản như điện, nước, khí đốt", chiến trường cạnh tranh chính chuyển sang tầng ứng dụng. Các ông lớn khác trong nước cũng đang tìm kiếm vị trí đứng khác biệt thông qua công cụ, nhưng với các con đường khác nhau, phản ánh sự khác biệt về tài nguyên hệ sinh thái và người dùng mục tiêu của mỗi hãng.

Tencent vào tháng 6 năm 2026 đã tung ra lá bài mới Agent doanh nghiệp, ra mắt WorkBuddy phiên bản doanh nghiệp. Định vị cốt lõi của nó là bàn làm việc thông minh đa tác nhân cho mọi tình huống nơi làm việc, tập trung vào việc chuyển từ hiệu quả cá nhân sang hợp tác tổ chức. WorkBuddy phiên bản doanh nghiệp hỗ trợ nhiều Agent chạy song song và kết nối với Connector của hệ thống nghiệp vụ, cố gắng chiếm lấy cổng vào thống nhất cho AI trong công việc. Logic xác lập vị trí của Tencent dựa vào hệ sinh thái WeChat Work và Tencent Cloud khổng lồ của họ. Đối với các doanh nghiệp lớn, điểm đau của AI trong công việc không nằm ở trải nghiệm tối ưu của một công cụ đơn lẻ, mà ở việc có thể kết nối các hệ thống công việc nội bộ cô lập hay không. Tencent bằng cách làm connector, cho phép Agent có thể trực tiếp điều phối dữ liệu và quy trình doanh nghiệp, tập trung vào sự hợp tác ở cấp độ tổ chức và giao nhiệm vụ phức tạp. Ưu điểm của con đường này là rào cản cao, một khi đã kết nối vào quy trình nghiệp vụ cốt lõi của doanh nghiệp, chi phí thay thế là rất lớn; thách thức là cần có khả năng dịch vụ doanh nghiệp mạnh mẽ và hỗ trợ tùy chỉnh cao.

Alibaba thì đi một con đường khác, chọn cách giảm ngưỡng tự động hóa ở phía Web. Alibaba đã mở mã nguồn khung GUI Agent chạy hoàn toàn trong trình duyệt PageAgent. Khung này không cần triển khai backend, chỉ một dòng mã là có thể tích hợp khả năng AI operator cho website. Logic xác lập vị trí của Alibaba nằm ở việc trao quyền cho nhà phát triển Web, biến bất kỳ trang web nào thành ứng dụng AI-native trong vài giây. Trong thực tế, nhiều hệ thống doanh nghiệp truyền thống không thể cung cấp API, việc thực hiện tự động hóa thông qua thao tác DOM front-end là một con đường tấn công thiết thực và hiệu quả. Ưu điểm của con đường này là nhẹ, dễ tích hợp, có thể nhanh chóng bao phủ số lượng lớn các trang web dài hạn; nhưng cấu trúc DOM front-end thay đổi thường xuyên cũng có thể tạo ra thách thức về ổn định, đòi hỏi khả năng phục hồi lỗi của Harness phải cao hơn.

So sánh lại, các hãng không còn chỉ cạnh tranh về điểm số mô hình đơn thuần, mà xây dựng công cụ dựa trên tài nguyên hệ sinh thái của riêng mình. Tencent làm connector, Alibaba thâm nhập front-end, Deepseek thì tiếp cận từ kịch bản kỹ thuật mã - nhu cầu cứng nhất của nhà phát triển. Sự phân hóa này cho thấy, ngành AI trong nước đã nhận ra rằng không có Agent tổng quát hoàn hảo, chỉ có các giải pháp chuyên sâu được mài giũa thông qua kỹ thuật Harness vững chắc trong các tình huống cụ thể. Đối với việc mua sắm doanh nghiệp, việc chọn công cụ của hãng nào, về bản chất là chọn con đường tự động hóa nào: là liên kết sâu với hệ sinh thái công việc, hay linh hoạt nhúng vào hệ thống Web hiện có, hoặc là trao quyền cho quy trình làm việc kỹ thuật của nhà phát triển.

ARR 20 Triệu USD Của Viktor Chứng Minh: Doanh Nghiệp Sẵn Sàng Trả Tiền Cho Khả Năng Tự Thực Thi

Sự trưởng thành của công cụ đang thay đổi mô hình mà AI tham gia vào lĩnh vực công việc. Logic của Copilot gốc là "soạn thảo và chờ con người hoàn thành", AI tạo ra một đoạn văn bản hoặc một đoạn mã, bước cuối cùng vẫn cần sự can thiệp của con người để sửa và thực thi. Ở chế độ này, AI chỉ là một công cụ tăng hiệu suất, không thể thay thế thực sự lực lượng lao động. Nhân viên doanh nghiệp cần liên tục theo dõi đầu ra của AI, kiểm tra và triển khai, điều này thực chất làm tăng gánh nặng nhận thức.

Thị trường nước ngoài đã xuất hiện tín hiệu rõ ràng về sự chuyển dịch mô hình. Là một tín hiệu tham chiếu xu hướng nước ngoài, công ty tự động hóa công việc AI Viktor của Ba Lan định vị là nhân viên AI bên trong Slack, đã đạt doanh thu hàng năm hóa 20 triệu USD (ARR) mà không có đội ngũ bán hàng, phục vụ 30 nghìn doanh nghiệp, và vào tháng 5 năm 2026 đã huy động được 75 triệu USD vòng Series A. Mô hình của Viktor đại diện cho hình thái cuối cùng của nhân viên AI kiểu mới: sở hữu máy tính đám mây, có thể làm việc liên tục trong thời gian dài, nắm chắc ngữ cảnh khổng lồ, và giao kết quả trực tiếp.

Viktor được định vị là AI Coworker Hạng 3, điều này có nghĩa là nó xử lý không còn là các nhiệm vụ hỏi đáp đơn giản, mà là các nhiệm vụ phức tạp cần nhiều bước, chạy lâu dài như kiểm toán tiếp thị, quản lý quảng cáo, nghiên cứu đầu mối. Phía doanh nghiệp có mong muốn trả tiền lớn cho loại AI không cần xác nhận cuối cùng của con người, có thể làm việc liên tục trong thời gian dài như vậy. Sự bùng nổ của dữ liệu thương mại này đã chứng minh rằng điểm neo giá trị của tự động hóa công việc đã chuyển từ "hỗ trợ tạo sinh" sang "tự thực thi".

Các hãng trong nước bố trí Harness và công cụ Agent, chính là để đón đầu xu hướng này. Khi Harness có thể cung cấp đủ hàng rào an toàn, khả năng lưu trữ trạng thái và khôi phục lỗi, AI có thể chuyển từ "thực tập sinh" cần con người liên tục theo dõi, thành "nhà thầu phụ" có thể giao kết quả công việc độc lập. Điểm quan tâm của việc mua sắm doanh nghiệp cũng sẽ chuyển từ kích thước tham số mô hình, sang việc Agent có thể chạy ổn định 8 giờ mà không sập không, có thể tự xử lý giới hạn API và thay đổi cấu trúc trang web hay không. Đối với nhà phát triển, điều này có nghĩa là trọng tâm xây dựng ứng dụng AI sẽ chuyển từ "làm thế nào để viết Prompt tốt" sang "làm thế nào để thiết kế môi trường thời gian chạy vững chắc".

Sự Bùng Nổ Token Và Rào Cản Kỹ Thuật Của "Khung Dày"

Sau khi chuyển sang cạnh tranh công cụ, những thách thức mà việc mua sắm doanh nghiệp và nhà phát triển phải đối mặt trong triển khai thực tế không giảm đi, mà ngược lại càng tập trung hơn vào khía cạnh kỹ thuật.

Vấn đề đầu tiên và cấp bách nhất là sự bùng nổ Token. Agent chạy dài hạn trong chu trình "suy nghĩ, hành động, phản hồi" rất dễ bị đầu ra công cụ thừa làm cho ngữ cảnh phình to nhanh chóng. Cộng đồng nhà phát triển thảo luận rộng rãi về vấn đề nan giải này, cho rằng nó không chỉ đẩy cao chi phí suy luận, mà còn khiến sự chú ý của mô hình phân tán, tỷ lệ thất bại nhiệm vụ tăng mạnh. Ví dụ, khi thực hiện nhiệm vụ thu thập dữ liệu trang web, nếu Harness nhồi toàn bộ mã nguồn HTML của trang web vào ngữ cảnh mà không xử lý, mô hình sẽ nhanh chóng lạc lối trong thông tin thừa, quên mất mục tiêu nhiệm vụ ban đầu. Do đó, khả năng nén ngữ cảnh và quản lý bộ nhớ của Harness trở thành chỉ số đánh giá cốt lõi khi doanh nghiệp mua sắm. Một Harness xuất sắc phải biết thông tin lịch sử nào có thể loại bỏ, kết quả trả về từ công cụ nào cần tóm tắt, điều này đòi hỏi khả năng kiến trúc kỹ thuật sâu, chứ không phải trí thông minh của bản thân mô hình.

Điều này cũng làm dấy lên sự cảnh giác của nhà phát triển đối với các khung "mỏng" chỉ là lớp vỏ. Nếu Harness mà các hãng mô hình lớn đưa ra chỉ là đóng gói API đơn giản, cung cấp cửa sổ hội thoại cơ bản và giao diện gọi công cụ, sẽ thiếu giá trị gỡ lỗi thực tế. Tính dễ vỡ trong môi trường sản xuất yêu cầu Harness phải có các tính năng "khung dày" như cách ly sandbox, kiểm soát quyền chi tiết, tiếp tục từ điểm ngắt. Chỉ có thời gian chạy với rào cản kỹ thuật sâu mới có thể thực sự giải quyết nhu cầu ổn định của ứng dụng cấp doanh nghiệp. Ví dụ, trong kịch bản thực thi mã, Harness phải cung cấp môi trường sandbox an toàn, ngăn mã độc do mô hình tạo ra phá hủy hệ thống chủ; trong nhiệm vụ dài hạn, phải hỗ trợ tiếp tục từ điểm ngắt, tránh việc toàn bộ nhiệm vụ phải bắt đầu lại từ đầu do mạng không ổn định.

Ngoài ra, các yếu tố địa chính trị đã để lại một khoảng trống thị trường khổng lồ cho Harness nội địa. Các sản phẩm tác nhân thông minh kỹ thuật hàng đầu nước ngoài như Claude Code áp dụng hạn chế truy cập đối với Trung Quốc đại lục và các doanh nghiệp có vốn Trung Quốc. Các nhà phát triển trong nước trong tình trạng không thể sử dụng trực tiếp các công cụ hàng đầu này, chỉ có thể tìm kiếm giải pháp thay thế nội địa. Việc Deepseek thành lập đội ngũ Harness không chỉ là theo kịp xu hướng công nghệ, mà còn là phản ứng trước nhu cầu thay thế khổng lồ này.

Đối với việc mua sắm doanh nghiệp và nhà phát triển, việc hiểu giá trị của Harness có nghĩa là khi lựa chọn sản phẩm AI, không còn bị mê hoặc bởi các demo hội thoại hào nhoáng, mà phải đặt câu hỏi về cơ chế khôi phục lỗi của nó là gì, chiến lược quản lý ngữ cảnh là gì, và liệu nó có thể thực sự hòa nhập vào quy trình làm việc hiện tại hay không. Trong giai đoạn cạnh tranh công cụ, doanh nghiệp nên ưu tiên xem xét khả năng giao hàng kỹ thuật và khả năng tương thích hệ sinh thái của hãng cung cấp, thay vì chỉ so sánh điểm số mô hình đơn thuần; nhà phát triển nên chú ý đến mức độ mở của khung Harness và độ hoàn thiện của công cụ gỡ lỗi, chọn nền tảng có thể cung cấp thời gian chạy sâu và kiểm soát được.

Tiền kỹ thuật số thịnh hành

Câu hỏi Liên quan

QDeepseek tại sao thành lập nhóm Harness để phát triển sản phẩm Agent mã thông minh?

ADeepseek thành lập nhóm Harness để nắm quyền thiết kế giao diện và vòng lặp dữ liệu huấn luyện, biến những con đường được cộng đồng phát triển thành sản phẩm chính thức. Họ nhận ra rằng khả năng mã mạnh không đồng nghĩa với việc trở thành công cụ sản xuất. Harness (cơ sở hạ tầng thời gian chạy) là thứ biến mô hình thành Agent có thể tương tác với thế giới bên ngoài, thực thi nhiệm vụ thực tế, và quan trọng hơn, nó là nơi huấn luyện mô hình thông qua dữ liệu phản hồi từ các nhiệm vụ phức tạp.

QSự khác biệt trong con đường xây dựng công cụ (toolchain) giữa Tencent, Alibaba và Deepseek là gì?

ACác công ty lớn có con đường khác nhau dựa trên hệ sinh thái và người dùng mục tiêu: Tencent tập trung vào việc kết nối (connector) thông qua WorkBuddy, tận dụng WeChat và đám mây để tích hợp với hệ thống doanh nghiệp, nhấn mạnh vào sự hợp tác cấp tổ chức. Alibaba chọn cách thâm nhập front-end với PageAgent, một framework Agent GUI chạy trên trình duyệt, giúp dễ dàng tích hợp AI vào bất kỳ trang web nào. Deepseek đi sâu vào kịch bản mã hóa và công việc kỹ thuật, phục vụ trực tiếp nhu cầu của các nhà phát triển.

QVí dụ về công ty Viktor chứng minh điều gì về xu hướng AI trong công việc văn phòng?

AThành công của Viktor (đạt 20 triệu USD ARR) chứng minh rằng các doanh nghiệp sẵn sàng trả tiền cho khả năng 'tự thực thi' (autonomous execution) của AI. AI không còn chỉ là công cụ hỗ trợ tạo nội dung (như Copilot) mà đã tiến hóa thành 'đồng nghiệp AI' có khả năng xử lý các nhiệm vụ phức tạp, nhiều bước, chạy lâu dài và giao kết quả cuối cùng mà không cần sự xác nhận liên tục của con người. Điều này cho thấy giá trị của tự động hóa công việc đã chuyển từ 'hỗ trợ tạo' sang 'tự thực thi'.

QThách thức kỹ thuật chính khi chuyển sang cạnh tranh bằng toolchain và Harness là gì?

AHai thách thức kỹ thuật chính là: 1) Vấn đề 'bùng nổ Token': Agent chạy lâu dài dễ làm ngữ cảnh phình to do đầu ra công cụ dư thừa, làm tăng chi phí suy luận và giảm tỷ lệ thành công nhiệm vụ. Harness cần có khả năng nén ngữ cảnh và quản lý bộ nhớ hiệu quả. 2) Yêu cầu về 'khung dày' (thick framework): Harness cho môi trường sản xuất cần các tính năng phức tạp như hộp cát (sandbox) cách ly, kiểm soát quyền chi tiết, khả năng tiếp tục từ điểm ngắt để đảm bảo ổn định và an toàn, thay vì chỉ là một lớp API đơn giản ('khung mỏng').

QTại sao việc hiểu giá trị của Harness lại quan trọng đối với doanh nghiệp và nhà phát triển khi lựa chọn sản phẩm AI?

AHiểu giá trị của Harness giúp doanh nghiệp và nhà phát triển không bị đánh lừa bởi các cuộc trò chuyện mẫu ấn tượng, mà tập trung vào các yếu tố then chốt cho triển khai thực tế. Họ cần đánh giá cơ chế phục hồi lỗi, chiến lược quản lý ngữ cảnh, và khả năng tích hợp vào quy trình làm việc hiện có của Harness. Trong giai đoạn cạnh tranh toolchain, năng lực kỹ thuật, khả năng giao hàng và tính tương thích sinh thái của nhà cung cấp quan trọng hơn điểm số benchmark của mô hình. Đối với nhà phát triển, mức độ mở và công cụ gỡ lỗi của framework Harness là yếu tố then chốt.

Nội dung Liên quan

Thiệt hại hơn 7,5 triệu USD: Phân tích cuộc tấn công bằng 'bẫy mật ong' nhắm vào MEV Bot và theo dõi dòng tiền bị đánh cắp

Ngày 21 tháng 6, MEV Bot Jaredfromsubway.eth hoạt động tích cực nhất trên Ethereum đã trở thành mục tiêu của một cuộc tấn công "honeypot" (bẫy mật) được thiết kế tinh vi, tổn thất hơn 7,5 triệu USD tài sản mã hóa. Kẻ tấn công đã triển khai một hệ thống hợp đồng phức tạp (hợp đồng điều phối, kích hoạt, hợp đồng con, token giả...) để tạo ra các cơ hội arbitrage ảo. Mấu chốt nằm ở việc lừa MEV Bot cấp quyền ủy quyền (approval) lớn cho các hợp đồng độc hại. Chúng thực hiện nhiều giao dịch mồi: giao dịch nhỏ diễn ra bình thường để tiêu hao quyền ủy quyền và giảm sự nghi ngờ, trong khi các giao dịch lớn lại giữ nguyên quyền ủy quyền mà không sử dụng. MEV Bot thấy lợi nhuận thực từ các giao dịch nhỏ và tin rằng đường đi arbitrage là hợp lệ, từ đó tiếp tục cấp các quyền ủy quyền lớn cho USDC, USDT, WETH. Sau khi thu thập đủ quyền ủy quyền, kẻ tấn công đã kích hoạt hợp đồng điều phối để rút toàn bộ số tài sản đã được ủy quyền từ ví của MEV Bot. Tổng cộng, 2,87 triệu USDC, 2,04 triệu USDT và 1.474 WETH đã bị đánh cắp, sau đó phần lớn được chuyển đổi thành ETH và phân tán. Cuộc tấn công này cho thấy một phương thức tinh vi nhắm vào logic hoạt động của MEV Bot. Nó cảnh báo rằng các bot không nên chỉ dựa vào mô phỏng lợi nhuận để đánh giá rủi ro, cần thận trọng với các hợp đồng lạ, token giả trong đường arbitrage và nên kiểm tra kỹ sự thay đổi quyền ủy quyền (allowance) sau giao dịch.

marsbit28 phút trước

Thiệt hại hơn 7,5 triệu USD: Phân tích cuộc tấn công bằng 'bẫy mật ong' nhắm vào MEV Bot và theo dõi dòng tiền bị đánh cắp

marsbit28 phút trước

Lợi thế kênh phân phối đã cạn kiệt, các giao thức DeFi dựa vào đâu để chống chọi với sự thu hoạch của các gập kềnh?

Bài viết phân tích chiến lược của các đại gia công nghệ như Coinbase, Stripe và Kraken trong việc củng cố quyền kiểm soát lợi nhuận bằng cách sở hữu hoặc mua lại cơ sở hạ tầng cốt lõi, thay vì phụ thuộc vào các giao thức mở. Coinbase, với 1,1 tỷ người dùng, đã xây dựng blockchain Base riêng và thu toàn bộ phí sắp xếp giao dịch, trong khi các giao thức như Morpho hoạt động trên đó phải chia sẻ doanh thu. Tương tự, Stripe mua lại Bridge để tự phát hành stablecoin và giữ lại lợi nhuận từ tài sản thế chấp, thay vì trả phí cho Circle. Kraken mua NinjaTrader để sở hữu giấy phép phái sinh mà tự xây dựng sẽ rất lâu. Tuy nhiên, các giao thức DeFi như Morpho và Uniswap đang xây dựng "hào bảo vệ" bằng cách triển khai đa chuỗi (multi-chain). Điều này giúp họ giảm thiểu rủi ro nếu bị một chuỗi đơn lẻ như Base từ chối, và khiến việc thay thế họ trở nên tốn kém về mặt kinh tế và kỹ thuật đối với các tập đoàn. Ví dụ, sản phẩm cho vay thế chấp Bitcoin 3 tỷ USD của Coinbase vẫn dựa trên Morpho vì việc tự tái tạo hệ thống an toàn của Morpho là rất khó khăn. Bài viết kết luận rằng tương lai của ngành có thể nghiêng về một vài gã khổng lồ nắm toàn bộ chuỗi giá trị, hoặc một hệ sinh thái cân bằng hơn nơi các giao thức mở, đa chuỗi và được tích hợp sâu vẫn giữ được vị thế nhờ vào chi phí chuyển đổi cao và lợi thế kỹ thuật chuyên môn. Cuộc đua giữa tốc độ mở rộng của thể chế và tốc độ mở rộng đa chuỗi của các giao thức mở sẽ quyết định cục diện cuối cùng.

Foresight News46 phút trước

Lợi thế kênh phân phối đã cạn kiệt, các giao thức DeFi dựa vào đâu để chống chọi với sự thu hoạch của các gập kềnh?

Foresight News46 phút trước

Phân Tích Hook của Uniswap v4: Thiết Kế Kiến Trúc, Lỗ Hổng Phổ Biến và Thực Hành Phòng Ngừa

Kể từ khi Uniswap v4 ra mắt mainnet, cơ chế Hook đã trở thành một trong những đổi mới được chú ý nhất trong DeFi. Bài viết này phân tích kiến trúc Hook của Uniswap v4, các lỗ hổng bảo mật phổ biến và thực hành phòng ngừa. Trọng tâm của v4 là hợp đồng PoolManager đơn lẻ và mô hình unlock/callback. Mọi thay đổi trạng thái pool phải thông qua PoolManager.unlock(), với ràng buộc then chốt là NonzeroDeltaCount phải bằng 0 khi kết thúc giao dịch. Mỗi pool được liên kết với một hợp đồng Hook cố định, được PoolManager gọi lại tại các điểm sự kiện quan trọng (ví dụ: beforeSwap, afterAddLiquidity). Quyền hạn của Hook được mã hóa trong 14 bit thấp của địa chỉ triển khai, đòi hỏi phải tính toán cẩn thận bằng công cụ như HookMiner. Bài viết chỉ ra nhiều lỗ hổng và điểm rủi ro tiềm ẩn: - **Kiểm soát truy cập thiếu sót:** BaseHook ban đầu chỉ bảo vệ unlockCallback(), để các hàm hook khác (beforeSwap, afterSwap...) không có bảo vệ, cần được triển khai thủ công. - **Ràng buộc pool lỏng lẻo:** PoolManager không giới hạn việc một Hook có thể được sử dụng cho nhiều pool. Hook cần tự triển khai whitelist hoặc cơ chế ràng buộc đơn pool trong beforeInitialize. - **Async/Custom Curve Hook rủi ro cao:** Hook có thể chặn toàn bộ số lượng swap (bằng cách trả về delta phủ định), thay thế hoàn toàn logic swap gốc của Uniswap, trở thành một hợp đồng tài chính tự trị cần được kiểm toán cực kỳ nghiêm ngặt. - **Kế toán Delta chỉ đảm bảo "bảo toàn", không đảm bảo "chính xác":** NonzeroDeltaCount == 0 đảm bảo sổ sách cân bằng cuối kỳ, nhưng không ngăn nội dung sổ sách bị thao túng độc hại. - **Nhầm lẫn loại token:** Khi giao thức cho phép người dùng tạo thị trường, việc xác thực ngữ nghĩa token là bắt buộc, không thể chỉ dựa vào kiểm tra interface. Sự cố bảo mật của Cork Protocol được nêu làm ví dụ, cho thấy sự phức tạp trong kiểm toán Hook v4: mỗi Hook là một vùng tin cậy độc lập, và việc kiểm toán phải bao quát toàn bộ "giao thức con" tương tác phức tạp, chứ không chỉ riêng mã hợp đồng Hook. Sự thay đổi này đòi hỏi nâng cấp phương pháp luận từ cả phía dự án và nhà kiểm toán.

marsbit52 phút trước

Phân Tích Hook của Uniswap v4: Thiết Kế Kiến Trúc, Lỗ Hổng Phổ Biến và Thực Hành Phòng Ngừa

marsbit52 phút trước

Chip, mô hình mã nguồn mở và 50 nghìn tỷ USD, Joseph Tsai một lần nữa phân tích lại Alibaba

Tại sự kiện VivaTech, Chủ tịch Alibaba Joseph Tsai đã trình bày tầm nhìn AI dài hạn của tập đoàn. Ông nhấn mạnh thị trường AI tiềm năng lên tới 50 nghìn tỷ USD, tương đương một nửa GDP toàn cầu từ đóng góp của trí tuệ và năng suất con người. Alibaba đang tập trung toàn lực vào AI với chiến lược đầu tư toàn diện trên 4 tầng: chip, cơ sở hạ tầng điện toán đám mây, mô hình (như Qwen - một trong những mô hình mã nguồn mở phổ biến nhất) và ứng dụng. Công ty tránh đầu tư vào tầng năng lượng do hiệu quả chi phí tại Trung Quốc. Cách tiếp cận này giúp Alibaba hiện diện ở mọi tầng giá trị tương lai, dù không chắc chắn giá trị cuối cùng sẽ tập trung ở đâu. Tsai bác bỏ quan điểm về bong bóng đầu tư vào cơ sở hạ tầng AI, dẫn đầu tư khổng lồ của các gã khổng lồ công nghệ Mỹ. Ông cho rằng các công ty Trung Quốc cần đầu tư nhiều hơn, và Alibaba may mắn có dòng tiền tự do ~25 tỷ USD/năm từ thương mại điện tử để tài trợ. Về mã nguồn mở, Tsai chỉ ra rằng khi các mô hình hàng đầu của Mỹ đều đóng, thì các công ty Trung Quốc như Alibaba đang dẫn dắt phong trào mã nguồn mở. Ông nhấn mạnh hai lợi ích chính: tính độc lập công nghệ (tránh rủi ro bị "tắt nguồn") và bảo mật dữ liệu (dữ liệu được giữ trong firewall của khách hàng). Điều này đặc biệt quan trọng cho chủ quyền số của các công ty châu Âu. Tsai cũng chia sẻ tầm nhìn về tương lai nơi AI Agent làm việc thay con người, giải phóng thời gian để mọi người tận hưởng cuộc sống, gia đình và giải trí.

marsbit1 giờ trước

Chip, mô hình mã nguồn mở và 50 nghìn tỷ USD, Joseph Tsai một lần nữa phân tích lại Alibaba

marsbit1 giờ trước

Thế hệ người bình thường Đông Á đang làm giàu nhờ TSMC và cổ phiếu Hàn Quốc liên quan đến AI

Bài viết từ WSJ mô tả cơn sốt đầu tư vào AI và ngành bán dẫn đang tạo ra của cải khổng lồ cho nhiều người bình thường tại Đông Á, đặc biệt là ở Hàn Quốc, Đài Loan và Nhật Bản. Làn sóng này được thúc đẩy bởi nhu cầu toàn cầu về chip phục vụ trí tuệ nhân tạo, biến các gã khổng lồ công nghệ như TSMC, Samsung, SK Hynix thành "người bán xẻng" trong cơn sốt vàng AI. Tại Hàn Quốc, những nhà đầu tư trẻ như Na Se-bin (24 tuổi) dành toàn bộ tiền tiết kiệm để đầu tư cổ phiếu, trong khi giáo viên Choi Sung-ho (35 tuổi) thấy danh mục đầu tư tăng gấp 5 lần. Ở Đài Loan, TSMC không chỉ thống trị thị trường chứng khoán (chiếm hơn 41% chỉ số) mà còn mang lại địa vị xã hội và mức lương cao gấp ba lần cho kỹ sư. Tại Nhật Bản, các công ty như Kioxia và TOTO cũng hưởng lợi nhờ cung cấp linh kiện liên quan. Bài viết cho thấy hiện tượng đầu tư đã trở nên phổ biến trong công chúng, từ học sinh đến tài xế taxi, thúc đẩy chi tiêu xa xỉ và thay đổi thói quen tài chính. Tuy nhiên, thị trường cũng tiềm ẩn biến động mạnh, như đợt sụt giảm 8% của KOSPI hồi tháng 6, dù các nhà lãnh đạo như Jensen Huang của NVIDIA vẫn lạc quan. Cơn sốt này nhấn mạnh sự phụ thuộc của cuộc cách mạng AI vào hạ tầng bán dẫn châu Á và tác động sâu rộng của nó đến xã hội.

Odaily星球日报1 giờ trước

Thế hệ người bình thường Đông Á đang làm giàu nhờ TSMC và cổ phiếu Hàn Quốc liên quan đến AI

Odaily星球日报1 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

AGENT S là gì

Agent S: Tương Lai của Tương Tác Tự Động trong Web3 Giới thiệu Trong bối cảnh không ngừng phát triển của Web3 và tiền điện tử, các đổi mới đang liên tục định nghĩa lại cách mà cá nhân tương tác với các nền tảng kỹ thuật số. Một dự án tiên phong như vậy, Agent S, hứa hẹn sẽ cách mạng hóa tương tác giữa con người và máy tính thông qua khung tác nhân mở của nó. Bằng cách mở đường cho các tương tác tự động, Agent S nhằm đơn giản hóa các nhiệm vụ phức tạp, cung cấp các ứng dụng chuyển đổi trong trí tuệ nhân tạo (AI). Cuộc khám phá chi tiết này sẽ đi sâu vào những phức tạp của dự án, các tính năng độc đáo của nó và những tác động đối với lĩnh vực tiền điện tử. Agent S là gì? Agent S đứng vững như một khung tác nhân mở đột phá, được thiết kế đặc biệt để giải quyết ba thách thức cơ bản trong việc tự động hóa các nhiệm vụ máy tính: Thu thập Kiến thức Cụ thể theo Miền: Khung này học một cách thông minh từ nhiều nguồn kiến thức bên ngoài và kinh nghiệm nội bộ. Cách tiếp cận kép này giúp nó xây dựng một kho lưu trữ phong phú về kiến thức cụ thể theo miền, nâng cao hiệu suất của nó trong việc thực hiện nhiệm vụ. Lập Kế Hoạch Qua Các Tầm Nhìn Nhiệm Vụ Dài Hạn: Agent S sử dụng lập kế hoạch phân cấp tăng cường kinh nghiệm, một cách tiếp cận chiến lược giúp phân chia và thực hiện các nhiệm vụ phức tạp một cách hiệu quả. Tính năng này nâng cao đáng kể khả năng quản lý nhiều nhiệm vụ con một cách hiệu quả và hiệu suất. Xử Lý Các Giao Diện Động, Không Đều: Dự án giới thiệu Giao Diện Tác Nhân-Máy Tính (ACI), một giải pháp đổi mới giúp nâng cao tương tác giữa các tác nhân và người dùng. Sử dụng các Mô Hình Ngôn Ngữ Lớn Đa Phương Thức (MLLMs), Agent S có thể điều hướng và thao tác các giao diện người dùng đồ họa đa dạng một cách liền mạch. Thông qua những tính năng tiên phong này, Agent S cung cấp một khung vững chắc giải quyết các phức tạp liên quan đến việc tự động hóa tương tác giữa con người với máy móc, mở ra nhiều ứng dụng trong AI và hơn thế nữa. Ai là Người Tạo ra Agent S? Mặc dù khái niệm về Agent S là hoàn toàn đổi mới, thông tin cụ thể về người sáng lập vẫn còn mơ hồ. Người sáng lập hiện vẫn chưa được biết đến, điều này làm nổi bật giai đoạn sơ khai của dự án hoặc sự lựa chọn chiến lược để giữ kín các thành viên sáng lập. Bất chấp sự ẩn danh, sự chú ý vẫn tập trung vào khả năng và tiềm năng của khung này. Ai là Các Nhà Đầu Tư của Agent S? Vì Agent S còn tương đối mới trong hệ sinh thái mã hóa, thông tin chi tiết về các nhà đầu tư và những người tài trợ tài chính của nó không được ghi chép rõ ràng. Sự thiếu vắng thông tin công khai về các nền tảng đầu tư hoặc tổ chức hỗ trợ dự án dấy lên câu hỏi về cấu trúc tài trợ và lộ trình phát triển của nó. Hiểu biết về sự hỗ trợ là rất quan trọng để đánh giá tính bền vững và tác động tiềm năng của dự án. Agent S Hoạt Động Như Thế Nào? Tại cốt lõi của Agent S là công nghệ tiên tiến cho phép nó hoạt động hiệu quả trong nhiều bối cảnh khác nhau. Mô hình hoạt động của nó được xây dựng xung quanh một số tính năng chính: Tương Tác Giống Như Con Người: Khung này cung cấp lập kế hoạch AI tiên tiến, cố gắng làm cho các tương tác với máy tính trở nên trực quan hơn. Bằng cách bắt chước hành vi của con người trong việc thực hiện nhiệm vụ, nó hứa hẹn nâng cao trải nghiệm người dùng. Ký Ức Tường Thuật: Được sử dụng để tận dụng các trải nghiệm cấp cao, Agent S sử dụng ký ức tường thuật để theo dõi lịch sử nhiệm vụ, từ đó nâng cao quy trình ra quyết định của nó. Ký Ức Tình Huống: Tính năng này cung cấp cho người dùng hướng dẫn từng bước, cho phép khung này cung cấp hỗ trợ theo ngữ cảnh khi các nhiệm vụ diễn ra. Hỗ Trợ OpenACI: Với khả năng chạy cục bộ, Agent S cho phép người dùng duy trì quyền kiểm soát đối với các tương tác và quy trình làm việc của họ, phù hợp với tinh thần phi tập trung của Web3. Tích Hợp Dễ Dàng với Các API Bên Ngoài: Tính linh hoạt và khả năng tương thích với nhiều nền tảng AI khác nhau đảm bảo rằng Agent S có thể hòa nhập liền mạch vào các hệ sinh thái công nghệ hiện có, làm cho nó trở thành lựa chọn hấp dẫn cho các nhà phát triển và tổ chức. Những chức năng này cùng nhau góp phần vào vị trí độc đáo của Agent S trong không gian tiền điện tử, khi nó tự động hóa các nhiệm vụ phức tạp, nhiều bước với sự can thiệp tối thiểu của con người. Khi dự án phát triển, các ứng dụng tiềm năng của nó trong Web3 có thể định nghĩa lại cách mà các tương tác kỹ thuật số diễn ra. Thời Gian Phát Triển của Agent S Sự phát triển và các cột mốc của Agent S có thể được tóm tắt trong một dòng thời gian nêu bật các sự kiện quan trọng của nó: 27 tháng 9, 2024: Khái niệm về Agent S được ra mắt trong một bài nghiên cứu toàn diện mang tên “Một Khung Tác Nhân Mở Sử Dụng Máy Tính Như Một Con Người,” trình bày nền tảng cho dự án. 10 tháng 10, 2024: Bài nghiên cứu được công bố công khai trên arXiv, cung cấp một cái nhìn sâu sắc về khung và đánh giá hiệu suất của nó dựa trên tiêu chuẩn OSWorld. 12 tháng 10, 2024: Một video trình bày được phát hành, cung cấp cái nhìn trực quan về khả năng và tính năng của Agent S, thu hút thêm sự quan tâm từ người dùng và nhà đầu tư tiềm năng. Những dấu mốc trong dòng thời gian không chỉ minh họa sự tiến bộ của Agent S mà còn chỉ ra cam kết của nó đối với sự minh bạch và sự tham gia của cộng đồng. Những Điểm Chính Về Agent S Khi khung Agent S tiếp tục phát triển, một số thuộc tính chính nổi bật, nhấn mạnh tính đổi mới và tiềm năng của nó: Khung Đổi Mới: Được thiết kế để cung cấp cách sử dụng máy tính trực quan giống như tương tác của con người, Agent S mang đến một cách tiếp cận mới cho việc tự động hóa nhiệm vụ. Tương Tác Tự Động: Khả năng tương tác tự động với máy tính thông qua GUI đánh dấu một bước tiến tới các giải pháp tính toán thông minh và hiệu quả hơn. Tự Động Hóa Nhiệm Vụ Phức Tạp: Với phương pháp mạnh mẽ của nó, nó có thể tự động hóa các nhiệm vụ phức tạp, nhiều bước, làm cho các quy trình nhanh hơn và ít sai sót hơn. Cải Tiến Liên Tục: Các cơ chế học tập cho phép Agent S cải thiện từ các trải nghiệm trước đó, liên tục nâng cao hiệu suất và hiệu quả của nó. Tính Linh Hoạt: Khả năng thích ứng của nó trên các môi trường hoạt động khác nhau như OSWorld và WindowsAgentArena đảm bảo rằng nó có thể phục vụ một loạt các ứng dụng rộng rãi. Khi Agent S định vị mình trong bối cảnh Web3 và tiền điện tử, tiềm năng của nó để nâng cao khả năng tương tác và tự động hóa quy trình đánh dấu một bước tiến quan trọng trong công nghệ AI. Thông qua khung đổi mới của mình, Agent S minh họa cho tương lai của các tương tác kỹ thuật số, hứa hẹn một trải nghiệm liền mạch và hiệu quả hơn cho người dùng trên nhiều ngành công nghiệp khác nhau. Kết luận Agent S đại diện cho một bước nhảy vọt táo bạo trong sự kết hợp giữa AI và Web3, với khả năng định nghĩa lại cách chúng ta tương tác với công nghệ. Mặc dù vẫn còn ở giai đoạn đầu, những khả năng cho ứng dụng của nó là rộng lớn và hấp dẫn. Thông qua khung toàn diện của mình giải quyết các thách thức quan trọng, Agent S nhằm đưa các tương tác tự động lên hàng đầu trong trải nghiệm kỹ thuật số. Khi chúng ta tiến sâu hơn vào các lĩnh vực tiền điện tử và phi tập trung, các dự án như Agent S chắc chắn sẽ đóng một vai trò quan trọng trong việc định hình tương lai của công nghệ và sự hợp tác giữa con người với máy tính.

Tổng lượt xem 882Xuất bản vào 2025.01.14Cập nhật vào 2025.01.14

AGENT S là gì

Làm thế nào để Mua S

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Sonic (S) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Sonic (S) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Sonic (S) của BạnSau khi mua Sonic (S), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Sonic (S)Giao dịch Sonic (S) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 1.6kXuất bản vào 2025.01.15Cập nhật vào 2026.06.02

Làm thế nào để Mua S

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của S (S) được trình bày dưới đây.

活动图片