Dữ liệu Anthropic: Gần một nửa lượt gọi AI Agent tập trung vào kỹ thuật phần mềm, 16 lĩnh vực chuyên sâu này vẫn là thị trường màu mỡ

marsbitXuất bản vào 2026-02-24Cập nhật gần nhất vào 2026-02-24

Tóm tắt

Bài viết trình bày nghiên cứu của Anthropic về việc sử dụng AI Agent trong thực tế, với dữ liệu nổi bật: gần 50% hoạt động tập trung vào lĩnh vực kỹ thuật phần mềm, trong khi 16 lĩnh vực khác như y tế, pháp lý, giáo dục… mỗi ngành chỉ chiếm dưới 5%. Điều này cho thấy cơ hội khổng lồ cho các công ty khởi nghiệp AI chuyên sâu theo ngành. Một phát hiện quan trọng: dù AI có khả năng làm việc liên tục gần 5 giờ, người dùng chỉ cho phép nó hoạt động trung bình 42 phút. Khoảng cách này cho thấy "thâm hụt tin cậy" chính là cơ hội sản phẩm tiếp theo. Người dùng mới tự động phê duyệt 20% thao tác, nhưng sau 750 phiên, tỷ lệ này tăng lên hơn 40%. Tuy nhiên, người dùng có kinh nghiệm can thiệp nhiều hơn, chuyển từ phê duyệt trước sang giám sát chủ động. Aaron Levie nhấn mạnh: thành công nằm ở việc xây dựng Agent tích hợp dữ liệu riêng, hiểu sâu nghiệp vụ ngành và quản lý thay đổi phía khách hàng. Các lĩnh vực như y tế, luật, giáo dục… vẫn là thị trường màu mỡ chưa được khai phá. Bài viết kết luận: với hơn 300 kỳ lân SaaS đã ra đời, 300 kỳ lân AI tiếp theo sẽ thuộc về những ai làm chủ được tri thức ngành và biết cách triển khai AI một cách hiệu quả.

Tác giả: Garry's List

Biên dịch: Deep Tide TechFlow

Deep Tide导读: Anthropic mới đây đã công bố nghiên cứu toàn diện nhất từ trước đến nay về việc sử dụng AI Agent trong thực tế, dữ liệu cốt lõi là: kỹ thuật phần mềm chiếm gần 50% lưu lượng gọi công cụ Agent, trong khi các lĩnh vực chuyên sâu như y tế, pháp lý, giáo dục và 14 lĩnh vực khác cộng lại còn chưa bằng một nửa phần còn lại, mỗi lĩnh vực đều có thị phần dưới 5%.

Đây không phải là tín hiệu thị trường bão hòa, mà là bản đồ của 300 kỳ lân AI chuyên sâu — điều có giá trị hơn là một phát hiện phản trực giác được bài viết trích dẫn: mô hình đã có thể làm việc độc lập gần 5 giờ, nhưng người dùng thực tế chỉ cho nó làm việc 42 phút, chính "khoảng cách niềm tin" này là cơ hội sản phẩm tiếp theo.

Toàn văn như sau:

Kỹ thuật phần mềm chiếm gần 50% tổng lượt gọi công cụ AI Agent. Các lĩnh vực chuyên sâu như y tế, pháp lý, tài chính và 13 lĩnh vực khác hầu như chưa được chạm tới, mỗi lĩnh vực đều dưới 5%. Điều này có nghĩa là có 300 kỳ lân AI chuyên sâu đang chờ được xây dựng.

Nếu hôm nay tôi khởi nghiệp, tôi sẽ nhìn chằm chằm vào vùng màu đỏ trên biểu đồ cột kia cho đến khi tôi nhìn thấy tương lai của mình.

Người sáng lập Box, Aaron Levie cho biết:

Biểu đồ này là một lời nhắc nhở tốt về cơ hội lớn đến thế nào trong lĩnh vực AI Agent hiện nay.

Chắc chắn sẽ có rất nhiều cơ hội Agent theo chiều ngang, nhưng cũng có rất nhiều quy trình công việc đòi hỏi kiến thức chuyên môn sâu về lĩnh vực mới thực sự giúp người dùng tự động hóa các quy trình độc đáo trong lĩnh vực của họ.

Khuôn mẫu là: Xây dựng phần mềm Agent tích hợp dữ liệu độc quyền, để xử lý hiệu quả quy trình công việc theo cách kết nối người dùng với sự hợp tác của Agent, đồng thời có khả năng xử lý ngữ cảnh chuyên sâu theo lĩnh vực cụ thể, cũng như khả năng thúc đẩy quản lý thay đổi phía khách hàng.

Hiện tại, nhiều lĩnh vực vẫn còn khoảng trống rất lớn.

Kỹ thuật phần mềm chiếm một nửa hoạt động AI Agent. Nửa còn lại phân tán trên 16 lĩnh vực chuyên sâu, không lĩnh vực nào vượt quá 9%. Y tế chiếm 1%, pháp lý 0.9%, giáo dục 1.8%. Đây không phải là những thị trường bão hòa, mà là những thị trường gần như chưa tồn tại.

Anthropic vừa công bố nghiên cứu toàn diện nhất từ trước đến nay về việc sử dụng AI Agent thực tế. Phát hiện cốt lõi là: Kỹ thuật phần mềm chiếm 49.7% lưu lượng gọi công cụ Agent trên API của họ. Kết luận cốt lõi bị chôn vùi phía sau là: mọi thứ khác đều là thị trường màu mỡ.

Triển khai chậm trễ

Một dữ liệu nên khiến các nhà khởi nghiệp phấn khích: khả năng của mô hình đã vượt xa ranh giới mà người dùng sẵn sàng tin tưởng nó.

Đánh giá năng lực của METR cho thấy, Claude có thể giải quyết các nhiệm vụ mà con người cần gần năm giờ để hoàn thành. Nhưng trong sử dụng thực tế, thời lượng phiên ở phần trăm thứ 99.9 chỉ vào khoảng 42 phút. Khoảng cách này — khoảng cách giữa những gì AI có thể làm và những gì chúng ta cho phép nó làm — là một cơ hội khổng lồ.

Hình: Thời lượng đào tạo dài nhất của Claude Code đã gần như tăng gấp đôi trong ba tháng. Điều này không chỉ nâng cao năng lực mà còn tăng cường niềm tin.

Nguồn:x.com

Từ tháng 10/2025 đến tháng 1/2026, thời lượng phiên đơn lẻ ở phần trăm thứ 99.9 đã tăng gần gấp đôi, từ dưới 25 phút lên hơn 45 phút. Sự tăng trưởng ổn định trên các phiên bản mô hình khác nhau. Đây không chỉ là mô hình trở nên mạnh hơn, mà là người dùng từng lần một học hỏi trong khi sử dụng, dần dần mở rộng niềm tin vào Agent.

"Từ tháng 8 đến tháng 12, tỷ lệ thành công của Claude Code trong các nhiệm vụ khó khăn nhất của người dùng nội bộ đã tăng gấp đôi, đồng thời, số lần can thiệp thủ công mỗi phiên giảm từ 5.4 lần xuống 3.3 lần."

Năng lực đã có ở đó, việc triển khai chưa theo kịp. Đây không phải là vấn đề, mà là cơ hội sản phẩm.

Niềm tin tiến hóa như thế nào

20% người dùng mới sẽ tự động phê duyệt thao tác của Claude Code. Đến phiên thứ 750, hơn 40% phiên chạy hoàn toàn ở chế độ phê duyệt tự động. Nhưng có một phát hiện phản trực giác: người dùng có kinh nghiệm lại can thiệp nhiều hơn, chứ không phải ít hơn. Người dùng mới can thiệp trong 5% số lượt, người dùng cũ là 9%.

Hình: Niềm tin là một kỹ năng tích lũy không ngừng. 20% người dùng mới sẽ tự động phê duyệt phiên. Đến phiên thứ 750, tỷ lệ này sẽ vượt quá 40%.

Hình ảnh: Anthropic

Nguồn: x.com

Điều này không mâu thuẫn, mà là sự thay đổi chiến lược giám sát. Người mới bắt đầu phê duyệt từng bước trước khi thao tác xảy ra, người dùng cũ thì ủy quyền trước, rồi can thiệp sau nếu có vấn đề — họ đã chuyển từ phê duyệt trước sang giám sát chủ động.

Đây là một phát hiện đáng chú ý ở khía cạnh bảo mật: Trong các nhiệm vụ phức tạp, tần suất Claude Code chủ động yêu cầu làm rõ cao hơn hơn hai lần tần suất can thiệp chủ động của con người. Agent sẽ tạm dừng để xác nhận, thay vì lao thẳng tới đích. Đây là tính năng, không phải lỗi.

"Bài học cốt lõi từ nghiên cứu này là: Quyền tự chủ mà Agent thực thi trong thực tế được xây dựng chung bởi mô hình, người dùng và sản phẩm. Claude sẽ tạm dừng đặt câu hỏi khi không chắc chắn, từ đó hạn chế tính độc lập của chính nó. Người dùng xây dựng niềm tin trong quá trình hợp tác với mô hình và điều chỉnh chiến lược giám sát cho phù hợp."

Chiến lược AI chuyên sâu của Levie

Aaron Levie chỉ ra khối tài sản và giá trị khổng lồ đang chờ được mở khóa: Xây dựng phần mềm Agent tích hợp dữ liệu độc quyền, để nó thực sự giải quyết con người và vấn đề thực tế, nhồi nhét ngữ cảnh để tối đa hóa đầu ra thông minh, và — đây là phần hầu hết nhà khởi nghiệp bỏ qua — thúc đẩy quản lý thay đổi phía khách hàng.

Điểm cuối cùng này chính là lý do khiến AI chuyên sâu khó bị sao chép đến vậy. Bất kỳ ai cũng có thể gói một API, nhưng rất ít người có thể thực sự điều hướng các quy trình công việc, ràng buộc quy định và sức cản tổ chức đặc thù trong thanh toán hóa đơn y tế, phát hiện pháp lý hoặc phê duyệt giấy phép xây dựng.

SaaS đã tăng trưởng gấp mười lần mỗi thập kỷ trong vài thập kỷ qua. 20 năm qua, hơn 40% vốn đầu tư mạo hiểm đổ vào các công ty SaaS. Ngành này đã sinh ra hơn 170 kỳ lân SaaS. Logic rất đơn giản: mỗi một trong những kỳ lân này, đều có một phiên bản AI chuyên sâu đang chờ xuất hiện. Và phiên bản AI có thể lớn hơn gấp mười lần, bởi nó thay thế không chỉ phần mềm, mà cả nhân viên vận hành.

Bản chất của việc cùng xây dựng

Phát hiện cốt lõi của Anthropic đáng để bất kỳ ai tham gia hoạch định chính sách AI quan tâm nghiêm túc. Quyền tự chủ không phải là thuộc tính cố hữu của mô hình, mà được xây dựng chung bởi mô hình, người dùng và sản phẩm. Đánh giá trước triển khai không thể nắm bắt điều này, bạn phải đo lường nó trong sử dụng thực tế.

Anthropic chính thức tuyên bố:

Kỹ thuật phần mềm chiếm khoảng 50% lưu lượng gọi công cụ Agent trên API của chúng tôi, nhưng chúng tôi cũng thấy các ngành khác đang nổi lên. Khi ranh giới giữa rủi ro và quyền tự chủ tiếp tục mở rộng, việc giám sát sau triển khai trở nên tối quan trọng. Chúng tôi khuyến khích các nhà phát triển mô hình khác mở rộng nghiên cứu này.

Các con số ở khía cạnh bảo mật rất đáng yên tâm: 73% lượt gọi công cụ có sự tham gia của con người trong vòng lặp (human-in-the-loop), chỉ 0.8% thao tác là không thể đảo ngược. Các kịch bản triển khai rủi ro cao nhất — như rò rỉ khóa API hoặc giao dịch mã hóa tự chủ — chủ yếu là đánh giá bảo mật, chứ không phải môi trường sản xuất thực tế.

"Các yêu cầu quy định cụ thể về chế độ tương tác — chẳng hạn yêu cầu con người phê duyệt mọi thao tác — sẽ chỉ tạo ra ma sát, mà không nhất thiết mang lại lợi ích bảo mật."

Chính sách bắt buộc "phê duyệt mọi thao tác" sẽ giết chết lợi ích năng suất, nhưng không tăng tính bảo mật. Mục tiêu tốt hơn là đảm bảo con người có thể giám sát và can thiệp, chứ không quy định cụ thể quy trình phê duyệt.

Kỳ lân ẩn nấp ở đâu

Bản đồ đã được vẽ ra. Kỹ thuật phần mềm đã có người làm. Y tế, pháp lý, tài chính, giáo dục, dịch vụ khách hàng, hậu cần — 16 lĩnh vực chuyên sâu, mỗi lĩnh vực đều có thị phần một con số — đang chờ ai đó nhúng thực sự kiến thức chuyên môn ngành vào Agent.

Trước đây đã sinh ra 300 kỳ lân SaaS, 300 kỳ lân AI chuyên sâu tiếp theo sắp xuất hiện. Những nhà sáng lập chọn lĩnh vực chuyên sâu, nhúng kiến thức chuyên môn ngành vào Agent, và tìm ra cách thúc đẩy quản lý thay đổi, sẽ sở hữu thị trường phần mềm doanh nghiệp của thập kỷ tới.

Mô hình đã có thể làm việc năm giờ, người dùng chỉ cho nó làm việc 42 phút. Đây chính là tín hiệu: chúng ta vẫn đang ở giai đoạn cực kỳ sớm, còn rất nhiều thứ có thể xây dựng, và ở vô số nơi còn chưa thấy trí thông minh phát huy tác dụng dù chỉ một phút.

Câu hỏi Liên quan

QTheo nghiên cứu của Anthropic, lĩnh vực nào chiếm gần 50% lượng gọi công cụ AI Agent?

APhát triển phần mềm (Software Engineering) chiếm gần 50% (49.7%) lượng gọi công cụ AI Agent.

QNghiên cứu chỉ ra có bao nhiêu lĩnh vực dọc được xem là 'thị trường màu xanh' với mỗi lĩnh vực chiếm dưới 5% thị phần?

ANghiên cứu chỉ ra có 16 lĩnh vực dọc (như y tế, pháp lý, giáo dục) được xem là 'thị trường màu xanh', với mỗi lĩnh vực chiếm dưới 5% thị phần.

QKhoảng cách giữa khả năng của mô hình AI và thời gian người dùng thực sự cho phép nó hoạt động là gì và tại sao đây được coi là một cơ hội?

AMô hình AI (Claude) có khả năng giải quyết công việc cần con người làm gần 5 giờ, nhưng trên thực tế, người dùng chỉ cho phép nó hoạt động khoảng 42 phút. Khoảng cách này cho thấy một 'sự thâm hụt tin tưởng' và là cơ hội lớn cho các sản phẩm mới nhằm thu hẹp khoảng cách đó.

QAaron Levie đã đề xuất công thức nào để xây dựng các Agent AI theo chiều dọc?

AAaron Levie đề xuất công thức: Xây dựng phần mềm Agent kết nối với dữ liệu độc quyền, thiết kế cách thức hợp tác hiệu quả giữa người dùng và Agent, trang bị khả năng hiểu ngữ cảnh chuyên sâu theo lĩnh vực cụ thể, và có khả năng thúc đẩy quản lý thay đổi phía khách hàng.

QTỷ lệ phần trăm các cuộc gọi công cụ AI Agent có sự tham gia của con người (human-in-the-loop) là bao nhiêu theo báo cáo?

ATheo báo cáo, 73% các cuộc gọi công cụ AI Agent có sự tham gia của con người trong vòng lặp (human-in-the-loop).

Nội dung Liên quan

750 tỷ USD Tái Phân Bổ Tài Sản Rủi Ro: SpaceX Niêm Yết Sẽ Kéo Theo Thị Trường Chứng Khoán Mỹ Và Bitcoin Ra Sao?

Tác giả: Chloe, ChainCatcher SpaceX (SPCX.O) đã lên sàn với giá chỉ dẫn mở cửa 172 USD, cao hơn 26-30% so với giá phát hành IPO 135 USD, huy động khoảng 750 tỷ USD và định giá khoảng 1,77 nghìn tỷ USD. Sự kiện này được coi là một trong những đợt IPO lớn nhất lịch sử. Thị trường coi SpaceX là cổ phiếu tăng trưởng siêu cấp nhờ yếu tố "AI + không gian + phí bảo hiểm Musk", chứ không chỉ là một công ty sản xuất vũ trụ thuần túy. Trong khi Bitcoin ổn định quanh 63.300 USD, thị trường phái sinh crypto đã giao dịch sôi động các hợp đồng tương lai vĩnh viễn pre-IPO của SpaceX, cho thấy giới giao dịch coi đây là tài sản có beta cao tiếp theo. IPO 750 tỷ USD có thể trở thành máy hút vốn khỏi các tài sản rủi ro khác như cổ phiếu, ETF hoặc crypto, vì nguồn vốn được chuyển hướng mạnh mẽ vào cổ phiếu mới. Nhu cầu đăng ký mua cao gấp 3-4 lần cho thấy một lượng vốn lớn đang điều chỉnh danh mục để tranh mua. Ngắn hạn, điều này có thể khuếch đại sự thèm ăn rủi ro, nhưng trung hạn, việc SpaceX có thể nhanh chóng được đưa vào các chỉ số lớn khiến các danh mục đầu tư thụ động tập trung hơn vào chủ đề AI/công nghệ. Lịch sử tương tự là đợt lên sàn của Coinbase năm 2021, đánh dấu đỉnh cao ngắn hạn của Bitcoin. SpaceX có thể là "lễ trưởng thành" cho chủ đề AI, không gian và hệ sinh thái Musk, thường báo hiệu câu chuyện đã được định giá tối đa. Mặt khác, SpaceX nắm giữ 18.712 BTC (trị giá khoảng 1,2 tỷ USD) trên bảng cân đối kế toán, củng cố hình ảnh Bitcoin như một tài sản kho bạc doanh nghiệp. Tuy nhiên, con số này chỉ chiếm 0,07% định giá của SpaceX, mang nhiều giá trị biểu tượng hơn trọng lượng tài chính. Tóm lại, IPO SpaceX là con dao hai lưỡi với Bitcoin. Ngắn hạn, nó là máy hút vốn cạnh tranh, nhưng dài hạn, việc nắm giữ BTC của SpaceX có thể trở thành cột mốc quan trọng trong việc các thể chế chấp nhận Bitcoin.

链捕手1 giờ trước

750 tỷ USD Tái Phân Bổ Tài Sản Rủi Ro: SpaceX Niêm Yết Sẽ Kéo Theo Thị Trường Chứng Khoán Mỹ Và Bitcoin Ra Sao?

链捕手1 giờ trước

Định luật Thao (τ), đưa EDA “nổ” ra khỏi vòng tròn

Tháng 5/2026, tại IEEE ISCAS, bà Hà Đình Ba, Chủ tịch bộ phận kinh doanh bán dẫn của Huawei, đã giới thiệu khái niệm "Định luật Thao (τ)". Khác với Định luật Moore tập trung vào thu nhỏ hình học, định luật τ hướng tới "thu nhỏ thời gian", tối ưu hóa hằng số thời gian τ xuyên suốt các cấp độ linh kiện, mạch, chip và hệ thống để tăng hiệu suất xử lý thông tin. Huawei cho biết đã sản xuất 381 chip dựa trên nguyên tắc này và dự kiến đạt trình độ tương đương 1.4nm vào năm 2031. Định luật τ đặt ra yêu cầu mới cho công cụ EDA, đẩy nó từ công cụ thiết kế hỗ trợ lên thành nền tảng tối ưu hóa hiệu suất hệ thống trọng yếu. Các thách thức chính bao gồm: thiếu khả năng thiết kế "3D thực sự" bản địa và tối ưu hóa xuyên tầng (STCO), cũng như thiếu công cụ phân tích đa trường vật lý (điện, nhiệt, cơ) kết hợp hiệu quả cho các cấu trúc xếp chồng 3D và Chiplet. Định luật này có thể thúc đẩy EDA trong nước Trung Quốc chuyển từ các công cụ điểm sang xây dựng nền tảng phần mềm công nghiệp "toàn quy trình, xuyên tầng, hợp tác mạnh". Các công ty như Hoa Đại Cửu Thiên đã bắt đầu phát triển các giải pháp toàn quy trình cho thiết kế 3DIC. Đại học Bắc Kinh cũng công bố nguyên mẫu công cụ EDA "3D thực sự" cho nhu cầu gấp logic, cho thấy sự tiến bộ trong việc lấp đầy khoảng trống then chốt, hướng tới mục tiêu không chỉ "có thể dùng" mà còn "dùng tốt" toàn diện.

marsbit3 giờ trước

Định luật Thao (τ), đưa EDA “nổ” ra khỏi vòng tròn

marsbit3 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片