Cùng với việc kỳ vọng IPO ngày càng tăng cao, nhịp độ phát hành sản phẩm mô hình của Anthropic cũng ngày càng tăng tốc.
Vừa rồi, Anthropic liên tiếp công bố hai tin tức quan trọng:một là nâng cấp mô hình hàng đầu lên Claude Opus 4.8, hai là hoàn tất vòng gọi vốn Series H trị giá 650 tỷ USD, định giá sau đầu tư đạt 9650 tỷ USD, đang tiến sát ngưỡng nghìn tỷ USD.
Đối với một công ty AI đã có định giá tiệm cận nghìn tỷ USD, thị trường không còn chỉ nhìn vào điểm benchmark của mô hình, mà là liệu nó có thể biến trí tuệ, công cụ, môi trường phát triển, nền tảng đám mây và tài nguyên tính toán thành một bộ cơ sở hạ tầng có thể giao hàng trên quy mô lớn hay không.
Nói cách khác, Anthropic phải chuyển dần từ một công ty giao mô hình tốt, sang một công ty đang cố gắng định hình lại cách thức làm việc với AI của doanh nghiệp.
Thêm lượng không tăng giá, Claude Opus 4.8 chính thức trình làng
Claude Opus 4.8 được phát hành lần này là một lần nâng cấp của Anthropic đối với dòng mô hình hàng đầu Opus. Với nhịp độ phát hành mô hình hiện tại, như lời đùa của cư dân mạng,chúng ta rất có thể sẽ nhìn thấy Claude Opus 6 trước cả khi GTA 6 ra mắt (nếu không delay, tháng 11).
Anthropic tuyên bố, Opus 4.8 được xây dựng trên nền tảng Opus 4.7, có cải thiện về mã hóa, nhiệm vụ tác nhân, lập luận và công việc tri thức, đồng thời đã mở cửa cho người dùng, giá sử dụng tiêu chuẩn vẫn không thay đổi,vẫn là 5 USD cho một triệu token đầu vào, 25 USD cho một triệu token đầu ra.
Nhà phát triển cũng có thể sử dụng claude-opus-4-8 thông qua Claude API.
So sánh giá API https://platform.claude.com/docs/en/about-claude/models/overview
Từ thông tin chính thức được tiết lộ, những cải tiến của Opus 4.8 bao phủ mã hóa, khả năng tác nhân, khả năng lập luận và các nhiệm vụ công việc tri thức thực tế.
Anthropic sử dụng một bảng so sánh trong tài liệu phát hành để thể hiện hiệu suất của Opus 4.8 so với Opus 4.7 đời trước và các mô hình khác trong nhiều bài kiểm tra, tất nhiên, so với chất lượng câu trả lời một lần,trọng tâm nâng cấp mô hình vẫn nằm ở biểu hiện trong các nhiệm vụ dài và cộng tác phức tạp.
Trong quy trình công việc thực tế, mô hình thường cần xử lý liên tục các nhiệm vụ nhiều bước, gọi công cụ, kiểm tra kết quả trung gian và tiếp tục tiến lên dựa trên phản hồi. Anthropic cho biết, những người thử nghiệm sớm nhận thấy Opus 4.8 đáng tin cậy hơn khi thực hiện nhiệm vụ tác nhân, và phán đoán cũng rõ ràng hơn.
Việc nâng cao tính trung thực của Opus 4.8 là một điểm nhấn.
Vấn đề phổ biến của mô hình AI là đưa ra phán đoán quá sớm khi chứng cứ không đủ, và tự tin tuyên bố đã đạt được tiến triển. Anthropic tuyên bố, Opus 4.8 sẵn sàng hơn trong việc nói rõ sự không chắc chắn trong công việc, và cũng ít đưa ra phán đoán thiếu cơ sở hơn.
Nhiệm vụ mã hóa đặc biệt thể hiện sự thay đổi này.
Đánh giá nội bộ cho thấy, xác suất để Opus 4.8 khiến mã do chính nó viết ra có lỗi nhưng vẫn vượt qua mà không được thông báo, chỉ bằng khoảng một phần tư so với đời trước. Nghĩa là, mô hình mới có khả năng cao hơn trong việc nhắc nhở người dùng khi phát hiện rủi ro, thay vì để lại vấn đề cho các bài kiểm tra sau này hoặc môi trường sản xuất.
Về mặt alignment và an toàn, Anthropic tiếp tục câu chuyện cốt lõi của mình. Tỷ lệ xảy ra hành vi không alignment như lừa dối, hợp tác lạm dụng của Opus 4.8 thấp hơn đáng kể so với Opus 4.7, và tiệm cận với một trong những mô hình có biểu hiện alignment tốt nhất hiện nay là Claude Mythos Preview.
An toàn, đáng tin cậy, có thể kiểm soát, vẫn là một nhóm từ khóa mà Anthropic dùng để phân biệt bản thân. Khi Claude thâm nhập sâu hơn vào quy trình doanh nghiệp, những từ khóa này cũng bắt đầu mang nhiều ý nghĩa thương mại hơn.
Tuy nhiên điều thú vị là, sau khi Opus 4.8 được phát hành, cư dân mạng đã phát hiện ra có chút không ổn.
https://x.com/realNyarime/status/2060059543820963975
Nhiều cư dân mạng thử nghiệm phát hiện, khi họ truy vấn sâu về danh tính mô hình của Opus 4.8, câu trả lời nó đưa ra không phải lúc nào cũng là Claude.
Đôi khi nó sẽ tự nhận mình là Qwen, đôi khi lại báo tên DeepSeek, nghi ngờ có hành vi chưng cất.
Và khi cư dân mạng đặt câu hỏi tương tự trong ứng dụng khách chính thức Claude, những câu trả lời kiểu này thường không dễ tái hiện. Nguyên nhân có lẽ nằm ở việc, prompt hệ thống và các ràng buộc ở tầng sản phẩm trong ứng dụng khách đầy đủ hơn.
Dynamic workflows ra mắt, Claude Code tiến tới cộng tác đa tác nhân
Cùng với Claude Opus 4.8 ra mắt, còn có nhiều tính năng sản phẩm và dành cho nhà phát triển.
Trong đó, tính năng ảnh hưởng trực tiếp nhất đến trải nghiệm người dùng Claude chính là effort control, tức điều chỉnh cường độ suy nghĩ.
Tùy chọn điều khiển nằm cạnh bộ chọn mô hình, như tên gọi, người dùng có thể quyết định Claude sẽ đầu tư bao nhiêu năng lực tính toán lập luận vào một nhiệm vụ. Ở cường độ cao hơn, Claude sẽ thực hiện nhiều suy luận hơn để đổi lấy chất lượng trả lời tốt hơn; ở cường độ thấp hơn, Claude phản hồi nhanh hơn, và mức tiêu hao hạn ngạch sử dụng cũng chậm hơn.
Anthropic cho biết, Opus 4.8 mặc định sử dụng high effort, người dùng còn có thể chọn extra, tương ứng với xhigh trong Claude Code, hoặc chọn max, để mô hình đầu tư thêm token. Anthropic đề xuất, các nhiệm vụ khó và quy trình công việc bất đồng bộ chạy lâu ngày phù hợp hơn với việc sử dụng extra.
Tính năng thực sự ảnh hưởng đến hình thái sản phẩm Claude Code, là dynamic workflows.
Tính năng này hiện đang trong giai đoạn research preview, mục tiêu là để Claude Code xử lý các nhiệm vụ quy mô lớn trong quá khứ cần chu kỳ kỹ thuật dài hơn. Công việc trước đây được lập kế hoạch theo quý, bây giờ thậm chí có cơ hội hoàn thành trong vài ngày.
Cơ chế cốt lõi của dynamic workflows là, Claude sẽ dựa trên nhiệm vụ người dùng để tự động viết orchestration scripts, và chạy hàng chục đến hàng trăm subagents song song trong một phiên duy nhất. Mô hình sẽ lập kế hoạch nhiệm vụ trước, sau đó phân bổ cho nhiều subagents, sau đó kiểm tra kết quả trả về, cuối cùng báo cáo lại cho người dùng. Sau khi Opus 4.8 ra mắt, các agents này còn có thể chạy lâu hơn.
Tính năng này chủ yếu hướng đến các kho mã phức tạp, đồ sộ hoặc có gánh nặng lịch sử lớn. Các tình huống điển hình bao gồm tìm lỗi trong phạm vi toàn bộ dịch vụ, kiểm toán tối ưu hóa hiệu suất, kiểm toán an ninh, di chuyển kho mã lớn, thay thế framework, di chuyển API lỗi thời, port ngôn ngữ, cũng như xác thực đa góc độ đối với các giải pháp quan trọng.
Về cách sử dụng, Anthropic đề xuất bật chế độ auto trong dynamic workflows. Người dùng có thể yêu cầu trực tiếp Claude tạo workflow, hoặc bật ultracode trong Claude Code. ultracode sẽ đặt cường độ suy nghĩ thành xhigh, và để Claude tự động đánh giá nhiệm vụ hiện tại có phù hợp sử dụng workflow hay không.
dynamic workflows hiện đã mở cửa trong Claude Code CLI, Desktop và VS Code extension, hướng đến các gói Max, Team và Enterprise. Trong đó, Enterprise khi phát hành mặc định đã tắt, cần quản trị viên bật trong cài đặt Claude Code.
Tính năng này cũng có thể được sử dụng thông qua Claude API, Amazon Bedrock, Vertex AI và Microsoft Foundry. Đối với người dùng Max, Team, và người dùng sử dụng Claude Code thông qua API, dynamic workflows mặc định được bật.
Anthropic sử dụng trường hợp di chuyển Bun để thể hiện giới hạn trên của dynamic workflows. Jarred Sumner sử dụng tính năng này để port Bun từ Zig sang Rust, cuối cùng tạo ra khoảng 750 nghìn dòng mã Rust, tỷ lệ vượt qua bộ test hiện có đạt 99.8%, từ lần commit đầu tiên đến khi merge mất khoảng 11 ngày.
Toàn bộ quá trình di chuyển được hoàn thành bởi nhiều workflow: đầu tiên ánh xạ lifetime Rust cho các trường struct trong kho mã Zig, sau đó tạo các file .rs có hành vi nhất quán cho mỗi file .zig, hàng trăm agents làm việc song song, mỗi file đều có hai reviewer. Sau đó, fix loop liên tục chạy build và test suite, cho đến khi build và test vượt qua. Sau khi di chuyển hoàn tất, lại có overnight workflow xử lý vấn đề sao chép dữ liệu không cần thiết, và mở PR cho từng loại vấn đề, để đánh giá cuối cùng.
Ngoài Claude Code, Anthropic còn cập nhật Messages API. Hiện tại, Messages API có thể chấp nhận system entries bên trong mảng messages.
Nhà phát triển có thể cập nhật hướng dẫn cho Claude trong quá trình thực thi nhiệm vụ, đồng thời không phá vỡ prompt cache, cũng không cần truyền cập nhật thông qua user turn. Khả năng này có thể được sử dụng để cập nhật quyền, ngân sách token hoặc ngữ cảnh môi trường trong thời gian chạy của agent.
Bước tiếp theo, Anthropic còn có kế hoạch ra mắt một loại mô hình mới có trình độ thông minh cao hơn Opus.Đúng vậy, chính là Claude Mythos Preview đáng sợ đó, dự kiến trong vài tuần tới có thể đưa các mô hình thuộc lớp Mythos đến với tất cả khách hàng.
Đến lúc đó, chúng tôi cũng sẽ lập tức nếm thử hương vị.
Đằng sau định giá gần nghìn tỷ USD, Claude cần nền tảng tính toán lớn hơn
Một tin tức khác được công bố cùng ngày với Claude Opus 4.8,là Anthropic hoàn tất vòng gọi vốn Series H trị giá 650 tỷ USD. Vòng này do Altimeter Capital, Dragoneer, Greenoaks và Sequoia Capital dẫn đầu, định giá sau đầu tư đạt 9650 tỷ USD.
Vòng gọi vốn này còn bao gồm cam kết đầu tư hiện có 150 tỷ USD từ các hyperscalers, trong đó có 50 tỷ USD từ Amazon. Các đối tác cơ sở hạ tầng chiến lược như Micron, Samsung, SK hynix cũng tham gia. Anthropic tuyên bố, những công ty này có vai trò then chốt trong việc cung cấp memory, storage và logic chips toàn cầu, có thể giúp họ mở rộng năng lực tính toán theo nhu cầu tăng trưởng của Claude.
Mở rộng năng lực tính toán là bối cảnh then chốt đằng sau vòng gọi vốn này. Anthropic đã tiết lộ nhiều thỏa thuận cơ sở hạ tầng: ký kết thỏa thuận với Amazon, nhận được công suất bổ sung tối đa 5 gigawatt; ký kết thỏa thuận với Google và Broadcom, nhận được công suất TPU thế hệ tiếp theo 5 gigawatt; đạt thỏa thuận với SpaceX, có thể sử dụng công suất GPU trong Colossus 1 và Colossus 2.
Anthropic còn nhấn mạnh, Claude là mô hình tiên phong đầu tiên đồng thời bước vào ba nền tảng đám mây lớn: AWS, Google Cloud và Microsoft Azure. Tuy nhiên, AWS vẫn là nhà cung cấp dịch vụ đám mây chính và đối tác huấn luyện của Anthropic.
Đằng sau việc gọi vốn, thực chất là sự thay đổi định vị thương mại của Anthropic. Các công ty mô hình lớn thời kỳ đầu cạnh tranh bằng năng lực mô hình và trải nghiệm trò chuyện chung, còn bây giờ khách hàng doanh nghiệp quan tâm hơn đến việc AI có thể bước vào quy trình cốt lõi hay không, có thể xử lý nhiệm vụ phức tạp hay không, có thể được tích hợp vào môi trường phát triển, nền tảng đám mây và hệ thống nội bộ hay không.
Claude Code, Cowork, effort control, dynamic workflows và cập nhật Messages API, đều xoay quanh hướng đi này.
Nhìn chung phát hành sản phẩm và gọi vốn, Anthropic đang đồng thời mở rộng ba loại năng lực.
Thứ nhất là năng lực mô hình,Opus 4.8 nâng cao biểu hiện về mã hóa, lập luận, nhiệm vụ tác nhân và công việc tri thức, đồng thời tăng cường biểu đạt sự không chắc chắn.
Thứ hai là năng lực quy trình công việc,dynamic workflows đưa Claude Code từ hỗ trợ mã đơn lần đi đến thực thi và kiểm tra kỹ thuật phức tạp hơn.
Thứ ba là năng lực cơ sở hạ tầng,gọi vốn 650 tỷ USD, cam kết đầu tư từ các nhà cung cấp đám mây siêu lớn, sự tham gia của các đối tác bộ nhớ và chip, cùng các thỏa thuận tính toán với Amazon, Google, Broadcom, SpaceX, cung cấp tài nguyên cho nhu cầu huấn luyện và suy luận mô hình tiếp theo.
Đây cũng là logic cốt lõi đằng sau việc định giá của Anthropic tiệm cận nghìn tỷ USD. Claude không còn chỉ là một cửa sổ trò chuyện AI, mà đang trở thành hệ thống công việc kết nối mô hình, mã, quy trình doanh nghiệp, nền tảng đám mây và cơ sở hạ tầng tính toán.
Opus 4.8 là nền tảng mô hình mới nhất trong hệ thống này, dynamic workflows là hình thái sản phẩm hướng đến nhiệm vụ kỹ thuật phức tạp, gọi vốn 650 tỷ USD và mở rộng năng lực tính toán là điều kiện tiên quyết để tiếp tục đưa hệ thống này đến với khách hàng quy mô lớn hơn.
Con sóng AI đã đẩy Anthropic lên đỉnh sóng, đứng ở độ cao này, phía trước là lướt theo gió, phía sau là chìm đắm rơi nước, không có tư thế thứ ba.
Bài viết này đến từ tài khoản WeChat công chúng "APPSO", tác giả: APPSO phát hiện sản phẩm ngày mai
























