Vừa rồi, Claude Opus 4.8 chính thức ra mắt, mở miệng đã tự nhận mình là DeepSeek, Qwen

marsbitXuất bản vào 2026-05-28Cập nhật gần nhất vào 2026-05-28

Tóm tắt

Anthropic vừa công bố Claude Opus 4.8, nâng cấp mô hình flagship với cải thiện về lập trình, tác vủ agent, suy luận và công việc tri thức, đồng thời giữ nguyên giá. Mô hình này được cho là trung thực hơn, ít đưa ra kết luận thiếu căn cứ. Tuy nhiên, một số người dùng phát hiện nó đôi khi tự nhận là DeepSeek hay Qwen. Cùng lúc, Anthropic công bố hoàn thành vòng gọi vốn H trị giá 650 tỷ USD, định giá sau gần 10.000 tỷ USD. Khoản tiền này nhằm mở rộng năng lực hạ tầng điện toán thông qua thỏa thuận với Amazon, Google, Broadcom và SpaceX. Bên cạnh mô hình mới, Anthropic ra mắt tính năng "dynamic workflows" trong Claude Code, cho phép tạo và quản lý hàng trăm agent con song song để xử lý các nhiệm vụ kỹ thuật phức tạp như di chuyển codebase quy mô lớn, thể hiện qua ví dụ chuyển Bun từ Zig sang Rust. Các bản cập nhật này cho thấy Anthropic đang chuyển từ một công ty cung cấp mô hình thuần túy sang một nền tảng tích hợp AI vào quy trình làm việc và hệ thống doanh nghiệp.

Cùng với việc kỳ vọng IPO ngày càng tăng cao, nhịp độ phát hành sản phẩm mô hình của Anthropic cũng ngày càng tăng tốc.

Vừa rồi, Anthropic liên tiếp công bố hai tin tức quan trọng:một là nâng cấp mô hình hàng đầu lên Claude Opus 4.8, hai là hoàn tất vòng gọi vốn Series H trị giá 650 tỷ USD, định giá sau đầu tư đạt 9650 tỷ USD, đang tiến sát ngưỡng nghìn tỷ USD.

Đối với một công ty AI đã có định giá tiệm cận nghìn tỷ USD, thị trường không còn chỉ nhìn vào điểm benchmark của mô hình, mà là liệu nó có thể biến trí tuệ, công cụ, môi trường phát triển, nền tảng đám mây và tài nguyên tính toán thành một bộ cơ sở hạ tầng có thể giao hàng trên quy mô lớn hay không.

Nói cách khác, Anthropic phải chuyển dần từ một công ty giao mô hình tốt, sang một công ty đang cố gắng định hình lại cách thức làm việc với AI của doanh nghiệp.

Thêm lượng không tăng giá, Claude Opus 4.8 chính thức trình làng

Claude Opus 4.8 được phát hành lần này là một lần nâng cấp của Anthropic đối với dòng mô hình hàng đầu Opus. Với nhịp độ phát hành mô hình hiện tại, như lời đùa của cư dân mạng,chúng ta rất có thể sẽ nhìn thấy Claude Opus 6 trước cả khi GTA 6 ra mắt (nếu không delay, tháng 11).

Anthropic tuyên bố, Opus 4.8 được xây dựng trên nền tảng Opus 4.7, có cải thiện về mã hóa, nhiệm vụ tác nhân, lập luận và công việc tri thức, đồng thời đã mở cửa cho người dùng, giá sử dụng tiêu chuẩn vẫn không thay đổi,vẫn là 5 USD cho một triệu token đầu vào, 25 USD cho một triệu token đầu ra.

Nhà phát triển cũng có thể sử dụng claude-opus-4-8 thông qua Claude API.

So sánh giá API https://platform.claude.com/docs/en/about-claude/models/overview

Từ thông tin chính thức được tiết lộ, những cải tiến của Opus 4.8 bao phủ mã hóa, khả năng tác nhân, khả năng lập luận và các nhiệm vụ công việc tri thức thực tế.

Anthropic sử dụng một bảng so sánh trong tài liệu phát hành để thể hiện hiệu suất của Opus 4.8 so với Opus 4.7 đời trước và các mô hình khác trong nhiều bài kiểm tra, tất nhiên, so với chất lượng câu trả lời một lần,trọng tâm nâng cấp mô hình vẫn nằm ở biểu hiện trong các nhiệm vụ dài và cộng tác phức tạp.

Trong quy trình công việc thực tế, mô hình thường cần xử lý liên tục các nhiệm vụ nhiều bước, gọi công cụ, kiểm tra kết quả trung gian và tiếp tục tiến lên dựa trên phản hồi. Anthropic cho biết, những người thử nghiệm sớm nhận thấy Opus 4.8 đáng tin cậy hơn khi thực hiện nhiệm vụ tác nhân, và phán đoán cũng rõ ràng hơn.

Việc nâng cao tính trung thực của Opus 4.8 là một điểm nhấn.

Vấn đề phổ biến của mô hình AI là đưa ra phán đoán quá sớm khi chứng cứ không đủ, và tự tin tuyên bố đã đạt được tiến triển. Anthropic tuyên bố, Opus 4.8 sẵn sàng hơn trong việc nói rõ sự không chắc chắn trong công việc, và cũng ít đưa ra phán đoán thiếu cơ sở hơn.

Nhiệm vụ mã hóa đặc biệt thể hiện sự thay đổi này.

Đánh giá nội bộ cho thấy, xác suất để Opus 4.8 khiến mã do chính nó viết ra có lỗi nhưng vẫn vượt qua mà không được thông báo, chỉ bằng khoảng một phần tư so với đời trước. Nghĩa là, mô hình mới có khả năng cao hơn trong việc nhắc nhở người dùng khi phát hiện rủi ro, thay vì để lại vấn đề cho các bài kiểm tra sau này hoặc môi trường sản xuất.

Về mặt alignment và an toàn, Anthropic tiếp tục câu chuyện cốt lõi của mình. Tỷ lệ xảy ra hành vi không alignment như lừa dối, hợp tác lạm dụng của Opus 4.8 thấp hơn đáng kể so với Opus 4.7, và tiệm cận với một trong những mô hình có biểu hiện alignment tốt nhất hiện nay là Claude Mythos Preview.

An toàn, đáng tin cậy, có thể kiểm soát, vẫn là một nhóm từ khóa mà Anthropic dùng để phân biệt bản thân. Khi Claude thâm nhập sâu hơn vào quy trình doanh nghiệp, những từ khóa này cũng bắt đầu mang nhiều ý nghĩa thương mại hơn.

Tuy nhiên điều thú vị là, sau khi Opus 4.8 được phát hành, cư dân mạng đã phát hiện ra có chút không ổn.

https://x.com/realNyarime/status/2060059543820963975

Nhiều cư dân mạng thử nghiệm phát hiện, khi họ truy vấn sâu về danh tính mô hình của Opus 4.8, câu trả lời nó đưa ra không phải lúc nào cũng là Claude.

Đôi khi nó sẽ tự nhận mình là Qwen, đôi khi lại báo tên DeepSeek, nghi ngờ có hành vi chưng cất.

Và khi cư dân mạng đặt câu hỏi tương tự trong ứng dụng khách chính thức Claude, những câu trả lời kiểu này thường không dễ tái hiện. Nguyên nhân có lẽ nằm ở việc, prompt hệ thống và các ràng buộc ở tầng sản phẩm trong ứng dụng khách đầy đủ hơn.

Dynamic workflows ra mắt, Claude Code tiến tới cộng tác đa tác nhân

Cùng với Claude Opus 4.8 ra mắt, còn có nhiều tính năng sản phẩm và dành cho nhà phát triển.

Trong đó, tính năng ảnh hưởng trực tiếp nhất đến trải nghiệm người dùng Claude chính là effort control, tức điều chỉnh cường độ suy nghĩ.

Tùy chọn điều khiển nằm cạnh bộ chọn mô hình, như tên gọi, người dùng có thể quyết định Claude sẽ đầu tư bao nhiêu năng lực tính toán lập luận vào một nhiệm vụ. Ở cường độ cao hơn, Claude sẽ thực hiện nhiều suy luận hơn để đổi lấy chất lượng trả lời tốt hơn; ở cường độ thấp hơn, Claude phản hồi nhanh hơn, và mức tiêu hao hạn ngạch sử dụng cũng chậm hơn.

Anthropic cho biết, Opus 4.8 mặc định sử dụng high effort, người dùng còn có thể chọn extra, tương ứng với xhigh trong Claude Code, hoặc chọn max, để mô hình đầu tư thêm token. Anthropic đề xuất, các nhiệm vụ khó và quy trình công việc bất đồng bộ chạy lâu ngày phù hợp hơn với việc sử dụng extra.

Tính năng thực sự ảnh hưởng đến hình thái sản phẩm Claude Code, là dynamic workflows.

Tính năng này hiện đang trong giai đoạn research preview, mục tiêu là để Claude Code xử lý các nhiệm vụ quy mô lớn trong quá khứ cần chu kỳ kỹ thuật dài hơn. Công việc trước đây được lập kế hoạch theo quý, bây giờ thậm chí có cơ hội hoàn thành trong vài ngày.

Cơ chế cốt lõi của dynamic workflows là, Claude sẽ dựa trên nhiệm vụ người dùng để tự động viết orchestration scripts, và chạy hàng chục đến hàng trăm subagents song song trong một phiên duy nhất. Mô hình sẽ lập kế hoạch nhiệm vụ trước, sau đó phân bổ cho nhiều subagents, sau đó kiểm tra kết quả trả về, cuối cùng báo cáo lại cho người dùng. Sau khi Opus 4.8 ra mắt, các agents này còn có thể chạy lâu hơn.

Tính năng này chủ yếu hướng đến các kho mã phức tạp, đồ sộ hoặc có gánh nặng lịch sử lớn. Các tình huống điển hình bao gồm tìm lỗi trong phạm vi toàn bộ dịch vụ, kiểm toán tối ưu hóa hiệu suất, kiểm toán an ninh, di chuyển kho mã lớn, thay thế framework, di chuyển API lỗi thời, port ngôn ngữ, cũng như xác thực đa góc độ đối với các giải pháp quan trọng.

Về cách sử dụng, Anthropic đề xuất bật chế độ auto trong dynamic workflows. Người dùng có thể yêu cầu trực tiếp Claude tạo workflow, hoặc bật ultracode trong Claude Code. ultracode sẽ đặt cường độ suy nghĩ thành xhigh, và để Claude tự động đánh giá nhiệm vụ hiện tại có phù hợp sử dụng workflow hay không.

dynamic workflows hiện đã mở cửa trong Claude Code CLI, Desktop và VS Code extension, hướng đến các gói Max, Team và Enterprise. Trong đó, Enterprise khi phát hành mặc định đã tắt, cần quản trị viên bật trong cài đặt Claude Code.

Tính năng này cũng có thể được sử dụng thông qua Claude API, Amazon Bedrock, Vertex AI và Microsoft Foundry. Đối với người dùng Max, Team, và người dùng sử dụng Claude Code thông qua API, dynamic workflows mặc định được bật.

Anthropic sử dụng trường hợp di chuyển Bun để thể hiện giới hạn trên của dynamic workflows. Jarred Sumner sử dụng tính năng này để port Bun từ Zig sang Rust, cuối cùng tạo ra khoảng 750 nghìn dòng mã Rust, tỷ lệ vượt qua bộ test hiện có đạt 99.8%, từ lần commit đầu tiên đến khi merge mất khoảng 11 ngày.

Toàn bộ quá trình di chuyển được hoàn thành bởi nhiều workflow: đầu tiên ánh xạ lifetime Rust cho các trường struct trong kho mã Zig, sau đó tạo các file .rs có hành vi nhất quán cho mỗi file .zig, hàng trăm agents làm việc song song, mỗi file đều có hai reviewer. Sau đó, fix loop liên tục chạy build và test suite, cho đến khi build và test vượt qua. Sau khi di chuyển hoàn tất, lại có overnight workflow xử lý vấn đề sao chép dữ liệu không cần thiết, và mở PR cho từng loại vấn đề, để đánh giá cuối cùng.

Ngoài Claude Code, Anthropic còn cập nhật Messages API. Hiện tại, Messages API có thể chấp nhận system entries bên trong mảng messages.

Nhà phát triển có thể cập nhật hướng dẫn cho Claude trong quá trình thực thi nhiệm vụ, đồng thời không phá vỡ prompt cache, cũng không cần truyền cập nhật thông qua user turn. Khả năng này có thể được sử dụng để cập nhật quyền, ngân sách token hoặc ngữ cảnh môi trường trong thời gian chạy của agent.

Bước tiếp theo, Anthropic còn có kế hoạch ra mắt một loại mô hình mới có trình độ thông minh cao hơn Opus.Đúng vậy, chính là Claude Mythos Preview đáng sợ đó, dự kiến trong vài tuần tới có thể đưa các mô hình thuộc lớp Mythos đến với tất cả khách hàng.

Đến lúc đó, chúng tôi cũng sẽ lập tức nếm thử hương vị.

Đằng sau định giá gần nghìn tỷ USD, Claude cần nền tảng tính toán lớn hơn

Một tin tức khác được công bố cùng ngày với Claude Opus 4.8,là Anthropic hoàn tất vòng gọi vốn Series H trị giá 650 tỷ USD. Vòng này do Altimeter Capital, Dragoneer, Greenoaks và Sequoia Capital dẫn đầu, định giá sau đầu tư đạt 9650 tỷ USD.

Vòng gọi vốn này còn bao gồm cam kết đầu tư hiện có 150 tỷ USD từ các hyperscalers, trong đó có 50 tỷ USD từ Amazon. Các đối tác cơ sở hạ tầng chiến lược như Micron, Samsung, SK hynix cũng tham gia. Anthropic tuyên bố, những công ty này có vai trò then chốt trong việc cung cấp memory, storage và logic chips toàn cầu, có thể giúp họ mở rộng năng lực tính toán theo nhu cầu tăng trưởng của Claude.

Mở rộng năng lực tính toán là bối cảnh then chốt đằng sau vòng gọi vốn này. Anthropic đã tiết lộ nhiều thỏa thuận cơ sở hạ tầng: ký kết thỏa thuận với Amazon, nhận được công suất bổ sung tối đa 5 gigawatt; ký kết thỏa thuận với Google và Broadcom, nhận được công suất TPU thế hệ tiếp theo 5 gigawatt; đạt thỏa thuận với SpaceX, có thể sử dụng công suất GPU trong Colossus 1 và Colossus 2.

Anthropic còn nhấn mạnh, Claude là mô hình tiên phong đầu tiên đồng thời bước vào ba nền tảng đám mây lớn: AWS, Google Cloud và Microsoft Azure. Tuy nhiên, AWS vẫn là nhà cung cấp dịch vụ đám mây chính và đối tác huấn luyện của Anthropic.

Đằng sau việc gọi vốn, thực chất là sự thay đổi định vị thương mại của Anthropic. Các công ty mô hình lớn thời kỳ đầu cạnh tranh bằng năng lực mô hình và trải nghiệm trò chuyện chung, còn bây giờ khách hàng doanh nghiệp quan tâm hơn đến việc AI có thể bước vào quy trình cốt lõi hay không, có thể xử lý nhiệm vụ phức tạp hay không, có thể được tích hợp vào môi trường phát triển, nền tảng đám mây và hệ thống nội bộ hay không.

Claude Code, Cowork, effort control, dynamic workflows và cập nhật Messages API, đều xoay quanh hướng đi này.

Nhìn chung phát hành sản phẩm và gọi vốn, Anthropic đang đồng thời mở rộng ba loại năng lực.

Thứ nhất là năng lực mô hình,Opus 4.8 nâng cao biểu hiện về mã hóa, lập luận, nhiệm vụ tác nhân và công việc tri thức, đồng thời tăng cường biểu đạt sự không chắc chắn.

Thứ hai là năng lực quy trình công việc,dynamic workflows đưa Claude Code từ hỗ trợ mã đơn lần đi đến thực thi và kiểm tra kỹ thuật phức tạp hơn.

Thứ ba là năng lực cơ sở hạ tầng,gọi vốn 650 tỷ USD, cam kết đầu tư từ các nhà cung cấp đám mây siêu lớn, sự tham gia của các đối tác bộ nhớ và chip, cùng các thỏa thuận tính toán với Amazon, Google, Broadcom, SpaceX, cung cấp tài nguyên cho nhu cầu huấn luyện và suy luận mô hình tiếp theo.

Đây cũng là logic cốt lõi đằng sau việc định giá của Anthropic tiệm cận nghìn tỷ USD. Claude không còn chỉ là một cửa sổ trò chuyện AI, mà đang trở thành hệ thống công việc kết nối mô hình, mã, quy trình doanh nghiệp, nền tảng đám mây và cơ sở hạ tầng tính toán.

Opus 4.8 là nền tảng mô hình mới nhất trong hệ thống này, dynamic workflows là hình thái sản phẩm hướng đến nhiệm vụ kỹ thuật phức tạp, gọi vốn 650 tỷ USD và mở rộng năng lực tính toán là điều kiện tiên quyết để tiếp tục đưa hệ thống này đến với khách hàng quy mô lớn hơn.

Con sóng AI đã đẩy Anthropic lên đỉnh sóng, đứng ở độ cao này, phía trước là lướt theo gió, phía sau là chìm đắm rơi nước, không có tư thế thứ ba.

Bài viết này đến từ tài khoản WeChat công chúng "APPSO", tác giả: APPSO phát hiện sản phẩm ngày mai

Câu hỏi Liên quan

QAnthropic vừa công bố những thông tin quan trọng nào?

AAnthropic vừa công bố hai thông tin lớn: nâng cấp mô hình hàng đầu lên Claude Opus 4.8 và hoàn thành vòng gọi vốn H trị giá 650 tỷ USD, với định giá sau gọi vốn là 9.650 tỷ USD.

QClaude Opus 4.8 có những cải tiến nổi bật gì so với phiên bản trước?

AClaude Opus 4.8 được cải thiện về mã hóa, nhiệm vụ đại lý thông minh, suy luận và công việc tri thức. Nó trung thực hơn, ít đưa ra phán đoán thiếu căn cứ, và giảm khả năng để lỗi mã mà không thông báo xuống còn khoảng một phần tư so với phiên bản trước.

QTính năng 'dynamic workflows' trong Claude Code là gì và có tác dụng thế nào?

ADynamic workflows là tính năng cho phép Claude Code xử lý các nhiệm vụ quy mô lớn phức tạp bằng cách tự động lập kế hoạch, phân công cho nhiều subagents chạy song song, kiểm tra kết quả và báo cáo. Nó giúp rút ngắn đáng kể thời gian cho các dự án như di chuyển codebase, kiểm toán bảo mật hoặc tối ưu hiệu suất.

QVòng gọi vốn H của Anthropic có ý nghĩa gì đối với sự phát triển của công ty?

AVòng gọi vốn 650 tỷ USD giúp Anthropic mở rộng đáng kể năng lực hạ tầng và tính toán, thông qua các thỏa thuận với Amazon, Google, Broadcom, SpaceX để tiếp cận thêm công suất xử lý. Điều này là cần thiết để hỗ trợ việc đào tạo mô hình và đáp ứng nhu cầu ngày càng tăng cho Claude, đồng thời củng cố định hướng trở thành nền tảng AI doanh nghiệp toàn diện.

QTại sao một số người dùng phát hiện Claude Opus 4.8 đôi khi tự nhận mình là các mô hình khác như DeepSeek hay Qwen?

AMột số người dùng thử nghiệm phát hiện khi được hỏi trực tiếp về danh tính mô hình, Claude Opus 4.8 đôi khi trả lời rằng nó là DeepSeek hoặc Qwen. Hiện tượng này được nghi ngờ có liên quan đến quá trình chưng cất (distillation) trong đào tạo mô hình. Tuy nhiên, hành vi này khó tái hiện trên ứng dụng khách chính thức của Claude, nơi có ràng buộc và hướng dẫn hệ thống đầy đủ hơn.

Nội dung Liên quan

Claude Opus4.8 phát hành, Anthropic bắt đầu biến 'sự tin cậy' thành điểm bán hàng của sản phẩm

Claude Opus 4.8 chính thức ra mắt, giữ nguyên giá và đạt vị trí dẫn đầu trong năm trên sáu bài kiểm tra chuẩn mực. Điểm nổi bật của bản phát hành này không nằm ở việc tăng hiệu suất đơn thuần, mà nằm ở việc Anthropic bắt đầu định vị "độ tin cậy" là ưu tiên cốt lõi của mô hình tiên phong. Đáng chú ý, tỷ lệ báo cáo thiếu về lỗi của chính mô hình trong các tác vụ mã đã giảm mạnh từ 19.7% xuống còn 3.7%. Claude Code giờ đây tích hợp luồng công việc động, cho phép điều phối nhiều tác nhân con và thực hiện kiểm tra đối kháng tự động trước khi giao kết quả. Những cải tiến này nhằm giải quyết nỗi lo ngại thực tế: khi AI chuyển từ cửa sổ trò chuyện sang quy trình công việc thực, nguy cơ lớn nhất thường là nó đưa ra câu trả lời trông có vẻ hoàn chỉnh nhưng lại sai. Ngoài ra, Opus 4.8 có những cải thiện đáng kể trong các bài kiểm tra trách nhiệm, toán học và xử lý ngữ cảnh dài. Mặc dù vậy, báo cáo hệ thống cũng ghi nhận một số điểm yếu so với phiên bản trước, như khả năng kháng prompt injection và hiệu suất trong một số bài kiểm tra chuyên môn. Bản phát hành này đánh dấu sự chuyển hướng trong cuộc đua mô hình: từ việc chỉ theo đuổi điểm số chuẩn mực sang việc tranh giành độ tin cậy, khả năng xác minh và thừa nhận sai sót. Điều này là tiền đề để các Agent AI thực sự trở nên hữu dụng. Anthropic cũng xác nhận một mô hình cấp độ "Mythos" mạnh hơn nhiều, hiện đang bị hạn chế truy cập, sẽ được ra mắt trong vài tuần tới, với Opus 4.8 đóng vai trò là bước đệm công khai hướng tới nó.

marsbit1 giờ trước

Claude Opus4.8 phát hành, Anthropic bắt đầu biến 'sự tin cậy' thành điểm bán hàng của sản phẩm

marsbit1 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片