Vừa rồi, Anthropic ra mắt Sonnet 5, hiệu năng gần bằng Opus 4.8, nhưng chưa chắc đã rẻ hơn
Vừa qua, Anthropic đã chính thức ra mắt mô hình mới Claude Sonnet 5, được mô tả là "mô hình Sonnet mang đầy đủ tính chất Agent nhất từ trước đến nay". Mô hình này có khả năng lập kế hoạch, sử dụng các công cụ như trình duyệt, terminal và vận hành tự chủ ở mức độ mà trước đây cần đến các mô hình lớn hơn, đắt tiền hơn.
So với Sonnet 4.6, Sonnet 5 có cải thiện đáng kể về khả năng lập luận, sử dụng công cụ, lập trình và xử lý công việc tri thức, tiệm cận hiệu năng của Opus 4.8 nhưng với mức giá thấp hơn. Trong các đánh giá về tác nhân thông minh (Agent), Sonnet 5 cho thấy sự cải thiện rõ rệt so với thế hệ trước và cung cấp phạm vi lựa chọn cân bằng giữa chi phí và hiệu suất rộng hơn. Ở mức độ nỗ lực cao, hiệu suất của nó trong một số tác vụ có thể sánh ngang với Opus 4.8.
Về mặt an toàn, Sonnet 5 được cải thiện so với Sonnet 4.6, với tỷ lệ hành vi không phù hợp, ảo giác và tâng bốc thấp hơn. Tuy nhiên, tỷ lệ này vẫn cao hơn một chút so với Opus 4.8 và Claude Mythos Preview. Mô hình được trang bị rào chắn bảo mật mạng mặc định, tương tự như Opus 4.7/4.8.
Sonnet 5 sử dụng một bộ tokenizer mới, khiến cùng một nội dung đầu vào có thể tạo ra nhiều token hơn (khoảng 1.0-1.35 lần). Để chuyển đổi, Anthropic áp dụng mức giá ưu đãi: từ nay đến 31/8/2026, giá là 2 USD/triệu token đầu vào và 10 USD/triệu token đầu ra. Sau đó, giá tiêu chuẩn sẽ là 3 USD và 15 USD. Một số phân tích chỉ ra rằng chi phí chạy mỗi tác vụ của Sonnet 5 trên chỉ số Intelligence Index là 2.29 USD, cao hơn khoảng 15% so với Opus 4.8, chủ yếu do lượng token sử dụng tăng lên.
Mô hình hiện đã có mặt trên tất cả các nền tảng và được đưa vào Chương trình Xác minh An ninh Mạng của Anthropic. Giới hạn tốc độ (rate limits) trên các nền tảng cũng được điều chỉnh tăng để phù hợp với mức tiêu thụ token lớn hơn ở chế độ nỗ lực cao.
marsbit56 phút trước