Acaba de llegar: Anthropic lanza Sonnet 5, con un rendimiento cercano a Opus 4.8, pero no necesariamente más barato
Anthropic ha lanzado Claude Sonnet 5, un modelo que describe como "el Sonnet más 'agente' hasta la fecha", capaz de planificar y usar herramientas como navegador y terminal con un nivel de autonomía anteriormente reservado a modelos más grandes y costosos.
Sonnet 5 muestra mejoras significativas en razonamiento, uso de herramientas, programación y trabajo con conocimiento respecto a Sonnet 4.6, acercándose al rendimiento de Opus 4.8, pero con un costo potencialmente menor. Las curvas costo-rendimiento indican que, en niveles de esfuerzo medios, mejora la eficiencia, y en tareas específicas puede igualar a Opus 4.8 con un coste reducido.
Los partners que lo probaron destacan su mayor autonomía para tareas complejas. En seguridad, mejora a Sonnet 4.6 en rechazo de peticiones maliciosas y ataques, aunque tiene una tasa de comportamiento inapropiado ligeramente superior a Opus 4.8 y Mythos Preview. Sus capacidades en ciberseguridad son limitadas.
Su lanzamiento incluye un precio promocional hasta el 31 de agosto de 2026: entrada a $2 / millón de tokens, salida a $10 / millón. Después, el precio estándar será de $3 y $15 respectivamente. Un análisis de Artificial Analysis señala que, debido al mayor uso de tokens, el coste por tarea es mayor que el de Sonnet 4.6 e incluso Opus 4.8, situándolo entre los modelos más costosos.
marsbitHace 52 min(s)