Por | AlfabetoAI
Anthropic publicó anoche un extenso artículo titulado "When AI builds itself" (Cuando la IA se construye a sí misma), que suena como una novela de ciencia ficción de Asimov. El tema es efectivamente un concepto muy de ciencia ficción: recursive self-improvement (mejora autorrecursiva).
En resumen, antes eran los investigadores humanos quienes escribían el código, ejecutaban experimentos, entrenaban modelos y hacían la IA más poderosa. Pero si la IA misma comienza a participar en el diseño, entrenamiento, prueba y optimización de sus propias versiones posteriores, entonces el ritmo de progreso de la IA ya no solo lo impulsan los humanos, sino que podría comenzar a "auto-evolucionar".
Por ello, Anthropic hizo un llamamiento:
"Creemos que sería muy beneficioso para el mundo si pudiera elegir ralentizar o suspender temporalmente el desarrollo de la IA de vanguardia, permitiendo que las estructuras sociales y la investigación de alineamiento (alignment) alcancen el progreso tecnológico."
Esta declaración suena como una advertencia de seguridad, pero situada en el contexto del momento en que Anthropic se prepara para su OPV (Oferta Pública de Venta), tampoco puede evitar verse como otro tipo de narrativa preestablecida: Claude es realmente demasiado útil, e incluso ha comenzado a crear la próxima generación de Claude por sí mismo.
Una nueva tormenta ha aparecido
Para ilustrar que la IA está participando cada vez más en el propio desarrollo de la IA, Anthropic presentó una gran cantidad de datos internos.
Por ejemplo, hasta mayo de 2026, más del 80% del código fusionado en el repositorio de código de Anthropic fue escrito por Claude. Antes del lanzamiento de Claude Code, esta cifra era solo de un dígito.
En el segundo trimestre de 2026, según las estadísticas de Anthropic, la cantidad de código que los ingenieros fusionaban diariamente ya era aproximadamente 8 veces mayor que en 2024.
Más notable que la cantidad de código es que Claude está abordando problemas de ingeniería más abiertos.
Anthropic menciona en el artículo que en el último año, la frecuencia con la que los empleados corrigen a Claude, lo llevan de vuelta al buen camino o toman una tarea a mitad de camino ha ido disminuyendo constantemente. Este cambio no solo ocurre en tareas simples, sino también en las tareas abiertas más complejas.
Por tareas abiertas se entienden problemas sin instrucciones claras. Por ejemplo, cuando se cae un sistema o falla una tarea de entrenamiento, el ingeniero inicialmente tampoco sabe cómo será la solución, solo puede investigar y juzgar sobre la marcha.
Este tipo de tareas solía depender más de la experiencia humana, y en aquellas tareas más abiertas, la tasa de éxito de Claude hasta mayo de 2026 alcanzó el 76%, aumentando 50 puntos porcentuales en seis meses.
No solo es escribir código, Anthropic también utiliza Claude para revisar código, detectar errores, vulnerabilidades de seguridad y otros defectos. Su análisis retrospectivo encontró que si cada cambio de código en el pasado hubiera pasado por una revisión automática de Claude, aproximadamente un tercio de los errores que causaron incidentes en línea en claude.ai podrían haberse detectado antes de su implementación.
Yendo más allá, Claude ya ha comenzado a participar en el flujo de investigación.
Anthropic tiene una prueba fija: darle a Claude un código para entrenar un modelo pequeño y pedirle que encuentre la manera de ejecutar el código más rápido sin alterar los resultados incorrectamente. En mayo de 2025, Claude Opus 4 lograba aproximadamente una aceleración de 3 veces; para abril de 2026, Claude Mythos Preview había elevado esa cifra a unas 52 veces.
Anthropic también menciona un caso de investigación abierta sobre seguridad de IA. Le plantean un problema a un agente impulsado por Claude: ¿puede un modelo más débil supervisar de manera fiable a un modelo más fuerte?
Este proceso requiere plantear hipótesis, probarlas, compartir descubrimientos con agentes paralelos e iterar repetidamente.
Dos investigadores humanos tardaron una semana en reducir aproximadamente el 23% de la brecha; mientras que Claude, con un consumo acumulado de aproximadamente 800 horas y unos 18,000 dólares en potencia de cálculo, redujo el 97%.
Este resultado, por supuesto, tiene limitaciones: el problema fue elegido por humanos, los criterios de puntuación también los definieron humanos, y los resultados no se trasladaron completamente a modelos a escala de producción. Pero aún así muestra que Claude ya puede, dentro de un marco de investigación establecido por humanos, diseñar experimentos, ejecutarlos e iterar por sí mismo.
Además, cuando los investigadores humanos "toman el camino equivocado", Claude puede dar un mejor juicio sobre el siguiente paso.
Anthropic tomó 129 sesiones internas de investigación de Claude Code, donde investigadores humanos y Claude resolvían juntos problemas de investigación abiertos. Anthropic seleccionó algunos nodos donde "los humanos demostraron posteriormente haber dado rodeos", luego dio el contexto previo a esos nodos a diferentes versiones de Claude para ver qué sugeriría hacer a continuación. Luego, otro Claude 'juez' que conocía el resultado completo de la sesión juzgaba: ¿cuál era mejor, la sugerencia del modelo o la elección humana en ese momento?
Los resultados mostraron que en aquellos nodos donde los investigadores humanos habían demostrado posteriormente tener margen de mejora, Claude era cada vez más capaz de proponer un mejor siguiente paso.
En el pasado, el progreso de los modelos de IA dependía principalmente de los investigadores e ingenieros humanos. Los humanos decidían qué experimentos hacer, escribían el código, entrenaban modelos e impulsaban la iteración funcional de la IA.
Ahora, cada vez más eslabones de esta cadena están siendo asumidos por Claude.
Anthropic presenta una tabla de etapas muy intuitiva:
De 2021 a 2023, Anthropic no difería de una empresa tecnológica común, todos escribían código y documentación en portátiles.
De 2023 a 2025, los chatbots comenzaron a integrarse en el flujo de trabajo. Los ingenieros pedían al modelo que generara fragmentos de código y luego los copiaban en el editor.
De 2025 a 2026, aparecieron los agentes de programación. Claude comenzó a poder escribir y modificar código de forma autónoma, a veces incluso completando archivos enteros de forma independiente.
Hoy en día, los agentes ya pueden ejecutar código por sí mismos y delegar trabajos de varias horas a otros agentes.
Y más adelante, está la etapa que realmente preocupa a Anthropic: el circuito cerrado.
Si llega ese día, las versiones posteriores de Claude podrían ser mejoradas continuamente por el propio Claude: eso es recursive self-improvement, mejora autorrecursiva.
Anthropic es muy cauteloso en el artículo: aún no hemos llegado a ese punto, y la mejora autorrecursiva no es inevitable. Pero aún así enfatiza que el camino hacia ese paso ya comienza a ser visible.
Por eso Anthropic habla de desaceleración, e incluso de pausa, al final del artículo. No significa que ahora todas las empresas de IA detengan inmediatamente el trabajo, sino que si los riesgos de la automejora de la IA continúan aumentando en el futuro, los laboratorios de vanguardia necesitarán un conjunto coordinado y verificable de mecanismos de desaceleración.
En otras palabras, la "singularidad" está por llegar, y la humanidad debe controlarla.
Claude, imparable
Si solo se mira superficialmente, este es un documento de seguridad muy visionario. Anthropic habla de mejora autorrecursiva, de que la IA puede mejorarse a sí misma cada vez más rápido, de que la sociedad humana necesita preparar mecanismos de desaceleración y pausa con anticipación.
Pero situado en el momento en que Anthropic se prepara para su OPV, este artículo adquiere otro significado.
En cierto sentido, los movimientos recientes de Anthropic se parecen a esos alumnos sobresalientes, algo presumidos, de la clase: realmente tiene capacidad, pero también es bastante petulante.
Lo que quiere decir no es solo "tenemos un Claude muy fuerte", sino algo más: quiere decir que "Claude está ayudándonos a crear un Claude aún más fuerte".
Si Anthropic solo vendiera un modelo o una herramienta, le sería difícil escapar por completo de la comparación horizontal: Anthropic tiene Claude, OpenAI tiene GPT; Anthropic tiene Claude Code, OpenAI tiene Codex; Anthropic compite por clientes empresariales, OpenAI también compite por clientes empresariales. La competencia entre las dos empresas es muy reñida, y se trata de ver quién puede contar la historia más grande al mercado.
Es importante señalar que solo 3 días antes, OpenAI había escrito en un documento sobre la gobernanza de la IA de vanguardia:
"También vemos signos tempranos de mejora autorrecursiva en los sistemas actuales: el desarrollo de la IA en sí está siendo acelerado por la IA.
Esto intensificará la presión competitiva entre desarrolladores y naciones, y presentará desafíos de gobernanza que las instituciones existentes no podrán manejar."
3 días después, Anthropic dice: el camino de Claude hacia la mejora autorrecursiva ya comienza a ser visible.
Si Claude realmente se desarrolla como espera, ya no sería una narrativa de producto común, se convertiría en una rueda volante de I+D.
Claude escribe código, ejecuta experimentos, optimiza flujos de entrenamiento, y a su vez reduce los incidentes en los propios productos de Anthropic... Una vez que este sistema funcione, Claude ya no será solo un producto de Anthropic, sino también una importante herramienta de producción.
Los usuarios ven el producto Claude, los clientes empresariales compran la capacidad de Claude, pero lo que Anthropic realmente quiere que el mercado de capitales note es: Claude ya está integrado en el proceso subyacente del desarrollo de modelos de vanguardia, se ha colocado en la sala de motores de Anthropic.
El mercado de capitales adora las historias de ruedas volantes, como una cornucopia que genera riqueza sin fin: un Claude más fuerte permite a los ingenieros de Anthropic fusionar más código, más código acelera la iteración de productos e infraestructura, una iteración más rápida permite a los investigadores ejecutar más experimentos, y más experimentos a su vez ayudan a que la próxima generación de Claude sea más fuerte. Una vez que la próxima generación de Claude sea más fuerte, continuará acelerando la I+D de Anthropic.
La velocidad de iteración de Claude también sustenta esta rueda volante. Según las fechas de lanzamiento público, desde 2023 hasta principios de 2025, las principales actualizaciones del modelo Claude se producían aproximadamente cada tres o cuatro meses, pero tras entrar en Claude 4, las actualizaciones de modelos de Anthropic se han vuelto claramente más frecuentes.
Claude 4 se lanzó en mayo de 2025, Opus 4.1 en agosto, Sonnet 4.5 en septiembre, Haiku 4.5 en octubre, Opus 4.5 en noviembre.
En 2026, Opus 4.6 se lanzó el 5 de febrero, Sonnet 4.6 el 17 de febrero, Opus 4.7 el 15 de abril, Opus 4.8 el 28 de mayo. De Opus 4.7 a Opus 4.8 solo pasaron 42 días.
Superficialmente, Anthropic está diciendo "esto podría ser muy peligroso, debemos preparar los frenos con anticipación", pero al mismo tiempo está insinuando: "ya hemos visto lo que sucederá cuando se pise el acelerador".
La sutileza de la narrativa de la OPV radica precisamente en esto. Por un lado, enfatiza mucho el riesgo, por otro, también eleva su propia posición tecnológica.
No todas las empresas de IA tienen la calificación para discutir la mejora autorrecursiva; primero debes hacer creer al exterior que tu IA ya ha entrado en el flujo de desarrollo de IA, para entonces tener la calificación de decir que esto puede requerir coordinación global.
OpenAI: ¿Cómo pueden hacer esto?
Como se mencionó anteriormente, justo antes de que Anthropic publicara este extenso artículo, OpenAI acababa de sacar a relucir el tema de la mejora autorrecursiva.
Pero la forma en que las dos empresas lo abordan es muy diferente.
El documento de OpenAI, "Democratic Governance of Frontier AI" (Gobernanza Democrática de la IA de Vanguardia), es un plan político dirigido a Washington. No se preocupa por "cómo se fortalece el modelo", sino por cómo se debe restringir cuando la IA de vanguardia sigue avanzando.
La mayoría del contenido de ese informe no es adecuado para extenderse, excepto una frase clave: OpenAI dice que en los sistemas actuales ya se pueden ver signos tempranos de mejora autorrecursiva.
Esta frase y el extenso artículo de Anthropic apuntan en la misma dirección.
Solo que OpenAI habla de sistemas e instituciones, y Anthropic habla de sí misma.
El significado de OpenAI es: el desarrollo de la IA es demasiado rápido, las estructuras de gobernanza actuales pueden no poder seguir el ritmo, por lo que se necesita un nuevo conjunto de reglas.
Mientras que Anthropic directamente muestra ese sistema y le dice al mercado: Claude ya ha entrado en nuestro flujo de I+D, por eso vemos el camino de la autoceleración de la IA.
Esta jugada es muy astuta, y probablemente en OpenAI ya están murmurando internamente: ¡Esto es plagio de ideas! ¡Fuimos nosotros los primeros!
Es broma, pero OpenAI realmente necesita esforzarse más, hay que sacar GPT 5.6 pronto.












