Jay, desde el Valle de la Innovación | Cuántico QbitAI
Descubrimiento importante:La autoevolución de la IA, ha comenzado.
Esta es la declaración impactante que Anthropic acaba de publicar en un extenso blog.
Nuestros datos internos muestran que Claude está acelerando el desarrollo de la IA, lo que podría ser una vía hacia la mejora recursiva de sí mismo (RSI).
No es una "exageración alarmista". Al leer el artículo, Anthropic realmente habla con datos concretos:
Hasta mayo de este año,más del 80% del código de Anthropic fue escrito por Claude.
Y antes del lanzamiento de Claude Code, esta cifra era solo de un solo dígito.
Al mismo tiempo, la cantidad promedio de código entregado por los ingenieros de Anthropic por trimestre es 8 veces mayor que en 2021-2025.
Lo más importante es la calidad:
En las tareas de programación más abiertas, ambiguas y donde ni siquiera se conoce la forma de la respuesta, la tasa de éxito de Claude es ahora del 76%, hace solo seis meses era del 26%.
Un salto de 50 puntos porcentuales. En medio año.
Muchos ingenieros dentro de Anthropic ya sienten que la calidad del código escrito por Claude es igual a la humana.
Se espera que lo supere este año.
Anthropic también enfatiza que si esta tendencia continúa, es completamente posible que la IA diseñe y construya la próxima generación de IA por sí misma.
Esto podría cambiar completamente la sociedad, trayendo enormes beneficios en los campos de la medicina, la tecnología y la economía. Pero también podría agravar los problemas de alineación, lo que finalmente llevaría a una pérdida de control.
Por lo tanto, Anthropic encabeza el llamamiento:
Si existe un mecanismo verificable que garantice que los laboratorios de IA realmente no están compitiendo en secreto, estamos dispuestos a reducir la velocidad, incluso a hacer una pausa.
Además, en este blog de Anthropic, también se presentan muchas opiniones y hechos interesantes.
La siguiente es una versión organizada para facilitar la lectura.
Disfruten.
Anthropic define el tono con un largo artículo
La ley de Moore del mundo de la IA ha llegado
Anthropic creó una nueva dimensión de medición llamada "Duración de tareas que la IA puede realizar de forma independiente".
En marzo de 2024, Claude Opus 3 podía manejar tareas de software que a un humano le llevarían unos 4 minutos.
Un año después, Claude Sonnet 3.7,1.5 horas.
Otro año más, Claude Opus 4.6,12 horas.
Y el último, Mythos, en pruebas internas su desempeño es:
Capaz de trabajar de forma continua "al menos"16 horas, ya alcanzando el límite superior que el marco de pruebas METR puede medir.
Esta velocidad de duplicación pasó de duplicarse cada 7 meses a duplicarse cada 4 meses.
Si la tendencia continúa,en 2027, podrían ser varias semanas.
Claude escribió la mayor parte del código de Anthropic
Hasta mayo de 2026, más del 80% del código en el repositorio de Anthropic fue escrito por Claude.
Antes del lanzamiento de Claude Code, esta cifra siempre fue de un solo dígito.
Este cambio también se refleja en la forma de trabajar de los ingenieros.
En los primeros cuatro años de Anthropic, la cantidad de líneas de código que los ingenieros fusionaban (merge) por día se mantuvo básicamente constante.
En 2025, cuando Claude comenzó a escribir su propio código, el número de fusiones comenzó a dispararse repentinamente.
Hoy, en el segundo trimestre de 2026,la cantidad de código que los ingenieros fusionan por día es 8 veces mayor que en 2024.
Sin embargo, aunque la cantidad de código ha aumentado, ¿la calidad del código se ha diluido?
Anthropic dice que en el último año, los ingenieros han corregido cada vez menos a Claude.
Esto es evidente en los puntos de referencia (benchmarks), como se muestra en la siguiente figura.
En tareas de todos los niveles de dificultad, la tasa de éxito de Claude aumentó dramáticamente sin excepción.
Por lo tanto, Anthropic ahora simplemente usa Claude para revisar el código.
Sí, todos los cambios enviados al repositorio de código pasan primero por una revisión automática de Claude, que verifica errores, vulnerabilidades de seguridad y otros defectos.
Su análisis retrospectivo encontró que si hubiera existido esta revisión automática previamente, aproximadamente un tercio de los errores que causaron incidentes en línea en claude.ai habrían sido bloqueados antes del lanzamiento.
Hay que recordar que los ingenieros que escribieron ese código ya se encuentran entre los mejores del mundo en construir sistemas de IA.
Claude está detectando sus errores.
La lupa de la creatividad
A continuación, el grado de participación de Claude en la investigación.
Anthropic tiene una práctica: cada vez que lanza un nuevo modelo, le da a Claude un fragmento de código para entrenar un pequeño modelo de IA, pidiéndole que optimice la velocidad de ejecución al máximo sin comprometer la corrección.
En mayo de 2025, la respuesta de Claude Opus 4 fue: aceleración 3 veces.
En abril de 2026, Claude Mythos Preview logró 52 veces.
Como referencia, un investigador humano experimentado necesita de 4 a 8 horas para lograr apenas 4 veces.
En menos de un año, Claude superó a los humanos.
En abril de 2026, Anthropic le asignó a Claude una investigación sobre seguridad de IA, algo así como "¿puede un modelo débil supervisar de manera confiable a un modelo fuerte?", y luego dejó que Claude propusiera hipótesis, ejecutara experimentos...
Primero, veamos el desempeño humano: dos investigadores humanos tardaron aproximadamente una semana en reducir la brecha en un 23%.
Mientras que Claude, después de aproximadamente 800 horas de cómputo, gastando alrededor de $18,000 en potencia de cálculo:
Redujo la brecha en un 97%.
¿Hacia dónde vamos?
Hasta este punto, la conclusión ya es clara.
El papel de los humanos en el proceso de desarrollo de la IA se está reduciendo en cada paso.
El código, lo escribió Claude. La revisión del código, la hace Claude. La ejecución de experimentos, Claude es un orden de magnitud más rápido que los humanos. El diseño de experimentos, Claude está comenzando a hacerlo por sí mismo...
La última ventaja comparativa que tienen los humanos ahora es el gusto y el criterio de investigación.
¿Pero cuánto tiempo podremos mantener esta ventaja?
Anthropic dice en el blog que tampoco están seguros.
Una posibilidad es que el "gusto por la investigación" sea como otras cosas que la IA no podía hacer antes: primero no podía, y de repente sí pudo.
Al igual que la IA para entender el humor, mostrar teoría de la mente o resolver acertijos lingüísticos, todos siguieron la misma curva.
Otra posibilidad es que, incluso si Claude nunca aprenda el verdadero gusto por la investigación, solo con las tendencias actuales de aceleración, la cantidad de trabajo que cada investigador humano puede dirigir simultáneamente ya es varias veces mayor.
No necesitas que la IA reemplace completamente tu pensamiento, solo necesita hacer todo el trabajo de "ejecución", y tú solo necesitashacer esa elección del 5% de la dirección.
Tres futuros posibles para la RSI
Al final del blog, Anthropic describe tres posibles direcciones de evolución sobre esta tendencia de "autoevolución".
1. Estancamiento.
Esas curvas exponenciales en realidad son curvas S.
Quizás el criterio de investigación es algo que no se puede resolver mediante escala (scale), sino que requiere un avance arquitectónico completamente nuevo.
O tal vez, el cuello de botella está en la energía, en los chips, en la cadena de suministro física de la potencia de cálculo.
Sin embargo, incluso si las capacidades de la IA se estancan en el nivel actual, ya ocurrirán cambios significativos en el mundo.
Hace algún tiempo, en el Proyecto Glasswing, Mythos Preview descubrió más de diez mil vulnerabilidades de software de alto riesgo y gravedad en las primeras semanas de su lanzamiento, distribuidas en los sistemas más críticos del mundo.
2. La IA continúa acelerando, pero los humanos aún mantienen el volante.
La eficiencia organizacional aumentará exponencialmente, una empresa de 100 personas hará el trabajo de 10,000 o incluso 100,000 personas.
Anthropic cree que es muy probable que estemos entrando en este escenario.
Pero también han descubierto un fenómeno interesante, que es la manifestación de la Ley de Amdahl en las organizaciones:
Claude escribe el código extremadamente rápido, pero la revisión del código se convierte en el nuevo cuello de botella. Surgen explosivamente nuevas ideas, herramientas y experimentos, que superan con creces la capacidad de digestión de la organización.
Los cuellos de botella no desaparecen, solo se trasladan al siguiente eslabón.
3. La IA logra una mejora recursiva completa de sí misma, comenzando a construir la próxima generación por sí misma.
En este escenario, la velocidad de desarrollo de la IA depende completamente de la potencia de cálculo. Los humanos retroceden a posiciones de supervisión, verificación y auditoría.
Si esto realmente ocurre, es muy probable que esta capacidad se traslade a otros campos científicos: medicina, materiales, energía, todos despegarán.
Por supuesto, otro futuro posible es el fracaso de la alineación.
En este caso, los sesgos se acumularían gradualmente durante el proceso de automejora iterativa de la IA, y finalmente: pérdida total de control.
OMT (Por cierto)
Estos son, en resumen, los puntos clave más importantes de Anthropic sobre la autoevolución.
Honestamente, al principio no le di mucha importancia, después de todo, Anthropic está a punto de realizar su OPV (IPO),¿no es esta una típica estrategia de relaciones públicas "al estilo de Anthropic"?
Pero esta vez, puede que realmente sea diferente.
Porque hace solo unos días,OpenAI también publicó un blog similar:
También vemos signos tempranos de autoevolución en los sistemas actuales: el desarrollo de la IA en sí mismo también es acelerado por la IA. Esperamos que esto intensifique la presión competitiva entre desarrolladores y naciones, y traiga desafíos de gobernanza que las instituciones existentes no puedan afrontar. Con la aparición de la RSI, la sociedad necesita métodos para dar forma a la trayectoria de desarrollo de la IA, asegurando que sirva a los intereses humanos.
La singularidad, parece llegar más rápido de lo que todos esperaban.
Blog: https://www.anthropic.com/institute/recursive-self-improvement
Enlaces de referencia:[1]https://x.com/kimmonismus/status/2062517474277675102[2]https://x.com/anthropicai/status/2062568873321513443
Este artículo proviene del WeChat oficial "Quantum Bit" (量子位), autor: Sigue la tecnología de vanguardia














