Anthropic grita que el lobo (AGI) está llegando, ¿es por la humanidad o por la OPV?

marsbitPublicado a 2026-06-05Actualizado a 2026-06-05

Resumen

Anthropic ha publicado un documento titulado "When AI builds itself", advirtiendo sobre el "mejoramiento recursivo automático" (recursive self-improvement), un concepto en el que la IA participa activamente en el diseño, entrenamiento, prueba y optimización de sus propias versiones futuras, lo que podría acelerar exponencialmente su progreso. La empresa presenta datos internos que muestran la creciente autonomía de Claude en la I+D de IA: más del 80% del código fusionado en mayo de 2026 fue escrito por Claude, su tasa de éxito en tareas complejas y abiertas alcanzó el 76%, y es capaz de revisar código y realizar investigaciones de seguridad de manera autónoma, a veces superando a los investigadores humanos en eficacia. Anthropic describe una evolución desde el desarrollo humano hasta la aparición de agentes de IA autónomos que pueden ejecutar y delegar tareas. Aunque afirma que el "bucle cerrado" de autorrealimentación completa aún no se ha alcanzado, advierte que el camino hacia él es ya visible. Por ello, pide mecanismos de coordinación global para posiblemente ralentizar o pausar el desarrollo de IA fronteriza, permitiendo que la seguridad y las estructuras sociales se pongan al día. El artículo también analiza el contexto de la próxima OPV de Anthropic, sugiriendo que este mensaje de advertencia sirve a la vez como una narrativa para el mercado: Claude no es solo un producto, sino una herramienta central que acelera su propio desarrollo, creando un "volante de inercia"...

Por | AlfabetoAI

Anthropic publicó anoche un extenso artículo titulado "When AI builds itself" (Cuando la IA se construye a sí misma), que suena como una novela de ciencia ficción de Asimov. El tema es efectivamente un concepto muy de ciencia ficción: recursive self-improvement (mejora autorrecursiva).

En resumen, antes eran los investigadores humanos quienes escribían el código, ejecutaban experimentos, entrenaban modelos y hacían la IA más poderosa. Pero si la IA misma comienza a participar en el diseño, entrenamiento, prueba y optimización de sus propias versiones posteriores, entonces el ritmo de progreso de la IA ya no solo lo impulsan los humanos, sino que podría comenzar a "auto-evolucionar".

Por ello, Anthropic hizo un llamamiento:

"Creemos que sería muy beneficioso para el mundo si pudiera elegir ralentizar o suspender temporalmente el desarrollo de la IA de vanguardia, permitiendo que las estructuras sociales y la investigación de alineamiento (alignment) alcancen el progreso tecnológico."

Esta declaración suena como una advertencia de seguridad, pero situada en el contexto del momento en que Anthropic se prepara para su OPV (Oferta Pública de Venta), tampoco puede evitar verse como otro tipo de narrativa preestablecida: Claude es realmente demasiado útil, e incluso ha comenzado a crear la próxima generación de Claude por sí mismo.

Una nueva tormenta ha aparecido

Para ilustrar que la IA está participando cada vez más en el propio desarrollo de la IA, Anthropic presentó una gran cantidad de datos internos.

Por ejemplo, hasta mayo de 2026, más del 80% del código fusionado en el repositorio de código de Anthropic fue escrito por Claude. Antes del lanzamiento de Claude Code, esta cifra era solo de un dígito.

En el segundo trimestre de 2026, según las estadísticas de Anthropic, la cantidad de código que los ingenieros fusionaban diariamente ya era aproximadamente 8 veces mayor que en 2024.

Más notable que la cantidad de código es que Claude está abordando problemas de ingeniería más abiertos.

Anthropic menciona en el artículo que en el último año, la frecuencia con la que los empleados corrigen a Claude, lo llevan de vuelta al buen camino o toman una tarea a mitad de camino ha ido disminuyendo constantemente. Este cambio no solo ocurre en tareas simples, sino también en las tareas abiertas más complejas.

Por tareas abiertas se entienden problemas sin instrucciones claras. Por ejemplo, cuando se cae un sistema o falla una tarea de entrenamiento, el ingeniero inicialmente tampoco sabe cómo será la solución, solo puede investigar y juzgar sobre la marcha.

Este tipo de tareas solía depender más de la experiencia humana, y en aquellas tareas más abiertas, la tasa de éxito de Claude hasta mayo de 2026 alcanzó el 76%, aumentando 50 puntos porcentuales en seis meses.

No solo es escribir código, Anthropic también utiliza Claude para revisar código, detectar errores, vulnerabilidades de seguridad y otros defectos. Su análisis retrospectivo encontró que si cada cambio de código en el pasado hubiera pasado por una revisión automática de Claude, aproximadamente un tercio de los errores que causaron incidentes en línea en claude.ai podrían haberse detectado antes de su implementación.

Yendo más allá, Claude ya ha comenzado a participar en el flujo de investigación.

Anthropic tiene una prueba fija: darle a Claude un código para entrenar un modelo pequeño y pedirle que encuentre la manera de ejecutar el código más rápido sin alterar los resultados incorrectamente. En mayo de 2025, Claude Opus 4 lograba aproximadamente una aceleración de 3 veces; para abril de 2026, Claude Mythos Preview había elevado esa cifra a unas 52 veces.

Anthropic también menciona un caso de investigación abierta sobre seguridad de IA. Le plantean un problema a un agente impulsado por Claude: ¿puede un modelo más débil supervisar de manera fiable a un modelo más fuerte?

Este proceso requiere plantear hipótesis, probarlas, compartir descubrimientos con agentes paralelos e iterar repetidamente.

Dos investigadores humanos tardaron una semana en reducir aproximadamente el 23% de la brecha; mientras que Claude, con un consumo acumulado de aproximadamente 800 horas y unos 18,000 dólares en potencia de cálculo, redujo el 97%.

Este resultado, por supuesto, tiene limitaciones: el problema fue elegido por humanos, los criterios de puntuación también los definieron humanos, y los resultados no se trasladaron completamente a modelos a escala de producción. Pero aún así muestra que Claude ya puede, dentro de un marco de investigación establecido por humanos, diseñar experimentos, ejecutarlos e iterar por sí mismo.

Además, cuando los investigadores humanos "toman el camino equivocado", Claude puede dar un mejor juicio sobre el siguiente paso.

Anthropic tomó 129 sesiones internas de investigación de Claude Code, donde investigadores humanos y Claude resolvían juntos problemas de investigación abiertos. Anthropic seleccionó algunos nodos donde "los humanos demostraron posteriormente haber dado rodeos", luego dio el contexto previo a esos nodos a diferentes versiones de Claude para ver qué sugeriría hacer a continuación. Luego, otro Claude 'juez' que conocía el resultado completo de la sesión juzgaba: ¿cuál era mejor, la sugerencia del modelo o la elección humana en ese momento?

Los resultados mostraron que en aquellos nodos donde los investigadores humanos habían demostrado posteriormente tener margen de mejora, Claude era cada vez más capaz de proponer un mejor siguiente paso.

En el pasado, el progreso de los modelos de IA dependía principalmente de los investigadores e ingenieros humanos. Los humanos decidían qué experimentos hacer, escribían el código, entrenaban modelos e impulsaban la iteración funcional de la IA.

Ahora, cada vez más eslabones de esta cadena están siendo asumidos por Claude.

Anthropic presenta una tabla de etapas muy intuitiva:

De 2021 a 2023, Anthropic no difería de una empresa tecnológica común, todos escribían código y documentación en portátiles.

De 2023 a 2025, los chatbots comenzaron a integrarse en el flujo de trabajo. Los ingenieros pedían al modelo que generara fragmentos de código y luego los copiaban en el editor.

De 2025 a 2026, aparecieron los agentes de programación. Claude comenzó a poder escribir y modificar código de forma autónoma, a veces incluso completando archivos enteros de forma independiente.

Hoy en día, los agentes ya pueden ejecutar código por sí mismos y delegar trabajos de varias horas a otros agentes.

Y más adelante, está la etapa que realmente preocupa a Anthropic: el circuito cerrado.

Si llega ese día, las versiones posteriores de Claude podrían ser mejoradas continuamente por el propio Claude: eso es recursive self-improvement, mejora autorrecursiva.

Anthropic es muy cauteloso en el artículo: aún no hemos llegado a ese punto, y la mejora autorrecursiva no es inevitable. Pero aún así enfatiza que el camino hacia ese paso ya comienza a ser visible.

Por eso Anthropic habla de desaceleración, e incluso de pausa, al final del artículo. No significa que ahora todas las empresas de IA detengan inmediatamente el trabajo, sino que si los riesgos de la automejora de la IA continúan aumentando en el futuro, los laboratorios de vanguardia necesitarán un conjunto coordinado y verificable de mecanismos de desaceleración.

En otras palabras, la "singularidad" está por llegar, y la humanidad debe controlarla.

Claude, imparable

Si solo se mira superficialmente, este es un documento de seguridad muy visionario. Anthropic habla de mejora autorrecursiva, de que la IA puede mejorarse a sí misma cada vez más rápido, de que la sociedad humana necesita preparar mecanismos de desaceleración y pausa con anticipación.

Pero situado en el momento en que Anthropic se prepara para su OPV, este artículo adquiere otro significado.

En cierto sentido, los movimientos recientes de Anthropic se parecen a esos alumnos sobresalientes, algo presumidos, de la clase: realmente tiene capacidad, pero también es bastante petulante.

Lo que quiere decir no es solo "tenemos un Claude muy fuerte", sino algo más: quiere decir que "Claude está ayudándonos a crear un Claude aún más fuerte".

Si Anthropic solo vendiera un modelo o una herramienta, le sería difícil escapar por completo de la comparación horizontal: Anthropic tiene Claude, OpenAI tiene GPT; Anthropic tiene Claude Code, OpenAI tiene Codex; Anthropic compite por clientes empresariales, OpenAI también compite por clientes empresariales. La competencia entre las dos empresas es muy reñida, y se trata de ver quién puede contar la historia más grande al mercado.

Es importante señalar que solo 3 días antes, OpenAI había escrito en un documento sobre la gobernanza de la IA de vanguardia:

"También vemos signos tempranos de mejora autorrecursiva en los sistemas actuales: el desarrollo de la IA en sí está siendo acelerado por la IA.

Esto intensificará la presión competitiva entre desarrolladores y naciones, y presentará desafíos de gobernanza que las instituciones existentes no podrán manejar."

3 días después, Anthropic dice: el camino de Claude hacia la mejora autorrecursiva ya comienza a ser visible.

Si Claude realmente se desarrolla como espera, ya no sería una narrativa de producto común, se convertiría en una rueda volante de I+D.

Claude escribe código, ejecuta experimentos, optimiza flujos de entrenamiento, y a su vez reduce los incidentes en los propios productos de Anthropic... Una vez que este sistema funcione, Claude ya no será solo un producto de Anthropic, sino también una importante herramienta de producción.

Los usuarios ven el producto Claude, los clientes empresariales compran la capacidad de Claude, pero lo que Anthropic realmente quiere que el mercado de capitales note es: Claude ya está integrado en el proceso subyacente del desarrollo de modelos de vanguardia, se ha colocado en la sala de motores de Anthropic.

El mercado de capitales adora las historias de ruedas volantes, como una cornucopia que genera riqueza sin fin: un Claude más fuerte permite a los ingenieros de Anthropic fusionar más código, más código acelera la iteración de productos e infraestructura, una iteración más rápida permite a los investigadores ejecutar más experimentos, y más experimentos a su vez ayudan a que la próxima generación de Claude sea más fuerte. Una vez que la próxima generación de Claude sea más fuerte, continuará acelerando la I+D de Anthropic.

La velocidad de iteración de Claude también sustenta esta rueda volante. Según las fechas de lanzamiento público, desde 2023 hasta principios de 2025, las principales actualizaciones del modelo Claude se producían aproximadamente cada tres o cuatro meses, pero tras entrar en Claude 4, las actualizaciones de modelos de Anthropic se han vuelto claramente más frecuentes.

Claude 4 se lanzó en mayo de 2025, Opus 4.1 en agosto, Sonnet 4.5 en septiembre, Haiku 4.5 en octubre, Opus 4.5 en noviembre.

En 2026, Opus 4.6 se lanzó el 5 de febrero, Sonnet 4.6 el 17 de febrero, Opus 4.7 el 15 de abril, Opus 4.8 el 28 de mayo. De Opus 4.7 a Opus 4.8 solo pasaron 42 días.

Superficialmente, Anthropic está diciendo "esto podría ser muy peligroso, debemos preparar los frenos con anticipación", pero al mismo tiempo está insinuando: "ya hemos visto lo que sucederá cuando se pise el acelerador".

La sutileza de la narrativa de la OPV radica precisamente en esto. Por un lado, enfatiza mucho el riesgo, por otro, también eleva su propia posición tecnológica.

No todas las empresas de IA tienen la calificación para discutir la mejora autorrecursiva; primero debes hacer creer al exterior que tu IA ya ha entrado en el flujo de desarrollo de IA, para entonces tener la calificación de decir que esto puede requerir coordinación global.

OpenAI: ¿Cómo pueden hacer esto?

Como se mencionó anteriormente, justo antes de que Anthropic publicara este extenso artículo, OpenAI acababa de sacar a relucir el tema de la mejora autorrecursiva.

Pero la forma en que las dos empresas lo abordan es muy diferente.

El documento de OpenAI, "Democratic Governance of Frontier AI" (Gobernanza Democrática de la IA de Vanguardia), es un plan político dirigido a Washington. No se preocupa por "cómo se fortalece el modelo", sino por cómo se debe restringir cuando la IA de vanguardia sigue avanzando.

La mayoría del contenido de ese informe no es adecuado para extenderse, excepto una frase clave: OpenAI dice que en los sistemas actuales ya se pueden ver signos tempranos de mejora autorrecursiva.

Esta frase y el extenso artículo de Anthropic apuntan en la misma dirección.

Solo que OpenAI habla de sistemas e instituciones, y Anthropic habla de sí misma.

El significado de OpenAI es: el desarrollo de la IA es demasiado rápido, las estructuras de gobernanza actuales pueden no poder seguir el ritmo, por lo que se necesita un nuevo conjunto de reglas.

Mientras que Anthropic directamente muestra ese sistema y le dice al mercado: Claude ya ha entrado en nuestro flujo de I+D, por eso vemos el camino de la autoceleración de la IA.

Esta jugada es muy astuta, y probablemente en OpenAI ya están murmurando internamente: ¡Esto es plagio de ideas! ¡Fuimos nosotros los primeros!

Es broma, pero OpenAI realmente necesita esforzarse más, hay que sacar GPT 5.6 pronto.

Preguntas relacionadas

Q¿Qué significa 'recursive self-improvement' en el contexto del artículo?

AEl 'recursive self-improvement' o mejora recursiva propia se refiere a un concepto en el que una IA no solo es creada y mejorada por humanos, sino que comienza a participar activamente en el diseño, entrenamiento, prueba y optimización de sus propias versiones posteriores. Esto podría conducir a una evolución autónoma y acelerada de la IA.

Q¿Qué porcentaje del código en el repositorio de Anthropic fue escrito por Claude, según el artículo?

ASegún el artículo, más del 80% del código integrado en el repositorio de Anthropic hasta mayo de 2026 fue escrito por Claude.

Q¿Cuál es la principal diferencia en el enfoque entre OpenAI y Anthropic sobre la 'recursive self-improvement'?

ALa principal diferencia es el enfoque: OpenAI aborda la 'recursive self-improvement' como un tema de gobernanza y políticas públicas, argumentando que se necesitan nuevas estructuras para controlarla. Anthropic, mientras tanto, se centra en mostrar cómo Claude ya está involucrado en su propio proceso de desarrollo y en cómo esto le otorga una ventaja técnica y narrativa.

QSegún Anthropic, ¿cuál es el riesgo potencial de la 'recursive self-improvement'?

AEl riesgo potencial es que si la IA alcanza un 'ciclo cerrado' de mejora recursiva, podría evolucionar a un ritmo que supere la capacidad de control y alineación por parte de los humanos. Por eso, Anthropic aboga por la posibilidad de desacelerar o pausar el desarrollo de IA de vanguardia para permitir que las salvaguardias sociales y de investigación se pongan al día.

Q¿Cómo utiliza el artículo el tema de la mejora recursiva en relación con la próxima OPI de Anthropic?

AEl artículo sugiere que, aunque Anthropic presenta la mejora recursiva como una advertencia de seguridad, también la utiliza como una narrativa estratégica para su OPI. Al afirmar que Claude está involucrado en su propio desarrollo, no solo resalta su fortaleza técnica, sino que presenta a la compañía como un líder que posee un 'volante de desarrollo' interno, lo que podría atraer inversores que buscan historias de crecimiento exponencial.

Lecturas Relacionadas

Valor de la asignación del oro como "seguro financiero" en el contexto de la crisis de la deuda estadounidense y los altos rendimientos

En un contexto de crisis de deuda estadounidense y altos rendimientos de los bonos, el oro se posiciona como un "seguro financiero" de valor para la diversificación de carteras. El precio del oro alcanzó un máximo histórico de $5,589/oz en enero de 2026, con un aumento del 35% interanual y más del 230% desde 2020. Este crecimiento responde a fuerzas macroeconómicas clave: la trayectoria fiscal insostenible de EE. UU. (deuda de $39 billones), la erosión de la confianza en el dólar impulsada por la desdolarización y las compras récord de bancos centrales (863 toneladas en 2025), el riesgo geopolítico (conflictos en Medio Oriente) y un entorno de tasas de interés reales bajas o negativas que reduce el costo de oportunidad de mantener el metal. Para los inversores, las principales vías de exposición son los ETFs respaldados por oro físico (como GLD, IAU), la tenencia física a través de dealers, o los ETFs de mineras de oro (como GDX) que ofrecen un apalancamiento al precio. Se recomienda una asignación moderada del 5-10% en una cartera, entendiendo al oro como un activo de cobertura y preservación de valor, no como una inversión de crecimiento. Los riesgos incluyen un repunte fuerte del dólar, un aumento sostenido de las tasas reales o una desescalada geopolítica. Factores clave a seguir son la evolución de las tasas reales en EE. UU., las negociaciones sobre el Estrecho de Ormuz, el ritmo de compras de los bancos centrales y las señales de política monetaria de la nueva Fed. La lógica estructural para mantener una exposición al oro sigue siendo sólida.

marsbitHace 36 min(s)

Valor de la asignación del oro como "seguro financiero" en el contexto de la crisis de la deuda estadounidense y los altos rendimientos

marsbitHace 36 min(s)

Vulnerabilidad de "Impresión Ilimitada" permaneció latente cuatro años, la moneda de privacidad ZEC se desplomó en un día

"Vulnerabilidad de 'impresión ilimitada' permaneció latente durante cuatro años, la moneda de privacidad ZEC se desploma un 50% en un día. El 5 de junio, el fundador de Zcash, Zooko Wilcox, confirmó que Orchard, el nuevo grupo de privacidad implementado en 2022, tuvo una vulnerabilidad crítica de falsificación. Aunque el equipo afirma que está parcheada y con baja probabilidad de explotación, el pánico en el mercado provocó que el precio de ZEC cayera más del 50%. El investigador de seguridad Taylor Hornby descubrió y verificó en mayo que, debido a una restricción incompleta en el circuito de pruebas de conocimiento cero de Orchard, un atacante podría generar ZEC falsos ilimitados e indetectables dentro del grupo blindado. La gran controversia radica en si se crearon ZEC falsos en los últimos cuatro años y cómo demostrar lo contrario, algo extremadamente difícil dada la naturaleza privada de Orchard. Aunque la vulnerabilidad está reparada, la imposibilidad de cuantificar un posible uso pasado genera una crisis de confianza. La venta total de ZEC por parte de Arthur Hayes, un importante impulsor narrativo, exacerbó el pánico. La comunidad cuestiona la gravedad del fallo y cómo un error tan crítico pasó desapercibido durante años, incluso siendo encontrado posteriormente con ayuda de IA. La discusión ha pasado de una corrección de precio a una crisis de credibilidad sobre la seguridad y las promesas de privacidad de Zcash."

Odaily星球日报Hace 54 min(s)

Vulnerabilidad de "Impresión Ilimitada" permaneció latente cuatro años, la moneda de privacidad ZEC se desplomó en un día

Odaily星球日报Hace 54 min(s)

¿Ha «concluido la recuperación» de Bitcoin para entrar formalmente en la fase tardía del mercado bajista?

Bitcoin ha caído un 13% esta semana, confirmando características de una fase tardía de mercado bajista. El precio se sitúa ahora en la mitad del rango entre el precio realizado y la media del mercado real, con la base de coste de los poseedores a corto plazo cayendo por debajo de esta media por primera vez desde enero de 2022. El ratio de ganancias/pérdidas realizadas se desplomó, indicando que el repunte a 82k USD fue un rebote dentro de la tendencia bajista, no un cambio estructural. Las pérdidas diarias realizadas aumentaron a 1.350 millones de dólares, con 770 millones procedentes de holders a largo plazo vendiendo en pérdidas, acelerando la redistribución de la oferta. El precio encontró un fuerte rechazo en los 83k USD, el coste promedio de los ETF spot estadounidenses, lo que devolvió a sus inversores a una posición de pérdidas no realizadas y solidificó ese nivel como resistencia. La presión vendedora en el mercado spot se ha intensificado, con un delta de volumen negativo significativo, mientras que los mercados de opciones siguen cotizando una prima alta por la volatilidad y la protección a la baja. Aunque las liquidaciones de futuros han reducido el apalancamiento, la demanda spot sostenible aún no ha regresado para absorber la oferta. En conclusión, el mercado permanece frágil, con riesgos a la baja persistente hasta que mejore la demanda spot y los inversores en ETF recuperen la rentabilidad.

Foresight NewsHace 1 hora(s)

¿Ha «concluido la recuperación» de Bitcoin para entrar formalmente en la fase tardía del mercado bajista?

Foresight NewsHace 1 hora(s)

Trading

Spot
Futuros

Artículos destacados

Cómo comprar NIGHT

¡Bienvenido a HTX.com! Hemos hecho que comprar Midnight (NIGHT) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar Midnight (NIGHT) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu Midnight (NIGHT)Después de comprar tu Midnight (NIGHT), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear Midnight (NIGHT)Tradear fácilmente con Midnight (NIGHT) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

525 Vistas totalesPublicado en 2025.12.08Actualizado en 2026.06.02

Cómo comprar NIGHT

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de NIGHT (NIGHT).

活动图片