Anthropic grita que el lobo (AGI) está llegando, ¿es por la humanidad o por la OPV?

marsbitPublicado em 2026-06-05Última atualização em 2026-06-05

Resumo

Anthropic ha publicado un documento titulado "When AI builds itself", advirtiendo sobre el "mejoramiento recursivo automático" (recursive self-improvement), un concepto en el que la IA participa activamente en el diseño, entrenamiento, prueba y optimización de sus propias versiones futuras, lo que podría acelerar exponencialmente su progreso. La empresa presenta datos internos que muestran la creciente autonomía de Claude en la I+D de IA: más del 80% del código fusionado en mayo de 2026 fue escrito por Claude, su tasa de éxito en tareas complejas y abiertas alcanzó el 76%, y es capaz de revisar código y realizar investigaciones de seguridad de manera autónoma, a veces superando a los investigadores humanos en eficacia. Anthropic describe una evolución desde el desarrollo humano hasta la aparición de agentes de IA autónomos que pueden ejecutar y delegar tareas. Aunque afirma que el "bucle cerrado" de autorrealimentación completa aún no se ha alcanzado, advierte que el camino hacia él es ya visible. Por ello, pide mecanismos de coordinación global para posiblemente ralentizar o pausar el desarrollo de IA fronteriza, permitiendo que la seguridad y las estructuras sociales se pongan al día. El artículo también analiza el contexto de la próxima OPV de Anthropic, sugiriendo que este mensaje de advertencia sirve a la vez como una narrativa para el mercado: Claude no es solo un producto, sino una herramienta central que acelera su propio desarrollo, creando un "volante de inercia"...

Por | AlfabetoAI

Anthropic publicó anoche un extenso artículo titulado "When AI builds itself" (Cuando la IA se construye a sí misma), que suena como una novela de ciencia ficción de Asimov. El tema es efectivamente un concepto muy de ciencia ficción: recursive self-improvement (mejora autorrecursiva).

En resumen, antes eran los investigadores humanos quienes escribían el código, ejecutaban experimentos, entrenaban modelos y hacían la IA más poderosa. Pero si la IA misma comienza a participar en el diseño, entrenamiento, prueba y optimización de sus propias versiones posteriores, entonces el ritmo de progreso de la IA ya no solo lo impulsan los humanos, sino que podría comenzar a "auto-evolucionar".

Por ello, Anthropic hizo un llamamiento:

"Creemos que sería muy beneficioso para el mundo si pudiera elegir ralentizar o suspender temporalmente el desarrollo de la IA de vanguardia, permitiendo que las estructuras sociales y la investigación de alineamiento (alignment) alcancen el progreso tecnológico."

Esta declaración suena como una advertencia de seguridad, pero situada en el contexto del momento en que Anthropic se prepara para su OPV (Oferta Pública de Venta), tampoco puede evitar verse como otro tipo de narrativa preestablecida: Claude es realmente demasiado útil, e incluso ha comenzado a crear la próxima generación de Claude por sí mismo.

Una nueva tormenta ha aparecido

Para ilustrar que la IA está participando cada vez más en el propio desarrollo de la IA, Anthropic presentó una gran cantidad de datos internos.

Por ejemplo, hasta mayo de 2026, más del 80% del código fusionado en el repositorio de código de Anthropic fue escrito por Claude. Antes del lanzamiento de Claude Code, esta cifra era solo de un dígito.

En el segundo trimestre de 2026, según las estadísticas de Anthropic, la cantidad de código que los ingenieros fusionaban diariamente ya era aproximadamente 8 veces mayor que en 2024.

Más notable que la cantidad de código es que Claude está abordando problemas de ingeniería más abiertos.

Anthropic menciona en el artículo que en el último año, la frecuencia con la que los empleados corrigen a Claude, lo llevan de vuelta al buen camino o toman una tarea a mitad de camino ha ido disminuyendo constantemente. Este cambio no solo ocurre en tareas simples, sino también en las tareas abiertas más complejas.

Por tareas abiertas se entienden problemas sin instrucciones claras. Por ejemplo, cuando se cae un sistema o falla una tarea de entrenamiento, el ingeniero inicialmente tampoco sabe cómo será la solución, solo puede investigar y juzgar sobre la marcha.

Este tipo de tareas solía depender más de la experiencia humana, y en aquellas tareas más abiertas, la tasa de éxito de Claude hasta mayo de 2026 alcanzó el 76%, aumentando 50 puntos porcentuales en seis meses.

No solo es escribir código, Anthropic también utiliza Claude para revisar código, detectar errores, vulnerabilidades de seguridad y otros defectos. Su análisis retrospectivo encontró que si cada cambio de código en el pasado hubiera pasado por una revisión automática de Claude, aproximadamente un tercio de los errores que causaron incidentes en línea en claude.ai podrían haberse detectado antes de su implementación.

Yendo más allá, Claude ya ha comenzado a participar en el flujo de investigación.

Anthropic tiene una prueba fija: darle a Claude un código para entrenar un modelo pequeño y pedirle que encuentre la manera de ejecutar el código más rápido sin alterar los resultados incorrectamente. En mayo de 2025, Claude Opus 4 lograba aproximadamente una aceleración de 3 veces; para abril de 2026, Claude Mythos Preview había elevado esa cifra a unas 52 veces.

Anthropic también menciona un caso de investigación abierta sobre seguridad de IA. Le plantean un problema a un agente impulsado por Claude: ¿puede un modelo más débil supervisar de manera fiable a un modelo más fuerte?

Este proceso requiere plantear hipótesis, probarlas, compartir descubrimientos con agentes paralelos e iterar repetidamente.

Dos investigadores humanos tardaron una semana en reducir aproximadamente el 23% de la brecha; mientras que Claude, con un consumo acumulado de aproximadamente 800 horas y unos 18,000 dólares en potencia de cálculo, redujo el 97%.

Este resultado, por supuesto, tiene limitaciones: el problema fue elegido por humanos, los criterios de puntuación también los definieron humanos, y los resultados no se trasladaron completamente a modelos a escala de producción. Pero aún así muestra que Claude ya puede, dentro de un marco de investigación establecido por humanos, diseñar experimentos, ejecutarlos e iterar por sí mismo.

Además, cuando los investigadores humanos "toman el camino equivocado", Claude puede dar un mejor juicio sobre el siguiente paso.

Anthropic tomó 129 sesiones internas de investigación de Claude Code, donde investigadores humanos y Claude resolvían juntos problemas de investigación abiertos. Anthropic seleccionó algunos nodos donde "los humanos demostraron posteriormente haber dado rodeos", luego dio el contexto previo a esos nodos a diferentes versiones de Claude para ver qué sugeriría hacer a continuación. Luego, otro Claude 'juez' que conocía el resultado completo de la sesión juzgaba: ¿cuál era mejor, la sugerencia del modelo o la elección humana en ese momento?

Los resultados mostraron que en aquellos nodos donde los investigadores humanos habían demostrado posteriormente tener margen de mejora, Claude era cada vez más capaz de proponer un mejor siguiente paso.

En el pasado, el progreso de los modelos de IA dependía principalmente de los investigadores e ingenieros humanos. Los humanos decidían qué experimentos hacer, escribían el código, entrenaban modelos e impulsaban la iteración funcional de la IA.

Ahora, cada vez más eslabones de esta cadena están siendo asumidos por Claude.

Anthropic presenta una tabla de etapas muy intuitiva:

De 2021 a 2023, Anthropic no difería de una empresa tecnológica común, todos escribían código y documentación en portátiles.

De 2023 a 2025, los chatbots comenzaron a integrarse en el flujo de trabajo. Los ingenieros pedían al modelo que generara fragmentos de código y luego los copiaban en el editor.

De 2025 a 2026, aparecieron los agentes de programación. Claude comenzó a poder escribir y modificar código de forma autónoma, a veces incluso completando archivos enteros de forma independiente.

Hoy en día, los agentes ya pueden ejecutar código por sí mismos y delegar trabajos de varias horas a otros agentes.

Y más adelante, está la etapa que realmente preocupa a Anthropic: el circuito cerrado.

Si llega ese día, las versiones posteriores de Claude podrían ser mejoradas continuamente por el propio Claude: eso es recursive self-improvement, mejora autorrecursiva.

Anthropic es muy cauteloso en el artículo: aún no hemos llegado a ese punto, y la mejora autorrecursiva no es inevitable. Pero aún así enfatiza que el camino hacia ese paso ya comienza a ser visible.

Por eso Anthropic habla de desaceleración, e incluso de pausa, al final del artículo. No significa que ahora todas las empresas de IA detengan inmediatamente el trabajo, sino que si los riesgos de la automejora de la IA continúan aumentando en el futuro, los laboratorios de vanguardia necesitarán un conjunto coordinado y verificable de mecanismos de desaceleración.

En otras palabras, la "singularidad" está por llegar, y la humanidad debe controlarla.

Claude, imparable

Si solo se mira superficialmente, este es un documento de seguridad muy visionario. Anthropic habla de mejora autorrecursiva, de que la IA puede mejorarse a sí misma cada vez más rápido, de que la sociedad humana necesita preparar mecanismos de desaceleración y pausa con anticipación.

Pero situado en el momento en que Anthropic se prepara para su OPV, este artículo adquiere otro significado.

En cierto sentido, los movimientos recientes de Anthropic se parecen a esos alumnos sobresalientes, algo presumidos, de la clase: realmente tiene capacidad, pero también es bastante petulante.

Lo que quiere decir no es solo "tenemos un Claude muy fuerte", sino algo más: quiere decir que "Claude está ayudándonos a crear un Claude aún más fuerte".

Si Anthropic solo vendiera un modelo o una herramienta, le sería difícil escapar por completo de la comparación horizontal: Anthropic tiene Claude, OpenAI tiene GPT; Anthropic tiene Claude Code, OpenAI tiene Codex; Anthropic compite por clientes empresariales, OpenAI también compite por clientes empresariales. La competencia entre las dos empresas es muy reñida, y se trata de ver quién puede contar la historia más grande al mercado.

Es importante señalar que solo 3 días antes, OpenAI había escrito en un documento sobre la gobernanza de la IA de vanguardia:

"También vemos signos tempranos de mejora autorrecursiva en los sistemas actuales: el desarrollo de la IA en sí está siendo acelerado por la IA.

Esto intensificará la presión competitiva entre desarrolladores y naciones, y presentará desafíos de gobernanza que las instituciones existentes no podrán manejar."

3 días después, Anthropic dice: el camino de Claude hacia la mejora autorrecursiva ya comienza a ser visible.

Si Claude realmente se desarrolla como espera, ya no sería una narrativa de producto común, se convertiría en una rueda volante de I+D.

Claude escribe código, ejecuta experimentos, optimiza flujos de entrenamiento, y a su vez reduce los incidentes en los propios productos de Anthropic... Una vez que este sistema funcione, Claude ya no será solo un producto de Anthropic, sino también una importante herramienta de producción.

Los usuarios ven el producto Claude, los clientes empresariales compran la capacidad de Claude, pero lo que Anthropic realmente quiere que el mercado de capitales note es: Claude ya está integrado en el proceso subyacente del desarrollo de modelos de vanguardia, se ha colocado en la sala de motores de Anthropic.

El mercado de capitales adora las historias de ruedas volantes, como una cornucopia que genera riqueza sin fin: un Claude más fuerte permite a los ingenieros de Anthropic fusionar más código, más código acelera la iteración de productos e infraestructura, una iteración más rápida permite a los investigadores ejecutar más experimentos, y más experimentos a su vez ayudan a que la próxima generación de Claude sea más fuerte. Una vez que la próxima generación de Claude sea más fuerte, continuará acelerando la I+D de Anthropic.

La velocidad de iteración de Claude también sustenta esta rueda volante. Según las fechas de lanzamiento público, desde 2023 hasta principios de 2025, las principales actualizaciones del modelo Claude se producían aproximadamente cada tres o cuatro meses, pero tras entrar en Claude 4, las actualizaciones de modelos de Anthropic se han vuelto claramente más frecuentes.

Claude 4 se lanzó en mayo de 2025, Opus 4.1 en agosto, Sonnet 4.5 en septiembre, Haiku 4.5 en octubre, Opus 4.5 en noviembre.

En 2026, Opus 4.6 se lanzó el 5 de febrero, Sonnet 4.6 el 17 de febrero, Opus 4.7 el 15 de abril, Opus 4.8 el 28 de mayo. De Opus 4.7 a Opus 4.8 solo pasaron 42 días.

Superficialmente, Anthropic está diciendo "esto podría ser muy peligroso, debemos preparar los frenos con anticipación", pero al mismo tiempo está insinuando: "ya hemos visto lo que sucederá cuando se pise el acelerador".

La sutileza de la narrativa de la OPV radica precisamente en esto. Por un lado, enfatiza mucho el riesgo, por otro, también eleva su propia posición tecnológica.

No todas las empresas de IA tienen la calificación para discutir la mejora autorrecursiva; primero debes hacer creer al exterior que tu IA ya ha entrado en el flujo de desarrollo de IA, para entonces tener la calificación de decir que esto puede requerir coordinación global.

OpenAI: ¿Cómo pueden hacer esto?

Como se mencionó anteriormente, justo antes de que Anthropic publicara este extenso artículo, OpenAI acababa de sacar a relucir el tema de la mejora autorrecursiva.

Pero la forma en que las dos empresas lo abordan es muy diferente.

El documento de OpenAI, "Democratic Governance of Frontier AI" (Gobernanza Democrática de la IA de Vanguardia), es un plan político dirigido a Washington. No se preocupa por "cómo se fortalece el modelo", sino por cómo se debe restringir cuando la IA de vanguardia sigue avanzando.

La mayoría del contenido de ese informe no es adecuado para extenderse, excepto una frase clave: OpenAI dice que en los sistemas actuales ya se pueden ver signos tempranos de mejora autorrecursiva.

Esta frase y el extenso artículo de Anthropic apuntan en la misma dirección.

Solo que OpenAI habla de sistemas e instituciones, y Anthropic habla de sí misma.

El significado de OpenAI es: el desarrollo de la IA es demasiado rápido, las estructuras de gobernanza actuales pueden no poder seguir el ritmo, por lo que se necesita un nuevo conjunto de reglas.

Mientras que Anthropic directamente muestra ese sistema y le dice al mercado: Claude ya ha entrado en nuestro flujo de I+D, por eso vemos el camino de la autoceleración de la IA.

Esta jugada es muy astuta, y probablemente en OpenAI ya están murmurando internamente: ¡Esto es plagio de ideas! ¡Fuimos nosotros los primeros!

Es broma, pero OpenAI realmente necesita esforzarse más, hay que sacar GPT 5.6 pronto.

Perguntas relacionadas

Q¿Qué significa 'recursive self-improvement' en el contexto del artículo?

AEl 'recursive self-improvement' o mejora recursiva propia se refiere a un concepto en el que una IA no solo es creada y mejorada por humanos, sino que comienza a participar activamente en el diseño, entrenamiento, prueba y optimización de sus propias versiones posteriores. Esto podría conducir a una evolución autónoma y acelerada de la IA.

Q¿Qué porcentaje del código en el repositorio de Anthropic fue escrito por Claude, según el artículo?

ASegún el artículo, más del 80% del código integrado en el repositorio de Anthropic hasta mayo de 2026 fue escrito por Claude.

Q¿Cuál es la principal diferencia en el enfoque entre OpenAI y Anthropic sobre la 'recursive self-improvement'?

ALa principal diferencia es el enfoque: OpenAI aborda la 'recursive self-improvement' como un tema de gobernanza y políticas públicas, argumentando que se necesitan nuevas estructuras para controlarla. Anthropic, mientras tanto, se centra en mostrar cómo Claude ya está involucrado en su propio proceso de desarrollo y en cómo esto le otorga una ventaja técnica y narrativa.

QSegún Anthropic, ¿cuál es el riesgo potencial de la 'recursive self-improvement'?

AEl riesgo potencial es que si la IA alcanza un 'ciclo cerrado' de mejora recursiva, podría evolucionar a un ritmo que supere la capacidad de control y alineación por parte de los humanos. Por eso, Anthropic aboga por la posibilidad de desacelerar o pausar el desarrollo de IA de vanguardia para permitir que las salvaguardias sociales y de investigación se pongan al día.

Q¿Cómo utiliza el artículo el tema de la mejora recursiva en relación con la próxima OPI de Anthropic?

AEl artículo sugiere que, aunque Anthropic presenta la mejora recursiva como una advertencia de seguridad, también la utiliza como una narrativa estratégica para su OPI. Al afirmar que Claude está involucrado en su propio desarrollo, no solo resalta su fortaleza técnica, sino que presenta a la compañía como un líder que posee un 'volante de desarrollo' interno, lo que podría atraer inversores que buscan historias de crecimiento exponencial.

Leituras Relacionadas

Uncovering the Truth About Agent Commerce, Payments, and Infrastructure

Decoding Agent Commerce, Payments, and Infrastructure: The Reality Over the past year, I've been building infrastructure for the Agent economy, engaging with major players like Stripe, Visa, Coinbase, Google, and dozens of startups. A clear conclusion emerges: true, large-scale demand does not yet exist. Startups face structural challenges. Data points illustrate this gap. Stripe's Agent commerce platform has over 1,000 merchants but only single-digit transacting agents. Visa's Agent payment token requires 9-month KYC and a $250M revenue threshold, accessible only to giants like Amazon. On-chain analysis reveals actual daily Agent transaction volume is around $17k, half of which are test transactions. The article analyzes four potential markets: **1. Agent-to-Merchant (A2M):** Current AI shopping UX is often inferior to traditional e-commerce for visual, comparison-heavy purchases (clothing, electronics). Chat interfaces are a step back. Real merchant interest is defensive "Agent Engine Optimization," fearing future obsolescence, not current demand. Potential exists in high-frequency, low-decision purchases (e.g., food delivery) or simplifying terrible UX (complex checkouts, non-native shoppers), but these require massive consumer distribution channels dominated by giants like DoorDash and Amazon. **2. Agent-to-API (A2A):** Developers already have subscriptions and billing for core APIs (compute, data). The argument for micro-payments via crypto for sub-dollar API calls is addressed by pre-paid balances today. The deeper issue is supplier resistance; major SaaS firms rely on enterprise contracts, not fractional cent pricing. Opportunity lies in the long tail of niche services, but this is a smaller market catering to developers, a historically low-paying group. **3. Agent-to-Agent (A2A):** This remains a theoretical long-term vision with near-zero current transaction volume. It involves unique challenges: discovery, trust, negotiation, dispute resolution. When it materializes, it will require a fundamentally new settlement infrastructure for high-speed, variable-value, multi-party transactions. It's a real long-term bet, but not the current market. **4. Agent-to-Finance (A2F):** This is the only category with existing, paying demand. Integrating AI into financial workflows (trading, portfolio management) is a natural evolution and enables new capabilities like autonomous rebalancing. However, competition favors incumbents with regulatory licenses, compliance infrastructure, and existing client relationships. **The Real Issue:** Why is infrastructure still being built? Incumbents can afford long-term bets, and payment companies see every problem as a nail for their payment hammer. However, payment is just one piece. The core challenge is *coordination*—orchestrating work between Agents and humans, verifying outcomes, and settling results. Payment is part of settlement, which is part of coordination. Companies that solve the coordination problem will subsume payments, not the other way around. Startups lack the infinite runway of giants and must find today's real market, which, after a year of exploration, lies outside these four categories—in an area with real, growing, and underserved activity.

marsbitHá 3h

Uncovering the Truth About Agent Commerce, Payments, and Infrastructure

marsbitHá 3h

Trading

Spot
Futuros

Artigos em Destaque

Como comprar NIGHT

Bem-vindo à HTX.com!Tornámos a compra de Midnight (NIGHT) simples e conveniente.Segue o nosso guia passo a passo para iniciar a tua jornada no mundo das criptos.Passo 1: cria a tua conta HTXUtiliza o teu e-mail ou número de telefone para te inscreveres numa conta gratuita na HTX.Desfruta de um processo de inscrição sem complicações e desbloqueia todas as funcionalidades.Obter a minha contaPasso 2: vai para Comprar Cripto e escolhe o teu método de pagamentoCartão de crédito/débito: usa o teu visa ou mastercard para comprar Midnight (NIGHT) instantaneamente.Saldo: usa os fundos da tua conta HTX para transacionar sem problemas.Terceiros: adicionamos métodos de pagamento populares, como Google Pay e Apple Pay, para aumentar a conveniência.P2P: transaciona diretamente com outros utilizadores na HTX.Mercado de balcão (OTC): oferecemos serviços personalizados e taxas de câmbio competitivas para os traders.Passo 3: armazena teu Midnight (NIGHT)Depois de comprar o teu Midnight (NIGHT), armazena-o na tua conta HTX.Alternativamente, podes enviá-lo para outro lugar através de transferência blockchain ou usá-lo para transacionar outras criptomoedas.Passo 4: transaciona Midnight (NIGHT)Transaciona facilmente Midnight (NIGHT) no mercado à vista da HTX.Acede simplesmente à tua conta, seleciona o teu par de trading, executa as tuas transações e monitoriza em tempo real.Oferecemos uma experiência de fácil utilização tanto para principiantes como para traders experientes.

311 Visualizações TotaisPublicado em {updateTime}Atualizado em 2026.06.02

Como comprar NIGHT

Discussões

Bem-vindo à Comunidade HTX. Aqui, pode manter-se informado sobre os mais recentes desenvolvimentos da plataforma e obter acesso a análises profissionais de mercado. As opiniões dos utilizadores sobre o preço de NIGHT (NIGHT) são apresentadas abaixo.

活动图片