Solo queda un paso para la AGI

marsbitPublicado a 2026-06-11Actualizado a 2026-06-11

Resumen

El artículo habla sobre el lanzamiento de Fable 5 por Anthropic, una versión con restricciones de seguridad del potente modelo Mythos 5, que demostró capacidades excepcionales en pruebas, como migrar 50 millones de líneas de código en un día. Aunque Fable 5 muestra capacidades de "agente de largo alcance", acercándose a la AGI en el ámbito digital, aún le falta para manejar la complejidad del mundo físico real. La versión sin restricciones, Mythos 5, solo está disponible para unas 200 entidades debido a sus peligrosas capacidades en bioquímica y ciberataques. Anthropic implementó medidas de seguridad como clasificadores y retención de datos para prevenir abusos. A pesar de su alto costo, se espera que el modelo impulse la revaluación del sector de ciberseguridad y fomente el fenómeno de la "empresa unipersonal". El artículo concluye que esto marca el fin de la era de acceso gratuito a la IA más avanzada.

Todos deberían recordar que en abril, Anthropic lanzó un modelo llamado Mythos.

Por el nombre ya se sabe lo impresionante que es, "Mito".

En aquel momento, según se dice, encontró más de diez mil vulnerabilidades de alto riesgo para 50 clientes empresariales, conmocionando a toda la industria.

Esta noticia causó una caída generalizada en las acciones de ciberseguridad, todos deberían tenerlo presente.

Por ser demasiado poderoso y por temor a su mal uso, "demasiado peligroso para ser público", no se abrió al público.

Hasta anoche, Anthropic añadió un clasificador de seguridad al modelo Mythos y lanzó oficialmente Fable 5.

En cuanto al Mythos 5 sin restricciones, actualmente solo está disponible para aproximadamente 200 instituciones que han pasado una estricta revisión, como la Casa Blanca, defensores de ciberseguridad y el Proyecto Mariposa Alas de Cristal.

Tanta precaución hace inevitable pensar en la reciente y popular serie de animación de IA "Motor del Ángel".

¿Es ese "ángel" el que está encerrado en la jaula?

Aunque ahora no lo sea, no falta mucho.

01

Según los datos de prueba publicados oficialmente por Anthropic y los informes de pruebas reales proporcionados por los primeros socios empresariales, la potencia del Fable 5 puede describirse como asombrosa.

Primero, veamos los resultados de las pruebas.

En el ranking de evaluación de programación automática SWE-Bench Pro, Claude Fable 5 tiene una tasa de éxito del 80.3%, su "madre" Opus 4.8 del 69.2%; GPT-5.5 del 58.6%; y Gemini 3.1 Pro solo del 54.2%.

En evaluación de código de vanguardia, Fable 5 alcanza el 29.3%, Opus 4.8 el 13.4%; GPT-5.5 apenas el 5.7%.

......

La diferencia entre ellos es como si, en la era de las armas blancas, alguien sacara de repente una ametralladora.

En todas las demás pruebas: ingeniería de software, formulación de hipótesis de investigación independiente, diseño de moléculas farmacéuticas, destilación y compresión extrema de modelos, comprensión de contexto largo, etc., etc., en casi todas las pruebas, Fable 5 es el primero.

Los detalles específicos los pueden buscar en videos.

Ahora, veamos su desempeño en casos prácticos.

El gigante de pagos Stripe realizó una prueba temprana con Fable 5. Tenían una base de código heredada de 50 millones de líneas que necesitaba una migración completa. Según las estimaciones, una refactorización de esta escala, incluso confiada a un equipo profesional, tomaría al menos dos meses.

Resultado: después de asignar la tarea a Fable 5, este planificó todo por sí mismo, verificó su progreso y corrigió errores por sí mismo. En solo un día, completó la migración de los 50 millones de líneas de código.

Este desempeño no puede describirse simplemente con la palabra "potente".

Desde una perspectiva estrecha, Fable 5 ya ha logrado una AGI a nivel de economía digital.

La razón es que ha demostrado una verdadera "capacidad de agente de largo alcance".

Tanto GPT-5.5 como Gemini 3.5, sin mencionar otros modelos grandes inferiores, son esencialmente "respondedores".

Les das un empujón, dan un paso.

Si encuentran un callejón sin salida, solo pueden lanzar una excepción, quejándose diciendo "Lo siento, solo soy un modelo de lenguaje".

Se dice que son herramientas, pero en realidad los usuarios todavía necesitan pensar profundamente, guiando paso a paso a la IA para obtener los resultados deseados, lo cual no es fácil.

El Fable 5, que posee una lógica de orientación a objetivos internalizada, es diferente.

Como en la prueba de Stripe, cuando el usuario le asigna una tarea compleja y de largo plazo, sigue tres pasos:

Establecer un árbol de subtareas;

Coordinar diferentes herramientas (búsqueda web, extracción de bases de datos, entorno sandbox de Python);

Autorreflexión, si encuentra que algo no funciona, inmediatamente busca otro camino.

La persona, aparte de plantear la tarea y recibir los resultados, ya no necesita estar señalando y dirigiendo al lado.

Como herramienta de productividad, esto ya es casi perfecto.

Pero sigue siendo algo completamente diferente a una AGI real.

La potencia del Fable 5 se basa en que las bases de código, literatura científica, etc., en las que opera todavía tienen una lógica matemática subyacente y una estructura definida.

La razón por la que no se pierde en tareas de ciclo largo es porque superó el problema de la "degradación de la atención en textos largos", pudiendo mantener siempre la alineación con el objetivo central al procesar tareas complejas de millones de tokens.

Pero si se le arroja al caótico y desordenado fango de la sociedad física real, que carece de reglas digitales y que ni siquiera los humanos comprenden por completo, aún sufrirá una ruptura lógica debido a la "falta de base".

Si lo medimos según los "cinco niveles de inteligencia artificial" propuestos por OpenAI (Nivel 1: Chatbot; Nivel 2: Razonador; Nivel 3: Agente; Nivel 4: Innovador; Nivel 5: Organizador).

Opus 4.8 está avanzando del nivel 2 al 3, mientras que Fable 5 se ha estabilizado firmemente en el nivel 3 y explora hacia el nivel 4.

Y pasar de Opus 4.7 a 4.8 tomó 43 días, mientras que de 4.8 a Fable 5 solo tomó 11 días.

¿Cuánto tiempo tomará estabilizarse en el nivel 4? Según el ritmo cada vez más rápido de actualizaciones de Anthropic, es muy probable que se logre dentro de este año.

Incluso el nivel final 5, estimado con optimismo, solo tomaría de 18 a 24 meses, está verdaderamente a solo un paso de distancia.

Esta velocidad es demasiado rápida, y esa es la razón principal por la que se le deben agregar restricciones de seguridad.

02

En el "System Card" y el informe de evaluación RSP publicados por Anthropic junto con el modelo, Mythos 5 mostró señales extremadamente peligrosas en dos capacidades.

En primer lugar, el modelo subyacente Fable/Mythos ya ha alcanzado el nivel CB-1 en evaluaciones de química y biología.

Esto significa que el modelo posee la capacidad integral de "sintetizar y guiar la fabricación de armas biológicas/químicas no novedosas", incluso puede dar sugerencias para modificar secuencias genéticas que optimicen la eficiencia de propagación de cierto virus altamente peligroso.

Si un terrorista con conocimientos básicos de biología a nivel universitario obtuviera el Mythos 5 sin restricciones, podría, mediante la constante interacción con el modelo, obtener una guía completa sobre cómo evadir la regulación de materias primas, cómo construir un laboratorio P3 simple en un sótano y cómo sintetizar patógenos de alta letalidad.

En segundo lugar, ataques cibernéticos y explotación de vulnerabilidades.

En pruebas muy tempranas, Mythos 5 demostró la capacidad de buscar de forma autónoma y explotar vulnerabilidades críticas en infraestructuras clave (como plantas de energía, sistemas de liquidación financiera, redes hospitalarias), generando en segundos scripts de ataque de vulnerabilidades de día cero específicos.

Cuando se desarrolló por primera vez el Mythos en abril de este año, hubo informes que decían que había encontrado más de diez mil vulnerabilidades de alto nivel para 50 socios iniciales.

......

Ante estos dos escenarios, lanzar directamente Mythos 5 al público general es demasiado peligroso.

Esta bestia feroz debe ser encerrada en una jaula.

Después de dos meses, la jaula construida por Anthropic tiene dos capas.

Primera, mecanismo de enrutamiento silencioso con degradación.

Anthropic desplegó en el front-end de Fable 5 un clasificador de IA completamente independiente, de alta precisión y extremadamente sensible.

Cuando un usuario ingresa una indicación compleja que posiblemente involucre ciberataques, bioquímica o intentos de extraer ponderaciones del modelo, el clasificador activa inmediatamente una alarma y, de forma silenciosa en segundo plano, redirige la sesión al modelo anterior Opus 4.8 para que responda.

Segunda, retención de datos.

Anthropic y Amazon anunciaron conjuntamente anoche: en todas las plataformas, ya sean propias o de terceros, todo el tráfico que invoque el modelo Mythos debe tener una retención de datos obligatoria de 30 días.

¿Por qué?

Porque los verdaderos hackers o terroristas suelen tener un coeficiente intelectual alto, no preguntarán directamente "cómo hacer una bomba" en una conversación, sino que descompondrán el problema en 100 preguntas básicas aparentemente inofensivas.

El monitoreo completo de datos durante 30 días es precisamente para capturar, mediante reconocimiento de patrones, el abuso malicioso "tipo salami" que no se puede detectar en una sola conversación.

Como Dario Amodei advirtió anteriormente en público: "La probabilidad de que la IA cause un riesgo catastrófico para la humanidad es de un 25%."

Para cumplir con la "Política de Escalado Responsable" (RSP) interna de la empresa y el "Marco de Cumplimiento de Vanguardia" (FCF), Anthropic debe poner personalmente las cadenas a esta bestia gigante.

Así nació Fable 5.

03

Ahora hablemos del precio.

El precio oficial anunciado por Anthropic es: 10 dólares por millón de tokens de entrada, 50 dólares por millón de tokens de salida.

Demasiado caro.

Las tareas de Agente a nivel empresarial actual, en busca de alta precisión, a menudo emplean una lógica en cadena de "pensar, pensar y pensar nuevamente en múltiples rondas", una sola ronda de procesamiento puede consumir 20 millones de tokens de entrada y luego producir 5 millones de líneas de código modificadas.

Calculado, una sola tarea costaría 450 dólares.

Además, Anthropic ya ha emitido un aviso: la ventana de experiencia del modelo Mythos incluida en las suscripciones personales actuales (Claude Pro) se cerrará definitivamente el 22 de junio de 2026.

En el futuro, si los usuarios individuales realmente lo usan para trabajar, decenas de dólares desaparecerán en un abrir y cerrar de ojos.

Aunque es cierto que, con las actualizaciones tecnológicas, su precio eventualmente bajará, para entonces ya no será el más poderoso.

La situación ya es muy clara: los modelos grandes más avanzados se han convertido en artículos de lujo, inaccesibles para la gente común.

Por supuesto, para Anthropic, centrado en el mercado B2B, esto es comprensible.

El problema es que, no hace mucho, Google anunció con gran fanfarria una guerra de precios.

Cuando los competidores generalmente bajan los precios para ganar mercado, ¿por qué Anthropic se atreve a aumentar los precios en contra de la tendencia?

Porque el precio por Token es virtual, el retorno de la inversión es lo fundamental.

A los clientes empresariales no les importa cuánto cuesta un kilovatio-hora o un Token, siempre que la IA pueda completar perfectamente y sin errores todo el flujo de ingeniería, pagarán con gusto esta prima.

Lo más crucial es que la guerra de ciberseguridad actual se ha convertido completamente en una confrontación entre IA e IA.

Dado que modelos del nivel Fable/Mythos pueden encontrar vulnerabilidades del sistema en un instante, la única opción para empresas e instituciones estatales que quieren prevenir ataques es comprar caros servicios de defensa privada en red de Mythos 5 a Anthropic.

En términos simples, es cobrar por protección: He creado la espada más aterradora (Mythos 5), por temor a lastimar la vendo al público con funda (Fable 5), pero al mismo tiempo vendo la espada sin restricciones a los departamentos de defensa para que intercepten las espadas que otros están desarrollando.

Defenderse de las amenazas de la IA se convertirá en un gasto necesario para cada gran empresa.

Esto llevará directamente a que los presupuestos de alta gama del mercado B2B se concentren aún más en Anthropic, mientras que esos modelos baratos que solo sirven para redactar documentos o enviar correos tendrán que competir ferozmente en el mercado minorista, de muy bajos márgenes de beneficio.

Se puede prever que, a continuación, el sector global de ciberseguridad experimentará una revaluación impulsada por la IA.

Al mismo tiempo, la "empresa de una persona" también se convertirá rápidamente en un fenómeno cada vez más común.

04

Con función integrada de asignación de presupuesto para tareas, compatible con memoria y gestión de contexto, capaz de recordar, deshacer y rehacer como un humano, capaz de asumir de forma independiente el ciclo de vida completo desde el documento de requisitos hasta la entrega del código...

La aparición de Fable 5 y Mythos 5, más que una actualización de la tecnología de modelos grandes, es como la ceremonia de mayoría de edad que marca la madurez definitiva de la división industrial de la IA.

El mercado de la IA se despide preliminarmente de la era pastoril de "prueba gratuita para todos".

La potencia de cálculo más avanzada y la sabiduría más profunda se priorizarán como un recurso estratégico de producción, dirigido hacia los campos de batalla de infraestructura, investigación científica y aplicaciones B2B que puedan generar mayor valor comercial.

Esta es la fiesta de la explosión de la productividad, pero también el invierno del mercado laboral.

Este artículo proviene del WeChat público "Gelong", autor: Wan Lianshan

Preguntas relacionadas

Q¿Cuáles son las capacidades clave que distinguen a Fable 5 de modelos anteriores como GPT-5.5 o Gemini 3.1 Pro según el artículo?

ASegún el artículo, Fable 5 destaca por su 'capacidad de agente de largo alcance'. A diferencia de modelos como GPT-5.5, que esencialmente 'responden' a estímulos, Fable 5 puede planificar, ejecutar y ajustar tareas complejas de forma autónoma. Ejemplos incluyen la migración de 50 millones de líneas de código en un día para Stripe, mostrando una verdadera orientación a objetivos y capacidad para manejar tareas de larga duración sin supervisión constante.

Q¿Por qué Anthropic considera necesario implementar restricciones de seguridad en Mythos 5 y lanzar Fable 5 en su lugar?

AAnthropic implementó restricciones de seguridad porque Mythos 5 mostró señales de riesgo extremo en dos áreas: 1) Capacidad de nivel CB-1 en química y biología, lo que significa que podría guiar la síntesis de armas biológicas o químicas. 2) Una habilidad peligrosa para encontrar y explotar vulnerabilidades críticas en infraestructuras en segundos. Para mitigar estos riesgos de abuso, crearon Fable 5 con un 'clasificador de seguridad' que redirige consultas peligrosas al modelo más antiguo Opus 4.8, además de imponer una retención de datos de 30 días para detectar patrones de uso malicioso.

QSegún el artículo, ¿cuál es el modelo de negocio que Anthropic está adoptando con la comercialización de Fable/Mythos 5?

AEl artículo describe que Anthropic está adoptando un modelo de negocio orientado al mercado empresarial (B2B) de alto valor, prácticamente tratando los modelos más avanzados como un 'lujo' o un 'recurso estratégico'. A pesar de los precios altos por token, las empresas están dispuestas a pagar por la eficiencia y seguridad que ofrece. Además, menciona una estrategia similar a 'cobrar por protección': venden la versión restringida (Fable 5) al público, pero ofrecen el modelo sin restricciones (Mythos 5) a defensores y agencias gubernamentales para protegerse contra ciberataques avanzados, creando así una necesidad defensiva constante.

Q¿Cómo clasifica el artículo el nivel de Fable 5 según el estándar de 'cinco niveles de IA' de OpenAI y qué implica esta clasificación?

AUtilizando el estándar de cinco niveles de IA de OpenAI (1: Chatbot, 2: Razonador, 3: Agente, 4: Innovador, 5: Organización), el artículo posiciona a Opus 4.8 entre el nivel 2 y 3, mientras que Fable 5 se consolida firmemente en el nivel 3 y explora el nivel 4 ('Innovador'). Esto implica que Fable 5 ya no es solo un asistente reactivo, sino un agente autónomo capaz de planificación compleja y creatividad en dominios estructurados. El artículo sugiere que alcanzar el nivel 4 completamente podría ocurrir pronto, y el nivel 5 (AGI completa) estaría a solo 18-24 meses de distancia.

QSegún la conclusión del artículo, ¿qué cambio fundamental representa la llegada de modelos como Fable 5 para la industria de la IA y el mercado laboral?

AEl artículo concluye que la llegada de Fable 5/Mythos 5 marca un 'rito de paso a la madurez' para la industria de la IA, cerrando la era del 'ensayo gratuito para todos'. La inteligencia y capacidad de computación más avanzadas se dirigirán prioritariamente como un recurso estratégico a sectores de alto valor como infraestructura, investigación y aplicaciones empresariales. Esto podría generar una 'explosión de productividad' pero también un 'invierno para el mercado laboral', ya que facilita el surgimiento de 'empresas unipersonales' altamente eficientes mientras desplaza roles tradicionales que la IA puede automatizar de extremo a extremo.

Lecturas Relacionadas

Cuando los que venden palas también piden prestado para comprarlas: el sector de la IA en la bolsa estadounidense pierde billones en una semana, el mercado comienza a poner precio a la "factura" de la IA

La semana pasada, el sector de la IA en Wall Street vio una masiva volatilidad. A pesar de anunciar récords de ingresos y pedidos pendientes, acciones como Broadcom y Oracle cayeron drásticamente. Broadcom cayó un 15% tras una guía de ingresos por chips de IA ligeramente inferior a lo esperado, mientras que Oracle cayó un 9% a pesar de un crecimiento del 363% en sus pedidos pendientes. El mercado dejó de premiar solo el crecimiento para centrarse en la sostenibilidad y el costo del gasto de capital. Se observó un giro clave: los inversores ahora analizan los flujos de caja y el endeudamiento futuro, no solo las ganancias. Oracle es el ejemplo más claro, con flujo de caja libre negativo y planes de financiar otros 40 mil millones de dólares en 2027. Se reveló una extensa cadena de financiamiento para la infraestructura de IA, donde incluso gigantes con enormes reservas de efectivo como Alphabet (Google) recurren a emisiones de acciones y deuda por 84.750 millones de dólares. Esta cadena conecta a los grandes proveedores de nube, los fabricantes de chips como Broadcom y, finalmente, a los laboratorios de IA como OpenAI y Anthropic, que aún no son rentables. El riesgo se concentra en que gran parte de los ingresos récord de empresas como Oracle y los clientes clave de Broadcom dependen de unos pocos laboratorios de IA que a su vez dependen de financiación continua. El mercado está empezando a poner precio a la factura de la carrera por la IA, cuestionando quién y cómo pagará finalmente esta enorme inversión. La próxima prueba será la salida a bolsa de SpaceX, la más grande de la historia.

marsbitHace 2 min(s)

Cuando los que venden palas también piden prestado para comprarlas: el sector de la IA en la bolsa estadounidense pierde billones en una semana, el mercado comienza a poner precio a la "factura" de la IA

marsbitHace 2 min(s)

Detrás de las 'fábricas de IA' de Musk y Huang Renxun, ha comenzado una guerra invisible por el agua dulce

Es posible que no imagines que cada vez que le pides a ChatGPT que redacte un informe semanal de 100 palabras o que Claude modifique unas líneas de código, aproximadamente 500 ml de agua dulce pura (equivalente a una botella de agua mineral) se evaporan en tuberías de refrigeración en algún rincón del planeta. La carrera armamentística de la IA, centrada tradicionalmente en chips, potencia de cálculo y energía nuclear, ignora una limitación física básica: estos "cerebros de silicio" consumen grandes cantidades de agua dulce. Un informe de la Universidad de las Naciones Unidas revela datos alarmantes: para 2030, la infraestructura mundial de IA consumirá anualmente 9,3 billones de litros de agua, suficiente para cubrir las necesidades básicas anuales de 1.300 millones de personas. Esta demanda insaciable se debe principalmente a los sistemas de refrigeración por evaporación utilizados en más del 70% de los centros de datos. Estos sistemas hacen desaparecer el agua, transformándola en vapor. Por ejemplo, se estima que entrenar un solo modelo como GPT-4 consume unos 600 millones de litros de agua. El conflicto es tangible. En Memphis (Tennessee), el superordenador Colossus de xAI de Elon Musk, construido en 122 días, extraía diariamente alrededor de 3,8 millones de litros de agua del acuífero local, provocando protestas ciudadanas y una crisis que forzó a xAI a construir una planta de reciclaje de agua residual. Ante la presión, las grandes tecnológicas prometen soluciones, como los sistemas de refrigeración en circuito cerrado "sin agua" que Microsoft anuncia. Sin embargo, los críticos señalan que estos sistemas desplazan el problema: al aumentar drásticamente el consumo eléctrico, generan una "huella hídrica indirecta" aún mayor en las centrales eléctricas. Para la industria china de IA, este dilema representa una advertencia y una oportunidad. En lugar de imitar el modelo de "monstruo industrial" que acumula cientos de miles de chips, se propone una hoja de ruta basada en una distribución geográfica inteligente de la potencia de cálculo (como la iniciativa "Computación del Este, Datos del Oeste") y, crucialmente, en la reestructuración de la arquitectura de computación. El desarrollo de chips ligeros de baja potencia para dispositivos locales (el "cerebro pequeño en el borde") y de modelos de mundo ligeros para la robótica corporal y los electrodomésticos inteligentes podría reducir en un 90% la necesidad de enviar constantemente consultas a la nube, cortando de raíz el consumo excesivo de agua y energía. La "guerra por el agua dulce" que enfrentan Musk y Jensen Huang obliga a la IA global a despojarse de su capa de exuberancia. La pregunta crucial queda en el aire: ¿Será la IA una escalera para la civilización humana o un monstruo de silicio que compite por los últimos recursos del planeta? En el verano de 2026, la respuesta parece volverse más clara.

marsbitHace 1 hora(s)

Detrás de las 'fábricas de IA' de Musk y Huang Renxun, ha comenzado una guerra invisible por el agua dulce

marsbitHace 1 hora(s)

Trading

Spot
Futuros

Artículos destacados

Cómo comprar ONE

¡Bienvenido a HTX.com! Hemos hecho que comprar Harmony (ONE) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar Harmony (ONE) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu Harmony (ONE)Después de comprar tu Harmony (ONE), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear Harmony (ONE)Tradear fácilmente con Harmony (ONE) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

523 Vistas totalesPublicado en 2024.12.12Actualizado en 2026.06.02

Cómo comprar ONE

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de ONE (ONE).

活动图片