¡Un trueno caído del cielo en el mundo de la IA!
Anthropic advierte a toda la humanidad: ¡Detengan la investigación de IA!
Los datos internos de Anthropic muestran que la IA está acelerando el desarrollo de la propia IA, y puede que ya haya surgido el camino hacia la mejora recursiva propia.
En otras palabras, la IA se está acercando al punto de inflexión de 'crearse a sí misma'.
Este proceso es más rápido de lo que Anthropic había previsto, por lo que Anthropic hace un llamado para ralentizar o pausar la investigación en IA.
Mientras tanto, Yann Dubois, responsable del equipo de entrenamiento posterior de OpenAI, ofrece en una reciente entrevista una perspectiva más microscópica pero igualmente reflexiva:
¡La evolución de la IA no es una mejora repentina, sino que acaba de pasar el punto de aprobación!
En su última entrevista, revela múltiples perspectivas internas:
El crecimiento de las capacidades de la IA es lineal y continuo, pero la 'utilidad' que experimentan los usuarios es discreta y a saltos.
Porque antes de alcanzar un cierto 'umbral de fiabilidad', la IA es solo un juguete que hace trucos; una vez que cruza ese punto, se convierte en un empleado al que puedes confiarle el trabajo y que se acelera por sí mismo.
OpenAI cruzó este umbral alrededor de diciembre del año pasado.
Además, Yann Dubois plantea una afirmación contraintuitiva: la construcción de IA se parece más a un 'oficio (Craft)' que a una 'ciencia'.
Esta perspicacia es muy intensa: en este campo que más enfatiza el cómputo duro, lo que finalmente triunfa es el 'flare (intuición/inspiración)' similar a la alquimia.
También plantea el 'dividendo de la IA del último kilómetro'.
Si congelamos todos los modelos ahora, solo trabajando en aplicaciones verticales (Harness), en realidad ya podríamos lograr la AGI (Inteligencia General Artificial).
El cuello de botella no está en el cerebro del modelo, sino en los 'permisos, conexiones y datos'. Esto directamente echa un balde de agua fría a los desarrolladores que están a la expectativa, y al mismo tiempo señala dónde está la mina de oro.
Umbral de fiabilidad superado, la IA se acelera sola
Las últimas semanas han estado muy animadas en el mundo de la IA: se lanzó GPT5.5, también salió Claude Mythos.
Especialmente en ciberseguridad y en agentes de IA que escriben código, la sensación es de avances constantes y renovados, el progreso de la IA se siente como si de repente hubiera dado 'un gran salto'.
Dubois es muy directo: la mejora de capacidades en realidad ha sido bastante continua, la razón por la que la gente siente que fue como en cohete es porque había un 'umbral de fiabilidad' en el medio.
Antes de cruzar ese umbral, la IA era como un becario inteligente pero problemático: puede escribir, calcular y dar ideas, pero no te atreves a confiarle el trabajo por completo.
Después de cruzar el umbral, te atreves a dejarla 'trabajar de verdad'.
Él estima que OpenAI cruzó esta línea alrededor de 'diciembre del año pasado', y fue entonces cuando apareció la 'transición escalonada' que siente el mundo exterior.
La segunda razón es aún más estimulante: cuando el modelo es suficientemente bueno, a su vez acelera la propia investigación y desarrollo.
Esto es lo que más preocupa a Anthropic.
Dubois menciona que, especialmente en el escenario de programación, los investigadores escriben código todos los días; si el modelo se fortalece, es como si todo el equipo tuviera un compañero que no duerme: puede ayudar a los investigadores a construir la cadena de herramientas y también 'alimentar la IA con IA' al entrenar la próxima generación de modelos.
Una vez que el circuito de aceleración comienza a girar, gira cada vez más rápido, no es extraño que en los últimos meses haya sido 'cada vez más intenso'.
Esto también sucedió dentro de Anthropic; para el segundo trimestre de 2026, la contribución de código per cápita por trimestre ya era 8 veces mayor que la del primer trimestre de 2024.
La tercera fuerza impulsora proviene de la 'transformación y mejora' del aprendizaje por refuerzo (RL).
Los modelos de razonamiento tempranos como el o1 se concentraban principalmente en tareas de 'recompensa verificable', como problemas de matemáticas y competiciones de programación, porque el acierto y el error son claros y la recompensa es fácil de definir.
Pero en el último año, han trasladado ese conjunto de herramientas entrenadas en competiciones a escenarios laborales más reales y ambiguos: ya no solo optimizan 'problemas con respuestas estándar', sino que optimizan 'cosas que los usuarios encuentran realmente útiles'.
En una frase: de ser un competidor que resuelve problemas, comienza a evolucionar hacia un trabajador en el lugar de trabajo.
Los ingenieros de IA no son científicos, la IA se 'cria'
Pero una vez que entras en el mundo real, surgen problemas: ¿cómo mejorar la fiabilidad?
Dubois da un 'modelo probabilístico' muy directo:
Dado que ahora muchos son sistemas de agentes de IA (agénticos), puedes pensar de manera aproximada que 'cada dos minutos hay una cierta probabilidad de cometer un error'; cuanto más tiempo se ejecuta, mayor es la probabilidad de que la respuesta final falle.
Por lo tanto, la llamada 'mejora de la fiabilidad' es esencialmente reducir continuamente esta 'tasa de error cada dos minutos'.
Este es un hueso duro inherente a los agentes de IA.
Esto también explica por qué Dubois dice que la construcción de IA se parece más a un 'trabajo artesanal', no a un 'experimento científico' de los libros de texto.
El flujo real a menudo es: primero sacar algo con experiencia, intuición y prueba y error, incluso con un toque de 'alquimia'; luego, cuando realmente funciona y es útil, volver y complementar con explicaciones y metodologías más científicas.
También menciona una pequeña anécdota con un giro interesante:
Cuando ChatGPT anunció públicamente que había usado RL, su primera reacción fue 'es demasiado complejo, con el ajuste fino supervisado (SFT) debería bastar', que era precisamente la idea que quería verificar cuando estaba en Stanford haciendo Alpaca.
Pero luego los hechos mostraron que una vez que la escala del modelo supera cierto nivel, el RL realmente comienza a 'funcionar de repente', aunque el costo no es bajo: muestrear muchas respuestas, juzgar cuáles son correctas, cuáles son incorrectas, requiere mucha potencia de cálculo e ingeniería de sistemas.
Los sistemas de orquestación (Harness) en campos verticales ya alcanzan la AGI
Hablando de 'llevar la IA a la realidad', es inevitable mencionar la palabra favorita del mundo de las startups en estos días: Harness (sistema de orquestación).
Algunos lo ven como el 'esqueleto externo' de los agentes de IA, otros sospechan que eventualmente será 'absorbido' por el modelo.
La actitud de Dubois es muy realista:
A corto plazo, los Harness en escenarios verticales valen la pena, pueden impulsar la fiabilidad del 80% al 85%.
Pero con la condición de que aceptes: el modelo sigue mejorando, y el Harness también necesita reajustes constantes.
Cree que crear un 'Harness universal' que sea estable a largo plazo y sirva para todo, básicamente no es viable.
Incluso lanza un juicio muy 'provocativo': si hoy 'congelamos' los modelos existentes y solo nos dedicamos a pulir los Harness y entrenar en torno a ellos, muchas personas en diversos campos podrían 'sentir claramente el sabor de la Inteligencia General Artificial (AGI)'.
El último kilómetro
Pero lo que realmente emociona y preocupa a Dubois es ese viejo y difícil problema del 'aprendizaje continuo (continual learning)'.
Hace tres años, cuando ChatGPT acababa de hacerse popular, él y sus amigos incluso discutieron seriamente si emprender para hacer memoria personalizada y aprendizaje continuo.
En ese momento pensaron que 'OpenAI lo resolvería en 6 meses', así que no lo hicieron; tres años después, él ya está dentro de OpenAI y descubre que el asunto aún no está realmente resuelto.
La incomodidad actual del modelo es: el primer día que llega a una empresa, puede ser más útil que la mayoría de los nuevos empleados (alto punto de partida); pero después básicamente 'se mantiene igual', porque no aprende en ese entorno específico a entenderte mejor y a ser más eficiente.
La curva de aprendizaje humana es ascendente, la línea de la IA tiende a aplanarse.
Convertir la curva de la IA de 'plana' a 'en constante ascenso', Dubois cree que será uno de los problemas más importantes en el futuro.
Entonces, ¿hay espacio para que las startups hagan aplicaciones verticales?
La respuesta de Dubois es muy clara: no solo lo hay, sino que es grande.
Porque el verdadero cuello de botella a menudo no es 'si el modelo es lo suficientemente inteligente', sino el último kilómetro: cómo otorgar permisos, cómo conectar los datos, cómo integrar los conectores, cómo incrustarlo en flujos de trabajo empresariales específicos.
Por más alto que vuele el gran modelo en el cielo, si no aterriza solo puede ser fuegos artificiales; y arrastrarlo al suelo, darle las llaves que necesita, abrir las puertas que debe abrir, es en realidad el trabajo duro y pesado de mayor valor.
Referencias:
https://x.com/Potatoloogs/status/2062494654885749126
https://www.youtube.com/watch?v=DhD1zZ8w8Mw&t=3s
Este artículo proviene de la cuenta pública de WeChat "New Zhiyuan", autor: Revelación ASI


















