Autor|桦林舞王
Editor| Jingyu
Si alguien me hubiera dicho hace unos años que uno de los cofundadores de OpenAI se iría a Anthropic para ayudar al competidor con investigación de preentrenamiento, probablemente habría pensado que esa persona estaba describiendo una trama de ciencia ficción.
Pero esto, hoy, realmente ha sucedido.
Andrej Karpathy, un nombre que casi no necesita presentación en el círculo de la IA. Profesor principal del curso CS231n de Stanford, el divulgador más popular en el campo del aprendizaje profundo, cofundador de OpenAI, exlíder del equipo de conducción autónoma de Tesla. Un solo tuit suyo puede hacer que la popularidad de una dirección técnica se dispare; si sube un video explicando Transformer a YouTube, las reproducciones superan fácilmente el millón.
Es precisamente esta persona la que hoy anunció que se une a Anthropic.
Anuncio oficial de Karpathy en X|Fuente de la imagen: X
En esta incorporación a Anthropic, Karpathy se enfocará en la investigación de preentrenamiento y dirigirá un nuevo equipo, cuya tarea central es utilizar a Claude para acelerar la exploración en la dirección del preentrenamiento.
El preentrenamiento es la base de las capacidades de los modelos grandes. Quien logre un avance en este nivel, tendrá la ventaja en la competencia de los próximos años. El hecho de que Anthropic coloque a Karpathy aquí deja muy clara su intención.
Pero si solo vemos esto como "una persona talentosa cambiando de trabajo", lo estamos subestimando.
Karpathy posee algo extremadamente escaso en el círculo de la IA: la superposición dual de credibilidad técnica e influencia masiva. No es solo un investigador que puede escribir buen código y publicar buenos artículos; es el tipo de persona que puede hacer que otros investigadores de primer nivel lo sigan de buena gana.
Existe un dicho en la industria: la incorporación de un investigador prestigioso a menudo lleva a un grupo de personas a reevaluar sus propias opciones profesionales. La llegada de Karpathy podría ser la señal de que Anthropic está a punto de recibir una ola de afluencia de talento.
Lo más sugerente son sus motivaciones. En 2015, fue uno de los cofundadores de OpenAI, y vivió personalmente todo el proceso de transformación de la compañía desde su ideal sin fines de lucro. Luego se fue a Tesla, después regresó brevemente a OpenAI, para luego dejarlo nuevamente y emprender por su cuenta.
Esta vez, elegir Anthropic lleva cierta carga de "declaración".
01 Anthropic, que no deja de ganar
Ver el fichaje de Karpathy de forma aislada hace que perdamos un contexto importante: Anthropic, en este último tiempo, se encuentra en una rara fase ascendente.
Hace dos semanas, unos datos del Ramp AI Index circularon discretamente por los medios tecnológicos.
Los datos mostraban que la tasa de adopción de Anthropic en el segmento empresarial aumentó 3.8 puntos porcentuales en abril, alcanzando el 34.4%, mientras que la de OpenAI cayó 2.9 puntos porcentuales en el mismo periodo, deslizándose hasta el 32.3%. Esta es la primera vez en la historia que Anthropic supera a OpenAI en la tasa de adopción empresarial. Aunque la diferencia aún no es abrumadora, su significado direccional es muy fuerte.
Esa misma semana, Anthropic lanzó una versión de Claude para pequeñas empresas, integrando herramientas de las que las pymes dependen a diario, como QuickBooks, PayPal, HubSpot, Canva, DocuSign, incorporando directamente las capacidades de IA en el flujo de trabajo de estos usuarios. Esta es una clara señal de descentralización; Anthropic ya no solo mira a los grandes clientes corporativos, sino que se dirige a un mercado más amplio.
Un día antes, Anthropic anunció una asociación con la Fundación Gates, comprometiéndose a invertir 200 millones de dólares en fondos, créditos de uso de Claude y soporte técnico durante cuatro años, cubriendo áreas como salud global, educación y desarrollo económico. El monto de esta colaboración no es lo más llamativo, pero su valor narrativo es alto: una empresa que originalmente se centraba en la "seguridad de la IA" está afianzando cada vez más la etiqueta de "IA responsable".
En el punto donde su valoración de financiación se acerca al billón de dólares y su tasa de adopción empresarial acaba de superar a la competencia, la incorporación de Karpathy es el broche de oro de todo esto.
El título del comentario de la revista Fortune fue muy directo: "Anthropic parece incapaz de dejar de ganar".
02 ¿Por qué no regresó a OpenAI?
Si alguien gana, necesariamente alguien más sufre presión.
Karpathy no es la primera persona que abandona el ecosistema de OpenAI y se dirige a Anthropic.
El propio equipo fundador de Anthropic, Dario Amodei, Daniela Amodei y un grupo de investigadores clave en ese momento, fueron quienes dejaron OpenAI colectivamente en 2021 para fundar esta empresa. En cierto modo, desde el día de su nacimiento, Anthropic ha sido producto de una divergencia de caminos dentro de OpenAI.
En los años siguientes, a medida que OpenAI avanzaba cada vez más rápido en la comercialización y la creación de productos, acelerando los lanzamientos, persiguiendo ingresos y acercándose gradualmente a Microsoft, algunos investigadores que valoraban más la "investigación pura" o la "seguridad primero" comenzaron a votar con los pies.
La elección de Karpathy por Anthropic llega en un momento sensible. OpenAI ha tenido recientemente una narrativa externa bastante densa, con las series GPT, la serie o, Sora, Operator avanzando simultáneamente en varios frentes. El ritmo interno es tan rápido que algunos en la industria lo describen en privado como "correr tres maratones al mismo tiempo". Bajo tal expansión acelerada, retener a aquellos que realmente se preocupan por la profundidad de la investigación y no solo por la valoración es un problema difícil de resolver.
Por supuesto, OpenAI aún posee una densidad de talento y una escala de recursos extremadamente fuertes; una sola partida no sacudirá sus cimientos. Pero si este flujo se convierte en una tendencia, lo que realmente debe alertarnos es el cambio en las expectativas de la industria que transmite.
Un analista tecnológico lo dijo de manera muy directa: "El desarrollo de la IA ya no es solo una competencia tecnológica, sino una guerra por el liderazgo del conocimiento. El movimiento de un investigador influyente puede remodelar las prioridades de investigación de toda la industria".
La influencia del propio Karpathy en la comunidad del aprendizaje profundo encaja perfectamente con este juicio. Sus conferencias de Stanford y sus videos de YouTube son material introductorio para muchos de los investigadores que ahora trabajan en los principales laboratorios de IA. A dónde vaya él, lleva implícita cierta garantía de que "esta dirección vale la pena apostar".
03 Preentrenamiento, jugando al futuro
Volviendo al enfoque específico de esta incorporación de Karpathy a Anthropic: el preentrenamiento.
En los últimos dos años, la atención de la industria se ha concentrado en gran medida en direcciones relativamente "cercanas a la capa de aplicación", como la inferencia, la multimodalidad, los agentes, RAG. Los avances en la capacidad de los modelos base han sido vistos por algunos como una fase que ya ha entrado en el "ajuste fino y la optimización", más que en una mejora fundamental.
Anthropic claramente no piensa así. Encargar a Karpathy que forme específicamente un equipo para explorar "usar a Claude para acelerar la investigación de preentrenamiento" es apostar por una dirección más fundamental, de ciclo más largo, pero con un rendimiento potencial mucho mayor.
Aquí hay una lógica interesante: usar los modelos grandes existentes para ayudar en el preentrenamiento de la próxima generación de modelos grandes es un enfoque de "la IA ayudando a la IA a evolucionar". Este camino aún es muy nuevo, no tiene un mapa de ruta maduro, pero si se puede transitar, significa que tanto la eficiencia del entrenamiento como los límites de capacidad podrían experimentar mejoras no lineales.
Encomendarle esto a Karpathy es una apuesta audaz de Anthropic en la dirección tecnológica.
La guerra por el talento en la industria de la IA, llegada a este punto, ya no puede describirse con la intensidad de captar a unos pocos ingenieros. Se asemeja más a una lucha por la "narrativa": quién atrae a las personas que pueden definir la dirección de la investigación, está enviando una señal a toda la industria: nosotros somos los protagonistas futuros de este juego.
La elección de Karpathy, quizás, sea precisamente esa señal.







