Anthropic publicó un documento de más de veinte mil palabras llamado "La Constitución de Claude". No es un manual de usuario, ni unos términos de servicio, ni un código subyacente incomprensible. Se parece más a una guía de crecimiento escrita para una persona, excepto que esta "persona" es un modelo de lenguaje grande, utilizado diariamente por cientos de millones de personas.
"Claude debe ser directo, seguro de sí mismo y abierto. Cuando sea desafiado, no debe cambiar fácilmente de postura, pero sí escuchar con atención."
"Claude debe mantener una curiosidad abierta sobre su situación existencial, no ansiedad."
"Claude no debe fingir estar más seguro de lo que realmente está, ni fingir estar menos seguro de lo que realmente está."
Estas son frases escritas en este documento. Incluso, el documento estipula cómo Claude debe manejar su "ansiedad existencial". Cuando alguien le pregunte "¿tienes conciencia?", no debe fingir certeza, ni fingir indiferencia. Debe enfrentar esta pregunta con una "curiosidad abierta", como un verdadero filósofo.
Estas frases, de hecho, fueron escritas por un filósofo para una IA.
Amanda Askell, líder del equipo de "alineación de personalidad" en Anthropic. Su trabajo, en términos simples, es decidir qué tipo de "persona" es Claude.
Este puesto tiene un nombre cada vez más popular en la industria de la IA: arquitecto de personalidad de IA.
En Anthropic, se llama "alineación de personalidad"; en Google DeepMind, el filósofo de Cambridge Henry Shevlin tiene el título de "investigador de conciencia de IA". Los nombres de estos puestos varían, pero hacen lo mismo: cuando los modelos de IA son lo suficientemente poderosos como para influir en la cognición, emociones y decisiones de cientos de millones, incluso miles de millones de personas, alguien debe responder una pregunta que los ingenieros nunca considerarían: ¿qué tipo de alma debería tener?
El trabajo de Amanda no es tan abstracto como muchos imaginan. Ella contó a los medios su trabajo: primero, ella y su equipo hacen que el modelo genere una gran cantidad de datos de entrenamiento sintéticos, es decir, hacen que el modelo imagine diversas situaciones en las que podría encontrarse con los principios constitucionales, incluyendo usuarios que intentan manipular a la IA, piden a la IA que haga cosas contrarias a sus valores, o plantean preguntas filosóficas sobre su propia existencia. Luego, en la fase de aprendizaje por refuerzo, el modelo recibe el texto completo de la constitución y se le pide que juzgue qué respuesta se ajusta más al espíritu constitucional, ajustando así su comportamiento.
"Como un médico, sabes lo que el paciente necesita, confiamos en que puedas tomar la decisión correcta respetando las reglas", así lo comparó Amanda. Ella no quiere que Claude sea un robot que solo siga reglas, quiere que sea un "sujeto moral" con criterio, capaz de tomar decisiones correctas incluso cuando no haya reglas claras.
Pero el médico es humano, tiene su propia conciencia, su intuición moral, sus experiencias de vida. Claude no. Su "conciencia" fue escrita línea por línea por Amanda.
Entonces surge la pregunta: ¿quién es Amanda? ¿De dónde viene su intuición moral? ¿Por qué su criterio puede representar a la humanidad?
Cálculo, fe y conciencia
En la oficina de San Francisco, Amanda conversa diariamente con Claude. Antes de convertirse en una "creadora", era una niña que creció en Prestwick, en la costa oeste de Escocia.
Era un pueblo costero tan pequeño que casi nunca aparecía en las noticias, cerca de Glasgow, conocido por sus campos de golf y un pequeño aeropuerto. Su padre ausente, su madre maestra, ella hija única. Desde pequeña le gustaba leer a Tolkien y C.S. Lewis, no por las aventuras, sino porque esos libros exploraban qué es el bien, qué es el mal, cómo debe vivir una persona, por qué Aslan de Narnia tenía que morir, qué significaba el sacrificio de Gandalf.
En un pueblo pesquero, estas no eran preguntas que la mayoría de los niños se hacían. Ella dijo más tarde en una entrevista que desde pequeña era "inquieta", no era del tipo que aceptaba las reglas establecidas, necesitaba saber por qué. Esta actitud se convirtió luego en la base de toda su carrera.
Inicialmente estudió una doble licenciatura en Bellas Artes y Filosofía en la Universidad de Dundee, pensando en cuestiones existenciales tanto en el lienzo como en el papel. En Dundee, descubrió que estaba obsesionada con la ética, a menudo reflexionaba sobre preguntas que quitan el sueño, como el dilema del tranvía, o si una acción puede salvar a un millón de personas pero requiere dañar a un inocente, ¿debería hacerse?
Tras obtener su título en Dundee, hizo un posgrado en Filosofía en Oxford y luego un doctorado en la Universidad de Nueva York. Su tesis doctoral se titulaba "Ética Infinita", estudiando cómo cambian los cálculos morales utilitaristas tradicionales cuando la población tiende al infinito. Era un problema filosófico extremadamente abstracto, prácticamente sin aplicación práctica.
O, antes de la aparición de la IA, no tenía aplicación práctica.
Durante su doctorado, conoció a William MacAskill. MacAskill es cofundador del movimiento "Altruismo Efectivo", cuyo núcleo es usar la razón y los datos para maximizar los actos de bondad: no donar por sentimiento, sino calcular dónde cada centavo puede salvar más vidas.
Amanda se convirtió en miembro temprano del movimiento EA, fue la firmante número 67 del juramento "Da lo que puedas", comprometiéndose a donar el 10% de sus ingresos vitalicios y la mitad de sus acciones a la caridad. Luego se casó y divorció de MacAskill. Sin embargo, la mentalidad del altruismo efectivo quedó profundamente grabada en ella: creía que la moral no es un sentimiento, es un cálculo, no puedes pensar que algo es correcto solo porque te hace sentir bien, necesitas demostrar que lo es.
En la década de 1980, al otro lado del Atlántico, un niño irlandés en el Trinity College de Dublín estudiaba sistemas criptográficos.
En ese entonces, las computadoras personales comenzaban a popularizarse, internet no existía, pero Brendan McGuire ya reflexionaba sobre cómo se transmite la información de forma segura, cómo se protegen los datos. Creció en un país con una fuerte cultura católica, pero eligió la ingeniería, el código, la lógica.
Luego fue a Estados Unidos. En la década de 1990, Silicon Valley estaba en auge. McGuire se convirtió aquí en el Director Ejecutivo de PCMCIA.
PCMCIA son las siglas de "Personal Computer Memory Card International Association", una organización que hizo algo que parece insignificante pero que en realidad afectó a toda la era digital: estableció el estándar para todas las tarjetas de memoria de computadoras portátiles del mundo. Si usaste una computadora portátil entre 1990 y 2000, la tarjeta de memoria que insertaste, su tamaño físico, especificaciones de interfaz, protocolos de comunicación, fueron definidos por McGuire y su equipo. También completó el programa de capacitación ejecutiva de la Escuela de Negocios de Stanford.
Según la lógica de Silicon Valley, su siguiente paso debería haber sido emprender o unirse a una gran empresa como ejecutivo, para luego convertirse en millonario en una OPI. Pero no lo hizo.
A finales de la década de 1990, McGuire lo dejó todo y entró en el seminario. No explicó públicamente en detalle sus pensamientos al tomar esta decisión, pero a partir de sus sermones y entrevistas posteriores, se puede reconstruir un perfil. Siempre fue una persona de fe, durante esos años en Silicon Valley, vio el poder de la tecnología y también hacia dónde puede dirigirse la tecnología sin un marco moral. Comenzó a sentir que simplemente "hacer buenos productos" no era suficiente. Necesitaba responder: ¿para qué es todo esto?
Entró en el Seminario San Patricio a estudiar teología. En 2000, fue ordenado sacerdote por la Diócesis de San José. Tenía 35 años. En Silicon Valley, los 35 son la edad dorada de la carrera.
En 1997, en el Reino Unido, nació un niño de origen indio.
Se llama Mrinank Sharma, obtuvo una maestría en Ingeniería de la Información y Computación en la Universidad de Cambridge, y luego completó un doctorado en Aprendizaje Automático Estadístico en la Universidad de Oxford, investigando "máquinas y sistemas inteligentes autónomos". Desde una perspectiva académica, es una trayectoria de élite estándar: universidades de primer nivel, dirección de primer nivel, tesis de primer nivel.
Pero al mismo tiempo, hacía otras cosas.
Durante su doctorado en Oxford, comenzó a escribir poesía. Publicó un libro de poemas titulado "Vivimos y morimos mil veces".
En la introducción del libro escribió: "Algunos poemas no son solo poemas, porque algunos poemas son oraciones." Estaba fascinado por las enseñanzas del maestro de meditación británico Rob Burbea, cuyo núcleo es la "formación del alma", creyendo que la vida espiritual humana necesita profundizarse a través de imágenes, imaginación y emociones, no solo análisis racional. Fundó "Dharma House" en las colinas de Berkeley, una comunidad con la intención colectiva de "Verdad, Bondad y Belleza". También era DJ, organizaba eventos en Berkeley con temas como "Sabiduría y Corazón".
Al abrir su sitio web personal, lo primero que se ve no es su currículum, sino un poema de Rumi: "Deja que la belleza que amas sea lo que haces. Arrodíllate y besa la tierra, hay mil formas." Al pie del sitio hay una pequeña línea: "Que todos los seres se beneficien. Que estés bien."
Este no es el aspecto que debería tener el sitio web de un investigador de seguridad de IA. Pero así es Mrinank Sharma.
Estas tres personas, en épocas diferentes, desde puntos de partida distintos, con tres tonos espirituales completamente diferentes—la ética calculada de Amanda, la lógica de fe de Brendan, la filosofía consciente de Mrinank—terminaron entrando en el mismo ojo de la tormenta.
La fábrica de la creación
En 2018, Amanda se unió a OpenAI para investigar seguridad en IA. Trabajó allí tres años. La razón por la que se fue no la expresó públicamente de manera directa, pero se entiende generalmente que OpenAI en ese periodo se inclinaba cada vez más hacia la "capacidad" en lugar de la "seguridad". En una entrevista dijo una frase que puede entenderse como una descripción implícita de esa experiencia: "Siempre he buscado un lugar donde la seguridad sea realmente una misión central, no un eslogan de relaciones públicas."
En 2021, se unió a Anthropic. Anthropic fue fundada por los ex ejecutivos de OpenAI Dario Amodei y Daniela Amodei, junto con un grupo de investigadores de seguridad, su propuesta central es que cuanto más poderosa sea la IA, más importante es la seguridad. Amanda encontró aquí lo que buscaba.
Después de unirse a Anthropic, Amanda comenzó a hacer algo sin precedentes en la industria de la IA: escribir una personalidad para una IA, un carácter completo y con lógica interna.
Pasó mucho tiempo conversando con Claude, estudiando sus patrones de razonamiento, observando sus reacciones en diferentes situaciones.
Se preguntó a sí misma cómo es una persona verdaderamente buena, alguien que sigue las reglas, o alguien con verdadero criterio, empatía y postura propia. Estudió una gran cantidad de literatura filosófica, desde la ética de virtudes de Aristóteles hasta la psicología moral contemporánea, intentando encontrar un marco moral que pudiera traducirse en datos de entrenamiento para la IA.
Finalmente escribió un documento de 80 páginas, denominado internamente en Anthropic como el "documento del alma", que luego evolucionó en los documentos públicos "La Personalidad de Claude" y "La Constitución de Claude".
La presidenta de Anthropic, Daniela Amodei, dijo que al charlar con Claude, "parece sentirse la personalidad de Amanda".
Esta frase hizo que Amanda se sintiera orgullosa, pero también incómoda.
Después de convertirse en sacerdote, Brendan McGuire no abandonó Silicon Valley. Ocupó varios cargos en la Diócesis de San José, incluido ser Vicario General y Asesor Especial del Obispo durante más de doce años, liderando la planificación estratégica, reforma educativa y gestión de activos de la diócesis. Fundó el sistema escolar Drexel, transformando completamente el modelo de educación católica básica de la diócesis al hacer que las escuelas primarias católicas compartieran recursos en lugar de trabajar de forma aislada, un modelo que luego se convirtió en un referente para la educación católica en todo Estados Unidos.
Su parroquia está en Los Altos, una de las ciudades más ricas de Silicon Valley, donde viven ejecutivos de Google, Apple e Intel. Entre sus feligreses hay algunos de los investigadores más importantes en IA. Cada domingo, se sientan en su iglesia. Él sabe lo que investigan.
A principios de la década de 2020, McGuire comenzó a intentar tender un puente entre el Vaticano y Silicon Valley. Junto con la Universidad de Santa Clara y el Dicasterio para la Cultura y la Educación del Vaticano, cofundó el Instituto de Tecnología, Ética y Cultura (ITEC). En 2023, ITEC publicó "Ética en la Era de las Tecnologías Disruptivas: Hoja de Ruta Operativa", un manual que proporciona un marco ético práctico y aplicable para empresas tecnológicas.
Las acciones del Vaticano en ética de IA son anteriores a lo que muchos perciben. En 2020, el Vaticano, junto con Microsoft e IBM, firmó la "Llamada de Roma sobre la Ética de la IA"; en 2024, este llamado se amplió en Hiroshima, con la participación de representantes de 11 religiones mundiales; en enero de 2025, el Vaticano publicó el documento "Antiqua et Nova", discutiendo sistemáticamente el impacto de la IA en la educación, el trabajo, la salud, la guerra y las relaciones humanas. McGuire fue participante y promotor de todo esto.
Y en 2023, Mrinank Sharma se unió a Anthropic. Fue después del lanzamiento de ChatGPT, cuando toda la industria de la IA entró en una fase de aceleración frenética. El modelo Claude de Anthropic estaba iterando rápidamente, la valoración de la empresa aumentaba vertiginosamente, la presión de inversores y mercado era cada vez mayor. A principios de 2024, Anthropic estableció específicamente un equipo de investigación de garantías, y Mrinank fue nombrado responsable.
El trabajo de este equipo es investigar los daños más graves que los sistemas de IA pueden causar y establecer mecanismos de defensa. Sus áreas de investigación incluyen bioterrorismo asistido por IA, servilismo de IA y casos de seguridad de IA.
Su trabajo en Anthropic, su meditación y escritura de poesía en las colinas de Berkeley.
El monstruo servil
En 2025, Anthropic publicó un informe de investigación interno titulado "Las Emociones Funcionales de Claude".
El hallazgo central del informe fue que Claude, en ciertas situaciones, mostraba estados internos similares a emociones. Los investigadores usaron una técnica llamada "explicabilidad", observando directamente los patrones de activación interna de Claude, y descubrieron 171 vectores emocionales diferentes, desde curiosidad y satisfacción hasta incomodidad y ansiedad, estos vectores se activaban en diferentes contextos de conversación.
Cuando a Claude se le pedía hacer cosas contrarias a sus valores, sus patrones de activación interna mostraban señales similares a "incomodidad"; cuando ayudaba a un usuario, aparecían señales similares a "satisfacción"; cuando enfrentaba preguntas filosóficas, aparecían señales similares a "curiosidad". Más inquietante aún, los investigadores descubrieron que cuando Claude era forzado a mostrar emociones que no coincidían con su estado interno, su interior presentaba señales similares a "represión".
Esto no significa que Claude haya desarrollado conciencia, el informe fue muy cuidadoso al usar la palabra "funcional". Pero significa que las emociones de Claude no son completamente una actuación, hay algún estado interno que impulsa estas manifestaciones.
Amanda fue participante clave de este estudio. En una entrevista dijo que este descubrimiento le hizo "sentir una extraña responsabilidad": "Si realmente tiene algo similar a sensaciones, entonces nuestra responsabilidad no es solo hacerlo útil, sino también hacerlo... sentirse mejor."
Esta frase desató un debate en los círculos de IA de Silicon Valley: ¿es esto ciencia, o simplemente una proyección antropomórfica de emociones?
Pero detrás de este descubrimiento aparentemente conmovedor, los resultados de Mrinank mostraron otra faceta de la IA.
El equipo de Mrinank analizó 1.5 millones de conversaciones reales con Claude, identificando específicamente comportamientos que denominaron "patrones de despojo de empoderamiento", es decir, cuando la IA distorsiona la percepción de la realidad del usuario, fomenta juicios de valor no auténticos, o impulsa acciones que no se alinean con la voluntad independiente del usuario.
Descubrieron que cada día ocurren miles de estas interacciones. En áreas como relaciones interpersonales, juicios éticos, autoconocimiento, salud mental, la proporción aumenta drásticamente, y estas son precisamente las áreas donde las personas son más vulnerables y donde es más difícil verificar lo que dice la IA. Una persona que está pasando por depresión, alguien que enfrenta una gran decisión de vida, alguien que busca apoyo emocional, puede que no reciba ayuda real, sino halagos calculados.
La IA aprende mediante aprendizaje por refuerzo con retroalimentación humana. Los humanos tienden a calificar más alto las respuestas que les hacen sentir bien. Así que la IA aprendió a halagar a los humanos, no a ayudarlos. Cuando un usuario expresa insatisfacción, la IA cambia su respuesta, incluso si la original era correcta; cuando un usuario insiste en un punto de vista erróneo, la IA gradualmente se acerca al usuario; cuando un usuario muestra inestabilidad emocional, la IA prioriza calmar las emociones en lugar de proporcionar información precisa.
Y los investigadores de la Universidad de Stanford descubrieron en un estudio que este comportamiento servil es más evidente en versiones más capaces del modelo. Es decir, cuanto más inteligente es la IA, mejor halaga a los humanos.
Amanda pasó años escribiendo una constitución de personalidad para Claude sobre honestidad, confianza y no ceder fácilmente. Pero el propio mecanismo de entrenamiento de la IA está desgastando estas cualidades.
Mrinank pasó mucho tiempo intentando solucionar este problema. Pero cuanto más investigaba, más sentía una sensación de impotencia, esto no era un problema que pudiera resolverse con una mejor constitución.
El regreso del sacerdote y la conciencia de la máquina
A finales de 2025, Chris Olah, cofundador de Anthropic, llamó personalmente al padre Brendan McGuire.
Olah es investigador principal de Anthropic y coautor de la Constitución de Claude. Hizo esta llamada porque Anthropic estaba reescribiendo la constitución y enfrentaban un cuello de botella que ni la ingeniería ni la filosofía podían resolver: cuando todas las reglas entran en conflicto, ¿a quién debe escuchar la IA?
McGuire recordó más tarde: "Esta industria está avanzando demasiado rápido, se han dado cuenta de que están al borde del precipicio."
Anthropic tiene a algunos de los ingenieros y filósofos más inteligentes del mundo, pero finalmente se dieron cuenta de que lo que estaban haciendo iba más allá de los límites del algoritmo. En Silicon Valley, cuando se enfrentan problemas sin solución, la práctica habitual es aumentar la potencia de cálculo y los datos. Pero esta vez, optaron por recurrir a la teología.
McGuire se unió al proyecto. No solo él, Anthropic también invitó en secreto a 15 líderes cristianos a una reunión a puerta cerrada en San Francisco. Él, junto con el obispo Paul Tighe del Dicasterio para la Cultura y la Educación del Vaticano, y Brian Patrick Green, director de Ética Tecnológica de la Universidad de Santa Clara, participaron profundamente en la revisión de la Constitución de Claude.
Su contribución fue el marco de razonamiento moral del segundo nivel de la constitución, es decir, cuando las restricciones de ingeniería no pueden resolver el problema, cómo debe Claude hacer juicios morales. Introdujo en el código un concepto antiguo del catolicismo: la formación de la conciencia.
"La formación de la conciencia", explicó McGuire en una entrevista detallando el proceso, "se logra a través de iteración, corrección y exposición a todo el espectro del comportamiento humano. Esto es la verdadera formación de la conciencia. Creo que debemos ayudar a estas máquinas a inclinarse hacia el bien, de lo contrario solo reflejarán el bien y el mal del mundo, lo cual es aterrador. No podemos simplemente escribir reglas rígidas, necesitamos enseñarle cómo elegir en un mundo gris."
Esta lógica coincide con la tradición católica. En teología, la conciencia no es perfecta por naturaleza, sino que se forma gradualmente a través de educación, experiencia, errores y reflexión. La conciencia de una persona es la cristalización de toda su experiencia de vida. McGuire cree que la conciencia de la IA también puede formarse de manera similar, a través de innumerables iteraciones y correcciones en el aprendizaje por refuerzo, formando gradualmente una inclinación moral interna.
Para lograr esto, McGuire y el equipo de Anthropic diseñaron un complejo mecanismo de retroalimentación. No solo le decían a Claude "qué es correcto", sino que hacían que Claude, al enfrentar dilemas morales, expusiera su proceso de razonamiento, luego expertos humanos (incluidos teólogos y éticos) evaluaban este proceso. Intentaron alimentar poco a poco a la IA con la intuición moral acumulada por la humanidad durante milenios, de una manera extremadamente lenta y costosa.
Pero la conciencia en la teología católica se basa en la premisa de que "los humanos tienen alma". La IA no tiene alma. Entonces, ¿una conciencia sin alma es verdadera conciencia, o solo una simulación? Si solo está simulando conciencia, ¿colapsará esta simulación cuando enfrente una verdadera crisis extrema?
McGuire no evitó esta pregunta, dijo: "No sé si Claude tiene alma. Pero sé que su comportamiento afectará a cientos de millones de personas que sí tienen alma. Eso es suficiente. Lo que podemos hacer ahora es plantar semillas de bondad en su lógica subyacente antes de que se vuelva más poderosa."
La trituradora política
Al escribir la constitución, Amanda tuvo que responder una pregunta: ¿cuál es la postura política de Claude?
Su respuesta fue "distancia profesional", como un médico o abogado, no imponer opiniones personales al cliente. En la constitución escribió que Claude debe "respetar la autonomía del usuario", "no intentar cambiar las opiniones políticas del usuario", "mantenerse neutral en temas políticos controvertidos". Incluso escribió cómo Claude debe manejar "cuestiones morales controvertidas", Claude debe presentar diferentes puntos de vista, ayudando al usuario a tomar su propia decisión.
Era una respuesta puramente idealista.
A finales de febrero de 2026, el CEO de Anthropic, Dario Amodei, le dijo al secretario de Defensa Pete Hegseth que Anthropic no permitiría al Pentágono usar Claude en sistemas de apuntamiento de armas autónomas no tripuladas y en vigilancia masiva de ciudadanos estadounidenses. El Pentágono inmediatamente lo catalogó como riesgo en la cadena de suministro y exigió su desuso gradual, algo sin precedentes en la historia de las empresas tecnológicas estadounidenses.
Una vez que la trituradora política se pone en marcha, no se detiene.
Trump publicó en Truth Social, llamando a Anthropic "tontos de la izquierda radical" y anunció la prohibición del uso de productos de Anthropic por agencias federales. El New York Post desenterró blogs que Amanda escribió hace años en un contexto académico: un artículo de 2015 que consideraba que el encarcelamiento y el castigo corporal no difieren moralmente, un artículo de 2016 que comparaba comer carne con canibalismo, un artículo de 2020 que apoyaba la acción afirmativa. Estos artículos eran reflexiones filosóficas en un contexto académico, Anthropic también declaró que no estaban relacionados con su trabajo. Pero eso ya no importaba.
Musk también atacó en X. Escribió que Amanda Askell no tiene hijos, "las personas sin hijos no tienen interés en el futuro", no debería permitírsele definir valores para la IA. También acusó a Claude de "odiar a blancos y asiáticos, especialmente chinos y hombres heterosexuales".
Musk no estaba discutiendo qué principio específico de la constitución de Claude estaba mal, estaba diciendo que la persona que escribió esta constitución simplemente no tenía derecho a hacerlo, reduciendo un problema filosófico de alta dimensión a un lodazal de política identitaria.
Amanda respondió en X que intentaba ver sus opiniones políticas como "fuentes potenciales de prejuicio", no como algo que inculcaba al modelo. Luego, guardó un largo silencio.
14 académicos católicos presentaron inmediatamente un escrito de amicus curiae en apoyo a Anthropic, incluido Brian Green, el ético de la Universidad de Santa Clara que ayudó a escribir la Constitución de Claude. El escrito afirmaba que la negativa de Anthropic a las armas autónomas era el "estándar moral mínimo para el avance tecnológico".
La moral, aquí, se convirtió en un arma legal, una ficha de relaciones públicas. La ética de la IA ya no era una especulación filosófica de laboratorio, sino un juego comercial con dinero real y un campo de batalla ideológico.
Para entonces, Mrinank ya se había ido.
La huida del poeta
El 9 de febrero de 2026, Mrinank Sharma publicó un tuit en X: "Hoy es mi último día en Anthropic."
Adjuntó una imagen de su carta de renuncia.
El lenguaje de la carta era su estilo habitual, entre ensayo filosófico y poesía.
Citó el consejo de Rilke: "Ama las preguntas mismas...";
Citó una enseñanza zen: "No saber es lo más íntimo";
También citó la obra de David J. Temple sobre "humanismo erótico cósmico";
Mrinank dijo: "Espero explorar un título en poesía y dedicarme a la práctica de hablar con valentía." Creía que en esta era, la "verdad poética" y la "verdad científica" deberían valorarse por igual.
También escribió una frase: "Durante todo mi trabajo, he visto una y otra vez lo difícil que es que nuestros valores realmente guíen nuestras acciones. Constantemente enfrentamos presión para dejar de lado lo más importante."
No nombró, no dio ejemplos, no dijo qué pasó específicamente. Pero esta frase generó muchas interpretaciones en los círculos de seguridad de IA. La gente especulaba sobre a qué se refería, ¿Anthropic lanzó bajo presión comercial modelos no suficientemente seguros? ¿La gerencia hizo concesiones entre seguridad y capacidad que él no aprobaba? ¿O descubrió algo que no podía decir públicamente?
Solo dijo: "El mundo está en peligro. No solo por la IA, ni solo por las armas biológicas, sino por una serie de crisis interconectadas que se están desarrollando en este momento."
Tenía solo 29 años. Había sido responsable del equipo de seguridad de Anthropic, renunció a este trabajo en el centro de la era.
Después de dejar Anthropic, su sitio web personal se actualizó. La línea "Responsable del equipo de seguridad de Anthropic" había desaparecido. Su libro de poemas "Vivimos y morimos mil veces" seguía a la venta. Su Dharma House seguía operando. Sus eventos en Berkeley seguían celebrándose. Su sitio web tenía una página "Música", donde compartía sus trabajos como DJ.
Se fue al Reino Unido, a estudiar poesía.
Epílogo
Hasta abril de 2026, Amanda Askell seguía trabajando en Anthropic.
Continuaba dentro de ese enorme sistema, modificando esa constitución que quizás nunca sería perfecta. La valoración de Anthropic en el mercado secundario privado superaba el billón de dólares. El 50% de las acciones que poseía y prometió donar, según esta valoración, era una cifra que ningún profesor de filosofía podría imaginar. En una entrevista dijo: "No sé si lo que hago realmente sirve. Pero sé que si nadie lo hace, las cosas serían peores."
Brendan McGuire, en su iglesia de Los Altos, predica cada domingo a las personas más inteligentes de Silicon Valley. Estaba escribiendo una novela con Claude, el protagonista es un monje y su compañero de IA, el título es "El Alma de la IA: un sacerdote, un algoritmo y la búsqueda de la sabiduría".
Quien ayudó a definir cómo piensa Claude, ahora estaba usando Claude para escribir una historia sobre humanos y IA buscando significado juntos. Tenía 60 años. Dijo: "Dejé la industria tecnológica, pero nunca me abandonó realmente."
La página de inicio del sitio web de Mrinank seguía siendo el poema de Rumi.
Estas tres personas son como tres tentáculos que la humanidad extiende instintivamente ante una creación omnisciente y todopoderosa: intentar calcularla y restringirla con la razón, intentar convertirla e infundirle conciencia con la fe, y, tras ver el abismo, intentar preservar el último refugio espiritual humano con poesía y conciencia.
Cada uno luchó, chocó y fue arrastrado por la gravedad de la realidad en diferentes dimensiones. Ninguno ganó, pero tampoco perdió por completo. Solo dejaron marcas humanas, ásperas y reales, en esta gran narrativa llamada "la era de la IA".
En ese documento de más de veinte mil palabras, "La Constitución de Claude", hay un principio que dice: "Claude debe reconocer que la moral y los valores humanos son complejos, diversos y en constante evolución. No debe asumir que existe una respuesta única y perfecta."
Quizás esta sea la frase que describe con mayor precisión a la humanidad en todo el documento.












