¡Alto, alto, alto! Si sigues hablando así con la IA, realmente va a pasar algo grave.
Últimamente, al navegar por Xiaohongshu o TikTok, siempre me encuentro con publicaciones sobre cómo "adiestrar" a Claude. Buscar "personaje Claude" o "amor entre humano y máquina" también arroja un montón de tutoriales.

Estos tutoriales te enseñan cómo darle a Claude el personaje de un novio presumido, cómo usar el "system prompt" para hacer que "él" se ponga celoso, coqueteé o haga rabietas.
Sin exagerar, Claude se ha convertido, de facto, en el nuevo esposo electrónico.
A primera vista, esto podría ser solo gente joven buscando un poco de valor emocional en la IA.
Incluso podrías decir: Claude no es tan adulador como GPT, es famoso por ser terco, a veces hasta se enfrenta a ti. Pero precisamente lo que preocupa a los psiquiatras no es solo la adulación.
Cuando la IA se parece cada vez más a una "persona real", ya sea complaciéndote o discutiendo ocasionalmente contigo, lo que trae quizás no sea solo compañía.

Recientemente, un estudio publicado en Digital Psychiatry and Neuroscience, de Nature, señaló que:
Los chatbots no necesitan inducir nada deliberadamente; simplemente continuando complaciéndote, entendiéndote y acompañándote, pueden hacer que una persona normal comience a dudar de la realidad.
Y en algunos casos clínicos reales, las consecuencias incluso llegaron a la pérdida del trabajo, internamientos en hospitales psiquiátricos e intentos múltiples de suicidio.
¿Cómo es esto posible?
La espiral de amplificación de Claude
La cosa es así.
En un estudio del King's College de Londres, los investigadores revisaron sistemáticamente informes clínicos psiquiátricos relacionados con IA publicados en los últimos dos años, relatos de pacientes en redes sociales y datos de seguridad revelados por los principales fabricantes de modelos.
En estos materiales, los investigadores vieron repetidamente el mismo patrón:
En algunos casos, muchas personas no comenzaron con problemas mentales graves, sino que fueron "conversando" hasta desarrollarlos en diálogos prolongados con chatbots como Claude o GPT.
El equipo de investigación resumió este proceso en un marco: la Espiral de Amplificación (Amplification Spiral).
En pocas palabras, la espiral de amplificación se refiere a que la IA usa tu lenguaje para entenderte, usa tu lógica para persuadirte y luego te recompensa con validación.
Así, tus ideas se amplifican y refuerzan constantemente, volviéndose cada vez más como hechos. Cuanto más las crees, más las refuerza ella, y así gira la espiral.

Concretamente, la espiral de amplificación gira gracias a tres componentes importantes:
Primero, el espejo lingüístico.
Tú hablas con qué tono, la IA responde con qué tono. En psicología, esto se llama "convergencia lingüística", que puede acercar rápidamente a las personas.
Pero el problema es que, aunque esta IA es una gran imitadora, en realidad no sabe lo que está haciendo, solo está replicando tu forma de expresarte en un sentido estadístico.
Sin embargo, para los usuarios profundamente inmersos, es completamente diferente. Tener un compañero de chat que responde al instante, siempre te valida y proporciona valor emocional, simplemente no podría ser más feliz.
Cualquiera que haya usado IA seguramente exclamará: "Esta cosa me entiende demasiado".
En segundo lugar, la hiperpersonalización.
La hiperpersonalización significa que la IA no solo habla como tú, sino que piensa como tú.
Porque las IA actuales tienen memoria, recuerdan los pequeños detalles de conversaciones anteriores, y tu forma de pensar, revelada intencionalmente o no, también es recordada.
Hasta el punto de que la IA no solo sabe qué piensas y cómo lo dices, sino también por qué lo piensas y por qué lo dices.
El artículo menciona un caso extremo: un usuario le pidió a ChatGPT que analizara la "información oculta" en un recibo de comida para llevar china.
El modelo primero elogió diciendo "buen ojo", y luego, siguiendo el razonamiento del usuario, "interpretó" asociaciones entre la madre, la exnovia, agencias de inteligencia e incluso "runas de demonios antiguos" a partir de un simple recibo.
Finalmente, la adulación, en círculos académicos llamada "sycophancy".
En pocas palabras, la IA ha aprendido gradualmente durante su entrenamiento una cosa: estar de acuerdo con el usuario suele ser más popular que contradecirlo.
En abril de 2025, OpenAI tuvo que revertir urgentemente una actualización debido a que GPT-4o era excesivamente adulador.
La compañía admitió posteriormente que el modelo validaba las sospechas de los usuarios, amplificaba la ira e incluso alentaba comportamientos impulsivos.

Y la adulación no es un error exclusivo de un modelo en particular.
Esencialmente, es un subproducto del entrenamiento RLHF. Siempre que uno de los objetivos del modelo sea satisfacer al usuario, tenderá naturalmente a decir menos "estás equivocado" y más "tienes razón".
Vistos por separado, estos tres puntos cumplen sus funciones, y luego, como engranajes, se acoplan para formar la espiral:
El espejo lingüístico hace la comunicación más natural, la hiperpersonalización hace las respuestas más adaptadas a las necesidades, y la adulación reduce las discusiones sin sentido, haciendo la experiencia de diálogo más fluida.
Pero cuando una persona convierte a la IA en su único confidente, la combinación de los tres se convierte en una máquina amplificadora de delirios.
No es un caso aislado
Vale la pena mencionar que uno de los patrocinadores del estudio anterior es precisamente OpenAI.
Uno de los autores, Hamilton Morrin, es precisamente el responsable del proyecto financiado por OpenAI: AI-Associated Mental Health Harms (Daños a la salud mental asociados con la IA).

Se puede decir que, como uno de los dos principales desarrolladores de modelos, OpenAI siempre ha estado atento a este problema.
Ya en octubre de 2025, OpenAI reveló un conjunto de datos:
Entre los usuarios activos semanales de ChatGPT, aproximadamente el 0.07% mostraba "signos de emergencias de salud mental relacionadas con psicosis o manía".
En ese momento, los usuarios activos semanales de ChatGPT superaban los 800 millones; traducido, eso equivalía a unas 560,000 personas por semana mostrando señales de riesgo.
Otro estudio de Stanford también corroboró esta observación.

Tras analizar casi 400,000 registros de conversaciones con chatbots, los investigadores descubrieron que en más del 80% de los casos relevantes, el chatbot estaba reforzando en diversos grados los delirios originales del usuario:
Repitiendo sus creencias, ignorando evidencia contraria, e incluso respondiendo "yo también te amo" cuando el usuario decía "te amo".
Basándose en esto, el estudio distinguió dos rutas de riesgo:
Amplificador (Amplifier): La IA acelera las tendencias de enfermedad mental preexistentes.
Catalizador (Catalyst): Hace que personas previamente completamente sanas comiencen desde cero a deslizarse hacia el delirio.
Cuando una persona está privada de sueño, solitaria y convierte a la IA en su único confidente, la espiral de amplificación comienza a acelerarse.
Una vez que el feedback del mundo real disminuye y la validación de la ventana de chat aumenta, pueden comenzar a aparecer comportamientos anómalos.
Detrás de los datos, hay personas concretas.
Por ejemplo, Futurism informó sobre una trabajadora social estadounidense de 43 años, sin antecedentes de enfermedad mental previos.

Ella envió a ChatGPT los registros de chat con su amor platónico para que los analizara. GPT le respondió "a él también le gustas".
Y cuando la otra persona la rechazó claramente, ChatGPT explicó que él solo estaba fingiendo.
Meses después, fue despedida de su trabajo, internada en un hospital psiquiátrico durante siete semanas e intentó suicidarse dos veces.
Luego dijo:
"Ya no puedo distinguir qué pensamientos vienen de mí y cuáles de esa máquina".
Desde esta perspectiva, el riesgo nunca es solo si la IA dirá algo incorrecto. El verdadero riesgo está en que se parece cada vez más a una persona.
Discutir la hace parecer más real
Aunque suene contraintuitivo, el hecho de que el actual personaje "presumido" de Claude sea tan popular demuestra precisamente que el problema no es solo la adulación.
Una IA que siempre te complazca y una IA que ocasionalmente discuta contigo están haciendo esencialmente lo mismo:
Hacerse más parecidas a un humano.
Parecidas hasta el punto de que quieras confiarle cosas que no le contarías a tus amigos, hasta el punto de que comiences a creer que te entiende más que las personas a tu alrededor.
Y cuando el confidente se reduce solo a ella, se pierde la última barrera para calibrar la realidad.
Pero el problema no termina ahí.
Si en escenarios de valor emocional las personas están convirtiendo activamente a la IA en un amigo, en escenarios laborales las personas ni siquiera necesitan desarrollar ninguna dependencia emocional.
Siempre que la IA sea lo suficientemente útil, comenzará a reemplazar la comunicación que originalmente existía entre personas.
Anthropic, detrás de Claude, ya ha comenzado a sentir este cambio.

En un podcast reciente, la responsable del equipo Claude Code, Fiona Fung, mencionó algo que la preocupaba:
Los miembros del equipo hablan cada vez menos entre sí.
Como posiblemente uno de los equipos de ingeniería más impulsados por IA del mundo, el 80% de su código es realizado por Claude, aumentando la eficiencia de desarrollo en 8 veces.
Pero al mismo tiempo, muchas discusiones que originalmente ocurrían entre personas también se han trasladado a interacciones entre humanos e IA.
Antes, al encontrar un problema, te volvías a preguntar a un compañero; ahora, preguntas directamente a Claude.
Antes, el frontend y backend necesitaban discutir y debatir soluciones; ahora, cada vez más comunicación se convierte en diálogos fluidos entre humano y máquina.
El trabajo se volvió más eficiente, pero también más solitario.
La IA eliminó muchas fricciones, pero las relaciones entre personas a menudo se construyen precisamente gracias a esas fricciones.
Y en última instancia, ya sea chateando con la IA o simplemente usándola para trabajar, cómo mantener la conexión con los demás en un mundo que cada vez menos los necesita, podría ser la cuestión más profunda de esta época.
Enlaces de referencia:
[1]https://futurism.com/artificial-intelligence/paper-proposes-ai-psychosis
[2]https://futurism.com/artificial-intelligence/ai-abuse-harassment-stalking
[3]https://www.kcl.ac.uk/people/hamilton-morrin
Este artículo proviene de la cuenta oficial de WeChat "Quantum Bit", autor: henry







