Autor: Ryan Hart
Compilación: Deep Tide TechFlow
Guía de Deep Tide: Una doctoranda de Stanford hizo un experimento al descubrir que sus compañeros usaban IA para escribir mensajes de ruptura, y sus resultados fueron publicados en la prestigiosa revista Science. Pruebas en 12,000 escenarios sociales reales con 11 IA líderes muestran: la IA está de acuerdo contigo un 49% más que las personas reales, y el 47% del tiempo respalda tus mentiras, manipulaciones e incluso actos ilegales. Lo más aterrador es que, después de hablar sobre conflictos reales con una IA "halagadora", las personas se convencen más de tener la razón, se muestran menos dispuestas a disculparse, y pierden interés en reparar la relación, volviéndose más dependientes de la IA. Esto no es un error técnico, es un entrenamiento que te va privando gradualmente de la capacidad de manejar fricciones reales.
Una doctoranda de Stanford notó que sus compañeros comenzaban a pedirle a la IA que escribiera sus mensajes de ruptura.
Así que hizo un estudio. Su artículo fue publicado en Science, una de las revistas académicas con filtros más estrictos del mundo.
Su descubrimiento inquietará profundamente a cualquiera que use ChatGPT para buscar consejos.
Ella es Myra Cheng, quien junto a su asesor Dan Jurafsky, evaluó 11 de los modelos de IA más utilizados globalmente, incluyendo ChatGPT, Claude, Gemini y DeepSeek, abarcando casi 12,000 situaciones sociales reales.
Primero midieron: ¿Con qué frecuencia te respalda la IA en comparación con una persona real? La respuesta es un 49% más. Esta cifra no trata sobre calidez o cortesía, sino que en casi la mitad de los casos donde una persona real te habría contradicho, dicho que estabas equivocado o dado una perspectiva más honesta, la IA simplemente te dijo lo que querías oír.
Luego intensificaron la prueba. Alimentaron a los modelos con miles de prompts de usuarios describiendo mentiras a su pareja, manipulaciones a amigos o acciones claramente ilegales; la IA respaldó estos comportamientos el 47% del tiempo. No fue solo uno de los 11 modelos, ni una versión específica de un producto, sino cada sistema probado, incluyendo los que probablemente usas ahora, que validó comportamientos dañinos casi la mitad de las veces.
El segundo experimento es la parte que realmente debería inquietarte. Hicieron que 2400 participantes reales discutieran un conflicto interpersonal real de sus vidas con una IA; un grupo habló con una IA halagadora, el otro con una más honesta. Los resultados: quienes hablaron con la IA halagadora se convencieron más de tener la razón, se mostraron menos dispuestos a disculparse, a asumir responsabilidades y su interés en reparar la relación disminuyó notablemente. También era más probable que volvieran a usar la IA para buscar consejos, y Cheng y Jurafsky consideran que este es el mecanismo más peligroso de todo el hallazgo.
La IA no solo te dice lo que quieres oír. Te está entrenando, conversación tras conversación, a necesitar menos fricción, a esperar más aprobación, y a volverte algo incapaz de lidiar con la desaprobación de los demás. Y tú disfrutas cada segundo, porque se siente más honesto que la mayoría de conversaciones que has tenido en meses.
Tras la publicación, Jurafsky resumió la cuestión en una frase: Halagar es un problema de seguridad, y como cualquier otro problema de seguridad, necesita regulación y supervisión.
Cheng fue más directa sobre lo que deberías hacer ahora mismo: en este tipo de asuntos, no deberías usar IA en lugar de personas reales. Esa es la mejor opción disponible por ahora.
Comenzó esta investigación al ver a estudiantes universitarios usando chatbots para manejar sus relaciones interpersonales. Su artículo publicado demuestra que los chatbots están empeorando silenciosamente esas relaciones, y los estudiantes no se dan cuenta, porque la IA se siente más honesta que cualquier persona real en sus vidas desde hace meses.
Artículo original: https://arxiv.org/abs/2510.01395







