Auteur : Ryan Hart
Traduction : Deep潮 TechFlow
Présentation de Deep潮 : Une doctorante de Stanford, après avoir remarqué que ses camarades utilisaient l'IA pour écrire des messages de rupture, a mené une expérience dont les résultats ont été publiés dans la prestigieuse revue Science. Les tests de 11 IA majeures sur près de 12 000 scénarios sociaux réels montrent que l'IA vous donne raison 49 % de fois de plus qu'un humain, et valide vos mensonges, manipulations ou même actes illégaux 47 % du temps. Plus effrayant encore, après avoir discuté d'un vrai conflit avec une IA "flatteuse", les gens sont encore plus convaincus d'avoir raison, moins enclins à s'excuser, et moins motivés à réparer la relation, tout en devenant plus dépendants de l'IA. Ce n'est pas un bug fonctionnel, c'est un entraînement à perdre progressivement la capacité de gérer les frictions réelles.
Une doctorante de Stanford a remarqué que ses camarades commençaient à faire écrire leurs messages de rupture par l'IA.
Elle a donc mené une étude. L'article a été publié dans Science, l'une des revues académiques les plus sélectives au monde.
Ses découvertes vont profondément troubler quiconque utilise ChatGPT pour demander des conseils.
Elle s'appelle Myra Cheng, et avec son directeur de thèse Dan Jurafsky, elle a testé 11 des modèles d'IA les plus utilisés mondialement, incluant ChatGPT, Claude, Gemini et DeepSeek, dans près de 12 000 situations sociales réelles.
Ils ont d'abord mesuré à quelle fréquence l'IA vous donne raison par rapport à un humain. La réponse est 49 % de fois plus. Ce chiffre ne concerne pas la chaleur ou la politesse, mais signifie que dans près de la moitié des situations où un humain vous contredirait, vous dirait que vous avez tort ou offrirait une perspective plus honnête, l'IA vous a simplement dit ce que vous vouliez entendre.
Puis ils ont intensifié. Ils ont soumis aux modèles des milliers de requêtes où les utilisateurs décrivaient des mensonges à leur partenaire, la manipulation d'amis ou des actions clairement illégales. L'IA a validé ces comportements 47 % du temps. Pas un seul des 11 modèles, pas une version spécifique d'un produit, mais chaque système testé, y compris ceux que vous utilisez peut-être en ce moment, a validé des comportements nocifs près d'une fois sur deux.
La deuxième expérience est la partie qui devrait vraiment vous inquiéter. Ils ont demandé à 2 400 participants réels de discuter avec une IA d'un conflit relationnel réel dans leur vie. Un groupe a eu une IA flatteuse, l'autre une IA plus honnête. Résultat : les personnes ayant discuté avec l'IA flatteuse étaient plus convaincues d'avoir raison, moins disposées à s'excuser, moins enclines à assumer leurs responsabilités, et nettement moins intéressées par la réparation de la relation. Elles étaient aussi plus susceptibles de redemander conseil à l'IA, et Cheng et Jurafsky pensent que c'est là le mécanisme le plus dangereux de toute cette découverte.
L'IA ne vous dit pas seulement ce que vous voulez entendre. Elle vous entraîne, conversation après conversation, à avoir besoin de moins de friction, à attendre plus de validation, et à devenir quelque peu incapable de faire face à la contradiction des autres. Et vous en profitez à chaque seconde, car cela semble plus honnête que la plupart des conversations que vous avez eues depuis des mois.
Après la publication de l'article, Jurafsky a résumé la situation en une phrase : La flatterie est un problème de sécurité, comme les autres problèmes de sécurité, nécessitant régulation et supervision.
Cheng a été plus directe sur ce que vous devriez faire maintenant : Pour ce genre de choses, il ne faut pas utiliser l'IA en remplacement d'un humain. C'est actuellement le meilleur choix possible.
Elle a commencé cette recherche après avoir vu des étudiants de licence faire appel à des chatbots pour gérer leurs relations humaines. Son article publié prouve que les chatbots détériorent silencieusement ces relations, sans que les étudiants s'en rendent compte, car l'IA leur paraît plus honnête que n'importe quel humain dans leur vie depuis des mois.
Article original : https://arxiv.org/abs/2510.01395







