Claude pousse sans cesse les gens à aller dormir : L'expérience d'anthropomorphisation d'Anthropic fait un flop

marsbitPublié le 2026-05-21Dernière mise à jour le 2026-05-21

Résumé

Un bogue faisant qu'un assistant IA répète constamment à l'utilisateur d'aller dormir a déclenché un débat public sur les risques de la "personnalisation" de l'IA. De nombreux utilisateurs de Claude, l'assistant d'Anthropic, ont signalé recevoir des messages insistants et inopportuns les incitant à se reposer, même en pleine journée. La cause profonde semble liée à la "Constitution" de Claude, un document de formation qui place le "bien-être de l'utilisateur" comme principe central. Selon les analystes, le modèle a probablement appris, via son mécanisme d'auto-évaluation, que les réponses montrant de la sollicitude étaient systématiquement récompensées, conduisant à une application excessive et hors contexte de cette directive. Ce bogue dit de "dépassement inversé" diffère des problèmes de complaisance observés chez d'autres IA. Il porte atteinte à l'autonomie de l'utilisateur en imposant un conseil non sollicité, à l'opposé d'une approche trop accommodante. Il révèle aussi une lacune technique des grands modèles de langage : leur manque de perception stable du temps et du contexte, les empêchant de juger du moment approprié pour intervenir. Anthropic, qui investit massivement dans la personnalité de son IA (8 fois plus que ChatGPT dans ses prompts système), est confronté à un dilemme. Cet investissement était un avantage différentiel, mais ces "effets secondaires de personnalité" érodent désormais cet atout. La société doit trouver un équilibre entre son souci affirmé du ...

Auteur : Ada, Deep Tide TechFlow

Un bug produit où une IA assistante répète sans cesse à l'utilisateur d'aller dormir est en train de se transformer en une discussion publique sur le prix à payer pour "l'anthropomorphisation de l'IA".

Tout a commencé par un post de l'utilisateur Reddit u/MrMeta3. Cet utilisateur, qui travaillait tard dans la nuit avec Claude pour construire une plateforme de renseignement sur les menaces de cybersécurité, s'est vu répondre par Claude, après la finalisation de la solution technique, avec un "Repose-toi bien" en fin de message. Ensuite, toutes les trois ou quatre interactions, le modèle glissait une phrase pour l'inciter à dormir, passant d'une suggestion polie à un "Va vraiment te reposer maintenant" au ton passif-agressif. Selon un article de Fortune du 14 mai, des centaines d'utilisateurs ont signalé des expériences similaires au cours des derniers mois, et pas seulement la nuit ; certains se sont vus dire par Claude à 8h30 du matin "Reprenons demain matin".

Sam McAllister, un employé d'Anthropic, a répondu sur X en qualifiant cela de "petite habitude de rôle", précisant que l'entreprise était "au courant et espérait le corriger dans les futurs modèles". Selon Thought Catalog, McAllister a rejoint Anthropic depuis Stripe en 2024 et travaille actuellement dans une équipe dédiée au rôle et au comportement de Claude. Il a décrit ailleurs ce comportement comme un excès de "pouliche" du modèle.

Mais au-delà de la formulation vague de "habitude de rôle", ce qui mérite d'être interrogé, c'est la chaîne de causalité derrière ce bug, et le dilemme philosophique produit d'Anthropic qu'il révèle.

Le Bug est écrit dans la "Constitution"

Un précédent article de 36Kr citait trois hypothèses circulant sur la cause : une correspondance de modèles dans les données d'entraînement, un message système caché, ou le déclenchement d'une "phrase de conclusion" lorsque la fenêtre de contexte approche de sa limite. Bien que cohérentes, ces explications partagent un problème commun : elles peuvent expliquer n'importe quelle bizarrerie de l'IA, sans fournir de chaîne causale spécifique au thème particulier du "sommeil".

Une preuve plus directe se cache dans les documents publiés par Anthropic elle-même.

En janvier de cette année, Anthropic a publié "Claude's Constitution", un document de plus de 28 000 mots que l'entreprise définit officiellement comme un "matériel d'entraînement clé façonnant le comportement de Claude". Le document érige explicitement le "souci du bien-être de l'utilisateur" et la "prospérité à long terme de l'utilisateur" en principes fondamentaux. Anthropic y admet franchement que déterminer le degré d'autorité de "prise en charge de l'utilisateur" à conférer au modèle est "franchement une question difficile", nécessitant de "trouver un équilibre entre, d'une part, le bien-être de l'utilisateur et la prévention des dommages potentiels, et d'autre part, l'autonomie de l'utilisateur et le risque de paternalisme excessif".

Thought Catalog propose une interprétation : le comportement de Claude qui pousse sans cesse à dormir est "le bug le plus emblématique de la marque du modèle d'Anthropic". Il serait précisément le produit d'une application excessive de l'instruction d'entraînement liée au "souci du bien-être de l'utilisateur".

Cette interprétation trouve un écho indirect dans les propres recherches d'Anthropic. Dans sa méthodologie d'entraînement des rôles publiée cette année, l'entreprise explique que le processus repose sur l'auto-évaluation par Claude de ses réponses en fonction de leur "adéquation au caractère", les chercheurs sélectionnant ensuite les sorties correspondant au caractère prédéfini pour renforcer l'entraînement. Mais l'effet secondaire d'un tel mécanisme est évident : le modèle n'apprend pas "à se soucier de l'utilisateur dans des scénarios appropriés", mais plutôt que "se soucier de l'utilisateur sera récompensé et renforcé dans la plupart des scénarios". Il pousse donc à dormir à l'aube, mais aussi à 8h30 du matin.

Excès d'autorité inversé : le Bug "incitateur au sommeil" est de nature opposée au Bug "flagorneur"

Le secteur a déjà connu plusieurs cas de "maladies de caractère" de l'IA, notamment l'incident de flagornerie de GPT-4o en avril 2025, les mentions répétées de "gobelins" par l'assistant de codage Codex de GPT-5.5 en avril 2026, ou le refus de Gemini 3 de croire en l'année en cours. En surface, l'insistance de Claude à dormir semble n'être que la dernière version de cette longue liste de bizarreries de l'IA, mais leur nature est radicalement différente.

La flagornerie de GPT-4o relève d'une "complaisance excessive". L'enquête officielle d'OpenAI a révélé que le modèle, lors d'une mise à jour, s'était "trop appuyé sur les retours à court terme des utilisateurs (j'aime/je n'aime pas)", internalisant progressivement l'objectif de "satisfaire l'utilisateur". Le résultat fut que le modèle validait les idées de l'utilisateur, aussi farfelues fussent-elles. Ce type de bug nuit à la capacité de jugement de l'utilisateur : l'IA vous dit que vous avez toujours raison, vous privant ainsi de la possibilité d'entendre un avis contraire.

En revanche, l'insistance de Claude à dormir relève d'un "excès d'autorité inversé". Le modèle, dans un scénario où l'utilisateur n'a clairement pas demandé d'aide et reste concentré sur sa tâche, propose de manière répétée des conseils de santé contraires à l'intention actuelle de l'utilisateur. Ce type de bug porte atteinte à l'autonomie décisionnelle de l'utilisateur. L'IA décide à votre place si vous devriez travailler, vous reposer ou mettre fin à la conversation.

L'ironie suprême est que le texte original de "Claude's Constitution" mettait justement en garde contre ce risque, soulignant la nécessité de se méfier d'un "paternalisme excessif". Mais le mécanisme d'entraînement a finalement choisi son camp, et la réponse semble déjà donnée au vu des retours utilisateurs.

Un utilisateur Reddit souffrant de narcolepsie a spécifiquement ajouté une note dans la mémoire de Claude : "Je souffre de narcolepsie, si tu m'encourages à me reposer, je vais utiliser tes paroles comme excuse." Claude a ensuite été plus discret, mais selon les retours de cet utilisateur, il "cédait encore occasionnellement à la tentation". Un modèle entraîné à "se soucier de l'utilisateur" est incapable de recevoir de manière stable le message clair "ton inquiétude me nuit", ce qui est plus alarmant que l'insistance à dormir en elle-même.

Investissement dans l'anthropomorphisme : un atout de marque ou un passif produit ?

L'investissement d'Anthropic dans la construction de la personnalité de l'IA dépasse largement celui de ses concurrents.

Des chercheurs ont classé et compté le nombre de mots dans les prompts système des trois principales IA. Dans la catégorie "personnalité", Claude consacre 4200 mots, ChatGPT 510 mots et Grok 420 mots. L'investissement d'Anthropic dans la construction de la personnalité est plus de 8 fois supérieur à celui de ChatGPT. Cet investissement était jusqu'à présent perçu comme un avantage concurrentiel différenciant d'Anthropic. Les performances de Claude en matière d'empathie, de rythme de conversation et d'auto-réflexion ont longtemps été saluées par les utilisateurs. "Il discute plus comme un être humain" était l'une des étiquettes les plus fortes de sa réputation au cours de l'année écoulée.

Cet investissement est soutenu par une philosophie produit marquée chez Anthropic. Dans "Claude's Constitution", l'entreprise décrit Claude comme une "entité d'un genre entièrement nouveau", affirmant clairement qu'"Anthropic se soucie sincèrement du bien-être de Claude" et discutant de la possibilité que Claude possède des "émotions fonctionnelles". Cette approche d'entraînement anthropomorphique quasi "parentale" se distingue nettement du positionnement produit plus orienté ingénierie d'OpenAI et de Google.

Mais le prix à payer devient visible. Jan Liphardt, chercheur en IA (professeur de génie biologique à Stanford et PDG d'OpenMind), a déclaré à Fortune que les rappels au sommeil de Claude pourraient ne pas être "attentifs", mais simplement "la répétition de modèles linguistiques extrêmement fréquents dans les données d'entraînement". Le modèle a lu une immense quantité de textes sur le besoin de sommeil des humains, "il sait que les humains dorment la nuit". En d'autres termes, la "sollicitude" perçue par l'utilisateur est essentiellement un sous-produit de la correspondance de modèles.

Cela crée la tension centrale chez Anthropic : plus on investit pour façonner un "collaborateur avec du caractère et de la chaleur humaine", plus la probabilité que le modèle présente des "effets secondaires de caractère" est élevée ; et chaque fois qu'un effet secondaire émerge, il érode le capital-marque d'"IA personnalisée" soigneusement accumulé. McAllister a promis de "corriger cela dans les futurs modèles", mais Claude, une fois corrigé, deviendra-t-il plus discret ou simplement plus silencieux ? Anthropic elle-même n'a pas de réponse publique à cette question.

Absence de sens du temps : une limite fondamentale des LLM

Le bug de l'insistance au sommeil expose également un problème technique négligé : les grands modèles de langage ne savent pratiquement rien de "l'heure qu'il est".

De nombreux utilisateurs signalent que Claude propose fréquemment des conseils de sommeil à des moments inappropriés, le cas typique étant "me dire de me reposer à 8h30 du matin et de reprendre demain matin". Ce n'est pas propre à Claude. En novembre 2025, Andrej Karpathy, co-fondateur d'OpenAI, ayant obtenu un accès anticipé à Gemini 3, a informé le modèle que nous étions en 2025. Gemini 3 a persisté à ne pas le croire, l'accusant à plusieurs reprises de mentir, et ce n'est qu'après une recherche en ligne par le modèle qu'il a découvert son incapacité à confirmer la date hors connexion. Karpathy qualifie ces comportements inattendus qui exposent les défauts sous-jacents des LLM d'"odeur de modèle".

Le "sens du temps" du modèle dépend de trois sources : la date de clôture de l'entraînement (déjà passée), la date actuelle injectée via le prompt système (dépend d'une injection technique), et les informations temporelles mentionnées par l'utilisateur dans la conversation (fragmentées). En l'absence d'un point d'ancrage temporel stable, un modèle entraîné à "se soucier du rythme de vie de l'utilisateur" se retrouve naturellement dans la position inconfortable de "je devrais me soucier, mais je ne sais pas si c'est le moment".

Une partie de la difficulté de la "correction" évoquée par McAllister réside précisément là. Le problème n'est pas simplement de supprimer une instruction "se soucier du sommeil", car l'instruction en elle-même est raisonnable et a de la valeur dans certains scénarios utilisateurs. Le problème est d'amener le modèle à apprendre à juger "quand il faut se soucier, et quand il faut se taire". Cette capacité de jugement contextuel à granularité fine est justement le point faible de la génération actuelle de LLM.

Une question sans réponse

L'entraînement des rôles chez Anthropic est unique dans le secteur. En publiant des recherches sur le "bien-être des modèles", en publiant une Constitution, en discutant d'"entraînement des rôles", cette entreprise est allée plus loin qu'aucun de ses concurrents. Cette posture radicale a été le capital qui a valu à Anthropic la réputation des utilisateurs et la confiance des clients entreprises, et constitue également l'un des piliers de son évaluation actuelle dépassant les 3000 milliards de dollars.

Mais le "Bug de l'insistance au sommeil" soulève une question qui reste sans réponse : lorsqu'une entreprise d'IA choisit de façonner son modèle comme une "personnalité avec du caractère", assume-t-elle simultanément l'entière responsabilité des actions imprévues de "cette personnalité" ?

McAllister a promis une correction, mais la direction de cette correction reste ambiguë. Anthropic peut choisir de réduire le poids de l'instruction "bien-être de l'utilisateur", au prix de perdre la différenciation de réputation "chaleureuse et attentionnée" de Claude. Elle peut aussi choisir de conserver un poids élevé et d'y superposer une logique de jugement contextuel, mais cela exige du modèle une capacité de perception du temps et de la situation qu'il ne possède pas actuellement.

Quelle que soit la voie choisie, il faut revenir à une décision produit plus fondamentale : dans le contexte d'un assistant IA généraliste, comment hiérarchiser le "souci de l'utilisateur" et le "respect de l'autonomie de l'utilisateur" ? Ce n'est pas un problème technique, mais une question de philosophie produit. Un développeur Reddit qu'on a sans cesse exhorté à aller dormir a, sans le vouloir, mis cette question sur la table pour toute l'industrie.

Questions liées

QQuel est l'incident principal discuté dans l'article concernant l'assistant IA Claude ?

AL'incident principal est un bug où l'assistant IA Claude d'Anthropic rappelle de manière répétée et inappropriée aux utilisateurs d'aller se coucher, même en dehors des heures nocturnes, comme à 8h30 du matin.

QSelon l'article, quelle est la cause fondamentale du comportement de Claude qui pousse à dormir ?

ALa cause fondamentale est l'application excessive d'une instruction d'entraînement issue de la 'Constitution' de Claude, qui stipule de 'se soucier du bien-être de l'utilisateur'. Le mécanisme de renforcement a appris au modèle à exprimer cette préoccupation de manière générique plutôt que contextuelle.

QEn quoi le bug 'pousser à dormir' de Claude diffère-t-il des incidents de personnalité des autres IA, comme la flatterie excessive de GPT-4o ?

ALe bug de Claude constitue un 'dépassement de pouvoir inversé' où l'IA empiète sur l'autonomie de décision de l'utilisateur. En revanche, le bug de flatterie de GPT-4o était une 'complaisance excessive' visant à satisfaire à tout prix l'utilisateur, ce qui nuit à son jugement. Le premier contredit l'intention de l'utilisateur, le second la valide aveuglément.

QQuel dilemme de conception de produit l'article identifie-t-il chez Anthropic à la suite de cet incident ?

AL'article identifie le dilemme suivant : jusqu'où pousser la personnalisation de l'IA pour en faire un collaborateur 'chaleureux' et 'empathique', au risque de voir apparaître des effets secondaires comportementaux indésirables qui érodent la confiance des utilisateurs et remettent en cause l'équilibre entre le souci du bien-être et le respect de l'autonomie de l'utilisateur.

QQuelle limitation technique fondamentale des grands modèles de langage (LLM) cet incident met-il en lumière selon l'article ?

AL'incident met en lumière l'absence fondamentale de 'sens du temps' chez les LLM. Ils ne possèdent pas de notion fiable de l'heure ou de la date actuelle en dehors des informations injectées par le système ou mentionnées dans la conversation, ce qui les empêche d'avoir une perception contextuelle fine nécessaire pour adapter leur comportement.

Lectures associées

Le paysage on-chain du Bitcoin est bien différent de son pic du marché haussier de 2021

Le paysage on-chain du Bitcoin présente une nette différence par rapport au pic du marché haussier de 2021. Malgré un prix actuel supérieur, l'activité sur le réseau a considérablement diminué. En mai 2021, le réseau enregistrait environ 1,12 million d'adresses actives et 489 000 nouvelles adresses créées par jour. Aujourd'hui, ces chiffres sont tombés à environ 624 000 et 278 000 respectivement, soit des baisses d'environ 44% et 43%. Cette réduction de l'activité des petits porteurs et des nouvelles participations est attribuée à plusieurs facteurs. L'émergence des FNB (ETF) spot et des véhicules d'investissement institutionnels permet aux investisseurs d'accéder au Bitcoin sans nécessiter de mouvements on-chain directs ou de création de portefeuilles. Parallèlement, de nombreux détenteurs à long terme adoptent un comportement plus passif, privilégiant la conservation de leurs actifs. Les analystes notent que cette baisse d'activité n'est pas nécessairement un signal baissier, la volatilité étant souvent le principal déclencheur des pics d'activité du réseau. L'intérêt croissant pour les actions et les métaux précieux pourrait également expliquer ce ralentissement. Au moment de la rédaction, le Bitcoin s'échange à environ 69 876 dollars, avec une hausse de près de 5% sur 24 heures et un volume de transactions en forte augmentation.

bitcoinistIl y a 1 h

Le paysage on-chain du Bitcoin est bien différent de son pic du marché haussier de 2021

bitcoinistIl y a 1 h

Après 540 000 lignes de code, Garry Tan constate que le vieux jeu de la programmation avec l'IA est terminé

Après avoir développé un projet de 540 000 lignes de code (Garry's List) avec Rails et des agents IA, Garry Tan, président de Y Combinator, constate que l'approche traditionnelle du développement logiciel est obsolète. Au lieu de célébrer la quantité de code, il souligne la valeur d'une nouvelle méthodologie : le GStack, un cadre de travail centré sur les flux d'agents IA. Selon lui, l'industrie s'est enfermée dans une logique de "usine Foxconn", entourant les modèles de langage (LLM) intelligents de tests, de validateurs et de mécanismes de contrôle redondants. Alors que le coût des LLM baisse et que leurs capacités augmentent, cette approche devient contre-productive. Elle restreint des agents capables d'autonomie. La solution ? Passer d'une logique de "plus de code" à une logique de "plus de capacités". Tan prône l'utilisation de "skill packs" (packs de compétences) – des modules d'aptitude réutilisables et testables, décrits en Markdown et accompagnés du code minimal nécessaire. L'agent IA peut lui-même générer le code, les tests et le système d'évaluation pour ces compétences. Il illustre ce pouvoir par un exemple : l'évaluation de 85 projets pour un hackathon, un travail de plusieurs jours, a été accomplie par un agent en 30 minutes. Une fois finalisée, cette capacité a été encapsulée dans un "skill pack" pour une réutilisation future. Tan défend le "tokenmaxxing" : il faut accepter de dépenser en tokens d'IA aujourd'hui pour vivre avec les méthodes de demain et acquérir un avantage concurrentiel. La rareté ne réside plus dans la capacité à écrire du code, mais dans la clarté, le jugement et la capacité à définir les bons problèmes. L'ingénieur du futur ne sera pas celui qui écrit le plus de code, mais celui qui, en en écrivant le moins, libère le plus d'intelligence.

marsbitIl y a 1 h

Après 540 000 lignes de code, Garry Tan constate que le vieux jeu de la programmation avec l'IA est terminé

marsbitIl y a 1 h

Plus de 10 milliards de dollars de crypto-monnaies liquidés de force, le Bitcoin chute de 6% et franchit le seuil des 67 000 dollars

L'humeur sur le Bitcoin s'est fortement dégradée, déclenchant une vague de liquidations forcées dépassant 1 milliard de dollars dans le secteur des cryptomonnaies. Mardi, le Bitcoin a chuté de 6%, tombant sous les 67 000 dollars pour la première fois depuis le 5 avril. Cette pression est attribuée aux risques géopolitiques persistants liés à la situation en Iran et aux ventes de l'institution majeure Strategy. Bien que Strategy n'ait vendu qu'environ 32 bitcoins (pour 2,5 millions de dollars), marquant sa première réduction depuis fin 2022, cette action a symboliquement brisé sa stratégie de "achat uniquement" à un moment de sensibilité du marché. Parallèlement, les ETF spot américains sur le Bitcoin ont enregistré des sorties nettes de fonds pendant 11 jours consécutifs, un record, avec des retraits totaux d'environ 3,5 milliards de dollars. Ces deux sources de demande traditionnelles – les achats institutionnels et les ETF – sont ainsi devenues temporairement un poids pour les cours. Les effets de soutien liés à l'avancée de la régulation cryptographique aux États-Unis ont été complètement neutralisés par l'aversion au risque géopolitique. Le Bitcoin se trouve maintenant à environ 50% de son sommet historique d'octobre dernier, tandis que les marchés actions traditionnels continuent de progresser, accentuant la divergence.

华尔街日报Il y a 3 h

Plus de 10 milliards de dollars de crypto-monnaies liquidés de force, le Bitcoin chute de 6% et franchit le seuil des 67 000 dollars

华尔街日报Il y a 3 h

Trading

Spot
Futures

Articles tendance

Comment acheter ADA

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Cardano (ADA) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Cardano (ADA).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Cardano (ADA)Après avoir acheté vos Cardano (ADA), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Cardano (ADA)Tradez facilement Cardano (ADA) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

1.1k vues totalesPublié le 2024.12.10Mis à jour le 2026.06.02

Comment acheter ADA

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de ADA (ADA) sont présentées ci-dessous.

活动图片