Agentic Design Patterns : un livre qui m'a fait redéfinir "ce qu'est vraiment un Agent"

链捕手Publié le 2026-05-25Dernière mise à jour le 2026-05-25

Résumé

"**Agentic Design Patterns**" d'Antonio Gulli offre une vision structurée des agents IA à travers 21 modèles de conception. L'essentiel : un véritable agent va bien au-delà d’un simple LLM (niveau 0). Il se définit par sa capacité à utiliser des outils de façon autonome (niveau 1), à planifier et à pratiquer l’*Ingénierie du Contexte* pour filtrer et optimiser les informations (niveau 2), et, si nécessaire, à collaborer au sein d’équipes multi-agents spécialisées (niveau 3). L’article souligne deux concepts clés. D’abord, l’*Ingénierie du Contexte*, qui dépasse le simple prompt pour gérer stratégiquement les couches d’information (système, données externes, données implicites, boucle de feedback) présentées à l’agent. Ensuite, le modèle *Producteur-Critique* (Reflection), où deux agents aux rôles distincts (création et révision critique) travaillent en boucle pour améliorer continuellement la qualité du résultat, comme dans la génération de code. Il met également en garde contre la complexité inutile : un agent de niveau 2 bien conçu est souvent suffisant. Les systèmes multi-agents (niveau 3) ne sont nécessaires que pour les tâches véritablement complexes et parallélisables, et leur architecture de communication (par exemple, superviseur central ou réseau pair-à-pair) doit correspondre à la nature de la tâche. Enfin, la mémoire de l’agent doit être pensée en trois couches : la session (contexte immédiat), l’état (données temporaires de la tâche) et la mémoire à long terme ...

Auteur : Yanhua

Antonio Gullí est directeur de l'ingénierie chez Google. Il a écrit un livre de 453 pages, dans lequel il décompose le développement d'Agents IA en 21 modèles de conception.

Mais ceci n'est pas une critique de livre. Mon intention en lisant ce livre était très spécifique : j'ai écrit sur le Harness Engineering, sur les leçons tirées des difficultés rencontrées avec Clawdbot, sur cet article "L'Agent IA n'est pas magique" qui décrit sept tournants, du simple brûlage de tokens à une véritable utilité. Après chaque écriture, une question restait en suspens : y avait-il une logique sous-jacente réutilisable derrière tout cela ?

Ce livre m'a donné la réponse, et de manière plus profonde que je ne l'imaginais.

Ce que vous écrivez n'est peut-être pas du tout un Agent

Le jugement le plus sévère du livre se cache dans le prologue.

L'"IA" que la plupart des gens utilisent n'est que du Niveau 0 : un LLM nu, sans outils, sans mémoire, incapable d'agir. Vous lui demandez quel est le meilleur film aux Oscars 2025, il devine. Le livre est très clair : Les choses du Niveau 0 ne sont pas des Agents.

C'est en montant que l'on trouve de vrais Agents :

  • Niveau 1 : Utilisateur d'outils

    L'Agent commence à utiliser des outils : recherche, API, base de données. Mais il ne s'agit pas seulement de "pouvoir appeler une interface", il doit aussi juger lui-même quand l'appeler, quoi appeler et comment utiliser le résultat. Le livre donne un exemple très concret : l'utilisateur demande "Qu'y a-t-il de nouveau comme séries ?", l'Agent réalise lui-même que cette information n'est pas dans ses données d'entraînement, appelle activement l'outil de recherche pour la trouver, puis synthétise le résultat. L'étape clé est la "prise de conscience par lui-même". Ce n'est pas un humain qui lui dit "Va chercher", c'est lui qui juge avoir besoin de chercher. Cette capacité de jugement est le seuil du Niveau 1.

  • Niveau 2 : Penseur stratégique

    Deux choses supplémentaires : la planification et l'Ingénierie de Contexte. Le livre définit l'Ingénierie de Contexte : il ne s'agit pas d'empiler des informations, mais de sélectionner, couper et empaqueter soigneusement le contexte. L'exemple est excellent : l'utilisateur veut trouver un café entre deux lieux. L'Agent appelle d'abord un outil de cartographie pour obtenir un tas de données, puis décide lui-même que "la prochaine étape ne nécessite que les noms de rues", il réduit la sortie de la carte à une courte liste, puis la donne à un outil de recherche local. À chaque étape, il réduit le bruit informationnel.

    Il y a une phrase dans le livre que j'ai relue plusieurs fois : "Pour que l'IA atteigne sa précision maximale, il faut lui donner un contexte court, concentré et puissant." L'Ingénierie de Contexte sert précisément à cela.

    À ce niveau, l'Agent peut aussi réfléchir sur lui-même. Après avoir terminé son travail, il le revoit, identifie les problèmes et les corrige lui-même. J'en parlerai plus en détail plus tard.

  • Niveau 3 : Collaboration multi-Agents

    La position du livre est claire : ne cherchez pas toujours à créer un super agent polyvalent. La vraie approche fiable est de construire une équipe : Agent chef de projet + Agent chercheur + Agent designer + Agent rédacteur. L'exemple donné dans le livre est le lancement d'un nouveau produit : un "Agent chef de projet" coordonne, distribue les tâches à un "Agent recherche marketing", un "Agent conception produit", un "Agent marketing". La clé est la communication : comment les Agents s'échangent les données, synchronisent leur état, gèrent les conflits. Ce chapitre dessine six topologies de communication, de l'Agent simple au plus flexible, avec pour chacune des explications sur les scénarios appropriés.

Après avoir parcouru ces quatre niveaux, j'ai soudain compris pourquoi tant de gens disent "Mon Agent ne fonctionne pas bien". Le modèle n'est pas le problème, le problème est que vous l'utilisez comme un chatbot, il n'a peut-être même pas atteint le Niveau 1.

Ingénierie de Contexte : le concept le plus sous-estimé du livre

J'ai écrit un article sur le Harness Engineering, qui disait que la conception de la piste est plus importante que la puissance du moteur. En lisant ce livre, j'ai réalisé que l'Ingénierie de Contexte est la projection du Harness Engineering au niveau du prompt.

Le Prompt Engineering traditionnel ne se soucie que de "comment vous demandez". L'Ingénierie de Contexte du livre gère "ce que l'Agent a devant les yeux avant de demander". Elle comprend quatre couches d'information :

  1. Première couche, le system prompt. Définit qui est l'Agent, son ton, ses limites. La plupart des gens n'écrivent que cela.

  2. Deuxième couche, les données externes. Les documents récupérés par RAG, les valeurs de retour des appels d'outils, les données d'API en temps réel. C'est là où la plupart des gens se bloquent : ils savent qu'il faut nourrir avec des données, mais ne savent pas comment le faire sans submerger le modèle.

  3. Troisième couche, les données implicites. L'identité de l'utilisateur, l'historique des interactions, l'état de l'environnement. Ce que vous ne dites pas explicitement mais que l'Agent devrait savoir. Par exemple, si vous dites à l'Agent "Aide-moi à envoyer un e-mail à John pour confirmer la réunion de demain", il devrait savoir quelle est la réunion de demain dans votre calendrier, quelle est votre relation avec John.

  4. Quatrième couche, la boucle de rétroaction. Après chaque sortie de l'Agent, évaluer automatiquement la qualité, ajuster la stratégie de contexte suivante. Le livre appelle cela "l'optimisation automatisée du contexte", l'outil Vertex AI Prompt Optimizer de Google est une mise en œuvre technique de cette idée.

En lisant cela, je me suis souvenu de mon article "L'Agent IA n'est pas magique", où une expérience disait "votre Agent a besoin de règles, et de beaucoup de règles". En y repensant maintenant, ces règles étaient essentiellement une version manuelle de l'Ingénierie de Contexte, que le livre a systématisée.

Réflexion : deux Agents valent vraiment mieux qu'un

C'est le Pattern qui a le plus de valeur pratique pour moi dans tout le livre.

Le cœur de la Réflexion est simple : après avoir fait son travail, l'Agent le revoit lui-même, identifie les problèmes et les corrige. Mais la mise en œuvre doit être réfléchie. Le livre dit clairement : Le Producteur et le Critique doivent être deux Agents différents, avec des system prompts différents. La même persona revoyant son propre travail aura forcément des angles morts. Si vous demandez au même LLM d'écrire du code puis de réviser le code qu'il a écrit, il dira très probablement "c'est bon".

Le livre donne un exemple de code complet.

  • Le prompt du Producteur est "Vous êtes un développeur Python, écrivez une fonction pour calculer la factorielle, gérez les conditions limites et les exceptions".

  • Le prompt du Critique est "Vous êtes un ingénieur senior pointilleux, examinez le code ligne par ligne, vérifiez les bugs, le style, les conditions limites manquantes, les points d'amélioration. Si parfait, sortez CODE_IS_PERFECT, sinon listez tous les problèmes".

  • Puis une boucle for : Producteur écrit le code → Critique le révise → Producteur modifie selon les commentaires → Critique révise à nouveau → jusqu'à ce que le Critique dise CODE_IS_PERFECT ou qu'un nombre maximum d'itérations soit atteint.

C'est aussi simple que cela. Mais le livre rappelle un problème de coût souvent négligé : chaque cycle de réflexion est un nouvel appel LLM, plus d'itérations coûtent plus cher. Et à mesure que l'historique de la conversation gonfle, la fenêtre de contexte est remplie par les versions précédentes et les critiques, réduisant l'espace de raisonnement réellement disponible. La meilleure pratique pour la Réflexion est donc : fixer un nombre maximum d'itérations raisonnable (le livre utilise 3), s'arrêter dès que le Critique est satisfait, ne pas chercher la perfection.

L'utilité va bien au-delà de l'écriture de code. Écrire des articles, faire des plans, résumer des documents, résoudre des problèmes logiques, le modèle Producteur-Critique s'applique à tout. Le livre liste sept scénarios d'application, la logique centrale est la même : produire d'abord, réviser ensuite, corriger.

Multi-Agent : plus complexe n'est pas toujours mieux

Dans le chapitre sur la Collaboration Multi-Agent, ce que j'ai préféré, ce sont les six diagrammes de topologie de communication. Beaucoup commencent directement par des structures complexes, mais en réalité trois types suffisent pour la plupart des scénarios :

  1. Agent unique (exécution indépendante) : La tâche peut être décomposée en sous-problèmes indépendants, chaque Agent s'occupe du sien. Simple, facile à maintenir.

  2. Réseau pair-à-pair (Peer-to-Peer) : Les Agents communiquent directement entre eux, sans nœud de contrôle central. Décentralisé, tolérant aux pannes, si un Agent tombe, cela n'affecte pas l'ensemble. Mais le coût de coordination est élevé, risque de désordre.

  3. Superviseur (ordonnancement central) : Un Agent Superviseur gère un groupe d'Agents Travailleurs. Il attribue les tâches, collecte les résultats, résout les conflits. Hiérarchie claire, facile à gérer. Mais le Superviseur est un point de défaillance unique et un goulot d'étranglement en termes de performance.

Les trois autres types (Superviseur-comme-Outil, hiérarchique, hybride personnalisé) sont des variantes et combinaisons des trois premiers. Le livre est très pragmatique : La topologie dont vous avez besoin dépend de la complexité de votre tâche. Plus la tâche est fragmentée, plus le coût de communication est élevé, et à un certain point, le mode Superviseur devient plus efficace que le mode hiérarchique.

Ce que je retiens, c'est que beaucoup de gens passent 80% de leur temps sur les protocoles de communication lorsqu'ils construisent un système Multi-Agent, en oubliant de se poser une question plus fondamentale : cette tâche a-t-elle vraiment besoin de plusieurs Agents ? Le livre est clair, un Agent unique de Niveau 2 avec Réflexion est souvent suffisant. Le Niveau 3 est pour les scénarios qu'un Agent unique ne peut vraiment pas gérer.

Modèle de Mémoire à trois couches, je l'avais entrevu mais sans le nommer

Le chapitre sur la Mémoire est celui avec lequel je me suis le plus senti en phase, car lorsque j'ai écrit les deux articles sur Obsidian + Claude, je réfléchissais constamment à une question : comment la mémoire d'un Agent devrait-elle être stratifiée ?

Le livre donne la réponse :

  1. Session (couche conversation) : La fenêtre de contexte de la conversation en cours, c'est la mémoire la plus courte, elle disparaît à la fin de la conversation. Les modèles à long contexte ne font qu'agrandir cette fenêtre, mais elle reste essentiellement temporaire, et chaque raisonnement doit traiter toute la fenêtre, ce qui est coûteux et lent.

  2. État (couche d'état) : Données temporaires pendant l'exécution de la tâche en cours. Par exemple "quelle tâche est en cours", "où en est-elle", "quelles données intermédiaires ont été générées". Plus longue que la Session, mais nettoyée à la fin de la tâche. Le livre donne un exemple complet avec le mécanisme State de Google ADK.

  3. Mémoire (couche persistante) : Mémoire à long terme, entre sessions, entre tâches. Préférences de l'utilisateur, expériences acquises, décisions historiques importantes, stockées dans une base de données ou un index vectoriel, avec recherche sémantique. Le livre souligne un point important : la Mémoire ne consiste pas seulement à stocker, il faut aussi concevoir toute une stratégie de "quoi stocker, quand stocker, comment récupérer". Trop de stockage crée du bruit, pas assez n'est pas suffisant.

Dans mon article sur Clawdbot, je mentionnais le "fichier d'état" et les "documents de l'espace de travail", c'était essentiellement une fabrication manuelle des couches État et Mémoire, le livre a cadré cette pratique.

Cinq hypothèses, la cinquième est la plus incroyable

À la fin du livre, cinq hypothèses sur l'avenir des Agents sont mentionnées, les quatre premières sont dans un cadre de projection raisonnable : les Agents généraux passent de l'écriture de code à la gestion de projets, la personnalisation profonde découvre activement vos besoins, l'intelligence incarnée sort des écrans dans le monde physique, les Agents deviennent des entités économiques indépendantes.

La cinquième m'a laissé stupéfait : Multi-Agent transformable.

Vous déclarez uniquement un objectif, par exemple "créer une entreprise de commerce électronique de café de spécialité". Le système décide automatiquement : d'abord créer un "Agent recherche de marché" et un "Agent marque". Après avoir exécuté un tour de données, il juge lui-même que l'Agent marque n'est plus nécessaire, le divise en trois nouveaux : "Agent conception de logo", "Agent création de site", "Agent chaîne d'approvisionnement". Si l'Agent création de site devient un goulot d'étranglement, le système en clone automatiquement trois en parallèle pour travailler simultanément sur différentes pages. Tout au long du processus, le système optimise automatiquement et continuellement le prompt de chaque Agent, réorganisant constamment l'architecture de l'équipe.

Le livre appelle cela un "système multi-Agents auto-transformable et piloté par objectifs". Il n'exécute pas le plan que vous avez écrit, il génère son propre plan, l'ajuste lui-même, réorganise lui-même l'équipe d'exécution.

Cela me rappelle AutoResearch de Karpathy : écrire un program.md, définir les objectifs, les métriques, les limites, appuyer sur "Démarrer". L'humain est en dehors de la boucle. Mais ce livre va encore plus loin : même la façon dont l'équipe d'Agents est formée et réorganisée est laissée au système. L'humain ne fait que déclarer "ce qu'il veut".

Trois actions que vous pouvez mettre en œuvre immédiatement

Après avoir lu ce livre, j'ai trois actions que je peux immédiatement mettre en œuvre :

  • Première, ajoutez un Critique à votre Agent actuel. Que vous utilisiez Claude Code, CrewAI ou votre propre framework, ajoutez une étape à votre workflow existant : faites qu'un autre Agent (avec un system prompt différent) révise la sortie de l'étape précédente. Génération de code + revue de code, rédaction d'article + vérification des faits, élaboration de plan + évaluation de la faisabilité. Un appel LLM de plus, mais souvent un doublement de l'amélioration de la qualité. Le modèle Producteur-Critique du livre est prêt à l'emploi.

  • Deuxième, commencez à faire de l'Ingénierie de Contexte, pas seulement du Prompt Engineering. Revenez aux fichiers d'instructions que vous écrivez pour votre Agent. S'ils ne contiennent que des règles du type "comment faire", sans le contexte du type "quel environnement il affronte", ajoutez-le. Dites à l'Agent dans quel projet il se trouve, quelles décisions il a prises auparavant, quelles sont les préférences de l'utilisateur. Le chapitre sur l'Ingénierie de Contexte et votre AGENTS.md sont deux façons de dire la même chose.

  • Troisième, ne vous précipitez pas vers le Multi-Agent. Amenez d'abord votre Agent unique au Niveau 2 : avec outils, Réflexion, Mémoire. Le livre insiste : un Agent unique de Niveau 2 avec Producteur-Critique et Ingénierie de Contexte couvre la grande majorité des scénarios réels. Le Niveau 3 est pour les tâches véritablement interdisciplinaires, multi-étapes, nécessitant une division parallèle du travail. Le problème de la plupart des gens n'est pas de ne pas avoir assez d'Agents, c'est de ne pas avoir bien réglé un seul Agent.

Ce livre fait 453 pages, publié par Springer en 2025. Les exemples de code couvrent LangChain/LangGraph, Google ADK, CrewAI, OpenAI API. La préface est écrite par le VP de l'IA chez Google Cloud, et il y a une recommandation du CIO de Goldman Sachs, étonnamment agréable à lire.

Mais la raison pour laquelle je le recommande n'est pas son "exhaustivité". C'est qu'après l'avoir lu, vous réalisez une chose : les problèmes que vous avez rencontrés avec les Agents ces six derniers mois, quelqu'un les a déjà organisés en modèles. Vous n'avez plus besoin de réinventer la Réflexion, de deviner comment stratifier la Mémoire, d'expérimenter quelle topologie de communication utiliser pour le Multi-Agent.

Quelqu'un a dessiné la carte à votre place, il ne reste plus qu'à marcher.

Utilisez-vous un Agent IA pour le développement ? À quel Niveau se trouve votre Agent actuel ?

Questions liées

QQuelle est la principale contribution du livre "Agentic Design Patterns" selon l'auteur ?

ALe livre organise et systématise les connaissances et expériences pratiques du développement d'Agent IA en 21 modèles de conception. Il apporte des réponses claires à des problèmes fondamentaux, comme la définition d'un Agent, sa hiérarchisation, l'ingénierie du contexte, la réflexion, les collaborations multi-agents et la gestion de la mémoire. Il permet aux développeurs de ne pas avoir à réinventer ces concepts et de disposer d'une carte pour les guider.

QQuelle est la différence fondamentale entre le "Level 0" et le "Level 1" d'un Agent IA selon le livre ?

ALe "Level 0" fait référence à un LLM nu, sans outils, sans mémoire et incapable d'action. Il ne s'agit pas d'un véritable Agent. Le "Level 1" (utilisateur d'outils) franchit ce seuil en utilisant des outils comme la recherche ou des API. La différence clé réside dans la capacité de l'Agent à "prendre lui-même la décision" de savoir quand appeler un outil, lequel appeler et comment utiliser le résultat, sans que l'humain ne lui dise explicitement de le faire.

QEn quoi consiste le concept de "Context Engineering" présenté dans le livre ?

ALe "Context Engineering" est une approche systématique qui s'occupe de ce que l'Agent a "sous les yeux" avant de raisonner. Il dépasse le simple "Prompt Engineering" et organise le contexte en quatre couches : le prompt système, les données externes (ex. : documents RAG), les données implicites (ex. : historique, identité de l'utilisateur) et la boucle de rétroaction (évaluation et optimisation automatique du contexte). Son objectif est de fournir à l'Agent un contexte court, ciblé et puissant pour une meilleure précision.

QComment fonctionne le modèle de "Reflection" (Producteur-Critique) et quel est son principal avantage ?

ALe modèle de "Reflection" consiste à utiliser deux Agents distincts avec des prompts système différents. Un Agent "Producteur" crée un contenu initial (code, texte). Un second Agent "Critique" l'examine de manière approfondie et fournit des retours. Le Producteur modifie ensuite sa production en fonction des critiques. Cette boucle peut se répéter jusqu'à satisfaction ou un nombre maximal d'itérations. L'avantage principal est d'obtenir un résultat de qualité supérieure en introduisant un point de vue différent et critique, évitant ainsi les angles morts d'un seul Agent qui s'auto-évalue.

QSelon les recommandations finales de l'auteur, quelle est la première action à mettre en œuvre après la lecture du livre ?

ALa première action recommandée est d'ajouter immédiatement un Agent "Critique" à son Agent existant, quel que soit l'outil utilisé. Il suffit d'ajouter une étape dans le flux de travail où un second Agent (avec un prompt système différent) examine la sortie précédente. Cela peut s'appliquer à la génération de code (avec une revue), à la rédaction (avec une vérification des faits), etc. C'est une amélioration simple, éventuellement plus coûteuse en tokens, mais qui peut doubler la qualité du résultat.

Lectures associées

De l'IDE au terminal : Un manuel pratique d'ingénierie d'agents

En mars 2026, Matt Van Horn a publié un article intitulé "Chaque astuce Claude Code que je connais", déclenchant un débat sur son approche "No IDE". Il développe entièrement dans le terminal et un fichier plan.md, déléguant l'exécution à des agents d'IA. Cette méthode, popularisée par meng shao sous le nom de "Conseils pratiques pour l'ingénierie d'agents", repose sur un cycle "Research → Plan → Work". L'idée centrale est de remplacer l'IDE, qui offre un retour visuel immédiat (surlignage, débogage), par un flux de travail basé sur des commandes et un plan. Le fichier plan.md sert de "contrat" avec l'agent, définissant le problème, la solution et une checklist pour guider l'exécution et éviter la "dégradation du contexte" des LLM. Des outils comme Compound Engineering (avec /ce:plan) aident à générer et affiner ce plan. Le cycle en trois phases est crucial : 1. **Research** : L'agent collecte des informations (ex: avec last30days-skill). 2. **Plan** : Génération et révision humaine du plan pour corriger les hypothèses et ajouter des connaissances métier. 3. **Work** : L'agent exécute le plan en parallèle (/ce:work). Des astuces pratiques incluent : générer un plan dès qu'une idée émerge ; faire résumer le plan par l'agent ; utiliser plusieurs terminaux en parallèle ; saisir par voix les instructions complexes ; déclencher des tâches par email (agentmail) ; et utiliser des compétences préexistantes (AgentSkills). Cependant, cette approche présente des risques. Elle nécessite une forte capacité à décomposer les problèmes et à rédiger des instructions précises. Les erreurs non détectées en phase de planification peuvent être amplifiées. Enfin, il existe un risque de "psychose IA", où l'optimisation du flux de travail devient une fin en soi, éclipsant l'objectif initial. Ce flux de travail est un amplificateur d'efficacité pour les développeurs expérimentés sachant exactement ce qu'ils veulent, et non un outil d'apprentissage pour les débutants qui ont encore besoin des retours visuels de l'IDE. Les outils (Claude Code CLI, Compound Engineering) évoluent rapidement, offrant une fenêtre d'expérimentation aux pionniers.

marsbitIl y a 1 h

De l'IDE au terminal : Un manuel pratique d'ingénierie d'agents

marsbitIl y a 1 h

Ne vous focalisez plus sur les GPU, Intel dévoile une manœuvre majeure, peut-elle mettre fin au monopole de Nvidia sur la puissance de calcul ?

Au cours des deux dernières années, le GPU a été au cœur du matériel informatique pour l'IA. Cependant, lors du COMPUTEX 2026, Intel a présenté une vision différente, axée sur l'Agentic AI (IA agentique). Contrairement aux modèles d'IA traditionnels fonctionnant par « tours » de questions-réponses, l'IA agentique opère dans des flux de travail réels, suivant un cycle continu de réflexion, planification, action et évaluation. Cela transforme fondamentalement l'utilisation du calcul, nécessitant une forte coordination système et un traitement de tâches fragmentées. Intel soutient que cela rééquilibrera la répartition des ressources dans les centres de données. Alors que la phase d'entraînement des modèles avancés repose fortement sur les GPU (avec des ratios CPU/GPU pouvant atteindre 1:8), le déploiement d'agents intelligents nécessitera davantage de puissance CPU pour l'orchestration des tâches, l'appel d'outils et la gestion des données, ramenant le ratio vers 1:1, voire en faveur du CPU. La consommation de tokens peut être multipliée par 1000 par rapport à une inférence simple. Pour répondre à cette nouvelle demande, Intel a dévoilé le processeur Xeon 6+ (fabriqué en technologie 18A), offrant jusqu'à 288 cœurs efficaces et conçu pour une haute densité et une meilleure efficacité énergétique. Parallèlement, Intel a présenté une nouvelle architecture d'inférence découplée, développée avec des partenaires comme SambaNova. Cette solution répartit les différentes étapes de l'inférence (orchestration, décodage, pré-remplissage) sur les composants les plus adaptés (CPU Xeon 6, RDU SambaNova, GPU NVIDIA Blackwell) pour optimiser l'efficacité. L'écosystème d'Intel inclut également le processeur Core Ultra de 3ᵉ génération pour l'IA locale sur PC, permettant une répartition dynamique des charges de travail entre le périphérique et le cloud, et les processeurs Arc G3 pour les appareils portables. Enfin, Intel mise sur les puces sur mesure (comme les IPU développées avec Google) pour répondre aux besoins spécifiques de divers secteurs industriels. En résumé, face à la domination de NVIDIA sur les GPU, Intel adopte une stratégie globale : proposer une suite de solutions (puces universelles, architectures hétérogènes, IA locale, composants personnalisés) adaptée à chaque étape et besoin du nouveau paysage informatique défini par l'IA agentique. Le succès dépendra de l'exécution technique et de l'adoption par les clients, mais Intel affiche désormais une direction claire pour capitaliser sur cette reconfiguration des infrastructures d'IA.

marsbitIl y a 1 h

Ne vous focalisez plus sur les GPU, Intel dévoile une manœuvre majeure, peut-elle mettre fin au monopole de Nvidia sur la puissance de calcul ?

marsbitIl y a 1 h

“小美”, Yuanbao, l'interconnexion, est-ce un précurseur pour l'agent intelligent de WeChat ?

Lors de la publication des résultats du premier trimestre 2026 de Meituan, l'attention a été attirée par l'annonce de Wang兴 concernant l'intégration de son assistant IA "Xiao Mei" avec "Yuan Bao" de Tencent. Cette collaboration permettra aux utilisateurs d'exprimer des besoins en services de proximité dans Yuan Bao, déclenchant automatiquement une communication "Agent à Agent" avec Xiao Mei pour accéder aux services de livraison de repas de Meituan. Cet accord stratégique vise à positionner Meituan comme une infrastructure de services de base, tout en s'appuyant sur une entrée IA externe pour compenser son manque d'accès indépendant. Cette démarche intervient dans un contexte où les assistants IA rivaux, comme Dou Bao (ByteDance) et Qian Wen (Alibaba), développent leurs propres écosystèmes fermés ("jardin clos") en intégrant des services transactionnels, contournant potentiellement les avantages de Meituan. L'article analyse les défis de cette collaboration : plafond de l'expérience utilisateur due à l'architecture "Agent à Agent", répartition des bénéfices, et fluidité de l'expérience entre deux écosystèmes distincts. Elle est également interprétée comme un test préliminaire crucial pour le futur "Agent IA" intégré à WeChat, dont le lancement a été rapporté par le Financial Times. Le succès de ce partenariat avec Meituan pourrait servir de modèle pour convaincre d'autres grandes plateformes de s'intégrer à l'écosystème IA de Tencent via des protocoles standardisés, préservant leur souveraineté des données tout en gagnant en visibilité.

marsbitIl y a 3 h

“小美”, Yuanbao, l'interconnexion, est-ce un précurseur pour l'agent intelligent de WeChat ?

marsbitIl y a 3 h

Trading

Spot
Futures
活动图片