OpenAI mange-t-il la couche application ? a16z affirme que les véritables opportunités se trouvent au-delà des modèles généraux

marsbitPublié le 2026-05-28Dernière mise à jour le 2026-05-28

Résumé

Alors que les capacités des grands modèles de langage s'améliorent, une inquiétude émerge dans la couche applicative de l'IA : les sociétés de modèles comme OpenAI ou Anthropic, avec leurs avantages en matière de modèle, de distribution et de marque, risquent-elles d'absorber tout l'espace des applications ? L'associé d'a16z, Joe Schmidt, répond à cette question en utilisant la métaphore de la « Route de briques jaunes » du *Magicien d'Oz*. Il distingue deux catégories d'opportunités. La première, la « Route de briques jaunes », est celle que les laboratoires de grands modèles investissent directement : la génération de code, d'écrits, d'images, les assistants génériques. La seconde, « le reste du pays d'Oz », représente les scénarios verticaux complexes, intégrés aux processus métiers, dépendant de flux de travail spécifiques, de données, de conformité et d'intégrations système. Pour Schmidt, la vraie opportunité pour les startups réside dans ce second domaine. Les entreprises paient pour des systèmes responsables de résultats concrets, capables de gérer des données désordonnées, des validations multiples, des cas limites, la conformité, et l'optimisation des coûts face à l'évolution des modèles. L'article souligne que si les modèles sous-jacents deviendront plus puissants et interchangeables, la valeur durable proviendra des données, processus, connaissances métier et « mémoire opérationnelle » accumulés autour de flux de travail spécifiques. Les startups doivent éviter ...

Note de la rédaction : Alors que les capacités des grands modèles continuent de progresser, la couche applicative de l'IA fait face à une anxiété répandue : si des sociétés comme OpenAI, Anthropic, etc., maîtrisent à la fois les modèles de base, les canaux de distribution et l'avantage de marque, que reste-t-il à faire aux startups dans la couche application ?

C'est précisément la question à laquelle tente de répondre Joe Schmidt, partenaire chez a16z, dans cet article. Il emprunte la métaphore de la « route de briques jaunes » du Magicien d'Oz pour classer les opportunités d'applications d'IA en deux catégories : la première est la voie principale où les sociétés de grands modèles s'engagent elles-mêmes, comme la génération de code, l'écriture, la création d'images, les agents génériques ou les assistants de bureau horizontaux. L'autre ce sont les « autres parties du pays d'Oz », c'est-à-dire les scénarios verticaux, profonds dans les processus sectoriels, dépendants de flux de travail complexes, de sédimentation des données, de gouvernance de la conformité et de capacités d'intégration système.

Pour lui, la véritable opportunité pour les startups se trouve dans cette dernière catégorie.

De la vente à l'assurance, Joe Schmidt répète la même logique : ce pour quoi les entreprises sont vraiment prêtes à payer, ce n'est pas une fenêtre de chat plus intelligente, mais un système qui assume la responsabilité des résultats métier. Il doit comprendre l'état chaotique des données clients, gérer les validations multiples et les cas limites, assumer la responsabilité de la conformité et de l'audit, et aussi, lorsque les modèles évoluent, effectuer pour le client la migration, le routage et l'optimisation des coûts.

C'est également le jugement central de cet article sur la prochaine génération de logiciels d'entreprise : les modèles de base deviendront de plus en plus puissants, mais aussi de plus en plus remplaçables ; ce qui est vraiment irremplaçable, c'est les données, les processus, les capacités de gouvernance et la mémoire opérationnelle sédimentés autour d'industries et de flux de travail spécifiques. L'opportunité pour les entreprises d'applications d'IA ne réside pas dans la lutte avec les sociétés de modèles pour la « route de briques jaunes », mais dans l'exploration de ces lieux plus complexes, plus désordonnés, plus lents, mais aussi plus proches de la véritable valeur commerciale.

Voici l'article original :

Récemment, j'entends sans cesse la même question de la part de fondateurs et de futurs employés : reste-t-il quelque chose à faire dans la couche application de l'IA ? Ou bien OpenAI et Anthropic finiront-ils par tout tuer ?

Derrière cette question se cache une anxiété typique de l'ère de l'IA. Certains en ont déjà conclu que si l'on ne veut pas être relégué définitivement à la base, les seules positions à valeur durable sont soit au sein des grands laboratoires de modèles, soit dans l'entrepreneuriat dans des domaines de pointe comme la robotique, les hard tech ou assimilés – en théorie, donc, à faire des choses que « les laboratoires ne touchent pas ». Car si chaque type de logiciel doit être avalé, soit directement par Codex ou Claude qui absorberait le travail correspondant, soit par un futur modèle le rendant obsolète, le meilleur choix semble être : fuyez !

Je l'avoue, je suis moi-même presque un maximaliste de l'IA, et je pense qu'ils ont raison à moitié. Les grands laboratoires de modèles entrent effectivement dans de vastes zones de la couche application. Mais la « couche application » n'est pas un ensemble homogène d'opportunités. Le critère de jugement vraiment important est : marchez-vous sur la « route de briques jaunes », ou ailleurs dans le pays d'Oz.

La « route de briques jaunes » est notre métaphore pour décrire le chemin que les grands laboratoires de modèles empruntent et sur lequel ils consacrent d'énormes ressources. Des problèmes comme la génération de code, l'écriture, la création d'images sont naturellement adaptés aux laboratoires parce qu'ils s'améliorent avec l'augmentation des capacités brutes des modèles : chaque dollar investi dans le pré-entraînement et le post-entraînement améliore directement la qualité du produit.

Mais ailleurs dans le pays d'Oz, existent des problèmes plus complexes, généralement plus verticaux. Ils ne se résument pas à fournir simplement un outil horizontal à un utilisateur d'entreprise, en le branchant sur des outils et capacités informatiques standards. La valeur ici provient davantage de l'échafaudage construit autour du modèle : cet échafaudage qui rend la sortie fiable, conforme et véritablement intégrée aux processus métier dans une industrie spécifique. Les capacités brutes du modèle sous-jacent restent bien sûr importantes, mais ne sont plus le tout.

Nous le voyons en temps réel. OpenAI et Anthropic reconnaissent en fait au marché : ils ne peuvent pas résoudre tous les problèmes avec un assistant IA générique unique. Ils ont annoncé investir massivement dans des projets conjoints de déploiement en première ligne, construisant des entreprises entières autour de la configuration et de la personnalisation de modèles pour les entreprises. S'ils pensaient vraiment que la prochaine version de modèle résoudrait ces problèmes, ils n'investiraient pas des milliards dans ce type de projets.

Donc, si vous voulez gagner de l'argent avec des applications d'IA, ne prenez pas la route de briques jaunes, allez construire ailleurs dans le pays d'Oz. Voici ce que nous, ainsi que certains fondateurs de notre portefeuille, avons appris en pratique.

La route de briques jaunes

Si vous fondez une entreprise, la route de briques jaunes est la voie la plus évidente, mais aussi la plus dangereuse. Prenez un modèle haute performance, connectez-le à des connecteurs prêts à l'emploi comme Google Drive, Slack, Salesforce, Notion, GitHub, et superposez une couche d'orchestration d'agents intelligents par-dessus. Ça ressemble à de la magie.

Le problème est que c'est exactement ce que les grands laboratoires de modèles font avec Coworker et Codex. Il est clair qu'ils possèdent le modèle, ce qui signifie qu'ils ont de meilleures marges, un meilleur contrôle, et peuvent aussi exercer un pouvoir de fixation des prix sur tous les acteurs en aval. Mais peut-être plus important encore, ils contrôlent également les choix d'architecture qui déterminent à quels problèmes le produit est adapté. Jusqu'à présent, ils ont très délibérément adopté un modèle « modèle + appel d'outils », qui est précisément le modèle requis pour les travaux horizontaux, à faible nombre d'étapes, sur la route de briques jaunes. Même si une startup parvenait d'une manière ou d'une autre à surpasser Codex ou Claude Code, les grands laboratoires de modèles conservent une énorme capacité de distribution, ainsi que l'aura de marque la plus forte dans le domaine de l'IA.

Si vous êtes une entreprise d'application d'IA qui joue selon le même playbook : se connecter aux mêmes connecteurs, sans sous-agents ou configuration en dessous, et sans canaux de distribution, vous êtes probablement sur une route qui ne mène nulle part.

Ailleurs dans le pays d'Oz

Pour les startups, la situation n'est pas entièrement pessimiste. En dehors de la route de briques jaunes, il existe encore d'énormes opportunités. Les startups peuvent y trouver des clients et résoudre des problèmes complexes.

Ces entreprises construisent des expériences d'agents intelligents : le modèle est tissé dans un réseau complexe d'outils, d'automatisations et d'intégrations – en d'autres termes, du logiciel. Cela rend également la plupart de ces startups naturellement verticales. Elles peuvent se concentrer sur des flux de travail multi-étapes, multi-intervenants, concevoir des sous-agents pour différents rôles et scénarios verticaux, traiter des problèmes difficiles à atteindre pour les plateformes horizontales d'Anthropic et OpenAI : collecter du contexte à travers des systèmes, puis router les tâches vers plusieurs personnes nécessitant une validation à différentes étapes.

Ce type de travail implique généralement un ou plusieurs systèmes hérités, exige souvent des résultats déterministes car l'ambiguïté est inacceptable, et est parfois directement lié à un résultat commercial important. Les grands laboratoires de modèles savent bien sûr combien ces problèmes sont précieux : c'est pourquoi ils construisent leurs propres équipes de configuration externalisées, et c'est pourquoi toute une catégorie d'entreprises de services de renforcement de l'apprentissage pour les grands clients émerge.

Pourquoi le reste du pays d'Oz ne sera pas entièrement occupé par le « Magicien »

Une objection à l'argument ci-dessus est : jusqu'à présent, parier que les modèles ou les laboratoires ne continueront pas à progresser a toujours été un très mauvais pari. Ils vont probablement continuer à s'améliorer et finir par avaler les marchés servis par ces entreprises applicatives.

Les grands laboratoires de modèles vont certainement continuer à progresser. Mais je pense que les entreprises ailleurs dans le pays d'Oz ont, à long terme, plusieurs moyens de se défendre.

Les données et l'effet boule de neige de l'apprentissage

Beaucoup de ce que vous internalisez vraiment dans une activité n'existe dans aucun ensemble d'entraînement : les conventions sectorielles non écrites, les normes non documentées, la connaissance tribale dans la tête des praticiens. Elles ne sont pas sur l'internet public. Peu importe la puissance de calcul d'entraînement investie, elle ne peut remplacer le fait de pénétrer réellement à l'intérieur des flux de travail où réside cette connaissance.

Deux effets boule de neige se superposent ici : l'un est l'effet inter-clients, c'est-à-dire que lorsque vous voyez plus de variations du même type de problème, les modèles s'amplifient de manière exponentielle ; l'autre est l'effet intra-client, c'est-à-dire que les raisons derrière des décisions spécifiques, les exceptions non dites, les règles empiriques propres à l'entreprise, n'émergent que lorsque les utilisateurs interagissent réellement avec le système.

Même si les données clients ne peuvent pas être utilisées d'un client à l'autre, l'entreprise applicative peut toujours tirer parti de la reconnaissance de modèles pour différents types de problèmes clients et l'utiliser pour guider la conception architecturale des problèmes futurs. Une entreprise qui a déjà fait traiter cent modifications de ligne rouge juridique, mille cycles de souscription d'assurance, ou dix mille activités de développement commercial SDR par ses agents, a une compréhension de la forme des problèmes qu'un nouvel arrivant ne peut pas reproduire dès le premier lancement d'un nouvel agent.

Théoriquement, un agent horizontal pourrait construire la même infrastructure d'apprentissage. Mais la raison pour laquelle il ne le fait pas, outre le manque de concentration, est principalement l'expérience utilisateur. Capturer ce type de connaissance dépend entièrement du type d'interface de flux de travail que vous offrez à l'utilisateur. Les acteurs verticaux peuvent concevoir ces interfaces autour des informations qui ont vraiment besoin d'être exposées pour un flux de travail spécifique, ce que les outils horizontaux ne peuvent pas faire. Les ensembles d'évaluation, les sorties annotées, les systèmes de classification des cas limites peuvent se combiner en un effet boule de neige de données dans un domaine vertical, soutenant ainsi le fine-tuning. Un nouvel arrivant sans une exposition en environnement de production de taille équivalente aura du mal à générer un tel effet. Sa faisabilité dépend des droits sur les données, de l'utilisation productive accumulée et de la structure contractuelle avec les clients, mais la reconnaissance de modèles elle-même continue de s'accumuler.

Gérer la volatilité et la complexité des modèles

Les grands laboratoires de modèles font déjà du routage en interne : appeler différentes catégories de modèles pour différentes requêtes, utiliser des ensembles de modèles en coulisses. Mais ce qu'ils ne peuvent pas faire, c'est du routage inter-fournisseurs, ni évaluer facilement les modèles concurrents pour une sous-tâche spécifique, ou utiliser le véritable modèle open source fine-tuné le plus adapté pour un point étroit.

Les entreprises ailleurs dans le pays d'Oz choisiront le modèle le plus approprié pour chaque sous-tâche dans tout le marché des modèles, et pas seulement le modèle publié par un laboratoire mère. Elles assumeront également les tâches que personne ne veut faire : ré-exécuter les évaluations à chaque nouvelle version de modèle, recalibrer les prompts pour les cas limites des clients, mettre en production sans casser l'environnement. Les grands laboratoires de modèles ne feront pas cela pour le client. Ils vous vendent le nouveau modèle et vous disent de migrer. Les entreprises ailleurs dans le pays d'Oz absorbent le coût de migration. Le client obtient la meilleure capacité intelligente du marché, ainsi que la continuité à travers chaque mise à niveau.

Optimisation des coûts

Envoyer chaque requête à Opus 4.7 est le moyen le plus rapide de faire virer la marge brute au négatif. Les meilleures entreprises d'Oz feront du routage entre différents niveaux de modèles : les tâches les plus difficiles aux modèles de pointe, la plupart des tâches aux modèles intermédiaires, et dans les zones où cela a été prouvé possible, utiliser des modèles personnalisés plus petits ou fine-tunés.

Certaines de ces entreprises font maintenant leur propre post-entraînement sur cette base, optimisant le modèle pour le petit segment de travail qui intéresse vraiment le client, et fournissant le service à un coût bien inférieur à un appel API de pointe. Les grands laboratoires de modèles fixent un prix « plancher » : le niveau d'intelligence minimum que vous pouvez obtenir pour X dollars. Les entreprises d'Oz vendent l'inverse : le coût en dollars le plus bas pour le niveau d'intelligence réellement nécessaire par un flux de travail spécifique. Cela n'est possible que si vous savez très précisément quel niveau d'intelligence est nécessaire pour chaque sous-tâche. Et les grands laboratoires de modèles ne peuvent structurellement pas connaître chaque tâche dans chaque secteur vertical. Finalement, cela se traduit directement par une tarification par résultat plus basse et plus contrôlable.

Gouvernance

Devenir le plan de contrôle où un client exécute l'IA dans un domaine vertical crée une valeur considérable. Ce plan de contrôle est l'endroit où convergent les autorisations, l'audit, ce que l'agent est autorisé à faire, et ce que l'agent a réellement fait.

Ce plan de contrôle est construit sur des garde-fous pour des cas d'usage spécifiques, et ces garde-fous sont complètement différents selon les secteurs et les types de postes. Parce que ces entreprises possèdent de bout en bout les outils, les flux de travail et les données auxquels l'agent a accès, elles peuvent fournir des résultats déterministres d'une manière difficile à réaliser pour les outils horizontaux. Elles absorbent également la complexité réglementaire pour l'acheteur final : les règles fédérales de procédure civile et les règles de déontologie des avocats dans le droit, HIPAA dans la santé, les règles de la SEC et de la FINRA en finance, la régulation des assurances au niveau des États, etc. Les acteurs horizontaux ne peuvent pas faire cela de manière crédible sans se transformer en cent secteurs verticaux différents. Le DSI a besoin d'un partenaire qui peut s'engager clairement dans un contrat : il assumera la responsabilité du traitement de la conformité pour les agents qu'il fournit.

Tout cela revient finalement à la même chose : la concentration.

Cette concentration peut être un secteur vertical, comme l'assurance, le droit, la comptabilité ; ou une fonction suffisamment approfondie, comme les ventes, le service client, les finances. Quelle qu'elle soit, ce travail nécessite qu'une équipe s'immerge longtemps dans le même type de clientèle, comprenne ses flux de travail, ses cas limites et ses exigences réglementaires. Les grands laboratoires de modèles ne sont pas construits pour cela. Ils doivent servir tout le monde, couvrir partout, et c'est aussi pourquoi ils ont initialement construit la route de briques jaunes. Le même compromis les empêchera d'entrer ailleurs dans le pays d'Oz : vous pouvez être partout à la fois, ou excellent dans une chose, mais pas les deux.

L'exemple des ventes : conseils pratiques du CEO technique de 11x

En pratique, comment comprendre cela ? Voici quelques conseils pratiques de Prabhav Jain, CEO de 11x.

Se concentrer sur les résultats

Un chemin tactique viable pour construire une entreprise résistante aux grands laboratoires de modèles est de partir des résultats concrets qui intéressent vraiment le client. Pour nous, ce résultat est d'aider les entreprises à générer plus de prospects et de pipeline de ventes.

À partir de là, les questions deviennent très spécifiques : quelles activités voulons-nous posséder de bout en bout et qui font réellement progresser le pipeline de ventes ? Décomposez chaque activité en tâches. Quelles tâches conviennent à un agent, lesquelles non ? Quelles tâches nécessitent des insights sectoriels complexes, lesquelles non ? Les grands laboratoires de modèles lanceront aussi des flux de travail, mais lorsqu'une étape de flux de travail comporte de nombreuses étapes, des entrées désordonnées, un état difficile à interpréter, ou des contraintes du monde réel, un simple meilleur modèle ne suffit pas. Le travail revient alors à l'ingénierie logicielle traditionnelle, et à ce niveau, les grands laboratoires de modèles n'ont pas d'avantage sur une entreprise applicative concentrée.

Par exemple, certaines des tâches que nous traitons incluent : la prospection de leads basée sur des signaux personnalisés, l'enrichissement d'informations sur les leads, la recherche approfondie sur les comptes, l'extraction de contexte du CRM, la rédaction de messages pour différents canaux, l'agent de qualification des leads, et le système de délivrabilité des e-mails. Certaines sont des tâches d'agent, d'autres non. Ces tâches ne se font pas en une seule prompt, elles nécessitent des capacités d'ingénierie approfondies.

L'idée clé de l'analogie avec le pays d'Oz est : dans tout flux de travail réel, environ la moitié des tâches ne sont pas des tâches d'agent, et cette moitié n'apporte pas d'avantage de laboratoire. Sous la couche du modèle, leur capacité à écrire du logiciel déterministe n'est pas meilleure que la vôtre. Et l'autre moitié des tâches d'agent exige toujours de vous que vous ajustiez, entraîniez et contraigniez le modèle autour du résultat réellement désiré.

La connaissance du domaine n'est souvent pas dans les données d'entraînement générales. Ces capacités doivent être construites de bas en haut à partir du secteur vertical ou de la fonction spécifique, et fournies au modèle au bon moment dans le flux de travail. Lorsque notre agent qualifie un lead entrant par téléphone, il doit être formé à comprendre ce qui constitue une bonne conversation de vente pour un secteur et un profil d'utilisateur spécifiques. C'est le travail de l'entreprise applicative, et cette capacité s'amplifie exponentiellement.

Plus important encore, ces capacités deviennent constamment obsolètes, car l'entreprise elle-même évolue. Ainsi, votre capacité à faire évoluer continuellement le flux de travail et le contexte devient elle-même un avantage concurrentiel. Par exemple, lorsque nous avons commencé le produit d'emailing sortant à grande échelle, les « e-mails écrits par l'IA » commençaient tout juste à apparaître. Aujourd'hui, les gens ont développé une sensibilité aiguë pour distinguer quels e-mails sont écrits par l'IA et lesquels ressemblent plus à des humains, et le point clé est que ce jugement change tous les quelques mois. Nos agents doivent s'ajuster constamment à la dynamique du marché, mais c'est précisément là que se construit le fossé concurrentiel. En fait, malgré cette dynamique, notre taux de réponse positive a été multiplié par 4 au cours des derniers mois et a créé des centaines de millions de dollars de pipeline de ventes pour nos clients.

S'attaquer à des problèmes de haute complexité

Les problèmes complexes sont l'endroit où la valeur commerciale se libère réellement. Sinon, vous risquez de vous retrouver avec une simple couche d'emballage mince.

Décomposez un problème commercial suffisamment complexe, et vous verrez rapidement le désordre apparaître. Voici un exemple simple en apparence du domaine GTM : si une entreprise est déjà votre cliente, vous ne devriez pas contacter un contact dans cette entreprise. Mais ce n'est pas du tout simple.

Peut-être avez-vous le domaine de cette entreprise dans votre CRM. Mais que faire des entreprises avec des dizaines de filiales ? Et si l'enregistrement dans Salesforce utilise le domaine de la société mère ? Et si un champ de correspondance obsolète dans Salesforce vous fait envoyer un e-mail de prospection froide au Chief Revenue Officer d'un client existant ? Les données du monde réel sont désordonnées. Les humains ont du mal à les gérer, et les modèles ne franchissent pas miraculeusement ce seuil. Pour créer de l'ordre dans ce chaos, il faut concevoir des agents spécialisés autour de la forme spécifique du problème, et non pas simplement pointer un assistant générique vers le CRM. En fait, basé sur nos données, nous constatons que notre qualité et notre fraîcheur des données sont déjà supérieures à celles du client lui-même, donc par défaut, nous nous ancrons sur nos propres données.

Les garde-fous ne servent pas seulement à empêcher les mauvaises choses. C'est précisément pour cela que le client paie

Les garde-fous sont gravement sous-estimés. Même au sein d'un même produit, chaque cas d'usage nécessite ses propres garde-fous. Pour nous, les garanties requises pour un lead financier réglementé sont complètement différentes de celles pour un client SaaS de taille moyenne. Et ces garanties se répercutent sur la façon dont l'agent écrit, qui il peut contacter, quelles données il peut accéder, ce qu'il peut dire au téléphone, et comment chaque décision est enregistrée.

Un système « unique pour tous » s'effondrerait face à ces différences. Les garde-fous doivent être construits par cas d'usage, configurés par client, et audités en continu, et ce travail incombe entièrement à l'entreprise applicative. C'est pourquoi nous avons besoin d'ingénieurs de déploiement sur site et de stratèges de déploiement technique pour ajuster selon les exigences de chaque client.

Par exemple, nous avons travaillé avec une institution du Fortune 1000 pour effectuer des appels sortants vocaux avec consentement à leur vaste base de clients PME. Dans les premiers essais, le taux de décroché était faible. Nous avons dû itérer rapidement, apprendre comment engager ce public spécifique dans les 10 premières secondes de l'appel. Les propriétaires de PME se comportent différemment des acheteurs B2B de grande taille ou des consommateurs. Aujourd'hui, nous créons pour eux en une journée plus d'opportunités de vente que l'ensemble de leur équipe commerciale ne pouvait en créer en un mois sur ce segment.

L'exemple de l'assurance : conseils pratiques du CEO de FurtherAI

Les ventes ne sont qu'un exemple. L'assurance en est un autre, illustrant la même chose sous un angle différent. Voici comment Aman Gour, CEO de FurtherAI, comprend la « construction hors de la route de briques jaunes ».

Lorsque nous avons commencé à déployer l'IA dans les opérations réelles d'assurance, nous entendions constamment une hypothèse : le modèle est l'intelligence, le flux de travail n'est que l'échafaudage construit autour.

Mais plus nous travaillions avec des compagnies d'assurance, plus nous étions convaincus que c'était exactement l'inverse.

Dans l'industrie de l'assurance, beaucoup d'intelligence réside déjà dans le flux de travail lui-même. Deux compagnies d'assurance peuvent faire passer une soumission par un chemin qui semble identique : soumission, examen, devis, souscription. Le chemin lui-même est facile. Ce qui distingue vraiment les deux compagnies, c'est tout ce qui est à l'intérieur du chemin : quels risques nécessitent une escalade, quels signaux de perte sont importants, quelle règle de préférence de souscription prime en cas de conflit, quand une confirmation humaine est obligatoire, quelles données externes doivent être récupérées, et comment la décision finale est enregistrée.

Cette logique n'existe pas dans un moteur de règles propre. Elle est dispersée dans les procédures opérationnelles standard, les validations des managers, la philosophie de souscription, l'appétit pour le risque spécifique à la compagnie, et des années d'expérience opérationnelle. Beaucoup de cela n'est pas écrit sous une forme directement lisible par un modèle.

C'est pourquoi nous ne croyons pas aux agents purs qui raisonnent à partir de zéro à chaque fois, ni aux flux de travail rigides qui s'effondrent face à la complexité réelle. Au lieu de cela, nous construisons des flux de travail d'agents. Le flux de travail apporte la répétabilité, l'auditabilité et le contrôle des coûts ; l'agent gère la variabilité et rétablit le processus lorsque le chemin idéal est rompu ; les humains restent dans la boucle aux endroits impliquant jugement et responsabilité.

Le premier jour, ce système automatise le travail manuel. Mais avec le temps, chaque escalade devient un signal, chaque exception un retour d'information, chaque correction humaine vous dit où le manuel d'opérations d'origine est incomplet. Avec le temps, le flux de travail ne devient plus juste un script, mais la mémoire opérationnelle de la compagnie d'assurance.

C'est précisément la partie que les grands laboratoires de modèles ont du mal à atteindre. Ils continueront à publier de meilleurs modèles et de meilleurs agents généraux, et ils devraient le faire. Mais ils ne resteront pas longtemps dans le flux de travail de production d'une compagnie d'assurance pour apprendre pourquoi tel compte a été escaladé, pourquoi tel risque a été refusé, ou pourquoi tel souscripteur a outrepassé les directives d'appétit pour le risque, et s'est avéré avoir raison.

Cette compréhension ne peut venir que de l'exécution du même flux de travail des milliers de fois en environnement de production. Le flux de travail que vous livrez le premier jour n'est pas le fossé concurrentiel. La boucle formée par l'utilisation en production au fil du temps, c'est le fossé concurrentiel.

Pour nous, c'est le sens de « construire hors de la route de briques jaunes ».

Comment savoir si vous êtes ailleurs dans le pays d'Oz, ou toujours sur la route de briques jaunes ?

Test des outils et des étapes

Combien d'étapes ce travail nécessite-t-il ? À quel point les outils que vous devez construire pour le supporter sont-ils complexes ?

Comparez une recherche par une IA horizontale dans Google Drive : c'est une opération en une étape sur un outil, avec une grande tolérance aux erreurs dans le résultat. L'utilisateur lit le résumé, et si c'est faux, il repose la question.

Maintenant, regardez une tâche de modification de ligne rouge juridique en plusieurs étapes basée sur des précédents des trois dernières années d'un cabinet d'avocats : cela peut impliquer des dizaines d'étapes, plusieurs outils, la sortie doit passer par une revue de partenaire, et pourrait même nécessiter une argumentation en cour. Les deux ressemblent à « un agent qui fait quelque chose », mais seul le second nécessite ce logiciel profond construit par une équipe concentrée pendant des années.

Test du système

Construisez-vous un système dans lequel le client exécute son travail, ou ajoutez-vous un outil sur un système que le client possède déjà ?

Un système possède le flux de travail de bout en bout : capture des données, gouvernance, enregistrement du travail effectué. Le client pointe vers ce système en décrivant comment le travail réel se produit. Un outil ajoute juste une couche d'intelligence au flux de travail que le client exécute déjà.

Les produits de type outil peuvent aussi générer de vrais revenus, mais les grands laboratoires de modèles peuvent plus facilement les reprendre, car le client ne dépend pas de vous en tant que couche d'orchestration. Un ACV élevé est souvent le signe d'un produit de type système, car le système remplace de vrais effectifs, et est donc payé en conséquence. Mais ce n'est pas une garantie absolue. Vous devez vous demander : si un grand laboratoire de modèles lance un produit qui semble directement concurrent du vôtre, le client aura-t-il encore besoin de votre outil ? Si la réponse est oui, vous construisez un système. Si la réponse est non, vous êtes un outil – même si votre ACV est élevé.

Test du fonds de couverture / du compte de résultat

La performance des grands laboratoires de modèles est jugée par des benchmarks ; la performance des entreprises ailleurs dans le pays d'Oz est jugée par le compte de résultat du client.

Le client ne se soucie pas du score de votre modèle sur SWE-Bench ou MMLU. Il se soucie de : votre agent a-t-il conclu la vente, a-t-il correctement modifié la ligne rouge du contrat, a-t-il souscrit la bonne police. Si le client se concentre sur le résultat d'un flux de travail spécifique, et non sur un score de capacité générique, vous êtes ailleurs dans le pays d'Oz. Si le client paie pour une capacité générique, alors vous vendez ce qu'il peut obtenir via un siège Claude ou Codex.

Les meilleures entreprises d'agents doivent exécuter comme un fonds de couverture : elles gagnent sur l'alpha, et l'alpha se mesure dans le compte de résultat du client, pas dans les scores de benchmark.

Les deux peuvent gagner, et gagneront

Nous verrons d'énormes gagnants à la fois sur la route de briques jaunes et en dehors. Les modèles continueront de gagner, car ils possèdent le modèle et ont la capacité de distribution conçue pour les outils horizontaux.

Ailleurs dans le pays d'Oz peut aussi gagner, à condition de posséder le système de travail : c'est-à-dire l'interface où l'entreprise exécute réellement le travail, et les données qui y circulent et sont capturées. Ces entreprises possèdent la capture de données, le système d'actions de flux de travail et la gouvernance. À mesure que les flux de travail complexes d'un domaine vertical mûrissent, ils se combinent en une expérience centrale dont le client ne peut se passer. À mesure que les acteurs existants et les nouveaux entrants publient de nouvelles générations de modèles, cette entreprise devient la couche qui intègre et livre ces modèles au client. Le modèle sous-jacent est remplaçable, mais le système de travail ne l'est pas.

La prochaine génération de logiciels d'entreprise sera construite ailleurs que sur la route de briques jaunes.

Questions liées

QQuel est le concept principal présenté par a16z pour les entreprises en intelligence artificielle (IA) ?

Aa16z utilise la métaphore du 'Chemin de Brique Jaune' pour illustrer les opportunités en IA. Les startups doivent éviter ce chemin, qui est déjà occupé par des géants comme OpenAI, et se concentrer plutôt sur les 'autres parties d'Oz' – des scénarios verticaux et complexes liés à des secteurs spécifiques, où la valeur réside dans l'intégration du modèle, les flux de travail et la connaissance du domaine.

QPourquoi les startups en IA devraient-elles se concentrer sur les 'autres parties d'Oz' plutôt que sur le 'Chemin de Brique Jaune' ?

ALes 'autres parties d'Oz' offrent des défis verticaux et complexes où la valeur ne vient pas seulement du modèle de base, mais de l'échafaudage qui l'entoure : intégration dans des flux de travail métier, gestion de la conformité, accumulation de données spécifiques et gestion de la complexité opérationnelle. Ces aspects constituent une barrière à l'entrée et une valeur durable que les grands laboratoires de modèles, axés sur des solutions horizontales, ont du mal à reproduire.

QQuels sont les principaux avantages défensifs dont disposent les entreprises opérant dans les 'autres parties d'Oz' ?

ALes principaux avantages défensifs sont : 1) La roue d'apprentissage basée sur des données et connaissances spécifiques à un secteur, 2) La capacité à gérer la volatilité et la complexité des modèles en routant les requêtes vers le meilleur modèle pour chaque sous-tâche, 3) L'optimisation des coûts en utilisant une combinaison de modèles, et 4) La fourniture d'une gouvernance et d'une conformité adaptées à des réglementations sectorielles spécifiques.

QComment l'article illustre-t-il la différence entre un 'outil' et un 'système' pour les applications d'IA ?

AUn 'outil' ajoute une couche d'intelligence à un flux de travail existant du client (ex: un assistant d'écriture). Un 'système' est l'interface même où le travail est exécuté, possédant de bout en bout la capture des données, la gouvernance et l'enregistrement des tâches. Les systèmes sont plus résilients car les clients en dépendent pour leur fonctionnement central, tandis que les outils sont plus facilement remplaçables par des offres génériques des grands laboratoires.

QQuel test l'article propose-t-il pour déterminer si une entreprise est sur le 'Chemin de Brique Jaune' ou dans les 'autres parties d'Oz' ?

AL'article propose plusieurs tests, dont le 'Test du Fonds de Couverture / Compte de Résultat' : si la performance de l'entreprise est jugée sur les résultats concrets dans le compte de résultat du client (ex: ventes générées, polices souscrites), elle est dans les 'autres parties d'Oz'. Si elle est jugée sur des scores de benchmarks génériques (comme MMLU), elle est probablement sur le 'Chemin de Brique Jaune', en concurrence frontale avec les grands modèles.

Lectures associées

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

Trois ans après ses prédictions sur ChatGPT en mars 2023, Wang Jianshuo revient sur ses vingt affirmations initiales, évaluées en mai 2026 par des agents IA. Sur les vingt points, la majorité des tendances de fond étaient correctes : l'essor du RAG comme architecture dominante pour l'injection de connaissances, le rôle central de l'interface utilisateur en langage naturel (LUI), l'émergence de protocoles pour un "réseau d'agents", et le rattrapage technologique rapide des modèles chinois. Des erreurs notables portent sur des chiffres précis, comme les 100 billions de paramètres supposés de GPT-4 (en réalité environ 1,8 billion) ou une estimation trop basse des coûts de formation des grands modèles. Certaines prévisions se sont révélées trop absolues ("l'IA ne fera jamais de mathématiques pures") ou ont négligé les disparités (aucune vague de chômage massif, mais un impact sévère sur les jeunes diplômés). L'analyse révèle que les intuitions sur les mécanismes et les directions se sont avérées bien plus fiables que les prédictions numériques ou temporelles, souvent trop optimistes à court terme. La prudence dans les formulations et la reconnaissance des incertitudes se sont montrées précieuses avec le recul. Ce bilan offre des leçons pour les futurs pronostics : privilégier les tendances aux chiffres, anticiper les effets distributifs et accepter que certaines questions demandent plus de trois ans pour être tranchées.

marsbitIl y a 4 h

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

marsbitIl y a 4 h

Trois ans plus tard : un retour sur mes prédictions de 2023 concernant ChatGPT

Trois ans après ses prédictions sur le ChatGPT en mars 2023, Wang Jianshuo revient sur ses 20 affirmations initiales. Évaluées en mai 2026 par des agents IA, la plupart de ses intuitions sur les grandes tendances se sont révélées justes : le RAG est devenu l'architecture standard pour intégrer des connaissances, l'Interface Utilisateur en Langage Naturel (LUI) a créé un nouvel écosystème, et les modèles chinois ont presque rattrapé les leaders mondiaux. Des concepts comme les réseaux d'agents et la nature limitée du test de Turing se sont également matérialisés. Cependant, les prévisions quantitatives et les affirmations trop absolues ont souvent échoué. Le paramétrage supposé du GPT-4 (100T) était inexact, et les coûts de développement des modèles ont dépassé les estimations. Il a sous-estimé la vitesse de personnalisation des IA et l'impact distribué sur l'emploi des jeunes. La capture de valeur a surtout bénéficié à la couche matérielle (comme Nvidia), et non aux seules applications. Les leçons clés sont que les mécanismes et les directions sont plus fiables que les chiffres précis, que l'optimisme à court terme doit être tempéré, et que les nuances ("peut-être", "pour l'instant") rendent les prédictions plus robustes. Cette rétrospective souligne l'importance de distinguer les tendances confirmées des questions toujours ouvertes.

链捕手Il y a 7 h

Trois ans plus tard : un retour sur mes prédictions de 2023 concernant ChatGPT

链捕手Il y a 7 h

Du Token à la main-d'œuvre machine : l'IA passe d'outil à « travailleur »

Alors que l'IA écrit du code, traite des tickets clients et révise des documents juridiques, elle ne se contente plus d'être un outil mais devient une source directe de travail. La commercialisation de l'IA évolue ainsi d'un marché de « jetons » (tokens) ou d'heures de GPU vers un nouveau marché : celui de la « main-d'œuvre machine ». Dans ce marché, le jeton n'est qu'une unité de mesure, le GPU un intrant, et le modèle un outil de production. L'objet véritablement tarifé et échangé est le travail économique accompli directement par le logiciel. Le mécanisme de prix de l'IA devrait évoluer des jetons bruts vers des capacités de modèles standardisées, puis vers une main-d'œuvre sectorielle, et enfin vers un marché de résultats programmables. À l'avenir, les entreprises pourraient ne plus se soucier du modèle ou du GPU spécifique utilisé, mais uniquement du fait que la tâche soit livrée dans des délais, avec un taux de précision, une fiabilité et un coût conformes aux standards. Ce changement ne signifie pas un simple remplacement du travail humain. Alors que la machine assume des tâches standardisées et vérifiables, le rôle humain pourrait se déplacer vers la supervision, la responsabilité finale, la gestion du contexte et les jugements critiques. Dans certains cas, les 1% de jugement humain final pourraient gagner en valeur, car ils permettent de débloquer les 99% d'automatisation à grande échelle. Le marché évolue donc vers une couche où le « travail » lui-même devient l'unité stable, standardisée, vérifiable et négociable. La prochaine phase de concurrence ne portera pas seulement sur la puissance des modèles ou le prix du calcul, mais sur la capacité à standardiser, vérifier et tarifer le « travail » accompli, faisant de la main-d'œuvre machine une nouvelle ressource productive que l'on peut acheter, facturer et échanger.

marsbitIl y a 8 h

Du Token à la main-d'œuvre machine : l'IA passe d'outil à « travailleur »

marsbitIl y a 8 h

La réduction de 99% du prix de Xiaomi MiMo n'est pas un coup marketing ! Luo Fuli répond aux détracteurs sur X

Dans un article intitulé "La réduction de 99% du prix de MiMo de Xiaomi n'est pas du marketing ! Luo Fuli répond aux détracteurs sur X", Luo Fuli, responsable de MiMo, a publié un billet de blog technique de 5000 mots pour expliquer la baisse drastique des prix de l'API MiMo-V2.5. Contrairement aux interprétations initiales d'une guerre des prix ou d'une stratégie de perte, cette réduction de 99% concerne spécifiquement le coût des entrées en cache ("Input Cache Hit"), c'est-à-dire la relecture du contexte historique dans les conversations longues. Le billet détaille six piliers d'ingénierie ayant permis cette réduction : 1. **Architecture Hybride SWA** : Réduction du volume de la mémoire cache (KVCache) à 1/7 grâce à une attention par fenêtre glissante sur 60 des 70 couches du modèle. 2. **Gestion en double pool** : Allocation efficace de la mémoire pour matérialiser les gains théoriques du SWA, multipliant par 5 le nombre d'utilisateurs simultanés par GPU. 3. **Cache de préfixe optimisé** : Augmentation du taux de réussite du cache à 93-95% en moyenne, évitant de recalculer les contextes répétés. 4. **Système de cache distribué GCache** : Stockage des données sur les SSD des machines GPU existantes, réduisant les coûts de stockage additionnels à zéro. 5. **Système de routage LLM-Router** : Optimisation de l'acheminement des requêtes pour maximiser l'utilisation du cache et améliorer les performances. 6. **Prédiction Multi-Token (MTP)** : Accélération de la génération des réponses du modèle, réduisant également les coûts de sortie. Cette chaîne d'optimisations systémiques a réduit le temps GPU par requête d'un ordre de grandeur, permettant une baisse de prix de 99% tout en maintenant une marge positive. Luo Fuli souligne qu'il s'agit d'un accomplissement d'ingénierie validé en production, et non d'une simple manœuvre marketing, offrant une référence pour réduire les coûts dans le secteur de l'IA.

marsbitIl y a 10 h

La réduction de 99% du prix de Xiaomi MiMo n'est pas un coup marketing ! Luo Fuli répond aux détracteurs sur X

marsbitIl y a 10 h

Analyse rétrospective des opérations magistrales de Cathie Wood sur Circle

Cathy Wood (ARK) a réalisé une opération exemplaire sur l'action Circle, démontrant une maîtrise des mouvements de marché à court terme malgré son approche d'investissement habituellement tournée vers le très long terme. Elle a d'abord acquis près de 4,5 millions d'actions au prix d'introduction de 31 dollars, profitant ainsi de l'envolée initiale due à une faible offre flottante et une forte demande. Lorsque le titre a été propulsé à près de 300 dollars en juin 2025, porté par l'adoption du projet de loi sur les stablecoins (GENIUS Act), Wood a systématiquement vendu par tranches environ 1,7 million d'actions à un prix moyen d'environ 210 dollars, réalisant ainsi des plus-values substantielles. Cette décision était motivée à la fois par des règles internes de rééquilibrage de portefeuille et par l'anticipation de l'augmentation future de l'offre d'actions. Par la suite, face à la chute de l'action (jusqu'à -83% depuis son pic), Wood a racheté progressivement sa position initiale à des prix bien inférieurs (entre environ 50 et 130 dollars), portant son portefeuille à nouveau à environ 4,5 millions d'actions fin mars 2026. L'opération illustre trois principes clés : une conviction forte sur le modèle économique à long terme de Circle (stablecoin USDC), une exécution disciplinée par tranches sans chercher à prédire les sommets ou les creux, et le respect strict de règles de gestion des risques limitant le poids d'un titre dans le portefeuille.

marsbitIl y a 14 h

Analyse rétrospective des opérations magistrales de Cathie Wood sur Circle

marsbitIl y a 14 h

Trading

Spot
Futures

Articles tendance

Comment acheter LAYER

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Solayer (LAYER) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Solayer (LAYER).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Solayer (LAYER)Après avoir acheté vos Solayer (LAYER), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Solayer (LAYER)Tradez facilement Solayer (LAYER) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

342 vues totalesPublié le 2025.02.11Mis à jour le 2025.03.21

Comment acheter LAYER

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de LAYER (LAYER) sont présentées ci-dessous.

活动图片