OpenAI mange-t-il la couche application ? a16z affirme que les véritables opportunités se trouvent au-delà des modèles généraux

marsbitPublié le 2026-05-28Dernière mise à jour le 2026-05-28

Résumé

Alors que les capacités des grands modèles de langage s'améliorent, une inquiétude émerge dans la couche applicative de l'IA : les sociétés de modèles comme OpenAI ou Anthropic, avec leurs avantages en matière de modèle, de distribution et de marque, risquent-elles d'absorber tout l'espace des applications ? L'associé d'a16z, Joe Schmidt, répond à cette question en utilisant la métaphore de la « Route de briques jaunes » du *Magicien d'Oz*. Il distingue deux catégories d'opportunités. La première, la « Route de briques jaunes », est celle que les laboratoires de grands modèles investissent directement : la génération de code, d'écrits, d'images, les assistants génériques. La seconde, « le reste du pays d'Oz », représente les scénarios verticaux complexes, intégrés aux processus métiers, dépendant de flux de travail spécifiques, de données, de conformité et d'intégrations système. Pour Schmidt, la vraie opportunité pour les startups réside dans ce second domaine. Les entreprises paient pour des systèmes responsables de résultats concrets, capables de gérer des données désordonnées, des validations multiples, des cas limites, la conformité, et l'optimisation des coûts face à l'évolution des modèles. L'article souligne que si les modèles sous-jacents deviendront plus puissants et interchangeables, la valeur durable proviendra des données, processus, connaissances métier et « mémoire opérationnelle » accumulés autour de flux de travail spécifiques. Les startups doivent éviter ...

Note de la rédaction : Alors que les capacités des grands modèles continuent de progresser, la couche applicative de l'IA fait face à une anxiété répandue : si des sociétés comme OpenAI, Anthropic, etc., maîtrisent à la fois les modèles de base, les canaux de distribution et l'avantage de marque, que reste-t-il à faire aux startups dans la couche application ?

C'est précisément la question à laquelle tente de répondre Joe Schmidt, partenaire chez a16z, dans cet article. Il emprunte la métaphore de la « route de briques jaunes » du Magicien d'Oz pour classer les opportunités d'applications d'IA en deux catégories : la première est la voie principale où les sociétés de grands modèles s'engagent elles-mêmes, comme la génération de code, l'écriture, la création d'images, les agents génériques ou les assistants de bureau horizontaux. L'autre ce sont les « autres parties du pays d'Oz », c'est-à-dire les scénarios verticaux, profonds dans les processus sectoriels, dépendants de flux de travail complexes, de sédimentation des données, de gouvernance de la conformité et de capacités d'intégration système.

Pour lui, la véritable opportunité pour les startups se trouve dans cette dernière catégorie.

De la vente à l'assurance, Joe Schmidt répète la même logique : ce pour quoi les entreprises sont vraiment prêtes à payer, ce n'est pas une fenêtre de chat plus intelligente, mais un système qui assume la responsabilité des résultats métier. Il doit comprendre l'état chaotique des données clients, gérer les validations multiples et les cas limites, assumer la responsabilité de la conformité et de l'audit, et aussi, lorsque les modèles évoluent, effectuer pour le client la migration, le routage et l'optimisation des coûts.

C'est également le jugement central de cet article sur la prochaine génération de logiciels d'entreprise : les modèles de base deviendront de plus en plus puissants, mais aussi de plus en plus remplaçables ; ce qui est vraiment irremplaçable, c'est les données, les processus, les capacités de gouvernance et la mémoire opérationnelle sédimentés autour d'industries et de flux de travail spécifiques. L'opportunité pour les entreprises d'applications d'IA ne réside pas dans la lutte avec les sociétés de modèles pour la « route de briques jaunes », mais dans l'exploration de ces lieux plus complexes, plus désordonnés, plus lents, mais aussi plus proches de la véritable valeur commerciale.

Voici l'article original :

Récemment, j'entends sans cesse la même question de la part de fondateurs et de futurs employés : reste-t-il quelque chose à faire dans la couche application de l'IA ? Ou bien OpenAI et Anthropic finiront-ils par tout tuer ?

Derrière cette question se cache une anxiété typique de l'ère de l'IA. Certains en ont déjà conclu que si l'on ne veut pas être relégué définitivement à la base, les seules positions à valeur durable sont soit au sein des grands laboratoires de modèles, soit dans l'entrepreneuriat dans des domaines de pointe comme la robotique, les hard tech ou assimilés – en théorie, donc, à faire des choses que « les laboratoires ne touchent pas ». Car si chaque type de logiciel doit être avalé, soit directement par Codex ou Claude qui absorberait le travail correspondant, soit par un futur modèle le rendant obsolète, le meilleur choix semble être : fuyez !

Je l'avoue, je suis moi-même presque un maximaliste de l'IA, et je pense qu'ils ont raison à moitié. Les grands laboratoires de modèles entrent effectivement dans de vastes zones de la couche application. Mais la « couche application » n'est pas un ensemble homogène d'opportunités. Le critère de jugement vraiment important est : marchez-vous sur la « route de briques jaunes », ou ailleurs dans le pays d'Oz.

La « route de briques jaunes » est notre métaphore pour décrire le chemin que les grands laboratoires de modèles empruntent et sur lequel ils consacrent d'énormes ressources. Des problèmes comme la génération de code, l'écriture, la création d'images sont naturellement adaptés aux laboratoires parce qu'ils s'améliorent avec l'augmentation des capacités brutes des modèles : chaque dollar investi dans le pré-entraînement et le post-entraînement améliore directement la qualité du produit.

Mais ailleurs dans le pays d'Oz, existent des problèmes plus complexes, généralement plus verticaux. Ils ne se résument pas à fournir simplement un outil horizontal à un utilisateur d'entreprise, en le branchant sur des outils et capacités informatiques standards. La valeur ici provient davantage de l'échafaudage construit autour du modèle : cet échafaudage qui rend la sortie fiable, conforme et véritablement intégrée aux processus métier dans une industrie spécifique. Les capacités brutes du modèle sous-jacent restent bien sûr importantes, mais ne sont plus le tout.

Nous le voyons en temps réel. OpenAI et Anthropic reconnaissent en fait au marché : ils ne peuvent pas résoudre tous les problèmes avec un assistant IA générique unique. Ils ont annoncé investir massivement dans des projets conjoints de déploiement en première ligne, construisant des entreprises entières autour de la configuration et de la personnalisation de modèles pour les entreprises. S'ils pensaient vraiment que la prochaine version de modèle résoudrait ces problèmes, ils n'investiraient pas des milliards dans ce type de projets.

Donc, si vous voulez gagner de l'argent avec des applications d'IA, ne prenez pas la route de briques jaunes, allez construire ailleurs dans le pays d'Oz. Voici ce que nous, ainsi que certains fondateurs de notre portefeuille, avons appris en pratique.

La route de briques jaunes

Si vous fondez une entreprise, la route de briques jaunes est la voie la plus évidente, mais aussi la plus dangereuse. Prenez un modèle haute performance, connectez-le à des connecteurs prêts à l'emploi comme Google Drive, Slack, Salesforce, Notion, GitHub, et superposez une couche d'orchestration d'agents intelligents par-dessus. Ça ressemble à de la magie.

Le problème est que c'est exactement ce que les grands laboratoires de modèles font avec Coworker et Codex. Il est clair qu'ils possèdent le modèle, ce qui signifie qu'ils ont de meilleures marges, un meilleur contrôle, et peuvent aussi exercer un pouvoir de fixation des prix sur tous les acteurs en aval. Mais peut-être plus important encore, ils contrôlent également les choix d'architecture qui déterminent à quels problèmes le produit est adapté. Jusqu'à présent, ils ont très délibérément adopté un modèle « modèle + appel d'outils », qui est précisément le modèle requis pour les travaux horizontaux, à faible nombre d'étapes, sur la route de briques jaunes. Même si une startup parvenait d'une manière ou d'une autre à surpasser Codex ou Claude Code, les grands laboratoires de modèles conservent une énorme capacité de distribution, ainsi que l'aura de marque la plus forte dans le domaine de l'IA.

Si vous êtes une entreprise d'application d'IA qui joue selon le même playbook : se connecter aux mêmes connecteurs, sans sous-agents ou configuration en dessous, et sans canaux de distribution, vous êtes probablement sur une route qui ne mène nulle part.

Ailleurs dans le pays d'Oz

Pour les startups, la situation n'est pas entièrement pessimiste. En dehors de la route de briques jaunes, il existe encore d'énormes opportunités. Les startups peuvent y trouver des clients et résoudre des problèmes complexes.

Ces entreprises construisent des expériences d'agents intelligents : le modèle est tissé dans un réseau complexe d'outils, d'automatisations et d'intégrations – en d'autres termes, du logiciel. Cela rend également la plupart de ces startups naturellement verticales. Elles peuvent se concentrer sur des flux de travail multi-étapes, multi-intervenants, concevoir des sous-agents pour différents rôles et scénarios verticaux, traiter des problèmes difficiles à atteindre pour les plateformes horizontales d'Anthropic et OpenAI : collecter du contexte à travers des systèmes, puis router les tâches vers plusieurs personnes nécessitant une validation à différentes étapes.

Ce type de travail implique généralement un ou plusieurs systèmes hérités, exige souvent des résultats déterministes car l'ambiguïté est inacceptable, et est parfois directement lié à un résultat commercial important. Les grands laboratoires de modèles savent bien sûr combien ces problèmes sont précieux : c'est pourquoi ils construisent leurs propres équipes de configuration externalisées, et c'est pourquoi toute une catégorie d'entreprises de services de renforcement de l'apprentissage pour les grands clients émerge.

Pourquoi le reste du pays d'Oz ne sera pas entièrement occupé par le « Magicien »

Une objection à l'argument ci-dessus est : jusqu'à présent, parier que les modèles ou les laboratoires ne continueront pas à progresser a toujours été un très mauvais pari. Ils vont probablement continuer à s'améliorer et finir par avaler les marchés servis par ces entreprises applicatives.

Les grands laboratoires de modèles vont certainement continuer à progresser. Mais je pense que les entreprises ailleurs dans le pays d'Oz ont, à long terme, plusieurs moyens de se défendre.

Les données et l'effet boule de neige de l'apprentissage

Beaucoup de ce que vous internalisez vraiment dans une activité n'existe dans aucun ensemble d'entraînement : les conventions sectorielles non écrites, les normes non documentées, la connaissance tribale dans la tête des praticiens. Elles ne sont pas sur l'internet public. Peu importe la puissance de calcul d'entraînement investie, elle ne peut remplacer le fait de pénétrer réellement à l'intérieur des flux de travail où réside cette connaissance.

Deux effets boule de neige se superposent ici : l'un est l'effet inter-clients, c'est-à-dire que lorsque vous voyez plus de variations du même type de problème, les modèles s'amplifient de manière exponentielle ; l'autre est l'effet intra-client, c'est-à-dire que les raisons derrière des décisions spécifiques, les exceptions non dites, les règles empiriques propres à l'entreprise, n'émergent que lorsque les utilisateurs interagissent réellement avec le système.

Même si les données clients ne peuvent pas être utilisées d'un client à l'autre, l'entreprise applicative peut toujours tirer parti de la reconnaissance de modèles pour différents types de problèmes clients et l'utiliser pour guider la conception architecturale des problèmes futurs. Une entreprise qui a déjà fait traiter cent modifications de ligne rouge juridique, mille cycles de souscription d'assurance, ou dix mille activités de développement commercial SDR par ses agents, a une compréhension de la forme des problèmes qu'un nouvel arrivant ne peut pas reproduire dès le premier lancement d'un nouvel agent.

Théoriquement, un agent horizontal pourrait construire la même infrastructure d'apprentissage. Mais la raison pour laquelle il ne le fait pas, outre le manque de concentration, est principalement l'expérience utilisateur. Capturer ce type de connaissance dépend entièrement du type d'interface de flux de travail que vous offrez à l'utilisateur. Les acteurs verticaux peuvent concevoir ces interfaces autour des informations qui ont vraiment besoin d'être exposées pour un flux de travail spécifique, ce que les outils horizontaux ne peuvent pas faire. Les ensembles d'évaluation, les sorties annotées, les systèmes de classification des cas limites peuvent se combiner en un effet boule de neige de données dans un domaine vertical, soutenant ainsi le fine-tuning. Un nouvel arrivant sans une exposition en environnement de production de taille équivalente aura du mal à générer un tel effet. Sa faisabilité dépend des droits sur les données, de l'utilisation productive accumulée et de la structure contractuelle avec les clients, mais la reconnaissance de modèles elle-même continue de s'accumuler.

Gérer la volatilité et la complexité des modèles

Les grands laboratoires de modèles font déjà du routage en interne : appeler différentes catégories de modèles pour différentes requêtes, utiliser des ensembles de modèles en coulisses. Mais ce qu'ils ne peuvent pas faire, c'est du routage inter-fournisseurs, ni évaluer facilement les modèles concurrents pour une sous-tâche spécifique, ou utiliser le véritable modèle open source fine-tuné le plus adapté pour un point étroit.

Les entreprises ailleurs dans le pays d'Oz choisiront le modèle le plus approprié pour chaque sous-tâche dans tout le marché des modèles, et pas seulement le modèle publié par un laboratoire mère. Elles assumeront également les tâches que personne ne veut faire : ré-exécuter les évaluations à chaque nouvelle version de modèle, recalibrer les prompts pour les cas limites des clients, mettre en production sans casser l'environnement. Les grands laboratoires de modèles ne feront pas cela pour le client. Ils vous vendent le nouveau modèle et vous disent de migrer. Les entreprises ailleurs dans le pays d'Oz absorbent le coût de migration. Le client obtient la meilleure capacité intelligente du marché, ainsi que la continuité à travers chaque mise à niveau.

Optimisation des coûts

Envoyer chaque requête à Opus 4.7 est le moyen le plus rapide de faire virer la marge brute au négatif. Les meilleures entreprises d'Oz feront du routage entre différents niveaux de modèles : les tâches les plus difficiles aux modèles de pointe, la plupart des tâches aux modèles intermédiaires, et dans les zones où cela a été prouvé possible, utiliser des modèles personnalisés plus petits ou fine-tunés.

Certaines de ces entreprises font maintenant leur propre post-entraînement sur cette base, optimisant le modèle pour le petit segment de travail qui intéresse vraiment le client, et fournissant le service à un coût bien inférieur à un appel API de pointe. Les grands laboratoires de modèles fixent un prix « plancher » : le niveau d'intelligence minimum que vous pouvez obtenir pour X dollars. Les entreprises d'Oz vendent l'inverse : le coût en dollars le plus bas pour le niveau d'intelligence réellement nécessaire par un flux de travail spécifique. Cela n'est possible que si vous savez très précisément quel niveau d'intelligence est nécessaire pour chaque sous-tâche. Et les grands laboratoires de modèles ne peuvent structurellement pas connaître chaque tâche dans chaque secteur vertical. Finalement, cela se traduit directement par une tarification par résultat plus basse et plus contrôlable.

Gouvernance

Devenir le plan de contrôle où un client exécute l'IA dans un domaine vertical crée une valeur considérable. Ce plan de contrôle est l'endroit où convergent les autorisations, l'audit, ce que l'agent est autorisé à faire, et ce que l'agent a réellement fait.

Ce plan de contrôle est construit sur des garde-fous pour des cas d'usage spécifiques, et ces garde-fous sont complètement différents selon les secteurs et les types de postes. Parce que ces entreprises possèdent de bout en bout les outils, les flux de travail et les données auxquels l'agent a accès, elles peuvent fournir des résultats déterministres d'une manière difficile à réaliser pour les outils horizontaux. Elles absorbent également la complexité réglementaire pour l'acheteur final : les règles fédérales de procédure civile et les règles de déontologie des avocats dans le droit, HIPAA dans la santé, les règles de la SEC et de la FINRA en finance, la régulation des assurances au niveau des États, etc. Les acteurs horizontaux ne peuvent pas faire cela de manière crédible sans se transformer en cent secteurs verticaux différents. Le DSI a besoin d'un partenaire qui peut s'engager clairement dans un contrat : il assumera la responsabilité du traitement de la conformité pour les agents qu'il fournit.

Tout cela revient finalement à la même chose : la concentration.

Cette concentration peut être un secteur vertical, comme l'assurance, le droit, la comptabilité ; ou une fonction suffisamment approfondie, comme les ventes, le service client, les finances. Quelle qu'elle soit, ce travail nécessite qu'une équipe s'immerge longtemps dans le même type de clientèle, comprenne ses flux de travail, ses cas limites et ses exigences réglementaires. Les grands laboratoires de modèles ne sont pas construits pour cela. Ils doivent servir tout le monde, couvrir partout, et c'est aussi pourquoi ils ont initialement construit la route de briques jaunes. Le même compromis les empêchera d'entrer ailleurs dans le pays d'Oz : vous pouvez être partout à la fois, ou excellent dans une chose, mais pas les deux.

L'exemple des ventes : conseils pratiques du CEO technique de 11x

En pratique, comment comprendre cela ? Voici quelques conseils pratiques de Prabhav Jain, CEO de 11x.

Se concentrer sur les résultats

Un chemin tactique viable pour construire une entreprise résistante aux grands laboratoires de modèles est de partir des résultats concrets qui intéressent vraiment le client. Pour nous, ce résultat est d'aider les entreprises à générer plus de prospects et de pipeline de ventes.

À partir de là, les questions deviennent très spécifiques : quelles activités voulons-nous posséder de bout en bout et qui font réellement progresser le pipeline de ventes ? Décomposez chaque activité en tâches. Quelles tâches conviennent à un agent, lesquelles non ? Quelles tâches nécessitent des insights sectoriels complexes, lesquelles non ? Les grands laboratoires de modèles lanceront aussi des flux de travail, mais lorsqu'une étape de flux de travail comporte de nombreuses étapes, des entrées désordonnées, un état difficile à interpréter, ou des contraintes du monde réel, un simple meilleur modèle ne suffit pas. Le travail revient alors à l'ingénierie logicielle traditionnelle, et à ce niveau, les grands laboratoires de modèles n'ont pas d'avantage sur une entreprise applicative concentrée.

Par exemple, certaines des tâches que nous traitons incluent : la prospection de leads basée sur des signaux personnalisés, l'enrichissement d'informations sur les leads, la recherche approfondie sur les comptes, l'extraction de contexte du CRM, la rédaction de messages pour différents canaux, l'agent de qualification des leads, et le système de délivrabilité des e-mails. Certaines sont des tâches d'agent, d'autres non. Ces tâches ne se font pas en une seule prompt, elles nécessitent des capacités d'ingénierie approfondies.

L'idée clé de l'analogie avec le pays d'Oz est : dans tout flux de travail réel, environ la moitié des tâches ne sont pas des tâches d'agent, et cette moitié n'apporte pas d'avantage de laboratoire. Sous la couche du modèle, leur capacité à écrire du logiciel déterministe n'est pas meilleure que la vôtre. Et l'autre moitié des tâches d'agent exige toujours de vous que vous ajustiez, entraîniez et contraigniez le modèle autour du résultat réellement désiré.

La connaissance du domaine n'est souvent pas dans les données d'entraînement générales. Ces capacités doivent être construites de bas en haut à partir du secteur vertical ou de la fonction spécifique, et fournies au modèle au bon moment dans le flux de travail. Lorsque notre agent qualifie un lead entrant par téléphone, il doit être formé à comprendre ce qui constitue une bonne conversation de vente pour un secteur et un profil d'utilisateur spécifiques. C'est le travail de l'entreprise applicative, et cette capacité s'amplifie exponentiellement.

Plus important encore, ces capacités deviennent constamment obsolètes, car l'entreprise elle-même évolue. Ainsi, votre capacité à faire évoluer continuellement le flux de travail et le contexte devient elle-même un avantage concurrentiel. Par exemple, lorsque nous avons commencé le produit d'emailing sortant à grande échelle, les « e-mails écrits par l'IA » commençaient tout juste à apparaître. Aujourd'hui, les gens ont développé une sensibilité aiguë pour distinguer quels e-mails sont écrits par l'IA et lesquels ressemblent plus à des humains, et le point clé est que ce jugement change tous les quelques mois. Nos agents doivent s'ajuster constamment à la dynamique du marché, mais c'est précisément là que se construit le fossé concurrentiel. En fait, malgré cette dynamique, notre taux de réponse positive a été multiplié par 4 au cours des derniers mois et a créé des centaines de millions de dollars de pipeline de ventes pour nos clients.

S'attaquer à des problèmes de haute complexité

Les problèmes complexes sont l'endroit où la valeur commerciale se libère réellement. Sinon, vous risquez de vous retrouver avec une simple couche d'emballage mince.

Décomposez un problème commercial suffisamment complexe, et vous verrez rapidement le désordre apparaître. Voici un exemple simple en apparence du domaine GTM : si une entreprise est déjà votre cliente, vous ne devriez pas contacter un contact dans cette entreprise. Mais ce n'est pas du tout simple.

Peut-être avez-vous le domaine de cette entreprise dans votre CRM. Mais que faire des entreprises avec des dizaines de filiales ? Et si l'enregistrement dans Salesforce utilise le domaine de la société mère ? Et si un champ de correspondance obsolète dans Salesforce vous fait envoyer un e-mail de prospection froide au Chief Revenue Officer d'un client existant ? Les données du monde réel sont désordonnées. Les humains ont du mal à les gérer, et les modèles ne franchissent pas miraculeusement ce seuil. Pour créer de l'ordre dans ce chaos, il faut concevoir des agents spécialisés autour de la forme spécifique du problème, et non pas simplement pointer un assistant générique vers le CRM. En fait, basé sur nos données, nous constatons que notre qualité et notre fraîcheur des données sont déjà supérieures à celles du client lui-même, donc par défaut, nous nous ancrons sur nos propres données.

Les garde-fous ne servent pas seulement à empêcher les mauvaises choses. C'est précisément pour cela que le client paie

Les garde-fous sont gravement sous-estimés. Même au sein d'un même produit, chaque cas d'usage nécessite ses propres garde-fous. Pour nous, les garanties requises pour un lead financier réglementé sont complètement différentes de celles pour un client SaaS de taille moyenne. Et ces garanties se répercutent sur la façon dont l'agent écrit, qui il peut contacter, quelles données il peut accéder, ce qu'il peut dire au téléphone, et comment chaque décision est enregistrée.

Un système « unique pour tous » s'effondrerait face à ces différences. Les garde-fous doivent être construits par cas d'usage, configurés par client, et audités en continu, et ce travail incombe entièrement à l'entreprise applicative. C'est pourquoi nous avons besoin d'ingénieurs de déploiement sur site et de stratèges de déploiement technique pour ajuster selon les exigences de chaque client.

Par exemple, nous avons travaillé avec une institution du Fortune 1000 pour effectuer des appels sortants vocaux avec consentement à leur vaste base de clients PME. Dans les premiers essais, le taux de décroché était faible. Nous avons dû itérer rapidement, apprendre comment engager ce public spécifique dans les 10 premières secondes de l'appel. Les propriétaires de PME se comportent différemment des acheteurs B2B de grande taille ou des consommateurs. Aujourd'hui, nous créons pour eux en une journée plus d'opportunités de vente que l'ensemble de leur équipe commerciale ne pouvait en créer en un mois sur ce segment.

L'exemple de l'assurance : conseils pratiques du CEO de FurtherAI

Les ventes ne sont qu'un exemple. L'assurance en est un autre, illustrant la même chose sous un angle différent. Voici comment Aman Gour, CEO de FurtherAI, comprend la « construction hors de la route de briques jaunes ».

Lorsque nous avons commencé à déployer l'IA dans les opérations réelles d'assurance, nous entendions constamment une hypothèse : le modèle est l'intelligence, le flux de travail n'est que l'échafaudage construit autour.

Mais plus nous travaillions avec des compagnies d'assurance, plus nous étions convaincus que c'était exactement l'inverse.

Dans l'industrie de l'assurance, beaucoup d'intelligence réside déjà dans le flux de travail lui-même. Deux compagnies d'assurance peuvent faire passer une soumission par un chemin qui semble identique : soumission, examen, devis, souscription. Le chemin lui-même est facile. Ce qui distingue vraiment les deux compagnies, c'est tout ce qui est à l'intérieur du chemin : quels risques nécessitent une escalade, quels signaux de perte sont importants, quelle règle de préférence de souscription prime en cas de conflit, quand une confirmation humaine est obligatoire, quelles données externes doivent être récupérées, et comment la décision finale est enregistrée.

Cette logique n'existe pas dans un moteur de règles propre. Elle est dispersée dans les procédures opérationnelles standard, les validations des managers, la philosophie de souscription, l'appétit pour le risque spécifique à la compagnie, et des années d'expérience opérationnelle. Beaucoup de cela n'est pas écrit sous une forme directement lisible par un modèle.

C'est pourquoi nous ne croyons pas aux agents purs qui raisonnent à partir de zéro à chaque fois, ni aux flux de travail rigides qui s'effondrent face à la complexité réelle. Au lieu de cela, nous construisons des flux de travail d'agents. Le flux de travail apporte la répétabilité, l'auditabilité et le contrôle des coûts ; l'agent gère la variabilité et rétablit le processus lorsque le chemin idéal est rompu ; les humains restent dans la boucle aux endroits impliquant jugement et responsabilité.

Le premier jour, ce système automatise le travail manuel. Mais avec le temps, chaque escalade devient un signal, chaque exception un retour d'information, chaque correction humaine vous dit où le manuel d'opérations d'origine est incomplet. Avec le temps, le flux de travail ne devient plus juste un script, mais la mémoire opérationnelle de la compagnie d'assurance.

C'est précisément la partie que les grands laboratoires de modèles ont du mal à atteindre. Ils continueront à publier de meilleurs modèles et de meilleurs agents généraux, et ils devraient le faire. Mais ils ne resteront pas longtemps dans le flux de travail de production d'une compagnie d'assurance pour apprendre pourquoi tel compte a été escaladé, pourquoi tel risque a été refusé, ou pourquoi tel souscripteur a outrepassé les directives d'appétit pour le risque, et s'est avéré avoir raison.

Cette compréhension ne peut venir que de l'exécution du même flux de travail des milliers de fois en environnement de production. Le flux de travail que vous livrez le premier jour n'est pas le fossé concurrentiel. La boucle formée par l'utilisation en production au fil du temps, c'est le fossé concurrentiel.

Pour nous, c'est le sens de « construire hors de la route de briques jaunes ».

Comment savoir si vous êtes ailleurs dans le pays d'Oz, ou toujours sur la route de briques jaunes ?

Test des outils et des étapes

Combien d'étapes ce travail nécessite-t-il ? À quel point les outils que vous devez construire pour le supporter sont-ils complexes ?

Comparez une recherche par une IA horizontale dans Google Drive : c'est une opération en une étape sur un outil, avec une grande tolérance aux erreurs dans le résultat. L'utilisateur lit le résumé, et si c'est faux, il repose la question.

Maintenant, regardez une tâche de modification de ligne rouge juridique en plusieurs étapes basée sur des précédents des trois dernières années d'un cabinet d'avocats : cela peut impliquer des dizaines d'étapes, plusieurs outils, la sortie doit passer par une revue de partenaire, et pourrait même nécessiter une argumentation en cour. Les deux ressemblent à « un agent qui fait quelque chose », mais seul le second nécessite ce logiciel profond construit par une équipe concentrée pendant des années.

Test du système

Construisez-vous un système dans lequel le client exécute son travail, ou ajoutez-vous un outil sur un système que le client possède déjà ?

Un système possède le flux de travail de bout en bout : capture des données, gouvernance, enregistrement du travail effectué. Le client pointe vers ce système en décrivant comment le travail réel se produit. Un outil ajoute juste une couche d'intelligence au flux de travail que le client exécute déjà.

Les produits de type outil peuvent aussi générer de vrais revenus, mais les grands laboratoires de modèles peuvent plus facilement les reprendre, car le client ne dépend pas de vous en tant que couche d'orchestration. Un ACV élevé est souvent le signe d'un produit de type système, car le système remplace de vrais effectifs, et est donc payé en conséquence. Mais ce n'est pas une garantie absolue. Vous devez vous demander : si un grand laboratoire de modèles lance un produit qui semble directement concurrent du vôtre, le client aura-t-il encore besoin de votre outil ? Si la réponse est oui, vous construisez un système. Si la réponse est non, vous êtes un outil – même si votre ACV est élevé.

Test du fonds de couverture / du compte de résultat

La performance des grands laboratoires de modèles est jugée par des benchmarks ; la performance des entreprises ailleurs dans le pays d'Oz est jugée par le compte de résultat du client.

Le client ne se soucie pas du score de votre modèle sur SWE-Bench ou MMLU. Il se soucie de : votre agent a-t-il conclu la vente, a-t-il correctement modifié la ligne rouge du contrat, a-t-il souscrit la bonne police. Si le client se concentre sur le résultat d'un flux de travail spécifique, et non sur un score de capacité générique, vous êtes ailleurs dans le pays d'Oz. Si le client paie pour une capacité générique, alors vous vendez ce qu'il peut obtenir via un siège Claude ou Codex.

Les meilleures entreprises d'agents doivent exécuter comme un fonds de couverture : elles gagnent sur l'alpha, et l'alpha se mesure dans le compte de résultat du client, pas dans les scores de benchmark.

Les deux peuvent gagner, et gagneront

Nous verrons d'énormes gagnants à la fois sur la route de briques jaunes et en dehors. Les modèles continueront de gagner, car ils possèdent le modèle et ont la capacité de distribution conçue pour les outils horizontaux.

Ailleurs dans le pays d'Oz peut aussi gagner, à condition de posséder le système de travail : c'est-à-dire l'interface où l'entreprise exécute réellement le travail, et les données qui y circulent et sont capturées. Ces entreprises possèdent la capture de données, le système d'actions de flux de travail et la gouvernance. À mesure que les flux de travail complexes d'un domaine vertical mûrissent, ils se combinent en une expérience centrale dont le client ne peut se passer. À mesure que les acteurs existants et les nouveaux entrants publient de nouvelles générations de modèles, cette entreprise devient la couche qui intègre et livre ces modèles au client. Le modèle sous-jacent est remplaçable, mais le système de travail ne l'est pas.

La prochaine génération de logiciels d'entreprise sera construite ailleurs que sur la route de briques jaunes.

Questions liées

QQuel est le concept principal présenté par a16z pour les entreprises en intelligence artificielle (IA) ?

Aa16z utilise la métaphore du 'Chemin de Brique Jaune' pour illustrer les opportunités en IA. Les startups doivent éviter ce chemin, qui est déjà occupé par des géants comme OpenAI, et se concentrer plutôt sur les 'autres parties d'Oz' – des scénarios verticaux et complexes liés à des secteurs spécifiques, où la valeur réside dans l'intégration du modèle, les flux de travail et la connaissance du domaine.

QPourquoi les startups en IA devraient-elles se concentrer sur les 'autres parties d'Oz' plutôt que sur le 'Chemin de Brique Jaune' ?

ALes 'autres parties d'Oz' offrent des défis verticaux et complexes où la valeur ne vient pas seulement du modèle de base, mais de l'échafaudage qui l'entoure : intégration dans des flux de travail métier, gestion de la conformité, accumulation de données spécifiques et gestion de la complexité opérationnelle. Ces aspects constituent une barrière à l'entrée et une valeur durable que les grands laboratoires de modèles, axés sur des solutions horizontales, ont du mal à reproduire.

QQuels sont les principaux avantages défensifs dont disposent les entreprises opérant dans les 'autres parties d'Oz' ?

ALes principaux avantages défensifs sont : 1) La roue d'apprentissage basée sur des données et connaissances spécifiques à un secteur, 2) La capacité à gérer la volatilité et la complexité des modèles en routant les requêtes vers le meilleur modèle pour chaque sous-tâche, 3) L'optimisation des coûts en utilisant une combinaison de modèles, et 4) La fourniture d'une gouvernance et d'une conformité adaptées à des réglementations sectorielles spécifiques.

QComment l'article illustre-t-il la différence entre un 'outil' et un 'système' pour les applications d'IA ?

AUn 'outil' ajoute une couche d'intelligence à un flux de travail existant du client (ex: un assistant d'écriture). Un 'système' est l'interface même où le travail est exécuté, possédant de bout en bout la capture des données, la gouvernance et l'enregistrement des tâches. Les systèmes sont plus résilients car les clients en dépendent pour leur fonctionnement central, tandis que les outils sont plus facilement remplaçables par des offres génériques des grands laboratoires.

QQuel test l'article propose-t-il pour déterminer si une entreprise est sur le 'Chemin de Brique Jaune' ou dans les 'autres parties d'Oz' ?

AL'article propose plusieurs tests, dont le 'Test du Fonds de Couverture / Compte de Résultat' : si la performance de l'entreprise est jugée sur les résultats concrets dans le compte de résultat du client (ex: ventes générées, polices souscrites), elle est dans les 'autres parties d'Oz'. Si elle est jugée sur des scores de benchmarks génériques (comme MMLU), elle est probablement sur le 'Chemin de Brique Jaune', en concurrence frontale avec les grands modèles.

Lectures associées

Samsung compte sur le cycle technologique, SK Hynix sur le HBM, qu’est-ce qui a permis à Micron de gagner une capitalisation boursière de mille milliards de dollars ?

Le géant américain des semi-conducteurs Micron Technology a récemment franchi le cap des 1000 milliards de dollars de capitalisation boursière. Fondée en 1978 à Boise, dans l'Idaho, Micron est l'un des trois plus grands fabricants mondiaux de puces mémoire DRAM, aux côtés de Samsung et SK Hynix. Son parcours de survie est singulier. Contrairement à ses concurrents bénéficiant de soutiens gouvernementaux ou de capitaux abondants, Micron a souvent eu recours à des leviers politiques et juridiques pour traverser les crises. Dans les années 1980, elle a porté plainte pour dumping contre les fabricants japonais, conduisant à l'Accord semi-conducteur nippo-américain. En 2002, elle a échappé à de lourdes amendes antitrust en collaborant avec les autorités américaines contre ses concurrents. Ces manoeuvres lui ont valu l'étiquette d'"opportuniste politique". Une décision stratégique cruciale a cependant alourdi son avenir : l'acquisition en 2013 du japonais Elpida. Cette acquisition a intégré une technologie orientée vers la DRAM mobile, faisant manquer à Micron une décennie de développement clé dans la mémoire HBM (High Bandwidth Memory), essentielle pour l'IA. SK Hynix, pionnier dès 2013, domine aujourd'hui ce marché lucratif avec environ 85% des parts, laissant Micron loin derrière. Récemment, la stratégie de plainte de Micron s'est retournée contre elle. Après avoir intenté des poursuites et poussé à des restrictions contre le chinois Fujian Jinhua, la Chine a en 2023 interdit l'utilisation de ses produits dans les infrastructures critiques. Les ventes de Micron en Chine, qui représentaient une part importante de son chiffre d'affaires, se sont effondrées. Aujourd'hui, Micron est prise en tenaille par trois défis : un retard difficile à combler sur le marché haut de gamme du HBM, une érosion de ses parts sur le marché bas de gamme de la DRAM par des fabricants chinois comme CXMT, et la perte d'accès au marché chinois, privant la société d'opportunités cruciales pendant le boom de l'IA. La véritable force de Micron, qui lui a permis de résister aux cycles économiques, réside dans son contrôle des coûts de fabrication exceptionnel, fruit de décennies d'accumulation technique. Ses puces DRAM ont une surface plus petite que celles de ses concurrents, offrant un meilleur rendement par plaquette et un coût unitaire inférieur. Alors que Micron tente de rattraper son retard en HBM (elle a obtenu la certification HBM3E de Nvidia) et planifie la future génération HBM4, la question demeure : sa combinaison historique de levier politique et d'efficacité manufacturière suffira-t-elle à gagner la course de fond, basée sur la patience et l'anticipation technologique, qui définit l'ère de l'IA ? L'avenir de Micron se joue dans sa capacité à combler la "dette de temps" contractée par ses choix passés.

marsbitIl y a 9 mins

Samsung compte sur le cycle technologique, SK Hynix sur le HBM, qu’est-ce qui a permis à Micron de gagner une capitalisation boursière de mille milliards de dollars ?

marsbitIl y a 9 mins

Décryptage de l'algorithme du chercheur mystérieux Serenity et réévaluation des actifs mondiaux

Comment Serenity, un analyste anonyme, a-t-il généré un rendement de 22 500 % en deux ans ? Sa méthode clé : la « Chokepoint Theory ». Au lieu d'une approche descendante classique, il pratique un « reverse engineering » de la chaîne d'approvisionnement de l'IA pour identifier les points de blocage physique critiques et quasi irremplaçables. Il se concentre sur des composants méconnus mais essentiels, comme les éléments de la photonique sur silicium et de l'optique intégrée (CPO) pour les centres de données. Il identifie cinq goulots d'étranglement physiques : l'alignement de précision (ex: FOCI), les lasers (ex: Sivers Semiconductors), les équipements de fabrication (ex: Riber), les matières premières de haute pureté (ex: NCI) et les substrats SOI (Soitec). Son approche s'étend également à la robotique humanoïde, soulignant la dépendance occidentale aux composants hardware asiatiques et l'impact potentiellement dévastateur sur l'approvisionnement en terres rares (néodyme, dysprosium). Il a démontré l'efficacité de sa méthode avec des titres comme Raspberry Pi ($RPI), Sivers ($SIVE), ou Soitec, provoquant des réévaluations fulgurantes. Serenity combine une analyse technique profonde, des tests contradictoires avec l'IA et une exploitation des angles morts de la recherche institutionnelle pour réaliser des arbitrages informationnels. Cependant, cette stratégie présente des risques majeurs : faible liquidité des micro-capitalisations, dépendance à une seule voie technologique et accusations potentielles de manipulation de marché. Au final, sa principale leçon est méthodologique : rechercher les « interrupteurs physiques » silencieux et indispensables au sein des systèmes technologiques complexes, offrant ainsi un angle d'analyse distinct pour anticiper les réévaluations d'actifs.

marsbitIl y a 10 mins

Décryptage de l'algorithme du chercheur mystérieux Serenity et réévaluation des actifs mondiaux

marsbitIl y a 10 mins

Les régulateurs des deux côtés du détroit bloquent conjointement l'ouverture de comptes boursiers à Hong Kong, où pouvez-vous encore placer votre argent ?

Résumé : Début mai 2026, les régulateurs de Chine continentale et de Hong Kong ont conjointement resserré la réglementation concernant les comptes de courtage pour les investisseurs continentaux. La SFC de Hong Kong a émis une circulaire exigeant des déclarations écrites confirmant que les fonds d'investissement proviennent de sources légales hors de Chine, tandis que les autorités continentales ont lancé une campagne de rectification ciblant les activités transfrontalières illégales. Ces mesures ont effectivement fermé les "canaux gris" utilisés par de nombreux investisseurs continentaux via des courtiers en ligne comme Futu et Tiger Brokers. Désormais, l'ouverture de compte à Hong Kong pour les résidents continentaux est soumise à des vérifications strictes et signer la déclaration ne garantit plus l'approbation. Les comptes existants via ces plateformes sont entrés dans une période de transition de deux ans, avec des transactions en vente seule uniquement. Les voies restantes incluent certains courtiers titulaires d'une licence à Hong Kong (comme uSMART) pour les personnes répondant à des critères stricts (fonds provenant de l'étranger), ou les canaux officiels comme le Stock Connect, les QDII et le Cross-boundary Wealth Management Connect. La possession d'un compte bancaire à Hong Kong est également devenue un prérequis essentiel pour le financement des comptes de courtage. Ce resserrement marque la fin d'une période d'expansion non réglementée et redirige les flux de capitaux vers des voies d'investissement transnational plus conformes.

marsbitIl y a 18 mins

Les régulateurs des deux côtés du détroit bloquent conjointement l'ouverture de comptes boursiers à Hong Kong, où pouvez-vous encore placer votre argent ?

marsbitIl y a 18 mins

Fondateur de Hash Global : Pourquoi ai-je également choisi de liquider toutes mes ETH ?

L'auteur, fondateur de Hash Global, explique avoir vendu tous ses ETH. Il répond à un argument récent selon lequel le projet de loi américain CLARITY, en reconnaissant l'ETH comme une "marchandise numérique décentralisée", en ferait le grand gagnant, lui attribuant une prime monétaire similaire à celle du BTC ou de l'or. L'auteur reconnaît que la clarté réglementaire est un net positif, réduisant l'incertitude et facilitant l'adoption institutionnelle (ETF, garde, jalonnement, DeFi institutionnel, RWA). Cependant, il conteste fermement l'idée que cela se traduirait automatiquement par une prime monétaire aussi forte. Ses principaux arguments sont : 1. Le marché évalue toujours l'ETH sur des fondamentaux de réseau (revenus, activité DeFi, concurrence des L2, rendement du jalonnement) et non comme une réserve de valeur pure. 2. La classification juridique est un ticket d'entrée, pas une garantie de statut de réserve de valeur, qui nécessite un consensus historique et une simplicité narrative (comme le BTC "or numérique"). 3. L'avantage de l'ETH en tant qu'actif produisant du rendement (via le jalonnement) pourrait s'atténuer avec la tokenisation d'autres actifs (or, obligations) qui deviendront également productifs en DeFi. 4. La prime monétaire restera probablement l'apanage du BTC, de l'or physique et de l'or tokenisé. L'ETH est davantage l'infrastructure sur laquelle ces actifs circuleront. 5. La capture de valeur de l'ETH par rapport à sa couche 2 (L2) et à son écosystème n'est pas encore prouvée. Utiliser l'écosystème Ethereum ne signifie pas nécessairement détenir de l'ETH. 6. Les grands récits ne suffisent plus ; le marché demande des résultats concrets en termes de revenus, d'utilité et de flux de valeur. En conclusion, l'auteur considère l'ETH comme l'un des actifs d'infrastructure les plus importants du Web3, avec une valeur à long terme, mais estime que son cadre d'évaluation doit rester celui d'un *actif de réseau et d'infrastructure*, et non celui d'un *actif de réserve de valeur monétaire* pur. La clarté réglementaire corrigera le "rabais réglementaire", mais ne créera pas magiquement une prime monétaire comparable à celle de l'or.

marsbitIl y a 20 mins

Fondateur de Hash Global : Pourquoi ai-je également choisi de liquider toutes mes ETH ?

marsbitIl y a 20 mins

Iran et la Fed — Les "trois scénarios" à venir qui influenceront les marchés mondiaux

La situation en Iran et les perspectives de politique monétaire de la Fed sont devenues les deux principaux facteurs influençant les marchés mondiaux. Une analyse de Deutsche Bank explore trois scénarios possibles concernant les négociations de cessez-le-feu en Iran et leurs implications potentielles sur la trajectoire de la Fed. Le premier scénario, un accord de paix, atténuerait les pressions immédiates de hausse des taux, mais des risques à moyen terme subsisteraient si l'inflation persistait. Le deuxième, une impasse dans les négociations avec un pétrole durablement élevé, est identifié comme le plus susceptible de déclencher un resserrement substantiel de la Fed, potentiellement plusieurs hausses de taux en 2026. Le troisième, une escalade du conflit, créerait une double incertitude pour la Fed : devoir lutter contre un ancrage des anticipations inflationnistes ou répondre à un affaiblissement du marché du travail. La logique centrale est que la situation géopolitique détermine les prix du pétrole, qui influencent à leur tour la dynamique de l'inflation et l'ancrage des anticipations, façonnant ainsi la marge de manœuvre de la Fed. Les signaux clés à surveiller incluent l'évolution des négociations, la stabilité du pétrole en dessous de 100 dollars le baril et les changements de discours des responsables de la Fed.

marsbitIl y a 28 mins

Iran et la Fed — Les "trois scénarios" à venir qui influenceront les marchés mondiaux

marsbitIl y a 28 mins

Trading

Spot

Futures

Articles tendance

Comment acheter LAYER

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Solayer (LAYER) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Solayer (LAYER).Solde ：utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers ：pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P ：tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Solayer (LAYER)Après avoir acheté vos Solayer (LAYER), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Solayer (LAYER)Tradez facilement Solayer (LAYER) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

339 vues totalesPublié le 2025.02.11Mis à jour le 2025.03.21

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de LAYER (LAYER) sont présentées ci-dessous.

OpenAI mange-t-il la couche application ? a16z affirme que les véritables opportunités se trouvent au-delà des modèles généraux

Résumé

La route de briques jaunes

Ailleurs dans le pays d'Oz

Pourquoi le reste du pays d'Oz ne sera pas entièrement occupé par le « Magicien »

Les données et l'effet boule de neige de l'apprentissage

Gérer la volatilité et la complexité des modèles

Optimisation des coûts

Gouvernance

L'exemple des ventes : conseils pratiques du CEO technique de 11x

Se concentrer sur les résultats

S'attaquer à des problèmes de haute complexité

Les garde-fous ne servent pas seulement à empêcher les mauvaises choses. C'est précisément pour cela que le client paie

L'exemple de l'assurance : conseils pratiques du CEO de FurtherAI

Comment savoir si vous êtes ailleurs dans le pays d'Oz, ou toujours sur la route de briques jaunes ?

Test des outils et des étapes

Test du système

Test du fonds de couverture / du compte de résultat

Les deux peuvent gagner, et gagneront

Questions liées

Lectures associées

Samsung compte sur le cycle technologique, SK Hynix sur le HBM, qu’est-ce qui a permis à Micron de gagner une capitalisation boursière de mille milliards de dollars ?

Décryptage de l'algorithme du chercheur mystérieux Serenity et réévaluation des actifs mondiaux

Les régulateurs des deux côtés du détroit bloquent conjointement l'ouverture de comptes boursiers à Hong Kong, où pouvez-vous encore placer votre argent ?

Fondateur de Hash Global : Pourquoi ai-je également choisi de liquider toutes mes ETH ?

Iran et la Fed — Les "trois scénarios" à venir qui influenceront les marchés mondiaux

Trading

Articles tendance

Comment acheter LAYER

Discussions

Catégories populaires

Tags tendances