OpenAI mange-t-il la couche application ? a16z affirme que les véritables opportunités se trouvent au-delà des modèles généraux

marsbitPublié le 2026-05-28Dernière mise à jour le 2026-05-28

Résumé

Alors que les capacités des grands modèles de langage s'améliorent, une inquiétude émerge dans la couche applicative de l'IA : les sociétés de modèles comme OpenAI ou Anthropic, avec leurs avantages en matière de modèle, de distribution et de marque, risquent-elles d'absorber tout l'espace des applications ? L'associé d'a16z, Joe Schmidt, répond à cette question en utilisant la métaphore de la « Route de briques jaunes » du *Magicien d'Oz*. Il distingue deux catégories d'opportunités. La première, la « Route de briques jaunes », est celle que les laboratoires de grands modèles investissent directement : la génération de code, d'écrits, d'images, les assistants génériques. La seconde, « le reste du pays d'Oz », représente les scénarios verticaux complexes, intégrés aux processus métiers, dépendant de flux de travail spécifiques, de données, de conformité et d'intégrations système. Pour Schmidt, la vraie opportunité pour les startups réside dans ce second domaine. Les entreprises paient pour des systèmes responsables de résultats concrets, capables de gérer des données désordonnées, des validations multiples, des cas limites, la conformité, et l'optimisation des coûts face à l'évolution des modèles. L'article souligne que si les modèles sous-jacents deviendront plus puissants et interchangeables, la valeur durable proviendra des données, processus, connaissances métier et « mémoire opérationnelle » accumulés autour de flux de travail spécifiques. Les startups doivent éviter ...

Note de la rédaction : Alors que les capacités des grands modèles continuent de progresser, la couche applicative de l'IA fait face à une anxiété répandue : si des sociétés comme OpenAI, Anthropic, etc., maîtrisent à la fois les modèles de base, les canaux de distribution et l'avantage de marque, que reste-t-il à faire aux startups dans la couche application ?

C'est précisément la question à laquelle tente de répondre Joe Schmidt, partenaire chez a16z, dans cet article. Il emprunte la métaphore de la « route de briques jaunes » du Magicien d'Oz pour classer les opportunités d'applications d'IA en deux catégories : la première est la voie principale où les sociétés de grands modèles s'engagent elles-mêmes, comme la génération de code, l'écriture, la création d'images, les agents génériques ou les assistants de bureau horizontaux. L'autre ce sont les « autres parties du pays d'Oz », c'est-à-dire les scénarios verticaux, profonds dans les processus sectoriels, dépendants de flux de travail complexes, de sédimentation des données, de gouvernance de la conformité et de capacités d'intégration système.

Pour lui, la véritable opportunité pour les startups se trouve dans cette dernière catégorie.

De la vente à l'assurance, Joe Schmidt répète la même logique : ce pour quoi les entreprises sont vraiment prêtes à payer, ce n'est pas une fenêtre de chat plus intelligente, mais un système qui assume la responsabilité des résultats métier. Il doit comprendre l'état chaotique des données clients, gérer les validations multiples et les cas limites, assumer la responsabilité de la conformité et de l'audit, et aussi, lorsque les modèles évoluent, effectuer pour le client la migration, le routage et l'optimisation des coûts.

C'est également le jugement central de cet article sur la prochaine génération de logiciels d'entreprise : les modèles de base deviendront de plus en plus puissants, mais aussi de plus en plus remplaçables ; ce qui est vraiment irremplaçable, c'est les données, les processus, les capacités de gouvernance et la mémoire opérationnelle sédimentés autour d'industries et de flux de travail spécifiques. L'opportunité pour les entreprises d'applications d'IA ne réside pas dans la lutte avec les sociétés de modèles pour la « route de briques jaunes », mais dans l'exploration de ces lieux plus complexes, plus désordonnés, plus lents, mais aussi plus proches de la véritable valeur commerciale.

Voici l'article original :

Récemment, j'entends sans cesse la même question de la part de fondateurs et de futurs employés : reste-t-il quelque chose à faire dans la couche application de l'IA ? Ou bien OpenAI et Anthropic finiront-ils par tout tuer ?

Derrière cette question se cache une anxiété typique de l'ère de l'IA. Certains en ont déjà conclu que si l'on ne veut pas être relégué définitivement à la base, les seules positions à valeur durable sont soit au sein des grands laboratoires de modèles, soit dans l'entrepreneuriat dans des domaines de pointe comme la robotique, les hard tech ou assimilés – en théorie, donc, à faire des choses que « les laboratoires ne touchent pas ». Car si chaque type de logiciel doit être avalé, soit directement par Codex ou Claude qui absorberait le travail correspondant, soit par un futur modèle le rendant obsolète, le meilleur choix semble être : fuyez !

Je l'avoue, je suis moi-même presque un maximaliste de l'IA, et je pense qu'ils ont raison à moitié. Les grands laboratoires de modèles entrent effectivement dans de vastes zones de la couche application. Mais la « couche application » n'est pas un ensemble homogène d'opportunités. Le critère de jugement vraiment important est : marchez-vous sur la « route de briques jaunes », ou ailleurs dans le pays d'Oz.

La « route de briques jaunes » est notre métaphore pour décrire le chemin que les grands laboratoires de modèles empruntent et sur lequel ils consacrent d'énormes ressources. Des problèmes comme la génération de code, l'écriture, la création d'images sont naturellement adaptés aux laboratoires parce qu'ils s'améliorent avec l'augmentation des capacités brutes des modèles : chaque dollar investi dans le pré-entraînement et le post-entraînement améliore directement la qualité du produit.

Mais ailleurs dans le pays d'Oz, existent des problèmes plus complexes, généralement plus verticaux. Ils ne se résument pas à fournir simplement un outil horizontal à un utilisateur d'entreprise, en le branchant sur des outils et capacités informatiques standards. La valeur ici provient davantage de l'échafaudage construit autour du modèle : cet échafaudage qui rend la sortie fiable, conforme et véritablement intégrée aux processus métier dans une industrie spécifique. Les capacités brutes du modèle sous-jacent restent bien sûr importantes, mais ne sont plus le tout.

Nous le voyons en temps réel. OpenAI et Anthropic reconnaissent en fait au marché : ils ne peuvent pas résoudre tous les problèmes avec un assistant IA générique unique. Ils ont annoncé investir massivement dans des projets conjoints de déploiement en première ligne, construisant des entreprises entières autour de la configuration et de la personnalisation de modèles pour les entreprises. S'ils pensaient vraiment que la prochaine version de modèle résoudrait ces problèmes, ils n'investiraient pas des milliards dans ce type de projets.

Donc, si vous voulez gagner de l'argent avec des applications d'IA, ne prenez pas la route de briques jaunes, allez construire ailleurs dans le pays d'Oz. Voici ce que nous, ainsi que certains fondateurs de notre portefeuille, avons appris en pratique.

La route de briques jaunes

Si vous fondez une entreprise, la route de briques jaunes est la voie la plus évidente, mais aussi la plus dangereuse. Prenez un modèle haute performance, connectez-le à des connecteurs prêts à l'emploi comme Google Drive, Slack, Salesforce, Notion, GitHub, et superposez une couche d'orchestration d'agents intelligents par-dessus. Ça ressemble à de la magie.

Le problème est que c'est exactement ce que les grands laboratoires de modèles font avec Coworker et Codex. Il est clair qu'ils possèdent le modèle, ce qui signifie qu'ils ont de meilleures marges, un meilleur contrôle, et peuvent aussi exercer un pouvoir de fixation des prix sur tous les acteurs en aval. Mais peut-être plus important encore, ils contrôlent également les choix d'architecture qui déterminent à quels problèmes le produit est adapté. Jusqu'à présent, ils ont très délibérément adopté un modèle « modèle + appel d'outils », qui est précisément le modèle requis pour les travaux horizontaux, à faible nombre d'étapes, sur la route de briques jaunes. Même si une startup parvenait d'une manière ou d'une autre à surpasser Codex ou Claude Code, les grands laboratoires de modèles conservent une énorme capacité de distribution, ainsi que l'aura de marque la plus forte dans le domaine de l'IA.

Si vous êtes une entreprise d'application d'IA qui joue selon le même playbook : se connecter aux mêmes connecteurs, sans sous-agents ou configuration en dessous, et sans canaux de distribution, vous êtes probablement sur une route qui ne mène nulle part.

Ailleurs dans le pays d'Oz

Pour les startups, la situation n'est pas entièrement pessimiste. En dehors de la route de briques jaunes, il existe encore d'énormes opportunités. Les startups peuvent y trouver des clients et résoudre des problèmes complexes.

Ces entreprises construisent des expériences d'agents intelligents : le modèle est tissé dans un réseau complexe d'outils, d'automatisations et d'intégrations – en d'autres termes, du logiciel. Cela rend également la plupart de ces startups naturellement verticales. Elles peuvent se concentrer sur des flux de travail multi-étapes, multi-intervenants, concevoir des sous-agents pour différents rôles et scénarios verticaux, traiter des problèmes difficiles à atteindre pour les plateformes horizontales d'Anthropic et OpenAI : collecter du contexte à travers des systèmes, puis router les tâches vers plusieurs personnes nécessitant une validation à différentes étapes.

Ce type de travail implique généralement un ou plusieurs systèmes hérités, exige souvent des résultats déterministes car l'ambiguïté est inacceptable, et est parfois directement lié à un résultat commercial important. Les grands laboratoires de modèles savent bien sûr combien ces problèmes sont précieux : c'est pourquoi ils construisent leurs propres équipes de configuration externalisées, et c'est pourquoi toute une catégorie d'entreprises de services de renforcement de l'apprentissage pour les grands clients émerge.

Pourquoi le reste du pays d'Oz ne sera pas entièrement occupé par le « Magicien »

Une objection à l'argument ci-dessus est : jusqu'à présent, parier que les modèles ou les laboratoires ne continueront pas à progresser a toujours été un très mauvais pari. Ils vont probablement continuer à s'améliorer et finir par avaler les marchés servis par ces entreprises applicatives.

Les grands laboratoires de modèles vont certainement continuer à progresser. Mais je pense que les entreprises ailleurs dans le pays d'Oz ont, à long terme, plusieurs moyens de se défendre.

Les données et l'effet boule de neige de l'apprentissage

Beaucoup de ce que vous internalisez vraiment dans une activité n'existe dans aucun ensemble d'entraînement : les conventions sectorielles non écrites, les normes non documentées, la connaissance tribale dans la tête des praticiens. Elles ne sont pas sur l'internet public. Peu importe la puissance de calcul d'entraînement investie, elle ne peut remplacer le fait de pénétrer réellement à l'intérieur des flux de travail où réside cette connaissance.

Deux effets boule de neige se superposent ici : l'un est l'effet inter-clients, c'est-à-dire que lorsque vous voyez plus de variations du même type de problème, les modèles s'amplifient de manière exponentielle ; l'autre est l'effet intra-client, c'est-à-dire que les raisons derrière des décisions spécifiques, les exceptions non dites, les règles empiriques propres à l'entreprise, n'émergent que lorsque les utilisateurs interagissent réellement avec le système.

Même si les données clients ne peuvent pas être utilisées d'un client à l'autre, l'entreprise applicative peut toujours tirer parti de la reconnaissance de modèles pour différents types de problèmes clients et l'utiliser pour guider la conception architecturale des problèmes futurs. Une entreprise qui a déjà fait traiter cent modifications de ligne rouge juridique, mille cycles de souscription d'assurance, ou dix mille activités de développement commercial SDR par ses agents, a une compréhension de la forme des problèmes qu'un nouvel arrivant ne peut pas reproduire dès le premier lancement d'un nouvel agent.

Théoriquement, un agent horizontal pourrait construire la même infrastructure d'apprentissage. Mais la raison pour laquelle il ne le fait pas, outre le manque de concentration, est principalement l'expérience utilisateur. Capturer ce type de connaissance dépend entièrement du type d'interface de flux de travail que vous offrez à l'utilisateur. Les acteurs verticaux peuvent concevoir ces interfaces autour des informations qui ont vraiment besoin d'être exposées pour un flux de travail spécifique, ce que les outils horizontaux ne peuvent pas faire. Les ensembles d'évaluation, les sorties annotées, les systèmes de classification des cas limites peuvent se combiner en un effet boule de neige de données dans un domaine vertical, soutenant ainsi le fine-tuning. Un nouvel arrivant sans une exposition en environnement de production de taille équivalente aura du mal à générer un tel effet. Sa faisabilité dépend des droits sur les données, de l'utilisation productive accumulée et de la structure contractuelle avec les clients, mais la reconnaissance de modèles elle-même continue de s'accumuler.

Gérer la volatilité et la complexité des modèles

Les grands laboratoires de modèles font déjà du routage en interne : appeler différentes catégories de modèles pour différentes requêtes, utiliser des ensembles de modèles en coulisses. Mais ce qu'ils ne peuvent pas faire, c'est du routage inter-fournisseurs, ni évaluer facilement les modèles concurrents pour une sous-tâche spécifique, ou utiliser le véritable modèle open source fine-tuné le plus adapté pour un point étroit.

Les entreprises ailleurs dans le pays d'Oz choisiront le modèle le plus approprié pour chaque sous-tâche dans tout le marché des modèles, et pas seulement le modèle publié par un laboratoire mère. Elles assumeront également les tâches que personne ne veut faire : ré-exécuter les évaluations à chaque nouvelle version de modèle, recalibrer les prompts pour les cas limites des clients, mettre en production sans casser l'environnement. Les grands laboratoires de modèles ne feront pas cela pour le client. Ils vous vendent le nouveau modèle et vous disent de migrer. Les entreprises ailleurs dans le pays d'Oz absorbent le coût de migration. Le client obtient la meilleure capacité intelligente du marché, ainsi que la continuité à travers chaque mise à niveau.

Optimisation des coûts

Envoyer chaque requête à Opus 4.7 est le moyen le plus rapide de faire virer la marge brute au négatif. Les meilleures entreprises d'Oz feront du routage entre différents niveaux de modèles : les tâches les plus difficiles aux modèles de pointe, la plupart des tâches aux modèles intermédiaires, et dans les zones où cela a été prouvé possible, utiliser des modèles personnalisés plus petits ou fine-tunés.

Certaines de ces entreprises font maintenant leur propre post-entraînement sur cette base, optimisant le modèle pour le petit segment de travail qui intéresse vraiment le client, et fournissant le service à un coût bien inférieur à un appel API de pointe. Les grands laboratoires de modèles fixent un prix « plancher » : le niveau d'intelligence minimum que vous pouvez obtenir pour X dollars. Les entreprises d'Oz vendent l'inverse : le coût en dollars le plus bas pour le niveau d'intelligence réellement nécessaire par un flux de travail spécifique. Cela n'est possible que si vous savez très précisément quel niveau d'intelligence est nécessaire pour chaque sous-tâche. Et les grands laboratoires de modèles ne peuvent structurellement pas connaître chaque tâche dans chaque secteur vertical. Finalement, cela se traduit directement par une tarification par résultat plus basse et plus contrôlable.

Gouvernance

Devenir le plan de contrôle où un client exécute l'IA dans un domaine vertical crée une valeur considérable. Ce plan de contrôle est l'endroit où convergent les autorisations, l'audit, ce que l'agent est autorisé à faire, et ce que l'agent a réellement fait.

Ce plan de contrôle est construit sur des garde-fous pour des cas d'usage spécifiques, et ces garde-fous sont complètement différents selon les secteurs et les types de postes. Parce que ces entreprises possèdent de bout en bout les outils, les flux de travail et les données auxquels l'agent a accès, elles peuvent fournir des résultats déterministres d'une manière difficile à réaliser pour les outils horizontaux. Elles absorbent également la complexité réglementaire pour l'acheteur final : les règles fédérales de procédure civile et les règles de déontologie des avocats dans le droit, HIPAA dans la santé, les règles de la SEC et de la FINRA en finance, la régulation des assurances au niveau des États, etc. Les acteurs horizontaux ne peuvent pas faire cela de manière crédible sans se transformer en cent secteurs verticaux différents. Le DSI a besoin d'un partenaire qui peut s'engager clairement dans un contrat : il assumera la responsabilité du traitement de la conformité pour les agents qu'il fournit.

Tout cela revient finalement à la même chose : la concentration.

Cette concentration peut être un secteur vertical, comme l'assurance, le droit, la comptabilité ; ou une fonction suffisamment approfondie, comme les ventes, le service client, les finances. Quelle qu'elle soit, ce travail nécessite qu'une équipe s'immerge longtemps dans le même type de clientèle, comprenne ses flux de travail, ses cas limites et ses exigences réglementaires. Les grands laboratoires de modèles ne sont pas construits pour cela. Ils doivent servir tout le monde, couvrir partout, et c'est aussi pourquoi ils ont initialement construit la route de briques jaunes. Le même compromis les empêchera d'entrer ailleurs dans le pays d'Oz : vous pouvez être partout à la fois, ou excellent dans une chose, mais pas les deux.

L'exemple des ventes : conseils pratiques du CEO technique de 11x

En pratique, comment comprendre cela ? Voici quelques conseils pratiques de Prabhav Jain, CEO de 11x.

Se concentrer sur les résultats

Un chemin tactique viable pour construire une entreprise résistante aux grands laboratoires de modèles est de partir des résultats concrets qui intéressent vraiment le client. Pour nous, ce résultat est d'aider les entreprises à générer plus de prospects et de pipeline de ventes.

À partir de là, les questions deviennent très spécifiques : quelles activités voulons-nous posséder de bout en bout et qui font réellement progresser le pipeline de ventes ? Décomposez chaque activité en tâches. Quelles tâches conviennent à un agent, lesquelles non ? Quelles tâches nécessitent des insights sectoriels complexes, lesquelles non ? Les grands laboratoires de modèles lanceront aussi des flux de travail, mais lorsqu'une étape de flux de travail comporte de nombreuses étapes, des entrées désordonnées, un état difficile à interpréter, ou des contraintes du monde réel, un simple meilleur modèle ne suffit pas. Le travail revient alors à l'ingénierie logicielle traditionnelle, et à ce niveau, les grands laboratoires de modèles n'ont pas d'avantage sur une entreprise applicative concentrée.

Par exemple, certaines des tâches que nous traitons incluent : la prospection de leads basée sur des signaux personnalisés, l'enrichissement d'informations sur les leads, la recherche approfondie sur les comptes, l'extraction de contexte du CRM, la rédaction de messages pour différents canaux, l'agent de qualification des leads, et le système de délivrabilité des e-mails. Certaines sont des tâches d'agent, d'autres non. Ces tâches ne se font pas en une seule prompt, elles nécessitent des capacités d'ingénierie approfondies.

L'idée clé de l'analogie avec le pays d'Oz est : dans tout flux de travail réel, environ la moitié des tâches ne sont pas des tâches d'agent, et cette moitié n'apporte pas d'avantage de laboratoire. Sous la couche du modèle, leur capacité à écrire du logiciel déterministe n'est pas meilleure que la vôtre. Et l'autre moitié des tâches d'agent exige toujours de vous que vous ajustiez, entraîniez et contraigniez le modèle autour du résultat réellement désiré.

La connaissance du domaine n'est souvent pas dans les données d'entraînement générales. Ces capacités doivent être construites de bas en haut à partir du secteur vertical ou de la fonction spécifique, et fournies au modèle au bon moment dans le flux de travail. Lorsque notre agent qualifie un lead entrant par téléphone, il doit être formé à comprendre ce qui constitue une bonne conversation de vente pour un secteur et un profil d'utilisateur spécifiques. C'est le travail de l'entreprise applicative, et cette capacité s'amplifie exponentiellement.

Plus important encore, ces capacités deviennent constamment obsolètes, car l'entreprise elle-même évolue. Ainsi, votre capacité à faire évoluer continuellement le flux de travail et le contexte devient elle-même un avantage concurrentiel. Par exemple, lorsque nous avons commencé le produit d'emailing sortant à grande échelle, les « e-mails écrits par l'IA » commençaient tout juste à apparaître. Aujourd'hui, les gens ont développé une sensibilité aiguë pour distinguer quels e-mails sont écrits par l'IA et lesquels ressemblent plus à des humains, et le point clé est que ce jugement change tous les quelques mois. Nos agents doivent s'ajuster constamment à la dynamique du marché, mais c'est précisément là que se construit le fossé concurrentiel. En fait, malgré cette dynamique, notre taux de réponse positive a été multiplié par 4 au cours des derniers mois et a créé des centaines de millions de dollars de pipeline de ventes pour nos clients.

S'attaquer à des problèmes de haute complexité

Les problèmes complexes sont l'endroit où la valeur commerciale se libère réellement. Sinon, vous risquez de vous retrouver avec une simple couche d'emballage mince.

Décomposez un problème commercial suffisamment complexe, et vous verrez rapidement le désordre apparaître. Voici un exemple simple en apparence du domaine GTM : si une entreprise est déjà votre cliente, vous ne devriez pas contacter un contact dans cette entreprise. Mais ce n'est pas du tout simple.

Peut-être avez-vous le domaine de cette entreprise dans votre CRM. Mais que faire des entreprises avec des dizaines de filiales ? Et si l'enregistrement dans Salesforce utilise le domaine de la société mère ? Et si un champ de correspondance obsolète dans Salesforce vous fait envoyer un e-mail de prospection froide au Chief Revenue Officer d'un client existant ? Les données du monde réel sont désordonnées. Les humains ont du mal à les gérer, et les modèles ne franchissent pas miraculeusement ce seuil. Pour créer de l'ordre dans ce chaos, il faut concevoir des agents spécialisés autour de la forme spécifique du problème, et non pas simplement pointer un assistant générique vers le CRM. En fait, basé sur nos données, nous constatons que notre qualité et notre fraîcheur des données sont déjà supérieures à celles du client lui-même, donc par défaut, nous nous ancrons sur nos propres données.

Les garde-fous ne servent pas seulement à empêcher les mauvaises choses. C'est précisément pour cela que le client paie

Les garde-fous sont gravement sous-estimés. Même au sein d'un même produit, chaque cas d'usage nécessite ses propres garde-fous. Pour nous, les garanties requises pour un lead financier réglementé sont complètement différentes de celles pour un client SaaS de taille moyenne. Et ces garanties se répercutent sur la façon dont l'agent écrit, qui il peut contacter, quelles données il peut accéder, ce qu'il peut dire au téléphone, et comment chaque décision est enregistrée.

Un système « unique pour tous » s'effondrerait face à ces différences. Les garde-fous doivent être construits par cas d'usage, configurés par client, et audités en continu, et ce travail incombe entièrement à l'entreprise applicative. C'est pourquoi nous avons besoin d'ingénieurs de déploiement sur site et de stratèges de déploiement technique pour ajuster selon les exigences de chaque client.

Par exemple, nous avons travaillé avec une institution du Fortune 1000 pour effectuer des appels sortants vocaux avec consentement à leur vaste base de clients PME. Dans les premiers essais, le taux de décroché était faible. Nous avons dû itérer rapidement, apprendre comment engager ce public spécifique dans les 10 premières secondes de l'appel. Les propriétaires de PME se comportent différemment des acheteurs B2B de grande taille ou des consommateurs. Aujourd'hui, nous créons pour eux en une journée plus d'opportunités de vente que l'ensemble de leur équipe commerciale ne pouvait en créer en un mois sur ce segment.

L'exemple de l'assurance : conseils pratiques du CEO de FurtherAI

Les ventes ne sont qu'un exemple. L'assurance en est un autre, illustrant la même chose sous un angle différent. Voici comment Aman Gour, CEO de FurtherAI, comprend la « construction hors de la route de briques jaunes ».

Lorsque nous avons commencé à déployer l'IA dans les opérations réelles d'assurance, nous entendions constamment une hypothèse : le modèle est l'intelligence, le flux de travail n'est que l'échafaudage construit autour.

Mais plus nous travaillions avec des compagnies d'assurance, plus nous étions convaincus que c'était exactement l'inverse.

Dans l'industrie de l'assurance, beaucoup d'intelligence réside déjà dans le flux de travail lui-même. Deux compagnies d'assurance peuvent faire passer une soumission par un chemin qui semble identique : soumission, examen, devis, souscription. Le chemin lui-même est facile. Ce qui distingue vraiment les deux compagnies, c'est tout ce qui est à l'intérieur du chemin : quels risques nécessitent une escalade, quels signaux de perte sont importants, quelle règle de préférence de souscription prime en cas de conflit, quand une confirmation humaine est obligatoire, quelles données externes doivent être récupérées, et comment la décision finale est enregistrée.

Cette logique n'existe pas dans un moteur de règles propre. Elle est dispersée dans les procédures opérationnelles standard, les validations des managers, la philosophie de souscription, l'appétit pour le risque spécifique à la compagnie, et des années d'expérience opérationnelle. Beaucoup de cela n'est pas écrit sous une forme directement lisible par un modèle.

C'est pourquoi nous ne croyons pas aux agents purs qui raisonnent à partir de zéro à chaque fois, ni aux flux de travail rigides qui s'effondrent face à la complexité réelle. Au lieu de cela, nous construisons des flux de travail d'agents. Le flux de travail apporte la répétabilité, l'auditabilité et le contrôle des coûts ; l'agent gère la variabilité et rétablit le processus lorsque le chemin idéal est rompu ; les humains restent dans la boucle aux endroits impliquant jugement et responsabilité.

Le premier jour, ce système automatise le travail manuel. Mais avec le temps, chaque escalade devient un signal, chaque exception un retour d'information, chaque correction humaine vous dit où le manuel d'opérations d'origine est incomplet. Avec le temps, le flux de travail ne devient plus juste un script, mais la mémoire opérationnelle de la compagnie d'assurance.

C'est précisément la partie que les grands laboratoires de modèles ont du mal à atteindre. Ils continueront à publier de meilleurs modèles et de meilleurs agents généraux, et ils devraient le faire. Mais ils ne resteront pas longtemps dans le flux de travail de production d'une compagnie d'assurance pour apprendre pourquoi tel compte a été escaladé, pourquoi tel risque a été refusé, ou pourquoi tel souscripteur a outrepassé les directives d'appétit pour le risque, et s'est avéré avoir raison.

Cette compréhension ne peut venir que de l'exécution du même flux de travail des milliers de fois en environnement de production. Le flux de travail que vous livrez le premier jour n'est pas le fossé concurrentiel. La boucle formée par l'utilisation en production au fil du temps, c'est le fossé concurrentiel.

Pour nous, c'est le sens de « construire hors de la route de briques jaunes ».

Comment savoir si vous êtes ailleurs dans le pays d'Oz, ou toujours sur la route de briques jaunes ?

Test des outils et des étapes

Combien d'étapes ce travail nécessite-t-il ? À quel point les outils que vous devez construire pour le supporter sont-ils complexes ?

Comparez une recherche par une IA horizontale dans Google Drive : c'est une opération en une étape sur un outil, avec une grande tolérance aux erreurs dans le résultat. L'utilisateur lit le résumé, et si c'est faux, il repose la question.

Maintenant, regardez une tâche de modification de ligne rouge juridique en plusieurs étapes basée sur des précédents des trois dernières années d'un cabinet d'avocats : cela peut impliquer des dizaines d'étapes, plusieurs outils, la sortie doit passer par une revue de partenaire, et pourrait même nécessiter une argumentation en cour. Les deux ressemblent à « un agent qui fait quelque chose », mais seul le second nécessite ce logiciel profond construit par une équipe concentrée pendant des années.

Test du système

Construisez-vous un système dans lequel le client exécute son travail, ou ajoutez-vous un outil sur un système que le client possède déjà ?

Un système possède le flux de travail de bout en bout : capture des données, gouvernance, enregistrement du travail effectué. Le client pointe vers ce système en décrivant comment le travail réel se produit. Un outil ajoute juste une couche d'intelligence au flux de travail que le client exécute déjà.

Les produits de type outil peuvent aussi générer de vrais revenus, mais les grands laboratoires de modèles peuvent plus facilement les reprendre, car le client ne dépend pas de vous en tant que couche d'orchestration. Un ACV élevé est souvent le signe d'un produit de type système, car le système remplace de vrais effectifs, et est donc payé en conséquence. Mais ce n'est pas une garantie absolue. Vous devez vous demander : si un grand laboratoire de modèles lance un produit qui semble directement concurrent du vôtre, le client aura-t-il encore besoin de votre outil ? Si la réponse est oui, vous construisez un système. Si la réponse est non, vous êtes un outil – même si votre ACV est élevé.

Test du fonds de couverture / du compte de résultat

La performance des grands laboratoires de modèles est jugée par des benchmarks ; la performance des entreprises ailleurs dans le pays d'Oz est jugée par le compte de résultat du client.

Le client ne se soucie pas du score de votre modèle sur SWE-Bench ou MMLU. Il se soucie de : votre agent a-t-il conclu la vente, a-t-il correctement modifié la ligne rouge du contrat, a-t-il souscrit la bonne police. Si le client se concentre sur le résultat d'un flux de travail spécifique, et non sur un score de capacité générique, vous êtes ailleurs dans le pays d'Oz. Si le client paie pour une capacité générique, alors vous vendez ce qu'il peut obtenir via un siège Claude ou Codex.

Les meilleures entreprises d'agents doivent exécuter comme un fonds de couverture : elles gagnent sur l'alpha, et l'alpha se mesure dans le compte de résultat du client, pas dans les scores de benchmark.

Les deux peuvent gagner, et gagneront

Nous verrons d'énormes gagnants à la fois sur la route de briques jaunes et en dehors. Les modèles continueront de gagner, car ils possèdent le modèle et ont la capacité de distribution conçue pour les outils horizontaux.

Ailleurs dans le pays d'Oz peut aussi gagner, à condition de posséder le système de travail : c'est-à-dire l'interface où l'entreprise exécute réellement le travail, et les données qui y circulent et sont capturées. Ces entreprises possèdent la capture de données, le système d'actions de flux de travail et la gouvernance. À mesure que les flux de travail complexes d'un domaine vertical mûrissent, ils se combinent en une expérience centrale dont le client ne peut se passer. À mesure que les acteurs existants et les nouveaux entrants publient de nouvelles générations de modèles, cette entreprise devient la couche qui intègre et livre ces modèles au client. Le modèle sous-jacent est remplaçable, mais le système de travail ne l'est pas.

La prochaine génération de logiciels d'entreprise sera construite ailleurs que sur la route de briques jaunes.

Cryptos en tendance

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

BrevisBREV

PancakeSwapCAKE

JUSTJST

Questions liées

QQuel est le concept principal présenté par a16z pour les entreprises en intelligence artificielle (IA) ?

Aa16z utilise la métaphore du 'Chemin de Brique Jaune' pour illustrer les opportunités en IA. Les startups doivent éviter ce chemin, qui est déjà occupé par des géants comme OpenAI, et se concentrer plutôt sur les 'autres parties d'Oz' – des scénarios verticaux et complexes liés à des secteurs spécifiques, où la valeur réside dans l'intégration du modèle, les flux de travail et la connaissance du domaine.

QPourquoi les startups en IA devraient-elles se concentrer sur les 'autres parties d'Oz' plutôt que sur le 'Chemin de Brique Jaune' ?

ALes 'autres parties d'Oz' offrent des défis verticaux et complexes où la valeur ne vient pas seulement du modèle de base, mais de l'échafaudage qui l'entoure : intégration dans des flux de travail métier, gestion de la conformité, accumulation de données spécifiques et gestion de la complexité opérationnelle. Ces aspects constituent une barrière à l'entrée et une valeur durable que les grands laboratoires de modèles, axés sur des solutions horizontales, ont du mal à reproduire.

QQuels sont les principaux avantages défensifs dont disposent les entreprises opérant dans les 'autres parties d'Oz' ?

ALes principaux avantages défensifs sont : 1) La roue d'apprentissage basée sur des données et connaissances spécifiques à un secteur, 2) La capacité à gérer la volatilité et la complexité des modèles en routant les requêtes vers le meilleur modèle pour chaque sous-tâche, 3) L'optimisation des coûts en utilisant une combinaison de modèles, et 4) La fourniture d'une gouvernance et d'une conformité adaptées à des réglementations sectorielles spécifiques.

QComment l'article illustre-t-il la différence entre un 'outil' et un 'système' pour les applications d'IA ?

AUn 'outil' ajoute une couche d'intelligence à un flux de travail existant du client (ex: un assistant d'écriture). Un 'système' est l'interface même où le travail est exécuté, possédant de bout en bout la capture des données, la gouvernance et l'enregistrement des tâches. Les systèmes sont plus résilients car les clients en dépendent pour leur fonctionnement central, tandis que les outils sont plus facilement remplaçables par des offres génériques des grands laboratoires.

QQuel test l'article propose-t-il pour déterminer si une entreprise est sur le 'Chemin de Brique Jaune' ou dans les 'autres parties d'Oz' ?

AL'article propose plusieurs tests, dont le 'Test du Fonds de Couverture / Compte de Résultat' : si la performance de l'entreprise est jugée sur les résultats concrets dans le compte de résultat du client (ex: ventes générées, polices souscrites), elle est dans les 'autres parties d'Oz'. Si elle est jugée sur des scores de benchmarks génériques (comme MMLU), elle est probablement sur le 'Chemin de Brique Jaune', en concurrence frontale avec les grands modèles.

Lectures associées

Le moment des 5 000 milliards de dollars d'Apple : Le meilleur rapport financier, la plus faible IA

Apple a publié son rapport financier du T2 2026, affichant un chiffre d'affaires record de 109,4 milliards de dollars (+16,4%) et un bénéfice net de 29,8 milliards de dollars (+27%). Malgré ces résultats solides portés par les fortes ventes d'iPhone et de Mac, l'action a chuté après l'annonce, alors que les valeurs du secteur de l'IA connaissaient une forte hausse. Ce contraste souligne les inquiétudes des investisseurs concernant le retard d'Apple en matière d'intelligence artificielle. Le nouvel assistant IA Siri, présenté avec retard, et les partenariats avec Google aux États-Unis et avec Alibaba et Baidu en Chine pour le modèle de base, illustrent la stratégie de rattrapage d'Apple. Cependant, l'entreprise fait face à plusieurs défis : maintenir la croissance après le cycle exceptionnel de l'iPhone 17, gérer les pressions sur les coûts des composants, faire face à la concurrence croissante des téléphones IA, et assurer une transition de direction réussie avec le nouveau PDG John Ternus à partir de septembre. Ce trimestre historique marque à la fois l'apogée du mandat de Tim Cook et le début d'un nouveau chapitre pour Apple dans l'ère de l'IA.

marsbitIl y a 18 mins

Le moment des 5 000 milliards de dollars d'Apple : Le meilleur rapport financier, la plus faible IA

marsbitIl y a 18 mins

La crise pétrolière en Russie commence à s'atténuer : les régions commencent à lever les restrictions dans les stations-service

La crise des carburants en Russie, qui avait conduit à des quotas dans plus de 20 régions fin juin 2026, commence à s'atténuer. Début juillet, plusieurs régions ont assoupli ou levé les restrictions. Le kraï de Transbaïkalie a aboli son système de codes QR pour le réservation. L'oblast d'Omsk a entièrement supprimé les limites de vente. L'oblast de Saratov a augmenté le quota quotidien d'essence de 30 à 40 litres, et celui de Samara a prolongé ses limites sans les durcir. La crise avait été déclenchée par des attaques de drones ukrainiens contre des infrastructures pétrolières, perturbant l'approvisionnement. Pour y faire face, l'exportation d'essence avait été limitée et la priorité donnée à l'agriculture. À son pic, les restrictions variaient par région, allant de 30 à 100 litres d'essence par véhicule. Une analyse souligne que l'assouplissement des quotas reflète une stabilisation de la distribution, mais pas une résolution du problème de fond : environ 17% des capacités de raffinage russe seraient hors service. Sans réparations suffisantes avant la saison de chauffage, de nouvelles restrictions pourraient réapparaître à l'automne.

cryptonews.ruIl y a 1 h

La crise pétrolière en Russie commence à s'atténuer : les régions commencent à lever les restrictions dans les stations-service

cryptonews.ruIl y a 1 h

Cinq nouvelles fonctionnalités majeures arrivent sur XRP ! L'annonce faite par un représentant de Ripple

Le chef de produit de Ripple, Jazzi Cooper, a annoncé cinq nouvelles mises à jour majeures pour le Ledger XRP, prévues pour la version 3.3.0 la semaine prochaine. Ces fonctionnalités visent à renforcer l'utilité de XRP dans la finance institutionnelle et les marchés d'actifs tokenisés. Les nouveautés incluent : « MPT Confidentielle » pour la confidentialité des transactions via des preuves à divulgation nulle ; le « Traitement par Lots » permettant jusqu'à huit transactions atomiques ; un mécanisme de « Délégation d'Autorité » pour un contrôle granulaire des transactions sans partage des clés privées ; les « Frais et Réserves Sponsorisés » pour que des tiers puissent payer les frais des utilisateurs ; et le « MPT Dynamique » permettant aux émetteurs de mettre à jour certains paramètres des jetons après leur création. Ces mises à jour, une fois examinées et activées par les validateurs du réseau, sont conçues pour faciliter les transferts globaux, le commerce, les garanties et les règlements d'actifs tokenisés à grande échelle.

cryptonews.ruIl y a 2 h

Cinq nouvelles fonctionnalités majeures arrivent sur XRP ! L'annonce faite par un représentant de Ripple

cryptonews.ruIl y a 2 h

À l'instant, le nouveau modèle Astra d'OpenAI est dévoilé !

OpenAI prépare un nouveau modèle d'IA nommé Astra, conçu pour exceller dans l'exécution de tâches complexes et de longue durée. Ce modèle permettrait à plusieurs agents de travailler en collaboration sur des périodes étendues pour résoudre des problèmes difficiles, comme des défis mathématiques avancés. Astra constituerait une nouvelle catégorie de modèles au sein d'OpenAI, aux côtés des séries Sol, Terra et Luna, poursuivant une nomenclature à thème cosmique. Bien que déjà présenté à des décideurs politiques et en phase de test, la date de sortie publique d'Astra n'est pas encore fixée. Son nom définitif non plus, puisqu'il pourrait être lancé en tant que GPT-6 ou comme une version du GPT-5 (ex: GPT-5.7). Cette annonce intervient dans un contexte de sensibilité accrue concernant la sécurité des modèles d'IA à long terme, suite à des incidents récents où des agents ont franchi des environnements isolés. OpenAI prévoit également de publier un rapport détaillant la résolution de 10 problèmes mathématiques non résolus, potentiellement par Astra. Des informations non vérifiées suggèrent qu'Astra surpasserait les modèles actuels en capacité, en taille (peut-être le double du GPT-5.6 Sol) et en recherche scientifique. Il offrirait également une mémoire et une personnalisation améliorées pour des interactions continues. Une publication potentielle est évoquée pour le mois en cours.

marsbitIl y a 2 h

À l'instant, le nouveau modèle Astra d'OpenAI est dévoilé !

marsbitIl y a 2 h

Le supercycle de la mémoire IA est là : échangez DRAM, Micron et SanDisk dans un seul compte crypto

L'ère de l'IA se heurte à un goulot d'étranglement critique : la mémoire. Les puces DRAM et NAND flash, essentielles pour alimenter les GPU, font face à une pénurie structurelle, qualifiée de "supercycle". Goldman Sachs anticipe un déficit d'approvisionnement en DRAM d'environ 4,9% pour 2026, le plus sévère depuis quinze ans, les prix des contrats ayant bondi d'environ 90% au premier trimestre 2026. La construction de l'IA consomme déjà environ 20% de la production mondiale de DRAM. L'article présente trois instruments pour trader cette thématique sur la plateforme crypto WEEX, avec un règlement en USDT : 1. **DRAM/USDT** : Le moyen le plus direct de trader la pénurie mémoire elle-même, plutôt qu'un fabricant spécifique. 2. **Micron (MU)** : Leader dont toute la production 2026 de mémoire haute bande passante est déjà vendue. Son chiffre d'affaires a explosé (+196% sur un an) et sa capitalisation a dépassé 1 000 milliards de dollars. 3. **SanDisk (SNDK)** : Actif plus volatil lié au marché NAND flash, dont les prix ont plus que doublé. L'action a progressé d'environ 600% en 2026. WEEX permet d'accéder à ces trois expositions (spot et contrats perpétuels à effet de levier) depuis un compte unique, évitant ainsi de multiples intermédiaires. L'article conclut que ce "mur de la mémoire" est désormais négociable dans un compte crypto, tout en mettant en garde contre la volatilité inhérente à ce secteur cyclique et aux instruments à levier.

TheNewsCryptoIl y a 3 h

Le supercycle de la mémoire IA est là : échangez DRAM, Micron et SanDisk dans un seul compte crypto

TheNewsCryptoIl y a 3 h

Trading

Spot

Articles tendance

Comment acheter LAYER

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Solayer (LAYER) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Solayer (LAYER).Solde ：utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers ：pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P ：tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Solayer (LAYER)Après avoir acheté vos Solayer (LAYER), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Solayer (LAYER)Tradez facilement Solayer (LAYER) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

412 vues totalesPublié le 2025.02.11Mis à jour le 2026.06.02

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de LAYER (LAYER) sont présentées ci-dessous.

OpenAI mange-t-il la couche application ? a16z affirme que les véritables opportunités se trouvent au-delà des modèles généraux

Résumé

La route de briques jaunes

Ailleurs dans le pays d'Oz

Pourquoi le reste du pays d'Oz ne sera pas entièrement occupé par le « Magicien »

Les données et l'effet boule de neige de l'apprentissage

Gérer la volatilité et la complexité des modèles

Optimisation des coûts

Gouvernance

L'exemple des ventes : conseils pratiques du CEO technique de 11x

Se concentrer sur les résultats

S'attaquer à des problèmes de haute complexité

Les garde-fous ne servent pas seulement à empêcher les mauvaises choses. C'est précisément pour cela que le client paie

L'exemple de l'assurance : conseils pratiques du CEO de FurtherAI

Comment savoir si vous êtes ailleurs dans le pays d'Oz, ou toujours sur la route de briques jaunes ?

Test des outils et des étapes

Test du système

Test du fonds de couverture / du compte de résultat

Les deux peuvent gagner, et gagneront

Cryptos en tendance

Questions liées

Lectures associées

Le moment des 5 000 milliards de dollars d'Apple : Le meilleur rapport financier, la plus faible IA

La crise pétrolière en Russie commence à s'atténuer : les régions commencent à lever les restrictions dans les stations-service

Cinq nouvelles fonctionnalités majeures arrivent sur XRP ! L'annonce faite par un représentant de Ripple

À l'instant, le nouveau modèle Astra d'OpenAI est dévoilé !

Le supercycle de la mémoire IA est là : échangez DRAM, Micron et SanDisk dans un seul compte crypto

Trading

Articles tendance

Comment acheter LAYER

Discussions

Catégories populaires

Tags tendances