Partenaire YC : Comment construire une entreprise native AI auto-évolutive

marsbitPublié le 2026-05-20Dernière mise à jour le 2026-05-20

Résumé

Lors d'un récent talk YC, le partenaire Tom Blomfield a discuté de la transformation fondamentale des entreprises par l'IA. Il affirme que les structures hiérarchiques traditionnelles, comparables aux "légions romaines", sont dépassées. L'avenir appartient aux entreprises "natives IA", conçues comme des systèmes d'apprentissage autonomes plutôt que comme des pyramides de gestion. Le cœur de cette transformation réside dans la création de "boucles IA" récursives et auto-améliorées. Ces systèmes collectent en permanence des données (e-mails, tickets de support, données produit), les analysent, prennent des décisions via des règles et des outils, exécutent des actions, et apprennent des résultats pour s'ajuster automatiquement, même en l'absence des fondateurs. YC expérimente déjà avec des agents qui surveillent les échecs de requêtes, identifient les besoins (nouveaux outils, bases de données) et implémentent les corrections par eux-mêmes. Cela implique un changement radical d'organisation : "brûlez des tokens, pas des effectifs". Le goulot d'étranglement ne sera plus le nombre d'employés, mais la capacité à utiliser l'IA efficacement et la qualité des connaissances organisationnelles rendues lisibles pour l'IA. La gestion intermédiaire de coordination devient obsolète, tandis que les rôles d'individual contributor (IC) et de responsables directs prennent de l'importance. La condition préalable est de tout enregistrer (conversations, e-mails, réunions) pour créer un "cerveau...

Note de la rédaction : Dans cette dernière "batch talk" de YC, Tom Blomfield, partenaire général de YC, ne discute pas de "comment utiliser l'IA pour améliorer la productivité des employés", mais d'une question plus fondamentale : quand l'IA n'est plus seulement un Copilot, mais qu'elle peut percevoir, décider, utiliser des outils, recevoir des retours et s'autocorriger, à quoi devrait réellement ressembler une entreprise redessinée ?

Le jugement central de Tom est que les entreprises traditionnelles fonctionnent encore comme une "Légion romaine" : l'information remonte par la hiérarchie, les ordres descendent par la chaîne managériale. Mais l'IA est en train de briser cette hypothèse organisationnelle. Ce qui est vraiment important, ce n'est pas de faire écrire 20% de code en plus aux ingénieurs, mais d'extraire les connaissances métier éparpillées dans les e-mails, Slack, réunions, documents et cerveaux humains pour les transformer en un contexte organisationnel lisible, appelable et itérable par l'IA.

Selon lui, les futures entreprises natives IA seront constituées d'une série de boucles IA récursives et auto-améliorées : le système perçoit les changements externes à partir des e-mails clients, tickets de support, données produits, puis exécute des décisions via une couche de règles, une couche d'outils et des contrôles qualité, enfin apprend et se corrige automatiquement en fonction des résultats. YC teste déjà en interne des mécanismes similaires : un agent ne fait pas que répondre aux questions, il surveille aussi les requêtes qui échouent, juge s'il a besoin de nouveaux outils, nouvelles bases de données ou nouveaux index, et soumet, révise, fusionne et déploie automatiquement du code. Autrement dit, l'entreprise peut continuer à s'optimiser pendant que le fondateur dort.

Cela signifie aussi que l'impact de l'IA sur l'entreprise ne restera pas au niveau outil, mais transformera aussi la structure organisationnelle. Tom propose "brûler des tokens, pas des effectifs" ("burn tokens, not headcount") – à l'avenir, le goulot d'étranglement pour les startups ne sera peut-être plus le nombre d'employés, mais l'utilisation de tokens, la qualité du contexte métier et la lisibilité des connaissances organisationnelles. Les fonctions de coordination assumées par le middle management seront largement remplacées par l'IA, tandis que les rôles d'IC (contributeur individuel), de responsable direct et les rôles humains capables de traiter des jugements à haut risque dans le monde réel deviendront plus importants.

Le plus notable, ce n'est pas que l'IA rende l'entreprise plus efficace, mais qu'elle soit en train de changer la forme organisationnelle même de l'"entreprise". Quand le logiciel peut être généré temporairement, les processus améliorés automatiquement, l'expérience continuellement capitalisée en un cerveau d'entreprise, ce que le fondateur doit vraiment construire n'est peut-être plus une équipe à la hiérarchie claire, mais un système intelligent capable d'apprentissage continu et d'auto-optimisation.

Voici l'article original :

Réécrire le mode de fonctionnement : L'entreprise ne devrait plus fonctionner comme une Légion romaine

Cette partie s'appuie un peu sur un discours précédent de Diana. La vidéo de ce week-end est déjà en ligne, elle est excellente. De plus, Jack Dorsey a publié quelques tweets il y a deux ou trois semaines, je les trouve aussi très intéressants, donc j'ai "volé" pas mal de ses idées pour les intégrer à cette présentation.

Cette présentation sera assez conceptuelle, assez générale, elle porte principalement sur la façon dont nous devrions repenser la construction d'entreprise.

La Légion romaine était conçue essentiellement pour projeter le pouvoir depuis le centre, Rome, à travers deux continents, jusqu'au mur d'Hadrien près de l'Écosse. Elle s'appuyait sur une structure hiérarchique imbriquée, chaque niveau ayant une portée de gestion stable. Chaque niveau avait un responsable clair, chargé de transmettre les ordres vers le bas et de remonter l'information.

Si vous observez la plupart des entreprises d'aujourd'hui, vous verrez qu'elles fonctionnent encore comme une Légion romaine : les humains sont les canaux de circulation verticale de l'information. Ce qui m'a frappé dans les tweets de Jack Dorsey, c'est que nous avons toujours supposé que l'organisation hiérarchique était la meilleure façon d'organiser les unités de valeur économique. Mais je pense que l'IA est en train de briser cette hypothèse.

Il y a un an, si vous demandiez à quoi servait l'IA, on parlait généralement de "productivité" : par exemple, Copilot augmente l'efficacité des ingénieurs de 20%, intégrez Copilot au flux de travail, aidez les équipes à livrer plus de logiciels. Mais je pense que c'est une façon problématique de le comprendre. C'est comme mettre un moteur plus puissant sur une vieille façon de travailler. Ce qui mérite vraiment réflexion, ce n'est pas comment ajouter un outil IA à l'ancienne organisation, mais de réimaginer ce qu'est l'entreprise elle-même, comment elle devrait fonctionner.

Par exemple, ce que Garry vient de dire, je crois vraiment qu'il peut maintenant produire seul plus de code qu'une équipe d'ingénierie entière. Ce qui m'occupe vraiment l'esprit, c'est comment extraire les connaissances métier internes à l'entreprise, et les définir comme un contexte, un ensemble de compétences, ou comme vous voulez les appeler.

Les connaissances métier, le savoir-faire, étaient auparavant dispersés dans les cerveaux, les messages Slack, les e-mails, les documents Notion. Ces informations définissaient ensemble le fonctionnement de votre entreprise. Une fois que vous rendez ces connaissances claires, lisibles, vous pouvez passer d'une organisation hiérarchique à une organisation intelligente pilotée par des logiciels natifs IA.

Améliorer l'entreprise pendant son sommeil : Comment les boucles IA découvrent, corrigent et déploient automatiquement

L'IA n'est pas quelque chose d'ajouté à côté de l'entreprise. Ce n'est pas seulement un outil pour améliorer l'efficacité des ingénieurs. Je pense que nous pouvons réimaginer l'entreprise comme un ensemble de boucles IA récursives et auto-améliorées. Ce point est très important, car une fois que l'entreprise atteint ce stade, elle continue à s'auto-optimiser même pendant votre sommeil.

Un exemple.

Diana a aussi mentionné cette boucle IA dans son discours. Elle a d'abord une "couche de capteurs". Ça semble sophistiqué, mais ça peut être simple : les e-mails des clients, les tickets de support, les changements de code, les désabonnements d'utilisateurs, les données de télémétrie produit, ce sont toutes des données de capteurs, pour obtenir des informations du monde extérieur.

Ensuite, il y a la couche de stratégie ou de décision, c'est-à-dire les règles : ce que l'IA peut faire, ce qui nécessite une autorisation humaine, quelles actions doivent être enregistrées. Vient ensuite la couche d'outils, un peu comme les "skills" et le code mentionnés par Garry, essentiellement des API déterministes, par exemple interroger une base de données, consulter un agenda, etc., un ensemble d'outils que l'IA peut appeler.

Puis les contrôles qualité, comme les vérifications déterministes, les filtres de sécurité évoqués par Eva, et les revues humaines pour les actions à haut risque. Enfin, le mécanisme d'apprentissage : le système interagit avec le monde réel, découvre ce qui ne fonctionne pas, et renvoie le feedback au début de la boucle.

Si chaque étape peut fonctionner sans intervention humaine, ou avec très peu d'intervention, alors le système s'améliorera pendant que vous dormez.

Je peux vous donner des exemples que nous utilisons réellement. Au début, nous avons créé un agent auquel vous pouvez poser des questions, il a des outils déterministes pour interroger notre base de données. Par exemple, une question simple : quand ai-je eu mon dernier "office hours" avec cette entreprise ?

Ensuite, il est devenu un peu plus intelligent. Par exemple, pendant un office hours avec une entreprise qui a besoin de contacts dans le secteur pétrochimique. Le système peut interroger la base de données de différentes manières, utiliser le RAG, etc., pour trouver cinq fondateurs pertinents à recommander.

Mais c'est encore un sidekick, un agent assistant. C'est encore le mode d'utilisation de l'IA de l'année dernière : l'IA me rend plus efficace en tant que group partner, augmente ma productivité de 20 ou 30%.

Le vrai moment "aha" est venu quand nous avons ajouté un agent de surveillance au-dessus de ce système. Il examine chaque requête lancée par chaque employé de YC, juge quelles requêtes ont réussi, lesquelles ont échoué. Puis il se demande : pourquoi l'échec ? Comment faire pour que cette requête réussisse ? Avons-nous besoin d'un nouvel outil déterministe ? De mettre à jour le fichier de skills ? D'une nouvelle base de données ? D'un nouvel index ?

Ces choses se produisent réellement la nuit maintenant. Il écrit du code, soumet une demande de fusion (merge request) au dépôt de code de YC, un autre agent la révise, puis fusionne et déploie. Ainsi, le lendemain, quand un humain pose la même question, la requête réussit.

Pour moi, c'est le moment charnière. Ce n'est pas seulement rendre un humain 20 ou 30% plus performant. C'est l'IA qui parcourt elle-même la boucle, trouve comment s'améliorer.

Je pense que si vous pouvez identifier quelles parties de votre entreprise peuvent fonctionner ainsi, et minimiser le rôle d'exécution et de supervision humaines, alors vous pouvez investir des tokens sur ce problème, et l'entreprise continuera à s'améliorer.

Il y a beaucoup d'autres exemples. Par exemple, avec des données d'analyse produit, un agent peut analyser les données, identifier les points de friction les plus importants dans l'entonnoir de vente. Il peut étudier les meilleures pratiques, configurer un test A/B, l'exécuter une semaine, choisir la version performante, puis la déployer.

Cela se produira encore et encore. Votre produit aura une boucle de produit auto-optimisante.

C'est pareil pour le support client. Les suggestions des clients arrivent constamment, un agent peut faire le tri. Cet agent est en quelque sorte votre CPO et CTO, il doit juger : cette suggestion, nous n'en voulons pas, on jette ; mais celle-ci correspond à notre feuille de route, on peut la terminer ce soir. Écrire le code, déployer, livrer directement au client, sans intervention humaine.

Donc, si vous pouvez voir chaque partie de l'entreprise comme une boucle IA récursive auto-améliorée, cela deviendra quelque chose de totalement différent d'une entreprise hiérarchique "légion romaine".

Moins d'effectifs, plus de tokens : Les entreprises natives IA remodeleront la structure organisationnelle

Alors, si vous voulez faire cela, qu'est-ce que cela implique ?

Premier point : brûler des tokens, pas augmenter les effectifs. Nous voyons maintenant que beaucoup d'entreprises, au Demo Day, ont un chiffre d'affaires par tête environ 5 fois plus élevé qu'il y a 18 mois. Je pense que cette tendance continuera jusqu'aux phases Series A et B. Bientôt, la vraie limite ne sera pas le nombre d'employés, mais la consommation de tokens.

La façon la plus grossière actuellement est de mesurer la consommation de tokens par personne. Bien sûr, cet indicateur est stupide à l'extrême, facile à manipuler. Mais dans son principe, je pense qu'il est juste. Nous sommes dans une phase d'exploration "qu'est-ce qui est possible", donc tout le monde devrait expérimenter au maximum pour voir ce que cette nouvelle intelligence folle peut faire.

Une fois que vous en faites un classement, et liez promotions ou licenciements à cet indicateur, il sera évidemment manipulé, faussé. Mais en principe, comprendre qui dans l'organisation pousse l'utilisation des tokens à l'extrême, et qui ne le fait pas, est une façon de juger sur quels employés vous devriez concentrer votre temps.

Je pense que le middle management est terminé. Du moins pour ce type de problèmes de coordination, je ne pense pas qu'on ait encore besoin de middle management, l'IA devrait s'en charger.

Pour moi, il y a deux rôles importants à l'avenir. Jack Dorsey en a mentionné trois, mais je n'aime pas trop le troisième, donc je l'ai supprimé. Je pense que les deux vraiment importants sont : tout le monde doit être un IC, un contributeur individuel, un constructeur, un opérateur. Et le point clé est d'avoir un responsable direct désigné. Pour que quoi que ce soit avance, il faut une personne clairement nommée responsable, pas un comité, pas un groupe.

Je pense qu'une entreprise peut parfaitement être construite sur des IC. Le middle management est vraiment terminé. Et construire une entreprise auto-améliorée, c'est cette vision.

Au fait, je pense que tout le monde est encore à la pointe sur ce sujet. J'aimerais aussi savoir où vous en êtes. On a l'impression que tout le monde explore encore les limites. Je ne suis pas sûr que quelqu'un ait déjà construit une entreprise vraiment auto-améliorée dans chaque fonction. Peut-être que je me trompe, vous pouvez me prouver que j'ai tort.

Si c'était moi, par quoi commencerais-je ?

La première chose très importante est de rendre toute l'organisation lisible et compréhensible par l'IA. Qu'est-ce que cela signifie ? Cela signifie que vous devez tout enregistrer.

Pour faire simple, maintenant, tous les e-mails de nos partenaires, si vous envoyez un e-mail à un partenaire YC, cet e-mail entre dans la base de données de YC. Chaque message Slack, chaque DM, chaque office hours, nous avons commencé depuis trois ou quatre mois à tous les enregistrer. Tout ce qui se passe, s'il est enregistré, pour l'IA c'est arrivé ; s'il n'est pas enregistré, pour votre système intelligent, ce n'est pas arrivé.

Tout à l'heure, je discutais avec des fondateurs ici, nous avons parlé de beaucoup de bonnes choses sur leur entreprise. À chaque conversation, je pense : je devrais vraiment enregistrer cet échange. Parce que quelqu'un avait besoin que je lui présente une personne, maintenant je ne me souviens même plus de qui il s'agissait. Je lui ai dit oui sur le moment, puis je lui ai demandé de m'envoyer un e-mail ensuite, car je savais que j'allais oublier, je vais encore parler à 20 personnes.

Donc, cela pourrait nécessiter des téléphones, des enregistreurs, des lunettes intelligentes, ou mettre des micros dans chaque pièce. En bref, tout doit être enregistré pour que l'IA puisse le lire.

Ensuite, comme le dit Garry, il faut faire la séparation des locuteurs et le résumé. Vous ne pouvez pas balancer 10 000 heures d'enregistrement directement dans la fenêtre de contexte. Vous devez les organiser, agréger, compresser, extraire les parties importantes, laisser des indices à l'IA.

Un exemple : qui parmi vous a lu le manuel utilisateur de YC ? J'espère que tout le monde dans cette salle l'a ouvert au moins une fois. Ce n'est pas grave. Ce manuel a été écrit en grande partie il y a cinq ou dix ans, il est un peu obsolète.

Le week-end dernier, Harsh a soudain pensé : puisque nous avons accumulé environ 2 000 heures d'enregistrement d'office hours sur les trois derniers mois, pourquoi ne pas régénérer une version du manuel utilisateur ?

Vous pouvez donc donner au système un ensemble d'instructions : d'abord transcrire, compresser, synthétiser les enregistrements, les classer par thèmes comme financement, recrutement, conflits de cofondateurs, puis lui demander d'écrire une nouvelle version du manuel. À la fin du week-end, il avait généré un manuel de 150 pages, clairement meilleur que la version existante.

Encore plus important, maintenant nous pouvons le mettre à jour tous les mois. Ainsi, notre manuel utilisateur devient un système auto-amélioré. Chaque nouvelle suggestion est comparée au manuel existant, soit intégrée, soit rejetée. Le manuel devient ainsi un cerveau vivant constamment mis à jour, portant les conseils que nous donnons chaque semaine aux fondateurs.

Bien sûr, cela ne s'arrête pas au manuel. Vous pouvez l'utiliser comme contexte d'entrée pour un agent IA. Soudain, vous pouvez poser une question à une IA super intelligente et obtenir la sagesse combinée de 16 partenaires YC. Mais la condition préalable est que ces connaissances soient lisibles par l'IA. Donc vous devez tout enregistrer.

Le deuxième point est similaire : si quelque chose peut créer un artefact auto-améliorable et lisible par l'IA, gardez-le ; sinon, jetez-le.

Le troisième point est que chaque fonction devrait pouvoir générer son propre logiciel. Avant, on aurait dit "tableau de bord", mais maintenant ce n'est pas seulement un tableau de bord, c'est du logiciel généré à la demande. Codex 5.5 est maintenant assez bon, la plupart des logiciels internes simples et tableaux de bord peuvent être générés en une fois avec une qualité assez élevée. J'ai testé avec certains de nos outils internes ce week-end, les résultats étaient vraiment incroyables.

Donc, toutes les équipes opérationnelles internes devraient s'asseoir au-dessus de cette couche : avoir une compréhension intelligente du métier, puis générer elles-mêmes leurs tableaux de bord et flux de travail.

Et je considérerais ces logiciels comme entièrement jetables. Ce qui devrait être précieusement conservé, ce sont les données. Comme le dit Garry, il sauvegarde tous ses e-mails en Markdown, ne jette jamais rien. Mais le logiciel lui-même est éphémère, temporaire. Vous pouvez le générer, le régénérer.

Ce qui a de la valeur, c'est la compréhension métier dans les cerveaux : comment cette fonction opère, comment nous organisons un événement YC, etc. Quant au logiciel pour exécuter l'événement, vous pouvez en générer un pour l'événement, l'utiliser, le jeter. Un ou deux mois plus tard, le modèle est plus intelligent, vous jetez l'ancien logiciel, redonnez les instructions originales, et générez une nouvelle version.

Donc je pense que ce qui a de la valeur, c'est le contexte métier et les compétences (skills). Le logiciel construit dessus est temporaire.

Alors, dans ce monde, quel est le rôle des humains ?

Je pense que nous parlons en fait d'un "cerveau d'entreprise". Je sais qu'il y a beaucoup de gens dans cette salle qui travaillent sur des choses similaires. La partie centrale – toutes vos données, e-mails, DM, compétences, savoir-faire – c'est le cerveau de l'entreprise.

Les humains se situent à la périphérie de ce cerveau, responsables de l'interaction avec le monde réel. C'est-à-dire que les humains sont l'endroit où ce système intelligent touche la réalité. Les humains peuvent entrer dans des scénarios où le modèle ne peut pas encore aller. Par exemple, sur place lors d'une réunion, ou dans des situations nouvelles, complexes. J'allais prendre le téléphone comme exemple, mais maintenant l'IA peut facilement gérer les appels aussi.

Plus typiquement, les situations inconnues, les jugements éthiques, les moments à haut risque. Par exemple, un fondateur vient nous voir en disant qu'il envisage de se séparer de son cofondateur. Ce genre de moment vraiment à haut risque, chargé d'émotion, vous voudrez encore qu'un humain soit présent.

C'est la place des humains. Pour beaucoup de vos entreprises, c'est aussi le cas des conversations commerciales. Dans les 20 prochaines années, je pense qu'une présence humaine sera encore nécessaire sur le terrain commercial.

Donc, je pense que les humains vivront à la périphérie du cerveau d'entreprise, chargés d'apporter l'intelligence dans le monde réel.

J'ai dépassé mon temps, l'animateur va probablement me faire descendre de la scène. Je vous laisse avec une dernière question : si vous recréiez votre entreprise aujourd'hui, la concevriez-vous dès le départ sous cette forme ?

La plupart de vos entreprises sont encore assez petites pour pouvoir le faire. Donc je pense que vous n'avez aucune excuse. Et je sais que plusieurs personnes ici sont en train de démonter et reconstruire leur entreprise.

Je vais m'arrêter là et passer la parole à Pete. Merci à tous.

[Lien vidéo]

Questions liées

QQuelle est la vision principale de Tom Blomfield concernant l'impact de l'IA sur la structure des entreprises ?

ATom Blomfield pense que l'IA ne doit pas seulement être un outil d'amélioration de la productivité, mais qu'elle doit conduire à une refonte fondamentale de l'organisation des entreprises. Au lieu de perpétuer le modèle hiérarchique traditionnel (comparable à une « légion romaine »), les entreprises natives IA devraient être conçues comme des systèmes intelligents, composés de boucles IA récursives et auto-améliorantes, capables d'apprendre, de prendre des décisions et de s'optimiser continuellement, même en l'absence d'intervention humaine.

QComment l'IA peut-elle permettre à une entreprise de s'améliorer pendant que ses fondateurs dorment ?

AL'IA peut créer des boucles auto-améliorantes qui fonctionnent de manière autonome. Par exemple, un agent de surveillance peut analyser les requêtes échouées, identifier les causes (outils manquants, bases de données obsolètes, etc.), puis automatiquement écrire du code, soumettre des demandes de fusion, les faire examiner par un autre agent, et les déployer. Ainsi, le système se corrige et s'enrichit sans intervention humaine, permettant à l'entreprise de progresser continuellement, y compris en dehors des heures de travail.

QQue signifie l'expression « burn tokens, not headcount » dans le contexte des entreprises natives IA ?

A« Burn tokens, not headcount » signifie que dans une entreprise native IA, la limitation principale ne sera plus le nombre d'employés, mais plutôt la quantité de tokens utilisés (c'est-à-dire la capacité de traitement et d'interaction de l'IA). L'idée est que l'IA peut assumer de nombreuses tâches de coordination et d'exécution, réduisant ainsi le besoin d'une main-d'œuvre humaine étendue, en particulier au niveau du management intermédiaire. L'accent est mis sur l'optimisation de l'utilisation de l'IA plutôt que sur l'expansion des effectifs.

QPourquoi est-il crucial de rendre toute la connaissance organisationnelle lisible par l'IA ?

AIl est crucial de rendre la connaissance organisationnelle lisible par l'IA car celle-ci ne peut agir que sur les informations qu'elle peut « lire » et comprendre. Si les connaissances (conversations, e-mails, documents, réunions) ne sont pas enregistrées et structurées, elles sont invisibles pour le système IA. En documentant systématiquement tout, l'entreprise crée un « cerveau organisationnel » que l'IA peut consulter, analyser et utiliser pour prendre des décisions, générer des artefacts (comme un manuel mis à jour automatiquement) et améliorer en continu ses processus.

QQuel rôle les humains joueront-ils dans une entreprise native IA selon Tom Blomfield ?

ADans une entreprise native IA, les humains seront positionnés à la « périphérie » du « cerveau de l'entreprise ». Ils interagiront avec le monde réel dans des situations complexes, nouvelles, à haut risque ou émotionnellement intenses où l'IA est encore limitée. Par exemple, les réunions délicates, les jugements éthiques, les conversations de vente importantes ou les moments de crise nécessiteront une présence humaine. Leur rôle sera de relier l'intelligence du système IA aux réalités du terrain et de prendre en charge les interactions qui exigent une sensibilité et une adaptabilité humaines.

Lectures associées

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

Trois ans après ses prédictions sur ChatGPT en mars 2023, Wang Jianshuo revient sur ses vingt affirmations initiales, évaluées en mai 2026 par des agents IA. Sur les vingt points, la majorité des tendances de fond étaient correctes : l'essor du RAG comme architecture dominante pour l'injection de connaissances, le rôle central de l'interface utilisateur en langage naturel (LUI), l'émergence de protocoles pour un "réseau d'agents", et le rattrapage technologique rapide des modèles chinois. Des erreurs notables portent sur des chiffres précis, comme les 100 billions de paramètres supposés de GPT-4 (en réalité environ 1,8 billion) ou une estimation trop basse des coûts de formation des grands modèles. Certaines prévisions se sont révélées trop absolues ("l'IA ne fera jamais de mathématiques pures") ou ont négligé les disparités (aucune vague de chômage massif, mais un impact sévère sur les jeunes diplômés). L'analyse révèle que les intuitions sur les mécanismes et les directions se sont avérées bien plus fiables que les prédictions numériques ou temporelles, souvent trop optimistes à court terme. La prudence dans les formulations et la reconnaissance des incertitudes se sont montrées précieuses avec le recul. Ce bilan offre des leçons pour les futurs pronostics : privilégier les tendances aux chiffres, anticiper les effets distributifs et accepter que certaines questions demandent plus de trois ans pour être tranchées.

marsbitIl y a 7 h

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

marsbitIl y a 7 h

Trois ans plus tard : un retour sur mes prédictions de 2023 concernant ChatGPT

Trois ans après ses prédictions sur le ChatGPT en mars 2023, Wang Jianshuo revient sur ses 20 affirmations initiales. Évaluées en mai 2026 par des agents IA, la plupart de ses intuitions sur les grandes tendances se sont révélées justes : le RAG est devenu l'architecture standard pour intégrer des connaissances, l'Interface Utilisateur en Langage Naturel (LUI) a créé un nouvel écosystème, et les modèles chinois ont presque rattrapé les leaders mondiaux. Des concepts comme les réseaux d'agents et la nature limitée du test de Turing se sont également matérialisés. Cependant, les prévisions quantitatives et les affirmations trop absolues ont souvent échoué. Le paramétrage supposé du GPT-4 (100T) était inexact, et les coûts de développement des modèles ont dépassé les estimations. Il a sous-estimé la vitesse de personnalisation des IA et l'impact distribué sur l'emploi des jeunes. La capture de valeur a surtout bénéficié à la couche matérielle (comme Nvidia), et non aux seules applications. Les leçons clés sont que les mécanismes et les directions sont plus fiables que les chiffres précis, que l'optimisme à court terme doit être tempéré, et que les nuances ("peut-être", "pour l'instant") rendent les prédictions plus robustes. Cette rétrospective souligne l'importance de distinguer les tendances confirmées des questions toujours ouvertes.

链捕手Il y a 10 h

Trois ans plus tard : un retour sur mes prédictions de 2023 concernant ChatGPT

链捕手Il y a 10 h

Du Token à la main-d'œuvre machine : l'IA passe d'outil à « travailleur »

Alors que l'IA écrit du code, traite des tickets clients et révise des documents juridiques, elle ne se contente plus d'être un outil mais devient une source directe de travail. La commercialisation de l'IA évolue ainsi d'un marché de « jetons » (tokens) ou d'heures de GPU vers un nouveau marché : celui de la « main-d'œuvre machine ». Dans ce marché, le jeton n'est qu'une unité de mesure, le GPU un intrant, et le modèle un outil de production. L'objet véritablement tarifé et échangé est le travail économique accompli directement par le logiciel. Le mécanisme de prix de l'IA devrait évoluer des jetons bruts vers des capacités de modèles standardisées, puis vers une main-d'œuvre sectorielle, et enfin vers un marché de résultats programmables. À l'avenir, les entreprises pourraient ne plus se soucier du modèle ou du GPU spécifique utilisé, mais uniquement du fait que la tâche soit livrée dans des délais, avec un taux de précision, une fiabilité et un coût conformes aux standards. Ce changement ne signifie pas un simple remplacement du travail humain. Alors que la machine assume des tâches standardisées et vérifiables, le rôle humain pourrait se déplacer vers la supervision, la responsabilité finale, la gestion du contexte et les jugements critiques. Dans certains cas, les 1% de jugement humain final pourraient gagner en valeur, car ils permettent de débloquer les 99% d'automatisation à grande échelle. Le marché évolue donc vers une couche où le « travail » lui-même devient l'unité stable, standardisée, vérifiable et négociable. La prochaine phase de concurrence ne portera pas seulement sur la puissance des modèles ou le prix du calcul, mais sur la capacité à standardiser, vérifier et tarifer le « travail » accompli, faisant de la main-d'œuvre machine une nouvelle ressource productive que l'on peut acheter, facturer et échanger.

marsbitIl y a 11 h

Du Token à la main-d'œuvre machine : l'IA passe d'outil à « travailleur »

marsbitIl y a 11 h

La réduction de 99% du prix de Xiaomi MiMo n'est pas un coup marketing ! Luo Fuli répond aux détracteurs sur X

Dans un article intitulé "La réduction de 99% du prix de MiMo de Xiaomi n'est pas du marketing ! Luo Fuli répond aux détracteurs sur X", Luo Fuli, responsable de MiMo, a publié un billet de blog technique de 5000 mots pour expliquer la baisse drastique des prix de l'API MiMo-V2.5. Contrairement aux interprétations initiales d'une guerre des prix ou d'une stratégie de perte, cette réduction de 99% concerne spécifiquement le coût des entrées en cache ("Input Cache Hit"), c'est-à-dire la relecture du contexte historique dans les conversations longues. Le billet détaille six piliers d'ingénierie ayant permis cette réduction : 1. **Architecture Hybride SWA** : Réduction du volume de la mémoire cache (KVCache) à 1/7 grâce à une attention par fenêtre glissante sur 60 des 70 couches du modèle. 2. **Gestion en double pool** : Allocation efficace de la mémoire pour matérialiser les gains théoriques du SWA, multipliant par 5 le nombre d'utilisateurs simultanés par GPU. 3. **Cache de préfixe optimisé** : Augmentation du taux de réussite du cache à 93-95% en moyenne, évitant de recalculer les contextes répétés. 4. **Système de cache distribué GCache** : Stockage des données sur les SSD des machines GPU existantes, réduisant les coûts de stockage additionnels à zéro. 5. **Système de routage LLM-Router** : Optimisation de l'acheminement des requêtes pour maximiser l'utilisation du cache et améliorer les performances. 6. **Prédiction Multi-Token (MTP)** : Accélération de la génération des réponses du modèle, réduisant également les coûts de sortie. Cette chaîne d'optimisations systémiques a réduit le temps GPU par requête d'un ordre de grandeur, permettant une baisse de prix de 99% tout en maintenant une marge positive. Luo Fuli souligne qu'il s'agit d'un accomplissement d'ingénierie validé en production, et non d'une simple manœuvre marketing, offrant une référence pour réduire les coûts dans le secteur de l'IA.

marsbitIl y a 13 h

La réduction de 99% du prix de Xiaomi MiMo n'est pas un coup marketing ! Luo Fuli répond aux détracteurs sur X

marsbitIl y a 13 h

Trading

Spot
Futures
活动图片