Fondateur d'a16z : À l'ère des agents, ce qui compte vraiment a changé

marsbitPublié le 2026-04-20Dernière mise à jour le 2026-04-20

Résumé

Le fondateur d'a16z, Marc Andreessen, analyse l'ère des agents IA et ses implications profondes. Il souligne que l'IA actuelle n'est pas une innovation soudaine mais le résultat de 80 ans de recherche, avec des avancées comme les transformers et ChatGPT. Les agents IA combinent LLM, shell, système de fichiers et boucles d'exécution, permettant une autonomie et une introspection inédites. Andreessen prédit le déclin des interfaces utilisateur traditionnelles au profit d'interactions agent-first, où les bots deviennent les principaux utilisateurs des logiciels. Il compare le cycle d'investissement actuel à la bulle internet de 2000, mais note que les grandes entreprises tech dominent avec une demande réelle. L'open source et l'inférence en local sont cruciaux pour la diffusion et l'accessibilité de l'IA. Enfin, il identifie des défis majeurs : sécurité, identité numérique, intégration financière des agents, et résistances institutionnelles. La technologie avance, mais son adoption sociale restera progressive.

Titre original : Marc Andreessen introspects on Death of the Browser, Pi + OpenClaw, and Why "This Time Is Different"

Compilation originale : FuturePulse

Source du signal : Il s'agit de la dernière interview de Marc Andreessen, fondateur d'a16z, sur le podcast Latent Space. C'est un entrepreneur Internet américain renommé, l'une des figures clés du développement précoce d'Internet ; après avoir fondé a16z, il est également devenu une figure emblématique des investisseurs de premier plan de la Silicon Valley. L'ensemble de la conversation tourne autour de l'histoire et des tendances récentes de l'IA, et vaut vraiment la peine d'être lue.

I. Cette vague d'IA n'est pas apparue de nulle part, mais est le premier "démarrage" complet après 80 ans de course technologique

  • Cette vague d'IA n'est pas apparue de nulle part, mais est le résultat de 80 ans de course technologique

  • Marc Andreessen qualifie directement le présent de "succès nocturne de 80 ans" (80-year overnight success), signifiant que l'éruption soudaine perçue par le public est en réalité la libération concentrée de décennies de réserves technologiques.

  • Il retrace cette piste technologique jusqu'aux premières recherches sur les réseaux neuronaux et souligne qu'aujourd'hui, l'industrie a effectivement accepté le jugement selon lequel "les réseaux neuronaux sont l'architecture correcte".

  • Dans son récit, les points clés ne sont pas des moments uniques, mais une série d'empilements : AlexNet, Transformer, ChatGPT, les modèles de raisonnement, puis les agents et l'auto-amélioration.

  • Il souligne particulièrement que cette fois, ce n'est pas seulement la génération de texte qui devient plus forte, mais que quatre types de fonctionnalités apparaissent simultanément : LLMs, raisonnement, codage, et agents / auto-amélioration récursive.

  • La raison pour laquelle il pense que "this time is different" n'est pas que le récit est plus attrayant, mais parce que ces capacités ont commencé à travailler sur des tâches réelles.

II. L'architecture d'agent représentée par Pi et OpenClaw est un changement d'architecture logicielle plus profond que le chatbot

  • Il décrit l'agent de manière très concrète : essentiellement "LLM + shell + système de fichiers + markdown + cron/boucle". Dans cette structure, le LLM est le noyau de raisonnement et de génération, le shell fournit l'environnement d'exécution, le système de fichiers sauvegarde l'état, le markdown rend l'état lisible, et cron/boucle fournit le réveil périodique et l'avancement des tâches.

  • Il pense que l'importance de cette combinaison réside dans le fait qu'à part le modèle lui-même qui est nouveau, les autres composants sont tous des parties matures, compréhensibles et réutilisables du monde logiciel.

  • L'état de l'agent est sauvegardé dans des fichiers, il peut donc migrer entre modèles et runtimes ; le modèle sous-jacent peut être remplacé, mais la mémoire et l'état sont conservés.

  • Il souligne反复强调 l'introspection : l'agent connaît ses propres fichiers, peut lire son propre état, et peut même réécrire ses propres fichiers et fonctions, avançant vers la direction "étends-toi toi-même" (extend yourself).

  • À ses yeux, la véritable percée n'est pas seulement que "le modèle répond", mais que l'agent puisse utiliser la chaîne d'outils Unix existante, connectant ainsi toute la capacité potentielle de l'ordinateur.

III. Le navigateur, les GUI traditionnelles et l'ère du "logiciel cliqué à la main" seront progressivement remplacés par des modes d'interaction axés sur les agents

  • Marc Andreessen a clairement dit qu'à l'avenir, "vous pourriez ne plus avoir besoin d'interface utilisateur".

  • Il souligne en outre que les principaux utilisateurs des logiciels futurs pourraient ne pas être des humains, mais "d'autres bots".

  • Cela signifie que de nombreuses interfaces conçues aujourd'hui pour les clics, la navigation et le remplissage de formulaires par les humains, se dégraderont en couches d'exécution appelées en arrière-plan par les agents.

  • Dans ce monde, l'humain ressemble plus à celui qui propose l'objectif : dire au système ce qu'il veut, puis l'agent appelle les services, opère les logiciels, et complète le flux.

  • Il relie ce changement à un avenir logiciel plus large : les logiciels de haute qualité deviendront de plus en plus "abondants",不再是少数工程师手工打造的稀缺品 (ne seront plus des produits rares fabriqués artisanalement par une poignée d'ingénieurs).

  • Il estime également que l'importance des langages de programmation diminuera ; les modèles écriront du code跨语言 (跨语言 - cross-language), se traduiront mutuellement, et à l'avenir, les humains se soucieront plus d'expliquer pourquoi l'IA organise le code de cette manière, plutôt que de s'accrocher à un langage particulier lui-même.

  • Il mentionne même une direction plus radicale : conceptuellement, l'IA pourrait non seulement输出代码 (输出代码 - output code), mais aussi输出更底层的二进制代码(binary) ou model weights(poids de modèle).

IV. Ce cycle d'investissement en IA présente des similitudes avec la bulle Internet de 2000, mais les structures sous-jacentes de l'offre et de la demande sont différentes

  • En revenant sur l'année 2000, il souligne que l'effondrement n'était pas tant dû au fait qu'"Internet ne fonctionnait pas", qu'à une surconstruction des infrastructures de télécommunications et de bande passante, les fibres optiques et les centres de données ayant été déployés de manière超前 (avancée), puis digérés sur une longue période.

  • Il pense qu'aujourd'hui, on peut effectivement voir des inquiétudes de "surconstruction", mais les principaux investisseurs sont principalement de grandes entreprises disposant de liquidités abondantes comme Microsoft, Amazon, Google, et non des acteurs fragiles hautement杠杆化 (levier)).

  • Il souligne particulièrement que maintenant, dès qu'un investissement en GPU opérationnel est formé, il peut通常很快 (souvent très rapidement) se transformer en revenus, ce qui est différent de 2000 où il y avait大量闲置容量 (beaucoup de capacités inutilisées).

  • Il souligne également que nous utilisons en fait une version de la technologie "entravée (sandbagged)" : en raison de l'offre insuffisante de GPU, de mémoire, de centres de données, etc., le potentiel des modèles n'est pas pleinement libéré.

  • Dans son jugement,les véritables contraintes des prochaines années ne seront pas seulement les GPU, mais aussi l'interaction des goulots d'étranglement de l'écosystème des puces,包括 CPU, mémoire, réseau et l'ensemble de l'écosystème des puces.

  • Il place les lois de mise à l'échelle de l'IA (AI scaling laws) aux côtés de la ancienne loi de Moore, estimant qu'elles ne décrivent pas seulement des规律 (règles), mais stimulent également持续 (en continu) le capital, l'ingénierie et la synergie industrielle pour avancer.

  • Il mentionne un phénomène très反常 (anormal) mais important : à mesure que l'optimisation logicielle s'accélère, certaines puces de l'ancienne génération pourraient même devenir plus économiquement précieuses qu'au moment de leur achat.

V. L'open source, l'inférence en périphérie (edge) et l'exécution locale ne sont pas des accessoires, mais font partie du paysage concurrentiel de l'IA

  • Marc Andreessen estime clairement que l'open source est très important, non seulement parce qu'il est gratuit, mais parce qu'il "permet au monde entier d'apprendre comment c'est fait".

  • Il décrit les publications open source comme celles de DeepSeek comme un "cadeau au monde" (gift to the world), car le code + le document扩散知识 (diffusent rapidement les connaissances), élevant ainsi le niveau de base de toute l'industrie.

  • Dans son récit, l'open source n'est pas seulement un choix technique, mais peut aussi être une stratégie géopolitique et de marché : différents pays et entreprises adopteront différentes stratégies d'ouverture basées sur leurs propres restrictions commerciales et objectifs d'influence.

  • Il souligne simultanément l'importance de l'inférence en périphérie ("Edge inference") : dans les prochaines années, le coût de l'inférence centralisée未必足够低 (n'est pas nécessairement assez bas), de nombreuses applications grand public ne pourront pas supporter des coûts d'inférence云端 (cloud) élevés à long terme.

  • Il mentionne un modèle qui revient反复出现 : ce qui semble "impossible à exécuter sur un PC" aujourd'hui,常常 (souvent) quelques mois plus tard, peut vraiment fonctionner sur une machine locale.

  • Outre le coût, ce qui favorise l'exécution locale comprend la confiance, la vie privée, la latence et les scénarios d'utilisation : les appareils穿戴 (wearables), les serrures de porte, les appareils随身 (portables), etc., sont plus adaptés à une inférence就地 (locale) à faible latence.

  • Son jugement est très direct : presque tout ce qui contient une puce pourrait contenir un modèle d'IA à l'avenir.

VI. Le véritable défi de l'IA ne réside pas seulement dans la capacité des modèles, mais aussi dans la sécurité, l'identité, les flux financiers, les organisations et les résistances institutionnelles

  • En matière de sécurité, son jugement est très tranchant : presque tous les bogues de sécurité potentiels seront plus faciles à découvrir, et à court terme, une "catastrophe majeure de la sécurité informatique" pourrait survenir.

  • Mais il pense également que les intelligences de programmation mettront à l'échelle la capacité de corriger les vulnérabilités ; à l'avenir, la manière de "protéger les logiciels" pourrait simplement être de laisser un bot les scanner et les réparer.

  • Sur la question de l'identité, il estime que la "preuve de robot (proof of bot)" n'est pas viable, car les bots deviendront de plus en plus puissants ; la direction réellement viable est la "preuve d'humanité (proof of human)", c'est-à-dire la combinaison de la biométrie, de la vérification cryptographique et de la divulgation sélective (selective disclosure).

  • Il aborde également un problème souvent négligé : si les agents doivent vraiment agir dans le monde réel, ils auront最终 (finalement) besoin d'argent, de capacités de paiement, et même d'une forme de compte bancaire, de carte ou d'infrastructure de type stablecoin. Au niveau organisationnel, il utilise le cadre ducapitalisme managérial (managerial capitalism), estimant que l'IA pourrait renforcer à nouveau les entreprises dirigées par leur fondateur (founder-led company), car les bots sont très doués pour les rapports, la coordination, la paperasse et大量 "travaux de gestion".

  • Mais il ne pense pas que la société acceptera rapidement et facilement l'IA : il cite des exemples professionnels执照 (licences professionnelles), syndicats, grèves des dockers,政府部门 (départements gouvernementaux), éducation K-12, santé, etc., pour illustrer le fait que le monde réel comporte大量制度性减速器 (beaucoup de ralentisseurs institutionnels).

  • Son jugement est que les utopistes et les prophètes de l'apocalypse de l'IA忽略一点 (négligent un point) : le fait que la technologie soit possible ne signifie pas que 8 milliards de personnes changeront immédiatement.

Questions liées

QSelon Marc Andreessen, pourquoi l'IA actuelle est-elle qualifiée de 'succès nocturne de 80 ans' ?

AParce que le public perçoit l'IA comme une explosion soudaine, mais en réalité, elle est le résultat de décennies de préparation technique et de réserves technologiques qui sont maintenant libérées de manière concentrée.

QQuels sont les quatre types de fonctionnalités qui apparaissent simultanément dans l'IA moderne, selon Andreessen ?

ALes quatre fonctionnalités sont : les modèles de langage (LLMs), le raisonnement (reasoning), le codage (coding), et les agents / l'auto-amélioration récursive (agents / recursive self-improvement).

QComment Marc Andreessen définit-il la structure d'un agent IA ?

AIl décrit un agent comme une combinaison de 'LLM + shell + système de fichiers + markdown + cron/loop', où le LLM est le noyau de raisonnement, le shell fournit l'environnement d'exécution, le système de fichiers sauvegarde l'état, le markdown rend l'état lisible, et cron/loop permet un réveil périodique et l'avancement des tâches.

QQuelle est la différence fondamentale entre l'investissement en IA aujourd'hui et la bulle Internet de 2000, selon Andreessen ?

AAujourd'hui, les investissements sont principalement portés par de grandes entreprises solvables comme Microsoft, Amazon et Google, et la capacité GPU investie peut rapidement être convertie en revenus, contrairement à la bulle de 2000 où il y avait une surconstruction d'infrastructures avec une forte utilisation de leviers financiers et une capacité excédentaire importante.

QPourquoi l'open source est-il crucial dans le développement de l'IA, d'après Marc Andreessen ?

AL'open source est important non seulement parce qu'il est gratuit, mais aussi parce qu'il 'apprend au monde entier comment c'est fait', diffusant rapidement les connaissances et élevant le niveau de base de toute l'industrie.

Lectures associées

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

Trois ans après ses prédictions sur ChatGPT en mars 2023, Wang Jianshuo revient sur ses vingt affirmations initiales, évaluées en mai 2026 par des agents IA. Sur les vingt points, la majorité des tendances de fond étaient correctes : l'essor du RAG comme architecture dominante pour l'injection de connaissances, le rôle central de l'interface utilisateur en langage naturel (LUI), l'émergence de protocoles pour un "réseau d'agents", et le rattrapage technologique rapide des modèles chinois. Des erreurs notables portent sur des chiffres précis, comme les 100 billions de paramètres supposés de GPT-4 (en réalité environ 1,8 billion) ou une estimation trop basse des coûts de formation des grands modèles. Certaines prévisions se sont révélées trop absolues ("l'IA ne fera jamais de mathématiques pures") ou ont négligé les disparités (aucune vague de chômage massif, mais un impact sévère sur les jeunes diplômés). L'analyse révèle que les intuitions sur les mécanismes et les directions se sont avérées bien plus fiables que les prédictions numériques ou temporelles, souvent trop optimistes à court terme. La prudence dans les formulations et la reconnaissance des incertitudes se sont montrées précieuses avec le recul. Ce bilan offre des leçons pour les futurs pronostics : privilégier les tendances aux chiffres, anticiper les effets distributifs et accepter que certaines questions demandent plus de trois ans pour être tranchées.

marsbitIl y a 4 h

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

marsbitIl y a 4 h

Trois ans plus tard : un retour sur mes prédictions de 2023 concernant ChatGPT

Trois ans après ses prédictions sur le ChatGPT en mars 2023, Wang Jianshuo revient sur ses 20 affirmations initiales. Évaluées en mai 2026 par des agents IA, la plupart de ses intuitions sur les grandes tendances se sont révélées justes : le RAG est devenu l'architecture standard pour intégrer des connaissances, l'Interface Utilisateur en Langage Naturel (LUI) a créé un nouvel écosystème, et les modèles chinois ont presque rattrapé les leaders mondiaux. Des concepts comme les réseaux d'agents et la nature limitée du test de Turing se sont également matérialisés. Cependant, les prévisions quantitatives et les affirmations trop absolues ont souvent échoué. Le paramétrage supposé du GPT-4 (100T) était inexact, et les coûts de développement des modèles ont dépassé les estimations. Il a sous-estimé la vitesse de personnalisation des IA et l'impact distribué sur l'emploi des jeunes. La capture de valeur a surtout bénéficié à la couche matérielle (comme Nvidia), et non aux seules applications. Les leçons clés sont que les mécanismes et les directions sont plus fiables que les chiffres précis, que l'optimisme à court terme doit être tempéré, et que les nuances ("peut-être", "pour l'instant") rendent les prédictions plus robustes. Cette rétrospective souligne l'importance de distinguer les tendances confirmées des questions toujours ouvertes.

链捕手Il y a 6 h

Trois ans plus tard : un retour sur mes prédictions de 2023 concernant ChatGPT

链捕手Il y a 6 h

Du Token à la main-d'œuvre machine : l'IA passe d'outil à « travailleur »

Alors que l'IA écrit du code, traite des tickets clients et révise des documents juridiques, elle ne se contente plus d'être un outil mais devient une source directe de travail. La commercialisation de l'IA évolue ainsi d'un marché de « jetons » (tokens) ou d'heures de GPU vers un nouveau marché : celui de la « main-d'œuvre machine ». Dans ce marché, le jeton n'est qu'une unité de mesure, le GPU un intrant, et le modèle un outil de production. L'objet véritablement tarifé et échangé est le travail économique accompli directement par le logiciel. Le mécanisme de prix de l'IA devrait évoluer des jetons bruts vers des capacités de modèles standardisées, puis vers une main-d'œuvre sectorielle, et enfin vers un marché de résultats programmables. À l'avenir, les entreprises pourraient ne plus se soucier du modèle ou du GPU spécifique utilisé, mais uniquement du fait que la tâche soit livrée dans des délais, avec un taux de précision, une fiabilité et un coût conformes aux standards. Ce changement ne signifie pas un simple remplacement du travail humain. Alors que la machine assume des tâches standardisées et vérifiables, le rôle humain pourrait se déplacer vers la supervision, la responsabilité finale, la gestion du contexte et les jugements critiques. Dans certains cas, les 1% de jugement humain final pourraient gagner en valeur, car ils permettent de débloquer les 99% d'automatisation à grande échelle. Le marché évolue donc vers une couche où le « travail » lui-même devient l'unité stable, standardisée, vérifiable et négociable. La prochaine phase de concurrence ne portera pas seulement sur la puissance des modèles ou le prix du calcul, mais sur la capacité à standardiser, vérifier et tarifer le « travail » accompli, faisant de la main-d'œuvre machine une nouvelle ressource productive que l'on peut acheter, facturer et échanger.

marsbitIl y a 7 h

Du Token à la main-d'œuvre machine : l'IA passe d'outil à « travailleur »

marsbitIl y a 7 h

La réduction de 99% du prix de Xiaomi MiMo n'est pas un coup marketing ! Luo Fuli répond aux détracteurs sur X

Dans un article intitulé "La réduction de 99% du prix de MiMo de Xiaomi n'est pas du marketing ! Luo Fuli répond aux détracteurs sur X", Luo Fuli, responsable de MiMo, a publié un billet de blog technique de 5000 mots pour expliquer la baisse drastique des prix de l'API MiMo-V2.5. Contrairement aux interprétations initiales d'une guerre des prix ou d'une stratégie de perte, cette réduction de 99% concerne spécifiquement le coût des entrées en cache ("Input Cache Hit"), c'est-à-dire la relecture du contexte historique dans les conversations longues. Le billet détaille six piliers d'ingénierie ayant permis cette réduction : 1. **Architecture Hybride SWA** : Réduction du volume de la mémoire cache (KVCache) à 1/7 grâce à une attention par fenêtre glissante sur 60 des 70 couches du modèle. 2. **Gestion en double pool** : Allocation efficace de la mémoire pour matérialiser les gains théoriques du SWA, multipliant par 5 le nombre d'utilisateurs simultanés par GPU. 3. **Cache de préfixe optimisé** : Augmentation du taux de réussite du cache à 93-95% en moyenne, évitant de recalculer les contextes répétés. 4. **Système de cache distribué GCache** : Stockage des données sur les SSD des machines GPU existantes, réduisant les coûts de stockage additionnels à zéro. 5. **Système de routage LLM-Router** : Optimisation de l'acheminement des requêtes pour maximiser l'utilisation du cache et améliorer les performances. 6. **Prédiction Multi-Token (MTP)** : Accélération de la génération des réponses du modèle, réduisant également les coûts de sortie. Cette chaîne d'optimisations systémiques a réduit le temps GPU par requête d'un ordre de grandeur, permettant une baisse de prix de 99% tout en maintenant une marge positive. Luo Fuli souligne qu'il s'agit d'un accomplissement d'ingénierie validé en production, et non d'une simple manœuvre marketing, offrant une référence pour réduire les coûts dans le secteur de l'IA.

marsbitIl y a 9 h

La réduction de 99% du prix de Xiaomi MiMo n'est pas un coup marketing ! Luo Fuli répond aux détracteurs sur X

marsbitIl y a 9 h

Analyse rétrospective des opérations magistrales de Cathie Wood sur Circle

Cathy Wood (ARK) a réalisé une opération exemplaire sur l'action Circle, démontrant une maîtrise des mouvements de marché à court terme malgré son approche d'investissement habituellement tournée vers le très long terme. Elle a d'abord acquis près de 4,5 millions d'actions au prix d'introduction de 31 dollars, profitant ainsi de l'envolée initiale due à une faible offre flottante et une forte demande. Lorsque le titre a été propulsé à près de 300 dollars en juin 2025, porté par l'adoption du projet de loi sur les stablecoins (GENIUS Act), Wood a systématiquement vendu par tranches environ 1,7 million d'actions à un prix moyen d'environ 210 dollars, réalisant ainsi des plus-values substantielles. Cette décision était motivée à la fois par des règles internes de rééquilibrage de portefeuille et par l'anticipation de l'augmentation future de l'offre d'actions. Par la suite, face à la chute de l'action (jusqu'à -83% depuis son pic), Wood a racheté progressivement sa position initiale à des prix bien inférieurs (entre environ 50 et 130 dollars), portant son portefeuille à nouveau à environ 4,5 millions d'actions fin mars 2026. L'opération illustre trois principes clés : une conviction forte sur le modèle économique à long terme de Circle (stablecoin USDC), une exécution disciplinée par tranches sans chercher à prédire les sommets ou les creux, et le respect strict de règles de gestion des risques limitant le poids d'un titre dans le portefeuille.

marsbitIl y a 13 h

Analyse rétrospective des opérations magistrales de Cathie Wood sur Circle

marsbitIl y a 13 h

Trading

Spot
Futures

Articles tendance

Comment acheter ERA

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Caldera (ERA) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Caldera (ERA).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Caldera (ERA)Après avoir acheté vos Caldera (ERA), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Caldera (ERA)Tradez facilement Caldera (ERA) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

544 vues totalesPublié le 2025.07.17Mis à jour le 2025.07.17

Comment acheter ERA

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de ERA (ERA) sont présentées ci-dessous.

活动图片