Le PDG de Notion : les entreprises d'IA devraient être des "groupes de jazz", et je suis un "Refonder"

marsbitPublié le 2026-05-26Dernière mise à jour le 2026-05-26

Résumé

Le PDG de Notion, Ivan Zhao, se décrit comme un "Refounder" ayant reconstruit l'entreprise à deux reprises, notamment en relançant une stratégie centrée sur l'IA en 2023 après une première refonte à Kyoto en 2015. Il présente une formule du talent : Talent = Capacité × Goût × Initiative, estimant que les capacités techniques (Capabilité) se dévalorisent avec l'IA, tandis que le Goût (sens esthétique et jugement) et l'Initiative (volonté d'agir) deviennent les véritables atouts rares. En conséquence, Notion recrute désormais davantage sur la base du potentiel et de l'initiative que de l'expérience passée. Il compare l'organisation idéale à un "orchestre de jazz" flexible et improvisateur, par opposition à un orchestre militaire rigide. Cette philosophie se traduit par une équipe d'ingénieurs en forme d'haltère (alliant juniors supervisés par des seniors experts), la suppression du poste de directeur marketing (CMO) pour une communication plus directe, et l'intégration de nombreux entrepreneurs pour renforcer l'autonomie. Enfin, Ivan Zhao affirme avoir abandonné la planification produit traditionnelle au-delà de quelques semaines, privilégiant une adaptation hebdomadaire aux évolutions technologiques rapides, tout en conservant une planification financière prudente. Il invite à repenser les processus de recrutement, la structure organisationnelle et la planification à l'aune de l'IA, soulignant que le travail du savoir, invention récente, est toujours perfectible.

Le PDG de Notion, Ivan Zhao, s'est rendu la semaine dernière au siège de Sequoia Capital pour enregistrer un podcast, où il a évoqué ses expériences de deux quasi-faillites de l'entreprise et de deux reconstructions à partir de zéro. Aujourd'hui, il utilise la même logique pour "refonder" cette entreprise de mille personnes et se qualifie de "Refonder" :

Il estime que l'IA transforme les capacités techniques en marchandises, que ce qui devient vraiment rare est le Goût (Taste) et la Proactivité (Agency), il faut donc changer les critères de recrutement ; la transmission de l'information et le travail de coordination sont en train d'être pris en charge par l'IA, il faut donc changer la structure organisationnelle ; la technologie évolue trop vite, toute planification sur plusieurs semaines peut devenir obsolète, il faut donc aussi changer la façon de planifier. Enjoy !

01. Comment Notion a été reconstruit deux fois au bord de la faillite

En 2015, Notion n'avait toujours pas trouvé son PMF (Product-Market Fit) après deux ans. L'argent allait bientôt manquer. Ivan et le cofondateur Simon ont pris une décision que la plupart des fondateurs n'oseraient pas prendre : licencier tout le monde, déménager à Kyoto à deux et tout reconstruire à partir de zéro. Ils ont sous-loué leur logement et leurs bureaux de San Francisco. Pendant cette période, Notion a pour la première fois atteint une trésorerie positive.

(Le premier bureau de Notion à San Francisco)

Une fois sur place, la vie est devenue extrêmement simple. Coder, manger, coder à nouveau, manger à nouveau. Pas d'équipe, pas de processus, pas de ressources, juste deux personnes et une idée. Cette expérience a permis à Ivan de comprendre pour la première fois : ce qui fait avancer les choses, ce sont toujours le jugement et la volonté, la quantité de ressources étant secondaire. Un an et demi plus tard, Notion 1.0 est lancé.

(Le logement d'Ivan et de l'autre cofondateur Simon à Kyoto)

La deuxième fois, c'était en 2023. L'équipe était en réunion offsite à Cancún, Ivan a obtenu un accès anticipé à GPT-4. Cette expérience a été pour lui un choc quasi-traumatisant, il a immédiatement jugé : cela va tout changer, si nous ne mettons pas toute l'entreprise en jeu, rien de ce que nous ferons ensuite n'aura de sens. Il a donc annoncé un redémarrage complet de l'entreprise, qui comptait alors 500 personnes, pour se tourner entièrement vers l'IA.

Mais suivit près d'un an et demi de tourments. La technologie des modèles n'était pas encore mature, ils ont essayé presque toutes les directions, aucune n'a fonctionné. La croissance stagnait, le moral était bas. Ce n'est que lorsque les modèles sous-jacents ont vraiment mûri que le produit a commencé à décoller, le point d'inflexion des revenus et le décollage du produit IA sont apparus presque simultanément.

Dans ces deux expériences, ce qui a vraiment fonctionné, c'est son jugement et sa volonté d'avancer malgré l'incertitude, ce qui est aussi devenu le point de départ pour la refondation de l'entreprise.

02. Les "compétences" se déprécient, mais les entreprises continuent de les payer cher

Ivan propose une formule pour le talent :

Talent = Capacité × Goût × Proactivité (Talent = Capability × Taste × Agency).

Comprendre cette formule, c'est comprendre le processus de déduction.

Pourquoi la Capability se déprécie-t-elle ?

Avant Google, l'accès à l'information était une ressource rare, ceux qui pouvaient trouver l'information avaient un véritable avantage concurrentiel. Après Google, cet avantage a disparu, "je peux trouver cette information" est devenu une capacité de base. L'IA fait la même chose au niveau de la production de capacités. Écrire du code, rédiger des textes, analyser des données, toutes ces choses qui nécessitaient autrefois des années d'expérience pour être bien faites, peuvent maintenant être réalisées à un niveau correct par un jeune diplômé utilisant des outils d'IA. La rareté de la Capability est en train d'être systématiquement compressée.

Les propres mots d'Ivan : "Ce que les LLM réalisent, c'est comme Google qui a rendu l'information accessible à tous, ils rendent tout le monde capable d'être des rédacteurs et programmeurs corrects, tout le monde possède la Capability. Mais le Goût reste important, c'est votre système de valeurs, l'incarnation de ce que vous voulez apporter au monde ; l'Agency aussi, c'est à quel point vous êtes diligent, cela, l'entreprise ne peut pas le changer. Donc maintenant, nous optimisons pour ces deux derniers."

Pourquoi le Taste et l'Agency ne seront-ils pas nivelés ?

Le Goût (Taste), c'est votre système de valeurs, c'est la capacité à prendre des décisions quand il n'y a pas de réponse standard. Vers quelle direction un produit doit-il aller, quel arbitrage faire sur une architecture, l'IA peut donner des suggestions, mais juger quelle suggestion est la bonne, il faut toujours une personne au jugement réel pour trancher. Le Taste est ancré dans l'esthétique et les valeurs, il ne peut guère être changé à court terme même avec des efforts.

La Proactivité (Agency), c'est la volonté de faire avancer les choses. Avancer sans attendre d'instructions, ne pas reculer face aux obstacles, pouvoir mener à bien quelque chose qui n'est qu'à moitié terminé. C'est également quelque chose que l'IA ne peut pas fournir.

Avant, on recrutait sur l'expérience, puis en Silicon Valley, la tendance était de regarder la Pente (Slope) - le taux d'apprentissage pour remplacer l'accumulation passée. Mais Ivan dit que maintenant même la Slope ne suffit plus, elle mesure toujours la vitesse d'acquisition de la Capability, tournant essentiellement dans la même dimension en voie de dépréciation. Le Taste et l'Agency sont sur un tout autre axe, la vitesse d'apprentissage ne les prédit pas.

Deux actions concrètes sur le recrutement

Pour les postes d'ingénieur, embauche massive de jeunes diplômés, ce qui compte n'est plus l'expérience passée, mais la proactivité, la curiosité et le jugement ; pour les postes commerciaux, première série d'entretiens sans CV, les candidats doivent d'abord créer quelque chose, ce qui est évalué, c'est ce qu'ils peuvent faire maintenant, s'ils sont prêts à agir de manière proactive. Les deux actions font la même chose : remplacer "qu'avez-vous fait dans le passé" par "quel genre de personne êtes-vous maintenant".

Quelques questions à se poser : la dernière fois que vous avez décidé d'embaucher quelqu'un, quel était l'argument décisif ? Le candidat avait-il fait quelque chose de similaire dans une autre entreprise, avait-il un parcours que vous approuviez sur son CV, ou l'ampleur des projets passés était-elle suffisante ?

Tout cela sont des signaux de Capability. Si vous n'avez pas de méthode pour évaluer le Taste et l'Agency, votre processus de recrutement optimise probablement encore une dimension en dépréciation.

03. Être un Jazz Band flexible

Il y a trois ans, Notion a établi un slogan interne : nous voulons être un Jazz Band (groupe de jazz), pas un Marching Band (fanfare).

La divergence fondamentale ne réside pas dans le rythme, mais dans qui peut improviser. Un Marching Band a besoin d'un chef, chaque musicien suit la partition, l'unité est une vertu ; un Jazz Band a une structure et une complicité, mais chacun peut, à tout moment, relancer les autres, improviser et faire avancer. Le chef disparaît, la structure ne disparaît pas, car elle est déjà internalisée chez chacun.

Ivan dit que c'est son mécanisme d'auto-étalonnage. Il est du type Jazz Band, il ne supporte pas l'idée de tout déléguer et de ne donner que des ordres. Une fois la chose claire, il a commencé à recruter systématiquement des personnes partageant la même sensibilité, pour construire une entreprise conforme à son propre tempérament.

Cette logique se traduit dans l'organisation par trois actions concrètes.

L'équipe d'ingénierie en "haltère"

L'équipe d'ingénierie de Notion a maintenant la forme d'un haltère : aux deux extrémités se trouvent les "Super Junior" (ingénieurs super juniors) et les "Super Senior" (ingénieurs super seniors), la couche intermédiaire s'amenuise.

Auparavant, la valeur d'un Senior Engineer était multidimensionnelle : code plus fiable, compréhension plus profonde du système, capacité à mener des projets complexes de manière indépendante. Après l'apparition des AI Coding Agents, la majeure partie de cette chaîne de valeur a été reprise. La valeur des Seniors s'est donc recentrée sur la partie restante : le jugement architectural et le sens de la direction.

Actuellement, les LLM sont encore très faibles en matière d'architecture système, leurs suggestions prises individuellement semblent raisonnables, mais assemblées dans un système complexe, elles créent souvent des problèmes. C'est là qu'intervient le Taste, ce qui est vraiment irremplaçable chez une poignée de Seniors d'élite.

La combinaison optimale décrite par Ivan est à peu près celle-ci : un architecte senior de haut niveau, encadrant deux ou trois jeunes ingénieurs, chacun pilotant deux ou trois Coding Agents. Comparée à un groupe de Seniors pilotant chacun leurs Agents, cette structure a une productivité plus élevée, un effet multiplicateur meilleur. La couche intermédiaire est comprimée par les deux extrémités, la couche d'exécution est reprise par les Juniors + Agents, la couche de jugement n'est accessible qu'aux Seniors d'élite ayant de vraies capacités architecturales, la valeur des positions intermédiaires devient de moins en moins claire.

Dissolution de l'organisation du CMO

Notion n'a plus de CMO (Chief Marketing Officer) aujourd'hui. Le marketing est divisé en deux lignes fonctionnant indépendamment : l'une proche du produit, directement liée aux réseaux sociaux, suivant le rythme des lancements produits ; l'autre au service des ventes, se concentrant sur la génération de leads et de demandes.

La raison d'éliminer la couche de coordination intermédiaire est simple : l'IA prenant en charge une grande partie du travail de transmission d'information et de coordination, faire passer l'information par le CMO pour la redistribuer représente un coût trop élevé en pertes. Que les deux côtés gèrent leurs propres affaires est finalement plus rapide.

Introduction de plusieurs dizaines d'entrepreneurs

Notion a introduit, via des acquisitions, de nombreux fondateurs ayant une expérience entrepreneuriale, chacun dirigeant son domaine de prédilection. La personne responsable de la fonctionnalité de compte-rendu de réunion avait précédemment une start-up spécialisée dans ce domaine ; la personne responsable de la recherche d'entreprise était auparavant fondatrice d'un produit de recherche d'entreprise. Leur offrir une meilleure plateforme et de meilleures ressources pour continuer à faire ce qu'ils font de mieux est en soi une logique de fidélisation.

Ivan lui-même est un "Refonder", il peut à tout moment plonger dans n'importe quel domaine, ou lâcher complètement prise, aucun des deux n'est une menace territoriale. C'est un renforcement de la propriété Jazz Band de l'organisation au niveau de la composition du personnel, on fait entrer des personnes qui savent déjà jouer de manière indépendante.

04. La planification produit, Notion y a renoncé

Ivan divise l'activité de planification en deux choses fondamentalement différentes, traitées avec des logiques complètement distinctes.

Le plan financier, il le trouve encore utile, comme la vitesse d'un tapis de course : vous la fixez à un certain niveau, et vous savez à quel rythme vous courez, cette lecture est réelle. Notion est financièrement conservatrice à neutre, se laissant une marge de manœuvre confortable. À l'ère de l'IA, le coût devient aussi une nouvelle variable, les dépenses en Tokens augmentant directement avec l'utilisation des produits, il faut les inclure sérieusement dans les calculs.

La stratégie produit est une autre histoire.

Pas de plan, vraiment aucun, pas sur six mois, pas sur trois mois, c'est de l'improvisation semaine par semaine.

Ce jugement découle directement de la leçon de la deuxième reconstruction. Fin 2022, Notion voulait déjà faire un produit d'Agent IA, et y travaillait très sérieusement. Pendant un an et demi, pratiquement aucun progrès, l'équipe ne manquait pas de motivation, c'était le modèle sous-jacent lui-même qui n'était pas encore prêt. Tout plan produit à ce stade était vide, ce qui a vraiment fonctionné, c'est l'improvisation constante dans les limites données par la technologie.

Tout ce que vous pouvez planifier, c'est le Tempo (la pulsation), les objectifs financiers définissent la vitesse du tapis de course ; la Mélodie (Melody) est improvisée, écrite chaque semaine en fonction des réalités techniques et du marché. C'est précisément la raison principale pour laquelle un Jazz Band est plus adapté au contexte actuel qu'un Marching Band : le Marching Band doit répéter toute la partition à l'avance avant de monter sur scène, le Jazz Band improvise et s'adapte sur le moment, ne sait pas où ira la prochaine mesure, mais a la capacité de la saisir sur l'instant.

05. Votre entreprise, à quel niveau n'a-t-elle pas encore commencé à se réécrire

Interrogé sur ce à quoi ressemblera l'organisation dans trois ou quatre ans, Ivan ne décrit aucun plan technique, mais demande d'abord : qu'est-ce qui ne change pas ?

Sa réponse est : la nature humaine. Les humains sont naturellement hiérarchiques, la division du travail a un sens, les gens ont des intérêts et des valeurs différents, ce sont des constantes millénaires. Dans le système juridique, il n'y a pas non plus d'entreprise autonome, le PDG et le CFO doivent toujours signer et être responsables. Ces invariants sont les points d'ancrage de la conception organisationnelle, ce que l'IA change, c'est la manière dont l'information circule et dont les décisions sont prises entre ces personnes, la nature humaine elle-même est immuable.

Mais au-dessus de ce point d'ancrage, la réécriture se produit déjà à trois niveaux. Il vaut la peine de se poser sérieusement trois questions :

  • Votre processus de recrutement optimise-t-il encore principalement la Capability ? Avez-vous une méthode pour évaluer le Taste, une méthode pour évaluer l'Agency ?
  • Dans votre organisation, combien de personnes ont pour valeur principale de transmettre des informations et d'exécuter des instructions ? La pression structurelle sur ces postes augmentera continuellement avec la maturité des outils d'IA.
  • Votre planification produit essaie-t-elle encore de prérépéter la partition sur six mois ? Ce n'est pas que la planification trimestrielle soit en soi problématique, mais votre façon de l'utiliser, est-ce comme une promesse, ou comme une référence qui sera ajustée chaque semaine ?

Pour finir :

"Le travail intellectuel moderne n'a que 150 ans. Il est inventé. Il n'est pas aussi vieux que le feu ou le langage. Pourquoi ne pourrait-il pas en avoir une nouvelle saveur ?"

Le travail intellectuel n'existe que depuis 150 ans, il a été inventé par l'homme, la logique de fonctionnement des entreprises aussi est définie par l'homme. Ce qui a été inventé peut être réécrit, Notion est déjà en train de le réécrire, et avec deux ans d'avance sur la plupart des gens.

Questions liées

QQuel est le concept principal qu'Ivan Zhao, PDG de Notion, propose pour les entreprises à l'ère de l'IA, et comment se décrit-il dans ce contexte ?

AIvan Zhao propose que les entreprises à l'ère de l'IA devraient ressembler à un 'groupe de jazz' (Jazz Band), valorisant l'improvisation et l'initiative individuelle au sein d'une structure commune. Il se décrit comme un 'Refounder', soulignant son rôle dans la reconstruction continue de l'entreprise en s'adaptant aux changements profonds apportés par l'IA.

QSelon Ivan Zhao, quelle est la formule révisée du talent à l'ère de l'IA et pourquoi les critères de recrutement doivent-ils changer ?

ASa formule est : Talent = Capacité × Goût × Autonomie (Talent = Capability × Taste × Agency). Il affirme que la capacité (Capability) se banalise avec les outils d'IA, tandis que le goût (Taste, le jugement et les valeurs) et l'autonomie (Agency, la volonté d'agir) deviennent les véritables facteurs de différenciation et de rareté. Ainsi, le recrutement doit passer de l'évaluation de l'expérience passée (capacité) à celle du caractère et du potentiel actuels (goût et autonomie).

QComment l'organisation de l'équipe d'ingénierie de Notion a-t-elle évolué pour s'adapter à l'IA, et quelle est sa nouvelle structure ?

AL'équipe d'ingénierie de Notion a adopté une structure 'en haltère' (dumbbell-shaped). Elle est composée à ses extrémités de 'Super Juniors' (jeunes ingénieurs proactifs) et de 'Super Seniors' (architectes expérimentés au jugement aiguisé). La couche intermédiaire des ingénieurs seniors traditionnels rétrécit, car leurs tâches d'exécution sont reprises par les juniors couplés à des agents d'IA, et seuls les seniors possédant un excellent jugement architectural conservent une valeur cruciale.

QPourquoi Notion a-t-il dissous le poste de CMO (directeur marketing) et comment le marketing est-il désormais structuré ?

ANotion a supprimé le poste de CMO car, avec l'IA qui gère une grande partie de la coordination et de la transmission d'informations, une couche de management centralisé devenait une source de lenteur et de perte d'efficacité. Le marketing est maintenant divisé en deux branches autonomes : l'une étroitement liée aux produits et aux réseaux sociaux, l'autre concentrée sur la génération de leads pour soutenir les ventes. Cela permet une action plus directe et plus rapide.

QQuelle est l'approche de Notion en matière de planification de produit à l'ère de l'IA, et quelle métaphore musicale l'illustre ?

ANotion a largement abandonné la planification produit traditionnelle à long terme. Au lieu de plans fixes sur plusieurs mois, l'équipe travaille sur un tempo hebdomadaire, en improvisant constamment ('jamming') en fonction de l'évolution rapide de la technologie et du marché. Ivan Zhao utilise la métaphore du 'groupe de jazz' : l'équipe définit un rythme et une structure de base (le tempo), mais la mélodie (la stratégie produit détaillée) est improvisée semaine après semaine, à la différence d'un 'orchestre militaire' (Marching Band) qui suivrait une partition prédéfinie.

Lectures associées

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

Trois ans après ses prédictions sur ChatGPT en mars 2023, Wang Jianshuo revient sur ses vingt affirmations initiales, évaluées en mai 2026 par des agents IA. Sur les vingt points, la majorité des tendances de fond étaient correctes : l'essor du RAG comme architecture dominante pour l'injection de connaissances, le rôle central de l'interface utilisateur en langage naturel (LUI), l'émergence de protocoles pour un "réseau d'agents", et le rattrapage technologique rapide des modèles chinois. Des erreurs notables portent sur des chiffres précis, comme les 100 billions de paramètres supposés de GPT-4 (en réalité environ 1,8 billion) ou une estimation trop basse des coûts de formation des grands modèles. Certaines prévisions se sont révélées trop absolues ("l'IA ne fera jamais de mathématiques pures") ou ont négligé les disparités (aucune vague de chômage massif, mais un impact sévère sur les jeunes diplômés). L'analyse révèle que les intuitions sur les mécanismes et les directions se sont avérées bien plus fiables que les prédictions numériques ou temporelles, souvent trop optimistes à court terme. La prudence dans les formulations et la reconnaissance des incertitudes se sont montrées précieuses avec le recul. Ce bilan offre des leçons pour les futurs pronostics : privilégier les tendances aux chiffres, anticiper les effets distributifs et accepter que certaines questions demandent plus de trois ans pour être tranchées.

marsbitIl y a 7 h

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

marsbitIl y a 7 h

Trois ans plus tard : un retour sur mes prédictions de 2023 concernant ChatGPT

Trois ans après ses prédictions sur le ChatGPT en mars 2023, Wang Jianshuo revient sur ses 20 affirmations initiales. Évaluées en mai 2026 par des agents IA, la plupart de ses intuitions sur les grandes tendances se sont révélées justes : le RAG est devenu l'architecture standard pour intégrer des connaissances, l'Interface Utilisateur en Langage Naturel (LUI) a créé un nouvel écosystème, et les modèles chinois ont presque rattrapé les leaders mondiaux. Des concepts comme les réseaux d'agents et la nature limitée du test de Turing se sont également matérialisés. Cependant, les prévisions quantitatives et les affirmations trop absolues ont souvent échoué. Le paramétrage supposé du GPT-4 (100T) était inexact, et les coûts de développement des modèles ont dépassé les estimations. Il a sous-estimé la vitesse de personnalisation des IA et l'impact distribué sur l'emploi des jeunes. La capture de valeur a surtout bénéficié à la couche matérielle (comme Nvidia), et non aux seules applications. Les leçons clés sont que les mécanismes et les directions sont plus fiables que les chiffres précis, que l'optimisme à court terme doit être tempéré, et que les nuances ("peut-être", "pour l'instant") rendent les prédictions plus robustes. Cette rétrospective souligne l'importance de distinguer les tendances confirmées des questions toujours ouvertes.

链捕手Il y a 9 h

Trois ans plus tard : un retour sur mes prédictions de 2023 concernant ChatGPT

链捕手Il y a 9 h

Du Token à la main-d'œuvre machine : l'IA passe d'outil à « travailleur »

Alors que l'IA écrit du code, traite des tickets clients et révise des documents juridiques, elle ne se contente plus d'être un outil mais devient une source directe de travail. La commercialisation de l'IA évolue ainsi d'un marché de « jetons » (tokens) ou d'heures de GPU vers un nouveau marché : celui de la « main-d'œuvre machine ». Dans ce marché, le jeton n'est qu'une unité de mesure, le GPU un intrant, et le modèle un outil de production. L'objet véritablement tarifé et échangé est le travail économique accompli directement par le logiciel. Le mécanisme de prix de l'IA devrait évoluer des jetons bruts vers des capacités de modèles standardisées, puis vers une main-d'œuvre sectorielle, et enfin vers un marché de résultats programmables. À l'avenir, les entreprises pourraient ne plus se soucier du modèle ou du GPU spécifique utilisé, mais uniquement du fait que la tâche soit livrée dans des délais, avec un taux de précision, une fiabilité et un coût conformes aux standards. Ce changement ne signifie pas un simple remplacement du travail humain. Alors que la machine assume des tâches standardisées et vérifiables, le rôle humain pourrait se déplacer vers la supervision, la responsabilité finale, la gestion du contexte et les jugements critiques. Dans certains cas, les 1% de jugement humain final pourraient gagner en valeur, car ils permettent de débloquer les 99% d'automatisation à grande échelle. Le marché évolue donc vers une couche où le « travail » lui-même devient l'unité stable, standardisée, vérifiable et négociable. La prochaine phase de concurrence ne portera pas seulement sur la puissance des modèles ou le prix du calcul, mais sur la capacité à standardiser, vérifier et tarifer le « travail » accompli, faisant de la main-d'œuvre machine une nouvelle ressource productive que l'on peut acheter, facturer et échanger.

marsbitIl y a 10 h

Du Token à la main-d'œuvre machine : l'IA passe d'outil à « travailleur »

marsbitIl y a 10 h

La réduction de 99% du prix de Xiaomi MiMo n'est pas un coup marketing ! Luo Fuli répond aux détracteurs sur X

Dans un article intitulé "La réduction de 99% du prix de MiMo de Xiaomi n'est pas du marketing ! Luo Fuli répond aux détracteurs sur X", Luo Fuli, responsable de MiMo, a publié un billet de blog technique de 5000 mots pour expliquer la baisse drastique des prix de l'API MiMo-V2.5. Contrairement aux interprétations initiales d'une guerre des prix ou d'une stratégie de perte, cette réduction de 99% concerne spécifiquement le coût des entrées en cache ("Input Cache Hit"), c'est-à-dire la relecture du contexte historique dans les conversations longues. Le billet détaille six piliers d'ingénierie ayant permis cette réduction : 1. **Architecture Hybride SWA** : Réduction du volume de la mémoire cache (KVCache) à 1/7 grâce à une attention par fenêtre glissante sur 60 des 70 couches du modèle. 2. **Gestion en double pool** : Allocation efficace de la mémoire pour matérialiser les gains théoriques du SWA, multipliant par 5 le nombre d'utilisateurs simultanés par GPU. 3. **Cache de préfixe optimisé** : Augmentation du taux de réussite du cache à 93-95% en moyenne, évitant de recalculer les contextes répétés. 4. **Système de cache distribué GCache** : Stockage des données sur les SSD des machines GPU existantes, réduisant les coûts de stockage additionnels à zéro. 5. **Système de routage LLM-Router** : Optimisation de l'acheminement des requêtes pour maximiser l'utilisation du cache et améliorer les performances. 6. **Prédiction Multi-Token (MTP)** : Accélération de la génération des réponses du modèle, réduisant également les coûts de sortie. Cette chaîne d'optimisations systémiques a réduit le temps GPU par requête d'un ordre de grandeur, permettant une baisse de prix de 99% tout en maintenant une marge positive. Luo Fuli souligne qu'il s'agit d'un accomplissement d'ingénierie validé en production, et non d'une simple manœuvre marketing, offrant une référence pour réduire les coûts dans le secteur de l'IA.

marsbitIl y a 12 h

La réduction de 99% du prix de Xiaomi MiMo n'est pas un coup marketing ! Luo Fuli répond aux détracteurs sur X

marsbitIl y a 12 h

Trading

Spot
Futures

Articles tendance

Comment acheter BAND

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Band Protocol (BAND) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Band Protocol (BAND).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Band Protocol (BAND)Après avoir acheté vos Band Protocol (BAND), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Band Protocol (BAND)Tradez facilement Band Protocol (BAND) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

114 vues totalesPublié le 2024.12.12Mis à jour le 2025.03.21

Comment acheter BAND

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de BAND (BAND) sont présentées ci-dessous.

活动图片