Note de l'éditeur :
Le monde de l'IA est très animé ces derniers temps.
Anthropic est devenue l'entreprise à la croissance la plus rapide de l'histoire humaine, ses revenus annualisés passant de 1 milliard de dollars fin 2024 à 47 milliards de dollars en mai 2026. Elle a terminé hier un cycle de financement série H de 65 milliards de dollars, portant sa valorisation post-investissement à 965 milliards de dollars, dépassant OpenAI pour devenir l'entreprise d'IA la plus valorisée au monde, avec une IPO prévue pour cet automne.
La valorisation de DeepSeek a atteint 45 milliards de dollars, le Fonds national d'investissement de grande envergure ayant mené un premier tour de financement de 70 milliards de yuans (environ 10 milliards de dollars), la liste des investisseurs étant pratiquement finalisée.
Kimi a achevé un financement de 2 milliards de dollars, sa valorisation post-investissement dépassant les 20 milliards de dollars. En six mois, il a accumulé plus de 3,9 milliards de dollars de financement, devenant le champion du financement des startups chinoises de grands modèles.
Step Fun a complété un financement de près de 2,5 milliards de dollars, démantelant sa structure VIE pour se préparer à une IPO à Hong Kong.
ByteDance a augmenté ses investissements en infrastructures d'IA en 2026 de 160 milliards de yuans à plus de 200 milliards de yuans. Bloomberg a rapporté que ses dépenses d'investissement totales pourraient atteindre une limite supérieure de 70 milliards de dollars (environ 500 milliards de yuans).
Le 4 mai, Doubao a lancé trois niveaux d'abonnements payants, tirant le premier coup de feu marquant la fin de l'ère gratuite de l'IA en Chine.
Si l'on compare aux quatre saisons, à quelle saison se trouve l'économie de l'IA aujourd'hui ? Printemps, été, ou entre les deux ? Ou bien s'apprête-t-elle à entrer dans l'automne, comme certains parlent d'une période de bulle ?
La réponse se trouve en réalité dans les cycles.
Aujourd'hui, nous allons clarifier cela en utilisant un cadre d'évaluation en six dimensions pour juger les cycles, proposé par le professeur Su Dechao de la Faculté de philosophie de l'Université de Wuhan, conseiller fondateur de l'Académie PPE de Notesman et enseignant du cours de philosophie occidentale.
I. Évaluation quantitative des six dimensions pour juger les cycles
Beaucoup jugent les cycles sectoriels par exclusion : ce n'est pas l'hiver, le printemps est passé depuis longtemps, l'automne ne semble pas encore arrivé, pour finalement aboutir à une tautologie correcte : l'été. La méthode par exclusion ne donne qu'une réponse apparemment correcte, sans expliquer pourquoi.
Un jugement vraiment utile doit être quantifié à partir de dimensions spécifiques.
Le "cadre d'évaluation en six dimensions" attribue un score de 0 à 2 points pour chaque dimension suivante : "Récit vs Livraison, Connectivité systémique, Capacité de livraison, Rationalisation du ROI (Retour sur investissement), Phénomène sectoriel général, Environnement des capitaux". Plus le score total est élevé, plus on se rapproche de l'automne.
Évaluons point par point.
1. Récit vs Livraison : De raconter des histoires à regarder les comptes
C'est la première dimension, et aussi la plus facile à percevoir.
En 2022, lors de la sortie de ChatGPT, tout le monde disait "l'IA va tout changer". Mais personne ne vous demandait ce que vous pouviez faire concrètement, combien vous pouviez économiser.
Raconter des histoires suffisait, c'était le printemps.
Aujourd'hui, la situation est différente. Doubao lance des abonnements payants, avec trois tarifs clairement affichés : 68, 200 et 500 yuans. Les fonctionnalités payantes se concentrent sur la génération de PPT, l'analyse de données, la production vidéo. Ce n'est plus du récit, c'est livrer des capacités concrètes, puis facturer en fonction.
La plateforme publicitaire d'OpenAI est plus directe : les annonceurs achètent des emplacements publicitaires dans ChatGPT, paiement au clic. L'outil d'administration publicitaire en libre-service a été lancé en test le 5 mai, supprimant le seuil minimum de dépense de 50 000 dollars, permettant même aux PME de diffuser directement.
"L'IA changera l'industrie publicitaire à l'avenir" est un récit, "vous donner un canal publicitaire maintenant" est une livraison, ce sont deux choses différentes.
Le récit persiste, on parle encore de "l'IA change le monde", mais la livraison occupe déjà une part considérable.
Pour cet item, 1 point.
2. Connectivité systémique : Des îlots aux protocoles
Au printemps, chaque produit d'IA était un îlot isolé. Pour intégrer ChatGPT dans le système de l'entreprise, il fallait écrire son propre code d'adaptation, et le réécrire pour un autre modèle.
En avril 2026, Google a lancé la plateforme Gemini Enterprise Agent Platform, intégrant la gestion des agents dans les flux de travail existants des entreprises.
Microsoft Copilot intégré à la suite Office, l'assistant d'achats IA d'Amazon ouvert aux réponses sponsorisées par les marques, leurs frontières respectives se desserrent.
La connectivité doit atteindre un certain niveau pour permettre ce type de réactions synchronisées.
Une certaine protocolarisation est réalisée, mais les protocoles standardisés ne sont pas encore devenus dominants.
Pour cet item, 1 point.
3. Capacité de livraison : D'aider occasionnellement à travailler de manière stable
Au printemps, l'IA était comme un stagiaire, pouvant aider occasionnellement, mais nécessitant souvent de longues corrections.
Doubao compte plus de 300 millions d'utilisateurs. Fin mars 2026, le volume d'appels de tokens quotidiens a dépassé 120 billions, soit une croissance de plus de 1000 fois par rapport à mai 2024, et a doublé au cours des trois derniers mois.
OpenAI a 900 millions d'utilisateurs actifs hebdomadaires, 50 millions d'abonnés individuels, plus de 9 millions d'utilisateurs entreprise.
Que font ces entreprises avec l'IA ? Écrire du code, examiner des contrats, générer automatiquement des textes marketing, traiter des tickets de support client, tous des scénarios visant à remplacer le travail répétitif. Ce n'est plus de l'expérimentation à petite échelle, c'est utiliser l'IA pour travailler.
La livraison est là. Mais la capacité de livraison est-elle devenue un avantage compétitif central ? Difficile à dire. Le récit persiste, mais les entreprises qui peuvent se maintenir grâce à une livraison stable ne sont pas encore majoritaires.
Pour cet item, 1 point.
4. Rationalisation du ROI : De l'incalculable au début du calcul
Au printemps, personne ne calculait le ROI. Combien de puissance de calcul investie, combien de production obtenue ? Incalculable.
Maintenant, certains commencent à calculer : les prix des API de Tencent Hunyuan ont fortement augmenté (selon des informations du secteur, certains modèles ont vu des hausses de plus de 400%), reflet de la pression des coûts de calcul.
Une requête d'inférence d'un modèle de niveau GPT coûte environ 0,01-0,03 yuans en puissance de calcul. Lorsque le volume d'appels atteint des milliards, des dizaines de milliards, les coûts deviennent astronomiques. Les appels fréquents des 345 millions d'utilisateurs actifs mensuels de Doubao obligent ByteDance à faire face à ce problème.
Zhipu a augmenté ses prix trois fois dans l'année, Alibaba Cloud a supprimé le forfait de base de sa plateforme Bailian, derrière ces décisions se trouve la même logique : les produits dont le ROI est incalculable ne tiendront pas longtemps.
Mais le ROI est-il clair et calculable ? Quelques boucles fermées commencent à montrer un ROI, mais les critères sont flous. Certains calculent le coût par token, d'autres les gains d'efficacité, d'autres les conversions d'acquisition, sans standard uniforme.
Pour cet item, 1 point.
5. Phénomène sectoriel général : De personne ne parlant de profitabilité au début des doutes
Au printemps, tout le monde était en expansion, personne ne parlait de profitabilité, brûler de l'argent pour la croissance était le mode par défaut.
Maintenant, Doubao lance un modèle payant, Zhipu, MoonShot AI et d'autres augmentent leurs prix, reconnaissant ainsi que les coûts sont insoutenables et qu'il faut facturer.
Mais le modèle "brûler de l'argent pour la croissance" est-il largement rejeté ? Pas encore. Les capitaux investissent encore, les grands acteurs continuent de s'étendre, mais le rythme a ralenti, on commence à faire les comptes.
Pour cet item, 1 point.
6. Environnement des capitaux : De valorisations fantaisistes au début de la pression
Au printemps, lever des fonds était extrêmement facile, les valorisations étaient fantaisistes, un simple PPT pouvait rapporter des centaines de millions de dollars.
OpenAI lance sa plateforme publicitaire, visant 2,5 milliards de dollars de revenus publicitaires cette année, et un chiffre d'affaires total de 13 milliards de dollars en 2025, mais avec des pertes de 8 milliards de dollars.
Bien qu'OpenAI soit valorisé 852 milliards de dollars, Anthropic, arrivé plus tard, avait dépassé fin avril les 30 milliards de dollars de revenus annualisés, dépassant pour la première fois les 25 milliards de dollars d'OpenAI. Sur le marché secondaire privé, sa valorisation a été poussée près de 1 000 milliards de dollars, dépassant aussi OpenAI.
OpenAI fait face à d'énormes pressions sur les coûts, l'histoire "grandir puis lever des fonds" ne tient plus, il faut gagner de l'argent.
L'hiver du financement est-il là ? Pas encore. Les grands acteurs peuvent encore lever des fonds, mais la logique de valorisation a changé : avant on regardait le potentiel d'imagination, maintenant on regarde la capacité à générer des revenus.
Pour cet item, 1 point.
Six dimensions, 1 point chacune, total 6 points. Selon le cadre, 0-4 points c'est le printemps, 5-7 points l'été, 8-10 points l'automne, 11-12 points l'hiver.
Quel est l'état de l'été ?
Récit et livraison coexistent. Le potentiel d'imagination persiste, mais les comptes sont étalés sur la table. Les capitaux peuvent encore investir, mais commencent à demander un retour. Les utilisateurs continuent de croître, mais commencent à se segmenter, certains sont prêts à payer, d'autres n'utilisent que le gratuit.
Localement, des signes d'automne apparaissent. Si des signaux comme la tarification de Doubao ou la publicité d'OpenAI s'amplifient, gagnant 2 points supplémentaires (par exemple, le ROI devient clair, les capitaux exigent massivement de la livraison), alors l'automne sera vraiment là.
L'été est la phase où récit et livraison coexistent, mais où la livraison devient de plus en plus importante. Tout le monde sait qu'il faut encore raconter des histoires, mais le critère de validation qui se profile discrètement après le récit devient : qu'as-tu réellement livré ?
II. Pourquoi maintenant :
3 signaux, 2 moteurs
L'évaluation en six dimensions est une analyse statique. Dynamiquement, que s'est-il passé récemment ?
Le 6 mai (heure locale), Dario Amodei, fondateur d'Anthropic, a déclaré : "Notre croissance dépasse l'exponentiel, au premier trimestre de cette année, nos revenus et notre utilisation ont atteint une croissance annuelle de 80 fois, nous connaissons une croissance explosive. Nous fournissons autant de puissance de calcul que possible, aussi vite que possible, à une vitesse sans précédent."
C'est l'entreprise à la croissance de revenus la plus rapide de l'histoire humaine. Le jour où l'IA devient véritablement une infrastructure de productivité est peut-être arrivé.
La même semaine, deux signaux sont apparus simultanément : la tarification de Doubao, et la vente de publicité par OpenAI.
En surface, c'est une coïncidence, mais en profondeur, il y a deux lignes directrices : la pression des coûts et les opportunités de monétisation.
Signal 1 : La tarification de Doubao
Pourquoi Doubao facture-t-il ? Les appels fréquents de plus de 300 millions d'utilisateurs transforment les coûts de calcul en un problème incontournable.
Fin mars 2026, le volume d'appels quotidiens de tokens a dépassé 120 billions, soit une croissance de plus de mille fois par rapport à mai 2025, et a doublé au cours des trois derniers mois.
Selon des calculs publics de la société de courtage Zhejiang Securities cités par plusieurs médias, les dépenses d'investissement de ByteDance en 2025 s'élèvent à environ 160 milliards de yuans, dont environ 90 milliards pour l'achat de puissance de calcul IA, le reste pour les infrastructures et équipements réseau.
Le modèle gratuit ne tient vraiment plus. Une estimation des coûts circulant dans la communauté technique indique que l'amortissement matériel représente environ 58% du coût par inférence, les coûts électriques environ 29%. Plus la base d'utilisateurs est grande, plus les coûts sont élevés.
Si l'on convertit les 120 billions de tokens quotidiens au prix réduit des API publiques, cela équivaut à des revenus quotidiens potentiels de 3 à 5 milliards de yuans.
Mais actuellement ? Les revenus B2C sont nuls.
Une croissance de mille fois pour un résultat nul, c'est unique parmi les entreprises internet chinoises des 15 dernières années.
Parallèlement, les tokens en Chine entrent dans une phase de hausse continue des prix. Zhipu augmente ses prix API, GLM5.1 API +10%, la version internationale plus du double ; Alibaba Cloud supprime le forfait de base de Bailian ; GLM5.0, MiniMax2.5, Kimi2.5 mettent fin à la bêta gratuite.
Mais il y a aussi des baisses de prix : DeepSeek V4-Pro à -75%, 0,25 yuans/million de tokens ; le modèle de compréhension visuelle Tongyi Qianwen d'Alibaba Cloud baisse de plus de 80% ; Doubao 2.0Lite à seulement 0,6 yuans/million de tokens en entrée.
Les fabricants de grands modèles se stratifient : hausses d'un côté, baisses de l'autre.
Pression et opportunité, deux moteurs.
Signal 2 : La vente de publicité par OpenAI
Pourquoi OpenAI vend-il de la publicité ? Moitié pression, moitié opportunité.
Côté pression : en 2025, l'entreprise a un chiffre d'affaires de 13 milliards de dollars, des pertes en cash de 8 milliards. 50 millions d'abonnés individuels, 9 millions d'utilisateurs entreprise, génèrent des revenus annuels de plusieurs milliards de dollars, mais les coûts de calcul, de R&D, d'opération dépassent ce montant. Les revenus d'abonnement ne couvrent pas les coûts, les comptes ne sont pas équilibrés.
Côté opportunité : selon des estimations d'observateurs du secteur, le pilote publicitaire a généré près de 100 millions de dollars de revenus annuels récurrents (ARR) en moins de deux mois. Le potentiel de monétisation publicitaire auprès de 900 millions d'utilisateurs actifs hebdomadaires est immense.
Selon des prévisions d'institutions autorisées, les revenus publicitaires annuels de Meta dépasseront 243,46 milliards de dollars, plus que les 239,54 milliards de dollars de Google, montrant que la monétisation publicitaire reste un énorme marché.
Les prévisions présentées par OpenAI aux investisseurs sont : 2,5 milliards de dollars de revenus publicitaires en 2026, 100 milliards en 2030.
C'est un choix forcé par les coûts, mais aussi un choix actif guidé par l'opportunité. OpenAI vise non pas à couvrir les coûts, mais ce grand marché.
L'IA n'est pas gratuite. Les GPU, l'électricité, les ingénieurs, la bande passante coûtent cher. Plus la base d'utilisateurs est grande, plus les coûts sont élevés. Au printemps, on pouvait brûler l'argent des investisseurs, en été, il faut que les utilisateurs paient.
Mais l'été signifie aussi que les voies de monétisation s'ouvrent : publicité, abonnement, stratification, les moyens de générer des revenus sont bien plus nombreux qu'au printemps.
La logique profonde de l'apparition simultanée de ces deux signaux est : la base d'utilisateurs a atteint un point critique, la pression des coûts force les décisions de tarification, et simultanément, les opportunités de monétisation sont suffisamment mûres pour être exploitées.
L'été, c'est cette phase : les comptes sont ouverts, mais la fenêtre d'opportunité n'est pas encore fermée.
III. Entrer en été, comment avancer rapidement ?
Il est clair que l'IA est entrée dans "l'été", passant de "utilisable" à "capable de vous faire économiser de l'argent, de vous en faire gagner".
Comment le constate-t-on ? Quelques exemples :
Les designers de Semir mettaient auparavant au moins trois jours pour produire un rendu. Avec les outils d'IA, 30 secondes, le rendu est direct, pas besoin de prototype.
La designer Lin Jianxia le dit : "Les mauvais concepts sont directement éliminés, pas de gaspillage en coûts de prototype."
L'IA a amélioré l'efficacité globale de la conception et du développement de Semir de 35%, la vitesse de conception des motifs de plus de 200%. En 2025, la valeur directe apportée par l'IA à Semir est de 200 millions de yuans de nouveaux revenus et 20 millions de yuans de réduction des coûts.
Le modèle de conception "Ling Long" d'Anta, formé sur des dizaines de millions de données de chaussures et vêtements accumulées sur plus de trente ans, peut générer en quelques minutes 56 concepts d'inspiration. L'équipe de designers peut terminer les dessins au trait en 1 jour, générer des rendus haute définition.
Avec la collaboration IA-équipe, le cycle de conception des chaussures de tennis, du lancement à la validation finale, est inférieur à 40 jours, bien plus rapide que le cycle traditionnel de 3 mois.
Peacebird a réalisé l'intelligence de toute la chaîne marketing. À partir de la compréhension de l'objectif commercial "Augmenter le GMV des nouveaux produits enfants d'automne", l'IA peut cibler automatiquement les utilisateurs à fort potentiel, générer des recommandations de produits et contenus marketing personnalisés, et les envoyer en un clic sur l'Enterprise WeChat des vendeurs.
Au final, le taux de clics de la nouvelle série a augmenté de 90%, le taux de conversion de paiement de 20%, le GMV des nouveaux produits a bondi de 31%.
Midea Group a constitué une équipe de R&D IA de plus de 400 personnes, avec plus de 13 000 agents intelligents fonctionnant quotidiennement dans des scénarios résidentiels, bureaux, fabrication, médical, entreposage, logistique. Rien qu'en 2025, l'IA a fait économiser 700 millions de yuans à Midea, améliorant l'efficacité globale de plus de 15 millions d'heures.
Que montrent ces cas ? L'IA passe de "décoration" à "acteur principal".
Des exemples vus, comment agir ensuite ?
En bref : à partir d'une série de petites applications d'IA, construire progressivement de grands systèmes applicatifs d'IA.
Trois actions concrètes.
Première action : Trouver une petite entrée, valider une boucle de valeur fermée
Ne pas viser d'emblée la "transformation IA de toute l'entreprise", c'est le plus grand piège. 80% des échecs de déploiement d'IA proviennent de la recherche de l'exhaustivité, de vouloir l'IA pour l'IA.
Comment faire ? Retenir trois mots – Petit, Précis, Rapide :
Petit : Choisir d'abord 1-2 scénarios "douleur claire, processus standardisé, données suffisantes". Ex : service client IA, automatisation financière/administrative, génération de contenu marketing, audit de conformité des contrats. Ce sont des scénarios "haute valeur, faible barrière, résultats rapides".
Précis : Avant de lancer chaque scénario, définir une ligne de base sur 3-6 mois, préciser comment mesurer les gains, définir le succès. Les indicateurs clés doivent être des résultats financiers quantifiables, pas des métriques techniques comme "précision du modèle, vitesse de réponse".
Rapide : Si aucun résultat clair n'est visible en 3 mois, itérer rapidement ou arrêter, ne pas persister. Chaque projet IA doit avoir une limite de perte prédéfinie. Si les objectifs commerciaux fixés ne sont pas atteints pendant 2 cycles consécutifs, arrêt direct.
L'essentiel de cette étape est de valider une boucle fermée, donner confiance à l'équipe, détermination à la direction, pour pouvoir avancer ensuite.
Deuxième action : Du pilote à la réplication, capitaliser les capacités organisationnelles
Un scénario validé n'est pas une transformation, c'est un pilote au mieux. Ce qui fait la différence, c'est la capacité à transformer un succès ponctuel en une compétence organisationnelle.
Ne pas déployer à l'aveugle un scénario validé. D'abord formaliser la méthode : comment écrire les prompts, quelles tâches confier à l'IA, qui doit valider, quels pièges éviter, comment mesurer le succès. En faire un processus standard, puis l'étendre à des lignes métier similaires.
Construire "deux infrastructures" : une plateforme centrale de partage des capacités IA, pour éviter que chaque département parte de zéro (les ventes peuvent utiliser directement les capacités IA validées par la finance, la R&D réutiliser les modèles d'analyse utilisateur du marketing) ; et une base de connaissances de prompts, partagée par scénario, avec récompense pour les prompts les plus utilisés.
Et l'organisation doit suivre. Semir insiste : le déploiement de l'IA, c'est 70% de problèmes humains, 30% de technique. Lors de la réplication, trois choses doivent avancer de pair :
Équipe de talents : Pas seulement recruter quelques ingénieurs algorithmes. Il faut trois niveaux. Au sommet, la direction ou un cadre supérieur pilote personnellement. Au milieu, des "traducteurs" comprenant à la fois les limites de l'IA et les douleurs métier. À la base, des employés de première ligne capables d'utiliser les outils IA pour résoudre leurs problèmes.
Mécanismes d'incitation : Toutes les incitations doivent être liées à des résultats quantifiables de déploiement de l'IA, avec une part directe sur les revenus générés ou les économies réalisées grâce à l'IA. Les cycles de récompense doivent être courts, mensuels ou trimestriels, pour que les gens sentent vite "utiliser l'IA = plus d'argent". Le plus crucial : les incitations doivent aussi toucher les exécutants de première ligne, utilisateurs finaux des outils IA. Sans leur implication, l'IA ne se déploie jamais.
Structure organisationnelle : La direction doit piloter personnellement, impliquant responsables métier, technique, finance, RH, pas laisser le département IT seul. Intégrer le degré de coopération au déploiement de l'IA dans l'évaluation de performance des responsables de département. Si quelqu'un reste indifférent, l'évaluation s'en chargera.
En bref, cette étape transforme le "succès d'une personne" en "muscle organisationnel".
Troisième action : Reconstruction systémique, de l'ajout d'IA à la refonte par l'IA
Plusieurs scénarios validés, l'organisation suit, la suite n'est plus "coller de l'IA sur un vieux processus", mais laisser l'IA refaire le processus. C'est le grand système.
Reconstruction des processus : Séquentiel devient parallèle. L'ancienne méthode "une personne termine, passe à la suivante", séquentielle, est obsolète à l'ère de l'IA. Il faut passer à plusieurs personnes et plusieurs IA travaillant simultanément :
Avant une réunion, faire simuler par l'IA les positions de chaque partie, exposer à l'avance les failles logiques, conflits de ressources. La réunion formelle ne résout que les vrais désaccords, réduisant le temps de réunion de 70%.
Tableau de bord d'alignement en temps réel : Plus de rapports hebdomadaires. Tous, y compris l'IA, mettent à jour leur statut sur le même tableau. L'IA surveille les incohérences. Si vous parlez de "rapport qualité-prix élevé" mais fixez un prix haut de gamme, le tableau l'indique en rouge, détectable le jour même, pas besoin d'attendre la réunion de revue deux semaines plus tard.
À la réception d'une demande, ne pas se précipiter. D'abord faire reformuler par l'IA votre compréhension, pour confirmation. Si même l'IA comprend mal, la demande est mal formulée, éliminer les retouches à la source.
Les chaînes de déclenchement automatisées sont aussi cruciales : Un utilisateur se plaint → l'IA génère des propos d'apaisement → validation service client → partage groupe travail marque ; Le ROI baisse → l'IA cherche la cause → suggestions au responsable ; Le stock est bas → l'IA calcule le réapprovisionnement → envoi à la supply chain. Tout tourne sans surveillance constante.
En résumé : Les processus doivent passer de "poussés par les humains" à "quand un événement se produit, l'IA agit automatiquement, l'humain valide".
Pour conclure ces trois actions : D'abord valider une boucle fermée sur une douleur, prouver que l'IA peut générer des revenus/économies ; Ensuite formaliser et étendre la méthode réussie, adapter les personnes et les incitations ; Enfin laisser l'IA refaire les processus, les petits problèmes deviennent un grand système. Valider un point, l'étendre en une surface, puis laisser l'IA refaire l'ensemble du jeu.
Cet article provient du compte WeChat public "Notesman" (ID: Notesman), auteur : Lao Jia











