Source : Cynthia, Hong Kong Ethereum Community Hub
Invité : qinbaFrank — Investisseur sur les marchés secondaires américains et cryptos, analysant depuis longtemps la logique macroéconomique, industrielle et actionnariale selon les principes premiers.
Le 8 juin 2026, lors d'un événement VIP organisé conjointement par Futu, SNZ, ETH HK Hub et Sharplink, l'investisseur chevronné qinbaFrank a donné une présentation intitulée "Récapitulation et perspectives de la vague de puissance de calcul de l'IA", systématisant le parcours complet du marché de l'IA de 2023 à aujourd'hui : des trois grands débats du marché sur la "nécessité de la puissance de calcul" à la manière dont les dividendes de pénétration déterminent l'efficacité commerciale, puis à la phase cruciale actuelle de transition de la pénurie matérielle vers la validation commerciale.
Il a également fourni un cadre pour évaluer le niveau de ce cycle de correction — trois scénarios possibles : correction des valorisations, des résultats ou de la logique — et a expliqué pourquoi ce cycle de l'IA est "similaire en forme mais différent dans son essence" par rapport à la bulle Internet de l'an 2000.
Déclaration : Le contenu de cet article représente fidèlement les points de vue partagés par l'invité et ne constitue en aucun cas un conseil en investissement, une offre de vente de produit ou une promesse de rendement.
一、Pourquoi avoir signalé des risques et réduit légèrement la position le 3 juin
Depuis 2023, j'ai écrit à plusieurs reprises quelques réflexions sur l'économie et ce cycle de marché de l'IA/calcul. En juin 2024, j'ai recommandé Palantir sur X, estimant qu'il avait encore un potentiel de 3 à 5 fois en tant que représentant de l'IA dans la défense. À l'époque, ce jugement était très controversé, mais avec le recul, il a effectivement réalisé une progression très notable.
C'est la première fois que je viens faire une telle présentation en présentiel. Je profite de cette occasion pour systématiser mon cadre global sur ce cycle de l'IA : comment il s'est déroulé, où il en est actuellement et vers quelle direction il pourrait évoluer à l'avenir.
Mercredi soir dernier (3 juin), j'ai donné une interview de plus de deux heures pour la communauté d'investisseurs américains 168X sur X. Le point central était : le marché est un peu "trop chaud" récemment et a besoin d'un refroidissement et d'un ajustement appropriés. Les raisons spécifiques sont les suivantes :
- Premièrement, le sentiment est trop concentré, le FOMO est surchauffé. La concentration des capitaux dans les directions populaires a atteint une position extrême, une croissance parabolique est difficile à maintenir, et les commandes et les résultats ne sont pas encore totalement matérialisés.
- Deuxièmement, la tournée de présentation pour l'introduction en bourse de SpaceX a déclenché des réallocations chez les institutions. Pendant la tournée de présentation de SpaceX, de nombreuses institutions ont commencé à vendre prématurément certaines positions pour libérer des capitaux, plutôt que d'attendre le moment officiel de l'introduction — cet effet de rotation et de prélèvement des capitaux a tendance à se manifester à l'avance.
- Troisièmement, la situation géopolitique apporte un sentiment d'aversion au risque. Les négociations américano-iraniennes connaissent encore des rebondissements, s'ajoutant aux données sur l'emploi publiées vendredi dernier et aux données sur l'IPC de cette semaine, l'appétit pour le risque global du marché a diminué.
- Quatrièmement, les données sur l'emploi ont impacté les anticipations de baisse des taux. Si les créations d'emplois hors agriculture de mai dépassent largement les attentes, le marché réintégrera des trajectoires de taux d'intérêt plus élevées.
- Cinquièmement, les données sur l'IPC de cette semaine sont la véritable variable politique. Des données solides sur l'emploi ne suffisent pas à déterminer une hausse des taux, ce qui est vraiment crucial, c'est l'IPC sous-jacent — en particulier si la hausse des prix de l'énergie se transmet et s'étend aux prix des services, c'est la variable centrale à surveiller de près dans la ou les deux prochaines semaines.
La ligne de démarcation centrale pour juger du niveau de cette correction est : une simple digestion des capitaux/de la concentration conduit généralement à une correction de faible ampleur ; des données d'inflation supérieures aux attentes peuvent l'amplifier à un niveau faible à moyen ; seule une décélération marquée de la commercialisation de l'IA ou des revenus du cloud signifierait une remise à zéro de toute la narration. Dans l'ensemble, je pense qu'à court terme, le marché a besoin d'un certain temps pour digérer et attendre, les directions surchauffées et excessivement concentrées pourraient entrer dans une phase de correction douce ou modérée, jusqu'à ce que le prochain "signal macro" apporte un soulagement.
二、Récapitulation : Les "trois grands débats" du marché de l'IA au cours des trois dernières années
Pour comprendre la position actuelle, il est nécessaire de revoir le parcours complet de ce cycle de l'IA depuis 2023 jusqu'à aujourd'hui. Je pense qu'il ne s'agit pas d'une simple progression linéaire, mais d'une dynamique en vagues poussée par une succession de "débats de marché — validation — nouveaux débats".
Premier débat (deuxième semestre 2023) : Les dépenses en capital sont-elles vraiment nécessaires ?
Au premier semestre 2023, ce thème était principalement porté par les valorisations — les résultats ne s'étaient pas encore nettement améliorés, mais le cours des actions avait déjà progressé (multiplié par plusieurs fois environ). À cette époque, l'industrie mondiale des semi-conducteurs était en phase de ralentissement, et le marché était encore très divisé sur "la quantité de puissance de calcul dont l'IA a réellement besoin", ce qui s'est traduit globalement par une consolidation à des niveaux élevés au second semestre 2023.
Deuxième débat (début 2024 à début 2025) : Les dépenses en capital des grands acteurs continueront-elles à s'accélérer ?
Au premier trimestre 2024, les résultats de Nvidia ont commencé à s'améliorer séquentiellement, et les dépenses en capital des grandes entreprises technologiques ont également commencé à s'accélérer, ce qui a progressivement confirmé au marché que "la demande de puissance de calcul est une tendance réelle". Un événement marquant a été : lors du Forum économique mondial de Davos début 2024, Sam Altman d'OpenAI a déclaré que des milliers de milliards de dollars seraient nécessaires à l'avenir pour les capacités de fabrication de puces. À l'époque, cette affirmation était très contestée dans le secteur, y compris par les dirigeants de Nvidia et de TSMC qui avaient publiquement exprimé leur scepticisme, estimant qu'un investissement d'une telle ampleur n'était pas nécessaire. Mais étant donné que les dépenses en capital des grands fournisseurs de cloud ont continué à dépasser les attentes par la suite, le marché a progressivement accepté ce jugement — l'échelle de l'électricité et de la puissance de calcul nécessaires pour les nouveaux centres de données aux États-Unis est effectivement de l'ordre de milliers de milliards de dollars.
Durant cette phase, les capitaux sont passés des dépenses en capital des grandes entreprises technologiques vers Nvidia et sa chaîne d'approvisionnement amont, alimentant la hausse principale de 2024.
Troisième débat (début 2025) : La puissance de calcul est-elle surévaluée ?
Au premier trimestre 2025, la publication d'un modèle de grande envergure avec une efficacité d'entraînement nettement améliorée a suscité des doutes sur le marché quant au "besoin réel de tant de puissance de calcul", entraînant une correction marquée des cours. Ensuite, en février, les changements de politique tarifaire américaine ont provoqué une autre chute importante, les valeurs centrales concernées reculant considérablement par rapport à leurs sommets — c'était la deuxième correction significative de ce cycle.
Troisième phase (deuxième semestre 2025) : Formation du consensus
Dès le deuxième et troisième trimestres 2025, le marché a généralement pu constater une amélioration sensible des capacités et de l'utilité des grands modèles, les cas d'usage passant de "principalement l'entraînement" à "principalement l'inférence", l'augmentation de la taille des paramètres des modèles et des capacités multimodales a encore accru la demande en puissance de calcul. Durant cette phase, les dépenses en capital des grandes entreprises technologiques sont entrées dans une nouvelle phase d'accélération, et le marché a également entamé une nouvelle phase haussière.
三、Cadre central : Le taux de pénétration détermine l'efficacité de la commercialisation
Pour ma part, je juge de la portée potentielle d'une vague technologique principalement en fonction du taux de pénétration, et non pas simplement de "l'existence d'une tendance".
Beaucoup comparent ce cycle de l'IA à la bulle Internet de l'an 2000. Je pense qu'ils sont "similaires en forme mais différents dans leur essence" : tous deux ont connu une hausse parabolique des valorisations précédant les résultats, mais les environnements industriels sont radicalement différents.
-
Autour de l'an 2000, le taux de pénétration d'Internet aux États-Unis n'était que d'un peu plus de 30 %, les modèles économiques (publicité, commerce électronique, jeux, services à valeur ajoutée) étaient encore en phase d'expérimentation, donc après l'éclatement de la bulle, le Nasdaq a mis un temps considérable à sortir à nouveau du creux.
-
L'Internet mobile autour de 2010 était différent : après le lancement de l'iPhone en 2007 et l'ouverture d'Android, le taux de pénétration de l'Internet mobile en Chine et aux États-Unis est passé du stade précoce au grand public en environ dix ans (2010-2018) — beaucoup plus rapide que les vingt à trente ans qu'Internet a pris. Cela est dû au fait que l'infrastructure de la génération précédente (la généralisation d'Internet, l'efficacité de la diffusion de l'information) a posé de très bonnes bases pour la génération suivante.
Aujourd'hui, nous sommes dans un environnement où des milliards de personnes dans le monde sont habituées à utiliser WeChat, les médias sociaux, diverses applications — la vitesse de diffusion de l'information et le degré d'acceptation du grand public pour les nouvelles technologies ne sont absolument pas comparables à ceux de l'an 2000. C'est précisément là la plus grande différence entre l'environnement industriel de l'IA actuelle et celui d'Internet en 2000.
Concrètement, en termes de méthode de jugement, je souscris assez à un point clé du "cycle de vie d'adoption de la technologie" (théorie du franchissement du gouffre) : un taux de pénétration de 10 % est un point critique. En dessous de 10 %, cela signifie que la technologie est encore au stade de "validation précoce", sa caractère suffisamment révolutionnaire détermine si elle peut décoller ; une fois les 10 % franchis, cela signifie qu'elle a atteint le marché de masse, la pente de croissance devient généralement plus raide ; la fenêtre d'observation centrale se situe dans l'intervalle de 10 % à 50 %, c'est aussi la "période dorée" des investissements industriels liés — l'expansion de la base d'utilisateurs et l'augmentation de la volonté de payer se produisent simultanément, la consommation de tokens augmente en conséquence ; après avoir dépassé 50 %, l'espace de croissance additionnelle diminue marginalement.
En référence à une étude : une enquête d'une grande banque d'investissement sur la volonté des entreprises d'acheter de l'IA montre que ce pourcentage est passé d'environ 10 % en septembre dernier à environ 18 % fin mars — cela signifie que le taux de pénétration de l'IA dans les entreprises a franchi le point critique et est officiellement entré dans une phase de croissance rapide.
Si l'on place cette vague d'IA dans la comparaison des trois générations de vagues technologiques : l'Internet PC de 1990 à 2010 a mis environ 20 ans pour achever sa pénétration ; l'Internet mobile de 2010 à 2019 a pris moins de 10 ans ; et l'IA, à partir de 2023, pourrait se diffuser encore plus rapidement. La raison centrale est que plus l'infrastructure est complète, plus le cycle de commercialisation est court — à l'ère de l'Internet mobile, les smartphones, la 4G, les boutiques d'applications et le paiement mobile ont favorisé la massification ; et l'IA d'aujourd'hui, reposant sur l'infrastructure du cloud, des API de modèles, de la diffusion sociale et des agents, bénéficie de moyens de diffusion de l'information et de commercialisation plus matures que jamais auparavant.
四、IA vs Internet : Différences essentielles dans la logique de commercialisation
Le problème central qu'Internet résout est "l'efficacité de la connexion et de la diffusion de l'information" — il réduit les coûts des intermédiaires dans les flux d'information, de logistique et de capitaux, mais il ne remplace pas directement "l'humain".
L'IA est différente : elle remplace directement la cognition et le travail humains. Lorsque les capacités d'une IA atteignent voire dépassent celles d'un employé humain de "niveau social moyen", ce qu'elle apporte n'est pas seulement un gain d'efficacité, mais un véritable remplacement — cela signifie que le fait pour une entreprise de payer pour de l'IA est, en substance, équivalent aux coûts qu'elle engageait auparavant pour embaucher cette main-d'œuvre. C'est aussi pourquoi beaucoup de gens (moi y compris) voient leurs dépenses pour des outils d'IA passer rapidement de la version gratuite à des dizaines de dollars par mois, des centaines de dollars, voire des abonnements simultanés à plusieurs grands modèles — une fois que l'on expérimente que "cela fait effectivement mieux et plus vite que moi", la volonté de payer monte très fermement. Donc, une fois que l'IA dépasse le niveau d'intelligence social moyen, sa valeur commerciale augmente rapidement de façon exponentielle.
Cela rejoint également une question soulevée précédemment par un invité : dans la tendance où l'IA remplace rapidement le travail cognitif, comment la valeur de "fossé" des connaissances et de l'expérience professionnelles individuelles va-t-elle évoluer ? C'est l'une des raisons fondamentales pour lesquelles la commercialisation de l'IA est plus complexe que celle d'Internet.
五、Logique d'investissement dans la chaîne de puissance de calcul : De la "narration unique sur les GPU" à une réévaluation systémique
La logique d'investissement dans la puissance de calcul de ce cycle est en train de passer d'un simple pari sur les GPU à une réévaluation systémique de toute la chaîne : mémoire, CPU, interconnexion, alimentation, encapsulation, matériel périphérique. Dans l'ensemble, cela peut être résumé par un cadre en trois étapes : à court terme, regarder la "pénurie de ressources", à moyen terme, regarder la "mise à niveau des systèmes", à long terme, regarder le "taux de pénétration de l'IA physique (Physical AI)".
1. Tarification par la pénurie : Le débordement de la demande de GPU vers la mémoire et les CPU
La chaîne logique est : les contextes longs, le multimédia et les applications d'agents augmentent la demande de mémoire — la HBM se tend en premier, puis se propage couche par couche vers la DRAM/GDDR, la NAND/SSD/HDD, puis vers le niveau de planification du CPU, et enfin vers l'alimentation électrique.
D'abord la pénurie de GPU. En 2022-2023, l'industrie mondiale de la mémoire était en phase de ralentissement, de nombreuses capacités avaient été éliminées. En 2024, avec l'accélération des dépenses en capital des grands fournisseurs de cloud, l'impact de cette élimination de capacités a commencé à se manifester.
Puis la pénurie de mémoire/HBM. La HBM elle-même a un processus de fabrication complexe, avec des rendements qui s'améliorent lentement, et après l'excès de capacités désastreux du cycle précédent, les principaux fabricants de mémoire sont très prudents sur l'expansion, les nouvelles capacités ne seront libérées qu'au second semestre 2027. Cela a considérablement accru le pouvoir de négociation des fabricants de mémoire lors de la signature de contrats d'approvisionnement à long terme — les contrats sont signés pour 5 ans, avec des acomptes de 10 % à 30 % demandés, voire des garanties financières des clients en aval. C'est aussi pourquoi ces sociétés présentent des caractéristiques de "résultats augmentant avant les valorisations" : les résultats ont continuellement dépassé les attentes ces derniers trimestres, mais les valorisations ont été comprimées car le marché craignait de "retomber dans le cycle des semi-conducteurs", jusqu'à ce que l'existence de ces contrats à long terme fasse progressivement croire au marché que les fluctuations cycliques seraient "aplaties", et les valorisations ont alors commencé à se redresser.
Ensuite la pénurie de planification des CPU, et enfin la pénurie d'électricité. La raison principale est que de nombreuses tâches d'orchestration et de planification dans les centres de données ne sont pas adaptées au traitement par GPU et doivent dépendre des CPU. Prenons l'exemple du rack NVL72 de Nvidia : la configuration actuelle est d'environ 72 GPU pour 36 CPU Vera, soit un ratio CPU:GPU d'environ 1:2 (les premières solutions étaient d'environ 1:8) ; le marché anticipe qu'à l'avenir, cela pourrait évoluer vers un ratio proche de 1:1, ce qui signifie que les CPU (qu'ils soient d'Intel, d'AMD ou des puces ARM conçues en interne) voient leur importance dans l'infrastructure de calcul être réévaluée. La propagation suivante concerne l'alimentation électrique des centres de données et la capacité du réseau.
2. Tarification par la mise à niveau : L'interconnexion optique, l'alimentation électrique et l'encapsulation avancée évoluent simultanément
La deuxième ligne directrice est la "logique de mise à niveau" — le cœur ne réside pas dans "l'existence ou non de ce module", mais dans la capacité à continuer d'améliorer l'efficacité de conversion, la consommation d'énergie, la densité d'alimentation et le rendement d'encapsulation.
Interconnexion optique : Les modules optiques évoluent vers LPO/NPO/CPO. L'optique co-emballée (CPO) intègre plus étroitement les puces optiques et électroniques, ce qui peut en théorie réduire la consommation d'énergie, mais n'est pas encore produit en masse à grande échelle. Certaines visites et études montrent que les grands fournisseurs de cloud n'adopteront probablement pas massivement le CPO avant 2027 — la préoccupation centrale est la fiabilité : un module optique traditionnel défectueux peut être remplacé directement, tandis qu'en cas de problème avec le CPO, cela implique un remplacement au niveau de la carte entière, avec des coûts et des cycles de validation, et les grands acteurs ont besoin de temps pour valider suffisamment les rendements et les taux de défaillance.
Réseau d'alimentation : Évolution du 48/54V vers le HVDC 800V. Cela ressemble beaucoup au parcours de haute tension de l'industrie des véhicules électriques — les véhicules électriques précoces utilisaient généralement des architectures d'alimentation à tension relativement basse, moins efficaces ; plus tard, des acteurs comme BYD, Huawei, etc., sont progressivement passés à des architectures à courant continu à tension plus élevée, avec une tension plus haute, un courant plus faible et des pertes réduites. Le système d'alimentation des centres de données suit un chemin de mise à niveau similaire, ce qui stimule également la demande dans les chaînes liées aux semi-conducteurs de puissance (comme le carbure de silicium) et à la gestion de l'alimentation.
Encapsulation avancée : Empliage 3D + substrats en verre/céramique. Cela ressemble au parcours d'évolution des puces pour smartphones ces dernières années — lorsque les gains de performance apportés par la seule réduction des nœuds de fabrication atteignent des rendements marginaux de plus en plus faibles, l'industrie se tourne vers des méthodes d'encapsulation plus avancées (comme l'empliage 3D, les substrats en verre ou céramique) pour repousser les limites physiques, utilisant de meilleurs matériaux et des processus d'encapsulation pour continuer à améliorer les performances globales.
3. Tarification à long terme : Calcul en périphérie (Edge Computing) et IA physique (Physical AI)
La logique à long terme est l'entrée en phase de validation d'applications du calcul en périphérie et de l'IA physique — de l'inférence sur périphériques avec des petits modèles, aux robots, à la conduite autonome, puis à la production de masse et à la réduction des coûts, pour finalement former une nouvelle courbe de pénétration. Les points de suivi à court et moyen terme sont la mémoire, les CPU/ARM, l'interconnexion optique, les équipements électriques et l'encapsulation avancée ; à long terme, il faut regarder la courbe de production de masse des robots et de la conduite autonome.
六、Évolution des thèmes d'investissement : Des contraintes physiques aux systèmes d'exploitation verticaux spécialisés en IA (Vertical AI OS)
Une fois la tension de l'offre de puissance de calcul atténuée, le centre d'attention du marché connaîtra un parcours de migration : contraintes physiques (pénurie de puissance de calcul/capacités) → couche de déploiement en entreprise (les entreprises peuvent-elles transformer l'IA en système de production) → systèmes d'exploitation verticaux spécialisés en IA (maîtrise des points d'entrée des flux de travail sectoriels) → IA physique (entrée dans le monde physique réel).
L'essence de la couche de déploiement en entreprise n'est pas de simplement brancher une boîte de dialogue, mais de réécrire les flux de travail de l'entreprise : d'abord identifier les flux de travail à haute fréquence, à coût humain élevé et dont les résultats sont vérifiables, puis connecter les données privées de l'entreprise (impliquant RAG, gestion des autorisations, filiation des données, graphes de connaissances), permettre aux agents d'exécuter réellement des actions (appeler des API, des SaaS, compléter les processus d'approbation et de retour en arrière), et mesurer en continu les taux d'accomplissement des tâches, les taux de reprise en main, les coûts et le ROI.
Ce qu'on appelle le "système d'exploitation vertical spécialisé en IA" peut être compris comme la couche de contrôle intelligent du secteur — contrairement au SaaS traditionnel où "l'humain opère le logiciel", l'AI OS, c'est "l'IA appelle des outils, fait avancer les processus, l'humain supervise, approuve et décide", c'est essentiellement la combinaison de System of Intelligence + Action + Governance. Les indicateurs clés pour juger des progrès à ce stade incluent : la commercialisation continue-t-elle à s'accélérer (ARR des modèles, revenus du cloud, nombre de clients entreprises), la qualité du déploiement a-t-elle vraiment passé la ligne de production (taux d'accomplissement des tâches, taux de reprise manuelle, précision), l'aspect économique est-il bouclé (coût unitaire d'inférence, ROI, marge brute), et un fossé est-il formé (données privées, profondeur des processus, conformité et audit).
七、L'ancre sous-jacente de la progression en vagues : L'ARR des modèles et les revenus du cloud
Le maintien ou non de la narration du marché ne dépend pas de "si la valorisation est chère", mais du fait que l'ARR (revenus récurrents annualisés) des fournisseurs de modèles et les revenus des activités cloud continuent de croître fortement — cela détermine si les dépenses en capital des grandes entreprises technologiques sont justifiées et si la dynamique de toute la chaîne de puissance de calcul peut se poursuivre. Cette chaîne de transmission est : demande réelle (paiement réel B2C/B2B) → forte croissance de l'ARR des fournisseurs de modèles → activité cloud dépassant les attentes → la chaîne de puissance de calcul continue d'en bénéficier.
Autour de cette chaîne de transmission, on peut discuter de trois scénarios :
Scénario un : La croissance ne ralentit pas, la logique n'est pas inversée. Si l'ARR des fournisseurs de modèles continue d'augmenter et que l'activité cloud continue de dépasser les attentes, cela signifie que la justification des dépenses en capital reste valable, la logique de commandes de la chaîne de calcul reste active. Dans ce cas, même s'il y a eu une hausse excessive à court terme et qu'une correction faible à modérée se produit parce que les valorisations sont "jugées chères", les fondamentaux ne sont pas détériorés — souvent, la chute est rapide, mais le redressement aussi, et un trimestre de résultats ou une nouvelle application peuvent rapidement entraîner un renversement.
Scénario deux : La croissance est inférieure aux attentes, la narration est réinitialisée. Si les résultats des fournisseurs de modèles ralentissent nettement, ou si la chaîne de demande de l'activité cloud montre un ralentissement clair, cela signifie que le problème est plus proche de "l'origine de la commercialisation" — car une grande partie des achats de puissance de calcul dans le cloud provient précisément de ces fournisseurs de modèles. Dans ce cas, il s'agit au moins d'une correction de niveau moyen, il faut attendre de nouvelles preuves que l'échelle et la croissance peuvent à nouveau dépasser les attentes pour que la confiance revienne.
Scénario trois : Les facteurs macroéconomiques/de liquidités sont des "amplificateurs", mais pas la cause fondamentale. Les facteurs macroéconomiques et de liquidités affectent le sentiment du marché et le taux d'actualisation, mais ils ne deviennent un risque central que lorsqu'ils impactent réellement le niveau de commercialisation. Concrètement, cela peut se diviser en trois niveaux : un simple retrait de liquidités ou un dépassement ponctuel de l'IPC conduit généralement à une correction de faible ampleur ; si cela s'ajoute à une inflation persistante, une absence de baisse des taux et des risques géopolitiques, cela peut s'amplifier en une correction faible à moyenne ; seulement lorsque l'ARR des modèles ou les revenus du cloud montrent un vrai ralentissement, on entre dans une réinitialisation logique de niveau moyen.
En termes simples : tant que l'ARR des grands modèles et les revenus du cloud ne ralentissent pas, cette correction ressemble plus à une revalorisation au niveau des valorisations et des liquidités, et non à un effondrement de type an 2000 ; seulement lorsque les fondamentaux ralentissent réellement, il faut attendre de nouvelles preuves de renversement.
八、Phase actuelle : De la pénurie matérielle vers la validation commerciale
De avril à juin de cette année, l'hypothèse centrale du marché était : les prévisions de dépenses en capital des grands fournisseurs de cloud continueront à dépasser les attentes, et cela est soutenu par la demande réelle de paiement pour les services cloud par les entreprises et les consommateurs (c'est-à-dire la croissance des revenus de l'activité cloud). Si cette hypothèse est valable, cela signifie que les dépenses en capital sont "raisonnables et durables", et alors toute la chaîne d'approvisionnement — mémoire, optique, CPU, puces, jusqu'à l'électricité et le réseau — en bénéficiera.
Pour l'avenir, je pense que le centre d'attention du marché passera progressivement de la "pénurie matérielle" à la "matérialisation commerciale". Un rapport en mai de cette année mentionnait que sur le marché des services aux entreprises, la catégorie de produits qui se vend le mieux est en réalité les services de conseil/d'implémentation en IA — c'est-à-dire la capacité à aider les entreprises à vraiment intégrer l'IA dans leurs processus métiers spécifiques. La logique sous-jacente est la suivante : les processus de production et l'expérience centraux de nombreux secteurs ne sont pas des documents publics, mais sont détenus dans l'expérience des employés seniors, les données d'entraînement des grands modèles eux-mêmes ne contiennent pas ces "connaissances tacites". Celui qui peut aider les entreprises à combiner ce savoir-faire sectoriel avec l'IA pourra saisir l'opportunité de la phase suivante.
Mon jugement personnel est : tant que cette croissance elle-même ne se détériore pas significativement, les corrections qui suivront, qu'elles soient dues à des facteurs macroéconomiques (comme les taux d'intérêt, les tarifs douaniers, etc.), seront plus probablement des ajustements temporaires de faible à moyenne ampleur, et non un renversement de tendance. Ce qu'il faut vraiment surveiller, c'est une situation où la croissance globale de la commercialisation de l'IA est nettement inférieure aux attentes — c'est à ce moment-là qu'il faudra vraiment réévaluer la logique de valorisation de tout le secteur.
九、Référence historique : Cadre à trois niveaux pour les corrections du marché américain
Pour juger du niveau d'une correction sur le marché américain, regarder seulement l'ampleur de la chute n'a pas beaucoup de sens, la clé est de voir si la source du déclenchement renverse la logique à long terme — s'agit-il d'une simple impulsion de correction des valorisations, d'un choc macroéconomique, ou d'une réinitialisation de toute la narration industrielle. En prenant le Nasdaq comme référence (car son caractère technologique est plus pur), les corrections des 20 dernières années peuvent être grossièrement divisées en trois niveaux :
Niveau 1 faible (chute d'un seul chiffre en %) : La source déclenchante est généralement une impulsion de "correction des valorisations" après une hausse trop rapide, combinée à un choc de liquidités ou à des perturbations liées aux anticipations d'inflation/baisse des taux. Cette correction n'est pas une crise, les fondamentaux ne changent pas, une fois la perturbation confirmée comme atténuée, le renversement est généralement rapide. Un exemple relativement récent est la correction d'environ 7-8 % en novembre dernier, principalement due à un choc de liquidités combiné aux premiers doutes du marché sur les dépenses en capital en IA.
Niveau 2 moyen (chute d'environ 15 %) : S'accompagne généralement d'un événement macroéconomique majeur ou d'un choc de mécanisme de marché, le risque doit être revalorisé, mais cela ne signifie pas un effondrement de l'ordre sous-jacent, le marché a besoin d'attendre de nouvelles données pour confirmer que le risque ne se propage pas davantage. Par exemple, la correction d'environ 15 % d'août à octobre 2023, dans un contexte où le rendement des bons du Trésor à 10 ans approchait les 5 % ; la correction de juillet-août 2024 était liée à la liquidation d'opérations de portage (carry trade) et aux inquiétudes du marché sur une récession.
Niveau 3 important (chute de plus de 25 %) : Signifie que la logique macroéconomique habituelle est réinitialisée, ou que la narration à long terme de l'industrie est renversée, l'appétit pour le risque subit une réévaluation systémique, et des preuves entièrement nouvelles sont nécessaires pour reconstruire la confiance. Les exemples historiques incluent la crise financière de 2008 (division par deux), le quatrième trimestre 2018 (environ 25-30 %), le choc de la pandémie de mars 2020 (environ 30-40 %), le cycle de hausse des taux de 2022 (environ 33-35 %), ainsi que les corrections d'environ 28 % dues à des chocs tarifaires ou sur l'ordre commercial mondial.
Appliqué au cycle actuel de l'IA, la ligne de démarcation centrale reste de savoir si la croissance de la commercialisation de l'IA ralentit : si l'ARR des modèles, le nombre d'utilisateurs entreprises, les revenus des tokens et les revenus du cloud continuent de dépasser les attentes, cela signifie que la logique commerciale n'a pas été inversée, et le recul est davantage dû à des perturbations de liquidités ou macroéconomiques, entraînant une correction de faible à moyenne ampleur ; si les résultats des fournisseurs de modèles sont inférieurs aux attentes, cela signifie que l'on se rapproche davantage de l'origine de la commercialisation, nécessitant au moins une revalorisation de niveau moyen, et en attendant de nouvelles preuves ; seulement lorsque la croissance de l'IA ralentit, tout en s'ajoutant à des risques systémiques comme une inflation explosive, des conflits géopolitiques ou une rupture de l'ordre mondial, cela pourrait s'amplifier en une correction de grande ampleur.
En termes simples : Tant que la commercialisation de l'IA ne ralentit pas, la correction de ce cycle ressemble plus à une "revalorisation" ; seulement lorsque les preuves de la commercialisation font défaut, cela signifie que tout le cadre doit être réinitialisé.
十、Conclusion : L'IA est une transition fondamentale des capacités de base de la civilisation
Enfin, je partage ma compréhension personnelle de la nature de cette vague. Historiquement, la poudre à canon, la machine à vapeur, l'électricité, Internet étaient essentiellement des "révolutions industrielles ponctuelles" — elles amélioraient un certain outil, une source d'énergie ou un canal d'information, résolvaient un goulet d'étranglement clé avant de se diffuser le long de la chaîne industrielle, présentant une courbe en S d'un cycle technologique unique. Ces révolutions changeaient "une capacité unidimensionnelle", et n'amélioraient pas directement l'intelligence elle-même.
Je pense que l'IA est différente — elle améliore la capacité de base la plus fondamentale qu'est "l'intelligence". On peut faire l'analogie avec l'"utilisation du feu" par l'humanité : passer de ne pas savoir utiliser le feu à savoir l'utiliser n'a pas seulement apporté "un outil supplémentaire", mais la cuisson des aliments a modifié la structure corporelle, influençant ainsi la capacité cérébrale, et finalement apporté une expansion des capacités de toute la civilisation. L'IA modifie également les capacités de base — la perception, le raisonnement, la génération, la décision, l'action, tout cet ensemble de capacités se déplace globalement vers le haut, c'est une mise à niveau fondamentale au niveau de la "fonction de production de la civilisation", et non pas rendre un outil spécifique plus performant.
Précisément parce qu'il s'agit d'une transition fondamentale des capacités, des révolutions industrielles nouvelles vont émerger de manière continue et par vagues en amont : la révolution des agents, la révolution des robots, la révolution des drones, puis la défense, les technologies spatiales, et la restructuration des processus dans davantage de secteurs. Ce processus ne se matérialisera pas d'un coup, mais apparaîtra vague après vague. Donc, je pense que la ligne directrice qui mérite vraiment d'être suivie n'est pas de parier sur l'explosion d'une application spécifique, mais d'observer continuellement "comment les capacités intelligentes se répandent dans le monde physique et dans les processus de chaque secteur" — c'est la piste centrale pour juger de la portée potentielle de cette vague d'IA.
Pour l'avenir, dans un an ou deux, je pense que tout le monde continuera à ressentir cette "accélération dans l'accélération" — les capacités technologiques et les progrès de la commercialisation se valident et se poussent mutuellement. Mais le marché lui-même ne sera certainement pas une ligne droite, il présentera des caractéristiques en vagues, avec des changements de logique entre "pénurie — mise à niveau — matérialisation à long terme".
Déclaration : Le contenu de cet article représente fidèlement les points de vue partagés par l'invité et ne constitue en aucun cas un conseil en investissement, une offre de vente de produit ou une promesse de rendement.






