# Cloud Articles associés

Le Centre d'actualités HTX fournit les derniers articles et analyses approfondies sur "Cloud", couvrant les tendances du marché, les mises à jour des projets, les développements technologiques et les politiques réglementaires dans l'industrie crypto.

NVIDIA lance la plateforme DSX et continue d'avancer vers l'infrastructure des usines d'IA

NVIDIA a présenté la plateforme DSX lors de la conférence GTC Taipei, étendant son activité aux infrastructures d'usines d'IA. Contrairement à son approche historique centrée sur la vente de GPU, DSX vise à fournir aux entreprises une solution complète couvrant la conception, la simulation, le déploiement et la gestion opérationnelle. Face à l'expansion des modèles d'IA, NVIDIA estime que la compétition future se jouera sur l'efficacité globale des infrastructures, optimisant la production de puissance de calcul sous contrainte d'électricité, d'espace et de ressources. La plateforme DSX intègre ainsi puces, systèmes, logiciels et architectures de référence pour améliorer la vitesse de déploiement, la fiabilité et réduire les coûts par token généré. Le logiciel comprend DSX MaxLPS, qui utilise le refroidissement liquide pour déployer jusqu'à 40% de GPU supplémentaires par mégawatt, et DSX OS, une plateforme open source pour la gestion du cycle de vie et des opérations. DSX inclut également des outils de simulation, d'ajustement dynamique de la charge selon le réseau électrique (DSX Flex), et d'architecture de référence. Des fournisseurs de cloud comme CoreWeave ont déjà déployé des composants DSX, tandis que des partenaires matériels tels que Dell, HPE et Lenovo développent des systèmes compatibles. Cette initiative marque la transition stratégique de NVIDIA d'un fournisseur de puces vers un fournisseur de plateforme d'infrastructure IA complète, visant à établir un standard pour le cycle de vie des usines d'IA.

marsbitHier 04:29

NVIDIA lance la plateforme DSX et continue d'avancer vers l'infrastructure des usines d'IA

marsbitHier 04:29

Alibaba « met en rayon », ByteDance « s’entraîne »

Durant la dernière semaine de mai, deux événements consécutifs dans l'industrie de l'IA ont révélé les stratégies divergentes des géants chinois Alibaba et ByteDance. Alibaba adopte une approche d'application immédiate et de monétisation. Son modèle Qwen est intégré à Taobao pour des fonctionnalités comme l'essayage virtuel et la comparaison de prix, visant à transformer l'expérience d'achat. L'entreprise se positionne comme l'infrastructure ("eau, électricité, gaz") et la "caisse enregistreuse" de l'ère IA, avec ses services cloud alimentant de nombreux modèles locaux. Cette stratégie, soutenue par des réorganisations internes et l'initiative "AI Credit", génère déjà des revenus, comme en témoigne la croissance de 40% des revenus cloud externes. Cependant, elle suppose que les capacités des modèles de base n'évolueront pas assez vite pour rendre ses applications obsolètes. ByteDance, via son département Seed, privilégie la recherche fondamentale à long terme. Son objectif est "d'explorer les limites de l'intelligence". Son modèle de génération vidéo Seedance 2.0, salué comme le plus performant au monde, et des publications académiques ambitieuses sur les "modèles du monde" illustrent cette voie. La société, qui n'est pas cotée en bourse, peut se permettre d'engager des dépenses d'investissement massives (jusqu'à 470 milliards de yuans en 2026 selon des rapports) et d'accorder à ses chercheurs le temps de publier sans pression commerciale immédiate. Mais cette approche "laboratoire Nobel" commence à être questionnée par des signes de commercialisation sur des produits comme Doubao. L'article suggère que cette divergence stratégique tient moins à une philosophie qu'à un statut : Alibaba, société cotée, est soumis à la pression des marchés pour montrer des retours rapides, tandis que ByteDance, privée, peut investir sur le très long terme. Le jour où ByteDance envisagera une introduction en bourse, la pérennité de sa stratégie de recherche pure sera véritablement mise à l'épreuve.

marsbitHier 00:12

Alibaba « met en rayon », ByteDance « s’entraîne »

marsbitHier 00:12

Le cours de l'action Snowflake bondit de 33%, l'infrastructure IA passe des puces à la couche données

Snowflake a vu son action bondir de plus de 33% après avoir relevé ses prévisions de revenus annuels et conclu un accord de coopération de 60 milliards de dollars sur cinq ans avec AWS. Cette réaction du marché ne s'explique pas seulement par des résultats supérieurs aux attentes, mais par une réévaluation du rôle de Snowflake dans la chaîne de déploiement de l'IA en entreprise. L'accord garantit à Snowflake un accès aux puces Graviton d'AWS pour répondre aux contraintes de calcul, tout en intégrant davantage sa plateforme de données aux charges de travail d'IA sur le cloud AWS. Cela répond au besoin croissant des entreprises de connecter leurs propres données aux flux de travail d'IA pour construire des applications opérationnelles, gérables et évolutives. Alors que les actions de logiciels IA avaient subi des ventes massives, par scepticisme sur leur capacité à générer des revenus concrets, les performances de Snowflake démontrent que la conversion de l'IA en croissance réelle peut inverser rapidement le sentiment du marché. Plus de 30 analystes ont relevé leur cours cible, réévaluant le rôle des plateformes de données dans le cycle d'infrastructure de l'IA. Snowflake évolue ainsi au-delà du simple entrepôt de données, pour devenir une couche de données clé dans la mise en œuvre des applications d'IA en entreprise. Parallèlement, cet accord renforce l'écosystème des puces sur mesure d'Amazon, qui s'ancre ainsi plus profondément dans les infrastructures de l'IA.

marsbit05/29 19:12

Le cours de l'action Snowflake bondit de 33%, l'infrastructure IA passe des puces à la couche données

marsbit05/29 19:12

Quand le Token coûte plus cher que l'homme, le « récit de l'IA » rencontre des difficultés

**Résumé** La rentabilité des investissements en IA générative est sévèrement mise en doute, alors que les coûts liés aux tokens explosent sans que leur valeur commerciale tangible n'apparaisse. Des entreprises comme Uber constatent des niveaux de consommation « choquants » sans amélioration produit claire, tandis que Microsoft réduit ses licences face à des factures jugées insoutenables. Des données révèlent un problème systémique : une étude montre que seulement 18 cents sur chaque dollar dépensé en tokens génèrent de la valeur pour l'utilisateur final, le reste étant absorbé par la correction d'erreurs ou des frictions internes. Parallèlement, le prix des tokens a fortement augmenté. Le débat est polarisé. Les optimistes voient une transition douloureuse mais nécessaire, anticipant une explosion de la demande et une amélioration des indicateurs de rentabilité. Les pessimistes, comme des analystes de Goldman Sachs, soulignent une structure économique déformée où la valeur profite presque exclusivement aux fabricants de semi-conducteurs (comme Nvidia), tandis que les géants du cloud s'endettent lourdement pour financer l'infrastructure. Une inquiétude majeure réside dans la structure de financement circulaire entre les laboratoires d'IA (OpenAI, Anthropic) et les fournisseurs de cloud (Microsoft, Google...). Ces derniers investissent dans les labos via des crédits cloud, qui sont ensuite dépensés en services de calcul, alimentant ainsi leurs propres revenus. La pérennité de ce système dépend d'un financement externe continu aux labos, eux-mêmes tributaires de la volonté des entreprises clientes à payer des factures croissantes. La technologie IA est réelle et utile, mais la question centrale n'est plus seulement technique : elle est économique. L'industrie doit prouver que les gains de productivité en aval pourront compenser à temps les coûts exorbitants supportés en amont. La période où la simple consommation de tokens valait preuve de succès est révolue. La facture de l'IA est présentée, mais il reste incertain qui, in fine, devra la régler.

marsbit05/29 01:48

Quand le Token coûte plus cher que l'homme, le « récit de l'IA » rencontre des difficultés

marsbit05/29 01:48

De l'infrastructure électrique à l'économie des Token : le « gâteau à sept couches » de la chaîne industrielle de l'IA

Au cours des deux dernières années, le secteur de l'IA a été dominé par la « guerre des grands modèles », centrée sur l'augmentation des paramètres et des coûts d'entraînement. Cependant, en 2026, la logique évolue : la demande massive d'inférence (Inference) pour les agents IA devient le principal moteur de l'expansion des infrastructures. L'industrie passe ainsi de l'« ère des modèles » à l'« ère industrielle du Token », où la production, la distribution, la planification et la consommation de Tokens sont essentielles. Inspiré par la vision de Jensen Huang, l'écosystème économique de l'IA est décrit comme un « gâteau à sept couches » centré sur le Token : 1. Énergie électrique – la base énergétique. 2. AIDC (centres de données IA) – les usines à Tokens. 3. GPU – les équipements de production. 4. LLM (grands modèles de langage) – les moteurs de production. 5. Distribution des Tokens – le « réseau électrique » de l'IA. 6. Optimisation et planification intelligente des Tokens – le cerveau du système. 7. Agents IA – les terminaux consommateurs. Actuellement, cette chaîne est fragmentée et inefficace. Certains ont des GPU avancés mais manquent d'énergie, d'autres ont des AIDC mais pas de planification optimale, et d'autres encore développent des agents puissants mais font face à des coûts et des latences élevés. La clé pour passer de l'« ère des outils » à l'« ère de l'adoption massive » réside dans la connexion et la synergie de ces sept couches. Le futur de l'IA ne dépendra pas seulement de modèles performants, mais d'un réseau d'infrastructures intelligentes capable de produire, distribuer, planifier et consommer des Tokens de manière continue et efficace à l'échelle mondiale, à l'image des révolutions industrielle et internet.

marsbit05/26 05:50

De l'infrastructure électrique à l'économie des Token : le « gâteau à sept couches » de la chaîne industrielle de l'IA

marsbit05/26 05:50

Les trois géants du NeoCloud : NBIS, IREN, CRWV, lequel a le plus de valeur d'investissement ?

Dans cet entretien avec Nate d'Endicott Invests, l'accent est mis sur la valeur d'investissement des sociétés "NeoCloud" - NBIS (Nebius), IREN (IRON) et CRWV (CoreWeave) - dans le contexte de la pénurie persistante de puissance de calcul (GPU). Nate, fortement investi dans Nebius, estime que la pénurie durera 3 à 5 ans et que les hyperscalers (AWS, Azure, Google Cloud) ne peuvent pas remplacer rapidement ces fournisseurs spécialisés. Les trois sociétés présentent des profils distincts : CoreWeave, pionnier, se concentre sur l'entraînement des modèles ; IRON bénéficie d'un avantage en terres et énergie ; et Nebius se distingue par son équipe d'ingénieurs expérimentée et sa stratégie logicielle orientée "inférence". Nate souligne la récente hausse des prix de 30 à 70 % par Nebius pour ses GPU H100/B200 à partir du 1er juin, réfutant ainsi le discours baissier sur la dépréciation rapide des GPU. La formule simplifiée de revenus (1 MW = 10 millions de dollars/an) et les prévisions ambitieuses de Nebius (5 GW d'ici 2030, soit 50 milliards de dollars de revenus) illustrent le potentiel de croissance. Outre le cloud GPU, la valorisation de Nebius est renforcée par ses participations dans des filiales comme ClickHouse. En conclusion, Nate estime que les trois sociétés bénéficieront de la demande exponentielle, mais privilégie Nebius à long terme pour sa culture d'ingénierie et sa feuille de route logicielle.

marsbit05/25 10:36

Les trois géants du NeoCloud : NBIS, IREN, CRWV, lequel a le plus de valeur d'investissement ?

marsbit05/25 10:36

Samsung mise sur la mémoire HBM mobile : l'IA passe du cloud au creux de la main, une nouvelle opportunité d'investissement dans les semi-conducteurs ?

En 2026, le marché de l'IA reste très dynamique, entraînant une forte demande de mémoire haute performance dans les centres de données. Samsung Electronics a enregistré des résultats exceptionnels au premier trimestre, avec un bénéfice d'exploitation en hausse de plus de 750%. La société mise sur le développement de la mémoire HBM (High Bandwidth Memory) de serveur pour les appareils mobiles, visant à permettre aux smartphones et tablettes d'exécuter localement des fonctionnalités IA puissantes. Cette stratégie ouvre une nouvelle courbe de croissance en diversifiant les débouchés au-delà des serveurs. Samsung, qui a déjà commencé la production en masse des puces HBM4, raccourcit ses cycles de développement et augmente ses capacités de production. Cela pourrait améliorer sa part de marché face à des concurrents comme SK Hynix. Pour les utilisateurs, cette évolution signifie des expériences IA plus rapides, fluides et privées sur leur mobile, sans dépendre du cloud. Sur le plan concurrentiel, elle renforce l'avantage intégré de Samsung, qui maîtrise la mémoire, les processeurs Exynos et l'assemblage. Cette initiative devrait bénéficier à toute la chaîne d'approvisionnement (matériaux d'emballage avancés, refroidissement, batteries) et accompagner la transition de l'IA du cloud vers les terminaux. Cependant, des risques existent, comme des retards potentiels, des coûts initiaux élevés et la cyclicité du secteur de la mémoire. À long terme, cette orientation pourrait consolider la position de leader de Samsung dans les semi-conducteurs et redéfinir le paysage de l'informatique de l'IA.

marsbit05/19 14:53

Samsung mise sur la mémoire HBM mobile : l'IA passe du cloud au creux de la main, une nouvelle opportunité d'investissement dans les semi-conducteurs ?

marsbit05/19 14:53

Examen rapide des dernières positions du "prodigieux investisseur en IA" de 24 ans : 60 % de l'allocation pour se couvrir contre la baisse des semi-conducteurs

Le fonds Situation Awareness LP, dirigé par le prodige de 24 ans Leopold Aschenbrenner, a dévoilé ses positions via un dépôt 13F. Son portefeuille, d'une valeur notionnelle de 13,7 milliards de dollars, a été radicalement rééquilibré au premier trimestre. La stratégie la plus marquante est l'établissement d'une vaste couverture contre une correction potentielle du secteur des semi-conducteurs et du matériel informatique lié à l'IA. Plus de 60% de la valeur notionnelle du portefeuille est constituée de positions put (options de vente) sur des titres clés comme le fonds SMH, NVIDIA (NVDA), Oracle (ORCL), Broadcom (AVGO) et AMD. Ces puts visent à se protéger contre une volatilité ou un repli à court terme, indiquant une prudence envers les valorisations actuelles. Parallèlement, le fonds maintient une conviction forte sur les infrastructures à long terme de l'IA. Il a augmenté ses positions en actions classiques, notamment dans CoreWeave (CRWV, un fournisseur de cloud de GPU), et conserve un investissement important dans Bloom Energy (BE), une société d'énergie sur site. Il a également ajouté d'autres sociétés d'infrastructure d'énergie et de calcul. Les autres ajustements incluent la fermeture de positions à effet de levier sur Intel (INTC CALL), la sortie du secteur des modules optiques (LITE, COHR) et la prise de bénéfices sur certaines positions. En résumé, la stratégie d'Aschenbrenner semble scindée : une couverture massive contre les risques à court terme dans les fabricants de puces d'IA, couplée à un investissement soutenu dans les actifs d'infrastructure fondamentaux (calcul, énergie, données) considérés comme les goulots d'étranglement et les opportunités durables de la prochaine phase de croissance de l'IA.

marsbit05/18 13:36

Examen rapide des dernières positions du "prodigieux investisseur en IA" de 24 ans : 60 % de l'allocation pour se couvrir contre la baisse des semi-conducteurs

marsbit05/18 13:36

活动图片