# LLM Articles associés

Le Centre d'actualités HTX fournit les derniers articles et analyses approfondies sur "LLM", couvrant les tendances du marché, les mises à jour des projets, les développements technologiques et les politiques réglementaires dans l'industrie crypto.

Avancée majeure dans la collaboration de l'IA ! Stanford et NVIDIA éliminent les frictions de communication de l'IA, la vitesse de raisonnement bondit de 2,4 fois

Percée majeure dans la collaboration IA : Des chercheurs de Stanford, de l'UIUC, du MIT et de NVIDIA ont développé "RecursiveMAS", une nouvelle architecture qui permet à plusieurs agents IA de communiquer directement par leurs représentations internes (espace latent), éliminant ainsi la nécessité de générer et d'analyser du texte à chaque étape. Cette approche, comparée à une "télépathie", surmonte le problème de la "taxe linguistique" qui ralentit et alourdit les systèmes multi-agents traditionnels. Le système repose sur des modules légers "RecursiveLink" qui transfèrent les états cachés entre modèles. Seuls ces modules nécessitent un entraînement (environ 0.31% des paramètres), les modèles de base restant figés, ce qui réduit considérablement les coûts. Les tests sur 9 benchmarks montrent des gains significatifs : la précision augmente de 8.3% en moyenne, la vitesse de raisonnement est multipliée par 2.4 (avec des gains croissant avec le nombre de cycles récursifs), et la consommation de tokens est réduite de 75%. Cela ouvre une nouvelle voie pour améliorer l'efficacité des systèmes multi-agents en augmentant la profondeur récursive plutôt que le nombre d'agents ou la taille des modèles. Des défis subsistent, comme la vérification indépendante des résultats, l'interopérabilité entre modèles hétérogènes et la réduction de l'explicabilité du processus de collaboration.

marsbit05/21 00:17

Avancée majeure dans la collaboration de l'IA ! Stanford et NVIDIA éliminent les frictions de communication de l'IA, la vitesse de raisonnement bondit de 2,4 fois

marsbit05/21 00:17

Alibaba Cloud peut-il se réinventer ?

Ces cinq derniers mois, les revenus MaaS d'Alibaba Cloud ont été multipliés par 15, reflétant une transformation profonde. Lors d'un sommet, le géant du cloud a annoncé avoir achevé la mise à niveau de sa pile complète "puce - cloud - modèle - inférence" vers une architecture Agent, avec le lancement d'un nouveau portail IA "QianWen Cloud", de serveurs utilisant sa puce AI auto-développée Zhenwu M890 et de son dernier modèle phare Qwen3.7-Max. L'objectif est de passer d'un système conçu pour "l'humain utilisant le cloud" à un écosystème où "l'Agent consomme des Tokens". La puce, notamment la nouvelle Zhenwu M890, est vue comme le point de départ d'une bataille sur le coût marginal du Token. Parallèlement, la plateforme cloud elle-même est réécrite pour répondre aux besoins des Agents : interfaces standardisées, environnement d'exécution dédié (sandbox) et nouvelle logique d'orchestration des tâches. Concernant les modèles, l'accent est mis sur leur capacité à "faire" plutôt qu'à simplement "bien parler". Qwen3.7-Max a démontré une capacité d'exécution autonome de longue durée. La plateforme d'inférence "Bailian" a été améliorée pour soutenir ces charges et intègre également des modèles tiers. Cette refonte totale, techniquement et organisationnellement complexe, vise à saisir une opportunité perçue comme dix à cent fois plus grande que les précédentes. Alibaba Cloud reconstruit sa structure de revenus, ses relations clients et son système commercial autour du paradigme de l'IA, misant résolument sur un futur où les Agents et les Tokens seront centraux.

marsbit05/20 10:28

Alibaba Cloud peut-il se réinventer ?

marsbit05/20 10:28

Comprendre le Nouveau Modèle Économique du Token en un Article

L'essor des applications d'IA commercialisées évolue vers la vente de capacités d'appel de **Tokens**, l'unité minimale de traitement des modèles de langage et base de la tarification des API. Un nouveau marché intermédiaire émerge : la **distribution de Tokens**, reliant les fournisseurs de modèles en amont aux développeurs et entreprises en aval. Ceci est alimenté par une explosion de la consommation en Chine, passant de 100 milliards de Tokens/jour début 2024 à plus de 140 000 milliards en mars 2026. La chaîne comprend les fournisseurs de modèles (comme les séries Seedance, Qwen, GLM), les plateformes agréées qui agrègent et redistribuent l'accès via une API unifiée, et les consommateurs finaux. La valeur ajoutée réside dans la simplification de l'accès, l'abaissement des coûts pour les achats groupés et l'adaptation aux paiements locaux. La montée en puissance et le rapport coût-efficacité des grands modèles chinois (comme ceux de MiniMax, DeepSeek, Kimi) favorisent également leur adoption à l'international, créant des flux transfrontaliers. Des plateformes comme OpenRouter ou Silicone Flow en Chine jouent le rôle d'infrastructures de routage et de liquidité. La rentabilité ne repose pas uniquement sur la revente avec marge. Elle provient également des **services à valeur ajoutée** : optimisation des performances (moteurs d'inférence accélérée), ingénierie de prompt, intégration des systèmes d'entreprise et services de conseil. Les secteurs à forte consommation comme le marketing, les courts-métrages, les jeux et le commerce électronique sont des débouchés clés. Cependant, ce modèle présente des **risques** : faible barrière à l'entrée entraînant une concurrence féroce, nécessité d'avances de trésorerie importantes, risques de défaut de paiement et dépendance aux changements de politique tarifaire ou d'accès des fournisseurs de modèles en amont.

marsbit05/19 02:59

Comprendre le Nouveau Modèle Économique du Token en un Article

marsbit05/19 02:59

DeepSeek derrière le financement de l'IA : Alibaba à gauche, Tencent à droite

L'épisode du financement de DeepSeek a révélé les stratégies AI divergentes des géants chinois de la tech. Alors que la start-up visait une levée de fonds indépendante, Alibaba et Tencent ont abordé les négociations avec des logiques opposées. Alibaba, dont l'ADN est le contrôle et la fermeture d'écosystème (e-commerce, cloud), cherchait à intégrer profondément le modèle de DeepSeek dans ses propres services (Taobao, AliCloud), quitte à en faire un outil sur mesure. Cette approche "d'achat et de verrouillage" a conduit à son retrait des pourparlers, DeepSeek refusant de sacrifier son indépendance et sa vocation générale. À l'inverse, Tencent, habitué aux investissements ouverts et non contraignants (comme avec JD.com ou Meituan), a proposé une participation financière minoritaire sans exigence d'exclusivité ou de contrôle technique. Sa stratégie est d'utiliser l'AI externe comme un "lubrifiant" pour ses scénarios sociaux et de contenu existants, notamment via WeChat, son super-application. Un troisième acteur, ByteDance, suit une voie distincte : un développement interne massif (modèle Doubao) avec des investissements colossaux visant à capturer l'entrée utilisateur (To C), plutôt que d'investir dans des acteurs externes. Ces choix reflètent les héritages et les atouts de chacun : le contrôle et l'infrastructure B2B pour Alibaba, l'ouverture et le flux d'utilisateurs C2C pour Tencent, et la course à l'adoption utilisateur pour ByteDance. À moyen terme, une concurrence décalée semble se profiler : Alibaba dominant sur l'infrastructure et le B2B, Tencent intégrant l'AI dans les scénarios sociaux, et ByteDance se battant pour l'entrée utilisateur autonome. Le retrait d'Alibaba et l'intérêt de Tencent pour DeepSeek symbolisent moins un différend sur la valorisation que l'illustration de deux philosophies commerciales antagonistes face à l'IA.

marsbit05/18 04:48

DeepSeek derrière le financement de l'IA : Alibaba à gauche, Tencent à droite

marsbit05/18 04:48

À l'ère de l'IA, comment ne plus avoir un onboarding « à partir de zéro »

À l'ère de l'IA, l'intégration des nouveaux employés ne devrait plus commencer à partir de zéro. L'article, inspiré des 100 premiers jours de l'auteur chez Ramp, souligne que la vitesse d'une entreprise ne doit pas être ralentie par des processus d'adaptation longs. La solution réside dans la construction d'un « cerveau d'entreprise » – une couche de contexte centralisée et continuellement mise à jour. Ce système agrège automatiquement toutes les connaissances organisationnelles : transcriptions de réunions, documents, discussions Slack, retours clients et décisions. Il sert de base commune à la fois pour les nouveaux employés et les agents IA, leur permettant d'accéder immédiatement au contexte nécessaire. Au lieu d'outils IA isolés (comme des chatbots pour le service client ou les RH), l'avenir appartient à une infrastructure de connaissance unique et partagée. L'auteur décrit la mise en place pratique chez Ramp : un vault Obsidian alimenté par Claude, un enregistrement systématique des réunions, une bibliothèque de compétences pour les agents, et des synthèses quotidiennes. L'objectif est que l'intégration (« ramp-up ») cesse d'être une phase distincte. La victoire organisationnelle, telle une course de relais, combine vitesse et transmission de contexte parfaite pour que chacun, humain ou IA, puisse sprinter dès le premier jour.

marsbit05/17 06:07

À l'ère de l'IA, comment ne plus avoir un onboarding « à partir de zéro »

marsbit05/17 06:07

Les récits des actions technologiques dépendent de plus en plus d'Anthropic

Le récit des actions technologiques dépend de plus en plus d'Anthropic. La société est devenue le centre d'un puissant écosystème comprenant Google, Amazon et SpaceX (Elon Musk). Cet axe, baptisé « A », s'oppose à l'alliance « O » d'OpenAI, Microsoft et SoftBank, marquant une division profonde dans le secteur de l'IA. L'importance d'Anthropic réside dans sa capacité à générer des revenus et à structurer les récits financiers. Malgré un nombre d'utilisateurs actifs inférieur à celui d'OpenAI, son revenu par utilisateur est bien plus élevé. Ses engagements de commandes de calcul massifs (centaines de milliards de dollars) avec Google et Amazon, ainsi que le nouveau contrat de location avec SpaceXAI, en font un « nœud financier systémique ». Les bénéfices trimestriels de Google et Amazon sont fortement influencés par les réévaluations de sa participation dans Anthropic. En revanche, OpenAI, bien que pionnier, voit sa part de marché et ses revenus relatifs diminuer face à la montée d'Anthropic et des modèles open source comme DeepSeek-V4. La pression pour se monétiser s'intensifie, comme le montre l'introduction de publicités dans ChatGPT. L'alliance « O » montre des signes de faiblesse, avec la fin de l'exclusivité entre Microsoft et OpenAI. Le marché est en train de passer d'un récit axé sur la puissance de calcul (symbolisée par Nvidia) à un récit axé sur l'application commerciale rentable, où Anthropic excelle. Cependant, cette concentration du capital et des espoirs sur une seule entreprise crée un risque systémique. La performance continue des modèles d'Anthropic est essentielle pour soutenir les valorisations de ses puissants alliés. La menace des modèles open source performants, comme DeepSeek, plane comme une épée de Damoclès sur ce modèle économique fermé, ce qui pourrait entraîner des mesures géopolitiques pour les contenir.

marsbit05/12 01:21

Les récits des actions technologiques dépendent de plus en plus d'Anthropic

marsbit05/12 01:21

Facture de l’inférence IA en flèche, Shopify et Roblox mettent en garde : les économies réalisées grâce aux licenciements ne suffiront pas à payer la facture des puces

La saison des résultats du premier trimestre 2026 révèle un paradoxe financier pour les entreprises technologiques. Alors que l'IA permet des gains de productivité et une réduction des effectifs, ses coûts opérationnels – consommation de tokens et amortissement des GPU – grèvent désormais les marges de manière significative. Shopify illustre ce dilemme. Si l'IA génère plus de 50% du code et a permis 300 nouvelles fonctionnalités sans hausse des effectifs, les coûts des LLM (notamment via l'assistant Sidekick) pèsent sur la marge de ses solutions d'abonnement, malgré une croissance explosive de son utilisation. Chez Roblox, un quart de la révision à la baisse de sa marge prévisionnelle 2026 est directement attribué aux investissements en IA. La plateforme, qui exécute 1,5 million d'inférences par seconde, envisage de facturer les futures expériences IA avancées pour compenser ces coûts. À l'échelle du secteur, l'écart est frappant : les dépenses en capital IA d'Amazon, Meta, Microsoft et Google devraient atteindre 7250 milliards de dollars en 2026 (+77%). Les économies réalisées via les licenciements sont dépassées : chez Meta, les 24 milliards de dollars d'économies annuelles prévues ne compenseraient que 12% de l'amortissement supplémentaire lié à l'IA. Les grands gagnants sont les fournisseurs de modèles et de puces (OpenAI, Nvidia...), tandis que les entreprises applicatives doivent repenser leur modèle économique. Elles ne peuvent plus simplement financer la facture de l'IA par des réductions de coûts salariaux et doivent soit intégrer ces coûts dans leur stratégie commerciale (Shopify), soit les répercuter sur l'utilisateur final (Roblox).

marsbit05/11 07:01

Facture de l’inférence IA en flèche, Shopify et Roblox mettent en garde : les économies réalisées grâce aux licenciements ne suffiront pas à payer la facture des puces

marsbit05/11 07:01

活动图片