# LLM Articles associés

Le Centre d'actualités HTX fournit les derniers articles et analyses approfondies sur "LLM", couvrant les tendances du marché, les mises à jour des projets, les développements technologiques et les politiques réglementaires dans l'industrie crypto.

AI PC arrive, défie localement un grand modèle de 120B ! Nvidia redéfinit le socle de l’« ordinateur personnel IA » avec le RTX Spark

Ces deux dernières années, les fabricants de PC ont largement mis en avant la puissance des NPU (processeurs neuronaux) pour les "AI PC", mais leurs performances restaient modestes (environ 45 à 50 TOPS). Lors du GTC 2026, NVIDIA a présenté la puce RTX Spark, qui repousse radicalement cette limite avec une puissance annoncée de 1 pétaflop (1000 TOPS) pour l'IA. Cette SoC intègre un GPU Blackwell et un CPU Arm Grace conçu avec MediaTek, et surtout, elle adopte une architecture de mémoire unifiée allant jusqu'à 128 GB, partagée entre le CPU et le GPU. L'objectif principal est de permettre l'exécution locale de grands modèles de langage (LLM) de 120 milliards de paramètres, avec des fenêtres de contexte pouvant atteindre un million de tokens, ce qui redéfinit les capacités de l'IA de bord. NVIDIA a également annoncé des collaborations majeures avec Microsoft pour renforcer la sécurité Windows et intégrer le bac à sable OpenShell, ainsi qu'avec Adobe qui adapte en profondeur des logiciels comme Photoshop pour tirer parti de cette nouvelle architecture. Plusieurs grands fabricants d'ordinateurs (ASUS, Dell, HP, Lenovo, Microsoft Surface, MSI) prévoient de commercialiser des PC portables fins et des mini-desktops équipés du RTX Spark dès l'automne. Cette initiative marque un changement potentiel dans l'industrie du PC, faisant passer l'accent du processeur x86 traditionnel à une plateforme SoC centrée sur le GPU. Cependant, des questions pratiques concernant la dissipation thermique, l'autonomie, les performances réelles et la stratégie de tarification des OEM restent en suspens et détermineront le succès final de cette nouvelle norme matérielle.

marsbitIl y a 1 h

AI PC arrive, défie localement un grand modèle de 120B ! Nvidia redéfinit le socle de l’« ordinateur personnel IA » avec le RTX Spark

marsbitIl y a 1 h

Faire tourner un MoE sur smartphone ? Meta propose MobileMoE, avec une accélération de 3,8x sur iPhone 16 Pro

Récemment, Meta a proposé MobileMoE, une nouvelle architecture de modèle MoE (Mixture of Experts) optimisée pour fonctionner efficacement sur les smartphones. Cette approche remplace les couches denses traditionnelles des grands modèles de langage (LLM) par des couches MoE, permettant de réduire considérablement la quantité de calculs nécessaires à l'inférence tout en conservant des performances élevées. Les résultats montrent que MobileMoE atteint des scores similaires, voire supérieurs, aux modèles denses de référence sur 14 tests fondamentaux, tout en utilisant seulement 1/2 à 1/4 des opérations de calcul. Après quantification en INT4, le modèle conserve sa compétitivité. Lors de déploiements sur des appareils commerciaux comme l'iPhone 16 Pro, MobileMoE accélère l'inférence jusqu'à 3,8 fois lors de la phase d'entrée et jusqu'à 3,4 fois lors de la génération de tokens, tout en réduisant l'empreinte mémoire. L'étude établit de nouvelles frontières de Pareto pour les LLM sur appareils mobiles, offrant un meilleur compromis entre précision et coût de calcul. Les performances sont particulièrement notables sur les tâches de code et de mathématiques. Les auteurs soulignent que des progrès futurs pourraient passer par l'amélioration de l'alignement via des techniques comme le fine-tuning, le distillation et l'extension multimodale.

marsbitIl y a 1 h

Faire tourner un MoE sur smartphone ? Meta propose MobileMoE, avec une accélération de 3,8x sur iPhone 16 Pro

marsbitIl y a 1 h

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

Trois ans après ses prédictions sur ChatGPT en mars 2023, Wang Jianshuo revient sur ses vingt affirmations initiales, évaluées en mai 2026 par des agents IA. Sur les vingt points, la majorité des tendances de fond étaient correctes : l'essor du RAG comme architecture dominante pour l'injection de connaissances, le rôle central de l'interface utilisateur en langage naturel (LUI), l'émergence de protocoles pour un "réseau d'agents", et le rattrapage technologique rapide des modèles chinois. Des erreurs notables portent sur des chiffres précis, comme les 100 billions de paramètres supposés de GPT-4 (en réalité environ 1,8 billion) ou une estimation trop basse des coûts de formation des grands modèles. Certaines prévisions se sont révélées trop absolues ("l'IA ne fera jamais de mathématiques pures") ou ont négligé les disparités (aucune vague de chômage massif, mais un impact sévère sur les jeunes diplômés). L'analyse révèle que les intuitions sur les mécanismes et les directions se sont avérées bien plus fiables que les prédictions numériques ou temporelles, souvent trop optimistes à court terme. La prudence dans les formulations et la reconnaissance des incertitudes se sont montrées précieuses avec le recul. Ce bilan offre des leçons pour les futurs pronostics : privilégier les tendances aux chiffres, anticiper les effets distributifs et accepter que certaines questions demandent plus de trois ans pour être tranchées.

marsbitIl y a 15 h

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

marsbitIl y a 15 h

Trois ans plus tard : un retour sur mes prédictions de 2023 concernant ChatGPT

Trois ans après ses prédictions sur le ChatGPT en mars 2023, Wang Jianshuo revient sur ses 20 affirmations initiales. Évaluées en mai 2026 par des agents IA, la plupart de ses intuitions sur les grandes tendances se sont révélées justes : le RAG est devenu l'architecture standard pour intégrer des connaissances, l'Interface Utilisateur en Langage Naturel (LUI) a créé un nouvel écosystème, et les modèles chinois ont presque rattrapé les leaders mondiaux. Des concepts comme les réseaux d'agents et la nature limitée du test de Turing se sont également matérialisés. Cependant, les prévisions quantitatives et les affirmations trop absolues ont souvent échoué. Le paramétrage supposé du GPT-4 (100T) était inexact, et les coûts de développement des modèles ont dépassé les estimations. Il a sous-estimé la vitesse de personnalisation des IA et l'impact distribué sur l'emploi des jeunes. La capture de valeur a surtout bénéficié à la couche matérielle (comme Nvidia), et non aux seules applications. Les leçons clés sont que les mécanismes et les directions sont plus fiables que les chiffres précis, que l'optimisme à court terme doit être tempéré, et que les nuances ("peut-être", "pour l'instant") rendent les prédictions plus robustes. Cette rétrospective souligne l'importance de distinguer les tendances confirmées des questions toujours ouvertes.

链捕手Il y a 18 h

Trois ans plus tard : un retour sur mes prédictions de 2023 concernant ChatGPT

链捕手Il y a 18 h

6 questions pour comprendre les tendances commerciales de l'IA

L'économie de l'IA est entrée dans sa phase d'« été », caractérisée par une coexistence entre le récit et la livraison concrète, où la rentabilité devient cruciale. Cette analyse s'appuie sur un cadre à six dimensions, chacune notée 1 point sur 2, pour un total de 6 points, situant le secteur en plein été (5-7 points). Les six dimensions évaluées sont : 1. **Narration vs Livraison** : Passage des promesses à des offres payantes (ex. : abonnements Doubao, publicité OpenAI). 2. **Connectivité système** : Les produits IA sortent de leur isolement pour s'intégrer aux workflows. 3. **Capacité de livraison** : L'IA est utilisée à grande échelle pour des tâches productives (ex. : milliards d'appels quotidiens sur Doubao). 4. **Rationalisation du ROI** : Les coûts (calcul, électricité) imposent une tarification et un calcul du retour sur investissement. 5. **Phénomène sectoriel** : Fin de la gratuité généralisée, début des discussions sur la profitabilité. 6. **Environnement capitalistique** : Les investissements continuent, mais les valorisations dépendent désormais des revenus. Deux signes récents illustrent cette transition : * **Doubao lance des abonnements payants** en raison des coûts astronomiques liés à ses centaines de milliards de requêtes quotidiennes. * **OpenAI lance une plateforme publicitaire** pour monétiser son immense audience et couvrir ses lourdes pertes. Pour les entreprises, la période estivale est le moment d'agir. La feuille de route proposée est en trois étapes : 1. **Démarrer petit** : Identifier un point de douleur précis, obtenir un résultat financier clair (économie/recettes) en moins de 3 mois. 2. **Répliquer et institutionnaliser** : Capitaliser sur les succès initiaux, créer des plateformes de partage de compétences en IA et adapter la structure organisationnelle (formation, incitations). 3. **Refondre par l'IA** : Repenser fondamentalement les processus pour une collaboration parallèle entre humains et IA, visant une automatisation intelligente des flux de travail. En résumé, l'été de l'IA est une phase de validation commerciale où la valeur tangible prime. La stratégie gagnante consiste à prouver la valeur sur un point précis, à l'étendre, puis à réinventer les processus métier autour de l'intelligence artificielle.

marsbitHier 00:32

6 questions pour comprendre les tendances commerciales de l'IA

marsbitHier 00:32

Le leader des grands modèles de Shanghai lance son introduction en bourse sur le marché A

L'entreprise leader des grands modèles d'IA à Shanghai, MiniMax, a déposé le 29 mai un dossier de préparation à l'introduction en bourse auprès de la CSRC, visant une entrée sur le marché A, avec Citic Securities comme conseiller. Elle concourt ainsi avec Zhipu AI pour devenir la première entreprise de grands modèles cotée sur le marché A. MiniMax, fondée en janvier 2022 et déjà cotée à Hong Kong depuis janvier de cette année, a vu son cours s'envoler de 409,09% depuis son introduction, atteignant une capitalisation d'environ 227,5 milliards de yuans. Elle intégrera l'indice Hang Seng Tech à partir du 8 juin. Cette performance s'appuie sur des données financières solides. L'entreprise a annoncé un taux de croissance de son revenu annuel récurrent (ARR) supérieur à 100% sur les deux derniers mois. Son ARR dépasse désormais 300 millions de dollars. Pour l'exercice 2025, son chiffre d'affaires s'est élevé à environ 535 millions de yuans, avec une marge brute améliorée à 25,4%, bien qu'elle ait enregistré une perte nette ajustée d'environ 1,69 milliard de yuans. Sur le plan des produits, MiniMax a lancé plusieurs versions de son modèle phare (M2.5, M2.6, M2.7) et a annoncé la prochaine sortie de MiniMax-M3. Cette nouvelle version utilise un mécanisme d'attention éparse propriétaire (MiniMax Sparse Attention) permettant des gains significatifs de vitesse de traitement. L'entreprise propose également Mavis, un produit Agent amélioré. Dans un contexte de concurrence intense et d'investissements élevés en puissance de calcul, les principaux acteurs chinois des grands modèles, tels que MiniMax, Zhipu AI, Moonshot AI et Stepfun, accélèrent leurs démarches d'introduction en bourse pour diversifier leurs sources de financement.

marsbitIl y a 2 jours 02:48

Le leader des grands modèles de Shanghai lance son introduction en bourse sur le marché A

marsbitIl y a 2 jours 02:48

Le marché haussier américain de l'IA va-t-il s'effondrer ?

L'engouement des investisseurs pour l'intelligence artificielle (IA) atteint des sommets, comme en témoigne la valorisation de près de 9000 milliards de dollars d'OpenAI et d'Anthropic. Des acteurs comme SoftBank, dirigé par Masayoshi Son, y investissent massivement, parfois en s'endettant, attirés par d'importantes plus-values potentielles. Cependant, cette frénésie rappelle la bulle Internet des années 2000 et l'exemple de Yahoo. À l'époque, la conviction que les portails web détiendraient un monopole permanent sur le trafic s'est révélée fausse. Le modèle économique actuel des géants de l'IA, qui vendent des tokens via des API, repose sur l'hypothèse qu'ils deviendront les points de passage obligés et pérennes de l'ère de l'IA. Pourtant, l'intelligence artificielle se banalise rapidement, devenant une commodité. Pour justifier leurs valorisations astronomiques, ces entreprises devraient générer des bénéfices annuels de 250 à 300 milliards de dollars, un objectif loin d'être atteint. Leurs revenus récurrents annuels (ARR), bien qu'impressionnants, peuvent être volatils et gonflés par des promotions. Une guerre des prix sur les tokens et l'absence d'applications "superstar" générant des revenus massifs en aval fragilisent ce modèle. Deux scénarios se profilent : un effondrement de type "Yahoo", où les valorisations s'effondreraient face à l'absence de boucle commerciale viable, réduisant ces entreprises à des fournisseurs d'infrastructure aux marges modestes. Ou bien une refonte réussie de leur modèle économique, peut-être en remplaçant des logiciels existants ou en atteignant une IA générale. Dans les deux cas, la certitude du progrès de l'IA ne garantit pas le succès des acteurs actuels. Une correction brutale des valorisations, entraînant des effets de richesse négatifs et une contraction du crédit, pourrait avoir un impact systémique bien plus grave que la bulle Internet. Comme pour toute révolution technologique, le chemin vers la maturité, où l'IA deviendra une infrastructure omniprésente mais discrète, sera probablement marqué par des excès et des corrections.

marsbitIl y a 2 jours 09:15

Le marché haussier américain de l'IA va-t-il s'effondrer ?

marsbitIl y a 2 jours 09:15

TechFlow Intelligence : L’or au comptant chute sous les 4 400 dollars, le marché des crypto-monnaies baisse partout

Les grands titres du jour : l'or chute sous les 4400 dollars, et les marchés cryptos reculent. **IA & Tech :** Un débat anime Hacker News : Claude et ChatGPT sont-ils passés du statut de "jouets coûteux" à d'authentiques outils pour développeurs, ou leur adoption est-elle artificielle ? Par ailleurs, de graves vulnérabilités touchent des outils populaires comme VLLM, menaçant des millions d'agents IA. Du côté des modèles, Gemini Omni Flash est critiqué pour sa censure excessive, tandis qu'une simple amélioration de la quantification (de Q4 à Q6) boosterait significativement les capacités de codage de Qwen3.6-35B. **Crypto / Web3 :** Un employé de Google est accusé d'avoir utilisé des données internes de tendances de recherche pour gagner plus d'un million de dollars sur le marché de prédiction Polymarket. Une analyse révèle aussi des comptes suspects sur cette plateforme, avec un taux de gain de 98%. Parallèlement, une société crypto liée à Trump serait au bord de la faillite après avoir perdu 1,5 milliard de dollars. **Entreprises & Marchés :** En réaction à l'intégration forcée de l'IA par Google, le moteur de recherche respectueux de la vie privée DuckDuckGo a vu son trafic bondir de 28%. Une donnée interne de Microsoft indique que l'utilisation de l'IA coûterait, dans de nombreux cas, plus cher que le recours à des employés. Sur les marchés, les actions coréennes et celles liées aux puces IA (comme Micron) performent, tandis que Meta teste l'eau des abonnements payants sur Facebook et Instagram. **Contexte macro :** L'or a connu une chute brutale sous les 4400 $/once, en partie à cause des signaux hawkish de la Fed. À l'inverse, le pétrole Brent a grimpé à 97 dollars après une escalade militaire américaine contre l'Iran. **En filigrane :** Les frontières de l'information privilégiée sont redéfinies à l'ère de l'IA et des données massives, comme le montrent les affaires Polymarket. Parallèlement, le récit du "tout à l'IA" est contesté par des réalités de coût et les préférences des utilisateurs, suggérant un rééquilibrage en cours.

marsbit05/28 11:05

TechFlow Intelligence : L’or au comptant chute sous les 4 400 dollars, le marché des crypto-monnaies baisse partout

marsbit05/28 11:05

Les grands modèles de langage cartonnent à tous les examens, mais s'éloignent encore plus de l'AGI : Que révèle cet article de recherche ?

Cet article remet en question les définitions actuelles de l'AGI (Intelligence Artificielle Générale), souvent basées sur des performances à des tests humains, que les grands modèles linguistiques dépassent désormais sans pour autant démontrer une véritable intelligence générale adaptative. S'appuyant sur un article de Michael Timothy Bennett, l'auteur critique l'approche dominante de « Scale-maxing » (maximisation de l'échelle), qui repose sur des quantités massives de données et de puissance de calcul pour mémoriser des réponses approximatives, mais échoue face à des problèmes nouveaux ou requérant une compréhension causale. La proposition centrale est de redéfinir l'AGI non pas comme une imitation de l'homme, mais comme un « scientifique artificiel ». Un tel système devrait posséder trois capacités clés : 1) une **capacité d'expérimentation active** pour acquérir des informations par interaction avec son environnement, 2) une **compréhension causale** (« savoir pourquoi ») et non pas seulement des corrélations, et 3) la capacité à **équilibrer exploration et exploitation** des connaissances sous contraintes de ressources (calcul, mémoire, énergie). L'article conclut que la voie vers l'AGI nécessitera une fusion de différentes méthodes (maximisation d'échelle, de simplicité, et d'affaiblissement des contraintes), et non pas seulement le perfectionnement des grands modèles. Les critères d'évaluation devraient ainsi évoluer vers des « benchmarks d'adaptation » mesurant la capacité à découvrir de nouvelles connaissances dans des situations inédites, plutôt que la simple restitution de savoirs existants.

marsbit05/28 00:28

Les grands modèles de langage cartonnent à tous les examens, mais s'éloignent encore plus de l'AGI : Que révèle cet article de recherche ?

marsbit05/28 00:28

活动图片