Les 88 jours de Yao Shunyu

marsbitPublié le 2026-04-23Dernière mise à jour le 2026-04-23

Résumé

Le modèle Hy3 preview de Tencent Hunyuan, dirigé par Yao Shunyu, a été lancé 88 jours après une autocritique interne sévère. Avec 295B de paramètres totaux et 21B activés, ce modèle MoE à 256K de contexte représente un changement stratégique pour Tencent. Précédemment, Hunyuan souffrait d’un manque de capacités généralisables et d’une inadéquation avec les produits internes, poussant même certaines divisions à chercher des solutions externes. Une restructuration organisationnelle majeure a suivi, incluant la nomination de Yao Shunyu (27 ans, ancien d’OpenAI et expert en IA), la création de nouveaux départements techniques (AI Infra, AI Data), et la dissolution du AI Lab pour recentrer tous les efforts sur Hunyuan. Contrairement à l’approche précédente axée sur les benchmarks, Hy3 preview a été conçu en co-design avec les produits phares de Tencent (WeChat, jeux, publicité), visant une intégration rapide et des retours utilisateurs en temps réel. Bien qu’encore en preview, il symbolise une refonte profonde de la culture technique et organisationnelle de Tencent pour l’IA. Dans un contexte de compétition intense (DeepSeek, Alibaba, ByteDance), Tencent parie sur son écosystème massif et une agilité retrouvée pour regagner du terrain. Le vrai défi n’est pas technique, mais structurel : adapter l’organisation aux exigences de l’IA.

Texte | Hors de la page, Rédaction|Dessin

Tencent Hunyuan Hy3 preview est sorti.C'est le premier produit livré par Yao Shunyu après avoir rejoint Tencent.

Architecture MoE, 295B paramètres totaux, 21B paramètres activés, prend en charge jusqu'à 256K de contexte, entraînement commencé fin janvier, publié en moins de trois mois.

Un modèle de cette envergure aujourd'hui pourrait facilement passer inaperçu.

Mais si on replace cela dans le contexte d'il y a trois mois, cela devient intéressant.

Cette sortie semble être une mise à niveau de modèle, le vrai changement se produit en dehors du modèle, Tencent commence à utiliser l'IA pour réécrire sa propre organisation.

Le 26 janvier de cette année, lors de la conférence annuelle de Tencent, le président Martin Lau (Liu Chiping) a fait quelque chose que les cadres font rarement : une analyse publique des raisons de l'échec du modèle Hunyuan.

Il a utilisé une métaphore : un lycéen qui mémorise des questions pour un examen. Les résultats sembl bons, mais il est démasqué lors du vrai examen. Après analyse, il s'est avéré que chaque module clé avait des lacunes.

Les termes de Pony Ma (Ma Huateng) étaient plus directs : Trop lent. Neuf mois à un an de retard.

De cette conférence annuelle à la sortie de Hy3 preview aujourd'hui, 88 jours.

I. Mémoriser les questions ne rapporte pas de vrais points

L'histoire de Tencent Hunyuan remonte à septembre 2023, lorsque Tencent a officiellement lancé le modèle Hunyuan lors de la conférence mondiale sur l'écosystème numérique. Une grande entreprise entrait dans la course, avec un battage médiatique important.

Puis elle est entrée dans une logique d'auto-justification.

Ce n'était pas un manque d'investissement ou de personnel. Le problème était la voie choisie.

L'analyse de Martin Lau lors de la conférence annuelle a donné le diagnostic le plus clair. Les capacités de base du modèle étaient limitées, l'équipe a choisi la voie rapide, utilisant SFT (Fine-Tuning Supervisé) pour monter dans les classements. L'effet était immédiat, les résultats étaient beaux, mais une fois dans les scénarios réels, cela a exposé un manque de capacité de généralisation, l'incapacité du modèle à être réutilisé sur les produits.

En creusant plus profondément, chaque couche avait des fissures. Pas assez de données, pré-entraînement instable, l'Infra IA incapable de passer à l'échelle, manque de facteurs et d'objectifs pour l'apprentissage par renforcement, le modèle de base ne pouvait pas supporter les applications supérieures.

Cela a directement conduit à une impasse côté produit. Yuanbao, l'assistant IA de Tencent, avait environ 57 millions d'utilisateurs actifs mensuels au premier trimestre de cette année. Cela semble augmenter, mais pendant la même période, Doubao avait 345 millions, Qianwen 166 millions. L'écart ne se réduisait pas, il s'agrandissait.

L'écart n'était plus au niveau de l'échelle, mais dans la définition de l'accès.

Pire encore en interne. Les lignes métier de l'écosystème Tencent - WeChat, jeux, publicité, services aux entreprises - avaient besoin de capacités IA, mais le Hunyuan de l'époque ne pouvait pas les satisfaire. Ce n'est pas que les métiers ne voulaient pas l'utiliser, c'est que les résultats n'étaient pas à la hauteur. Certains métiers core n'osaient même pas utiliser Hunyuan, préférant trouver leur propre solution.

Un grand modèle auto-développé par une grande entreprise qui ne pouvait même pas avoir sa place à la table principale dans sa propre maison, c'est l'image la plus directe des difficultés passées de Hunyuan.

À l'époque, l'organisation de Tencent n'avait pas non plus suivi le rythme du développement des grands modèles. Tencent était longtemps centré sur l'ingénierie produit, les équipes IA étaient des acteurs secondaires. D'abord faire le produit, puis adapter l'IA. Selon les mots de Martin Lau, le développement IA de Tencent était comme un produit sans chef de produit, l'équipe R&D personne ne contrôlait la direction, beaucoup de travail était fait pour rien.

Pendant la même période, ByteDance a dépensé environ 90 milliards de yuans rien que pour l'achat de puces IA, DeepSeek a impressionné le monde avec l'efficacité ultime d'une petite équipe pour créer R1, les appels d'API mondiaux d'Alibaba Qianwen grimpaient en tête.

Hunyuan n'a pas perdu contre un adversaire particulier, c'est la structure organisationnelle elle-même qui l'a empêché d'aller sur le champ de bataille.

II. Emprunter d'abord une vie

Autour du Nouvel An chinois 2025, DeepSeek R1 a explosé, capturant l'attention de l'industrie mondiale de l'IA.

Tencent a pris une décision extrêmement pragmatique et astucieuse. Le 13 février, Yuanbao a pleinement intégré DeepSeek-R1 version complète, gratuitement.

Les utilisateurs actifs quotidiens de Yuanbao ont explosé de plus de 20 fois en un mois, dépassant Doubao le 22 février pour atteindre la deuxième place du classement des applications gratuites téléchargées sur l'App Store en Chine, et même brièvement la première place.

La vitesse de réaction de Tencent pendant cette fenêtre, toute l'industrie regardait. Recherche WeChat, navigateur QQ, saisie Sogou, ima, toute une suite de produits a intégré DeepSeek de manière intensive. Même le jeu mobile "Peace Elite" a intégré DeepSeek dans son porte-parole numérique.

Alors que toute l'industrie observait DeepSeek, Tencent a été la première grande entreprise à l'intégrer pleinement dans son écosystème.

Mais Tencent savait mieux que quiconque que cette opportunité était empruntée.

DeepSeek a aidé Yuanbao à attirer des utilisateurs, mais la rétention était une autre histoire. Le parcours de recherche était fragmenté, une partie passant par Hunyuan, une partie par DeepSeek, l'expérience n'était pas uniforme.

En simple, embrasser DeepSeek consistait essentiellement, alors que Hunyuan n'était pas encore prêt, à utiliser une capacité externe pour d'abord capter les utilisateurs et soutenir les scénarios.

Mais le problème était que l'écosystème WeChat de Tencent, les services aux entreprises, l'IA pour les jeux, le ciblage publicitaire intelligent, ces métiers core nécessitent des capacités IA profondément personnalisées, contrôlables et ajustables, qu'une API générique ne peut pas résoudre.

Hunyuan devait se lever tout seul. La question était comment.

III. Le démolisseur

En septembre 2025, un jeune homme de 27 ans rejoint discrètement Tencent.

Yao Shunyu, licence de la Yao Class de Tsinghua, doctorat de Princeton, encadré par Karthik Narasimhan, l'un des auteurs principaux de l'article fondateur du GPT. Pendant son doctorat, il a proposé le framework ReAct et l'Arbre de Pensées (Tree of Thoughts), deux travaux fondateurs dans le domaine des agents IA globaux.

Après son doctorat en 2024, il a rejoint OpenAI, participant profondément au développement de deux projets core d'agents intelligents : Operator et Deep Research.

Mais le CV n'est pas la clé, plus important encore est le changement architectural qu'il a apporté après son arrivée.

En décembre 2025, Tencent a publié un avis d'ajustement de la structure organisationnelle interne, nommant officiellement Yao Shunyu scientifique en chef de l'IA au bureau du PDG/Président, et responsable simultané des deux nouveaux départements Département AI Infra et Département des grands modèles de langage, avec une double reporting, directement au président de Tencent Martin Lau et au responsable du groupe d'affaires d'ingénierie technique TEG Lu Shan.

27 ans, accès direct au numéro deux de Tencent, aux commandes de deux départements core de l'IA, une telle promotion et de telles autorités sont extrêmement rares dans l'histoire de Tencent.

Selon des reportages, la première chose qu'il a faite après son arrivée a été d'inspecter module par module les raisons des mauvaises performances de Hunyuan, discutant souvent avec des collègues et des stagiaires jusqu'au milieu de la nuit. Les résultats du diagnostic rapportés à Martin Lau ont directement conduit à une série d'opérations organisationnelles.

Il n'a pas repris une tâche d'optimisation de modèle, mais un ensemble de méthodes de travail qui devaient être renversées.

En décembre 2025, Tencent a créé d'un coup trois départements core : Département AI Infra, Département AI Data, Département de plateforme de calcul de données, les infrastructures d'abord, démolir et reconstruire les fondations techniques sous-jacentes. Simultanément, l'entreprise a accéléré le recrutement mondial de talents IA de premier plan pour combler les lacunes techniques.

Le 20 mars de cette année, le Tencent AI Lab, vieux de dix ans, a été officiellement dissous. Tout le personnel core R&D a été intégré au Département des grands modèles de langage, rattaché à la ligne principale de développement de Hunyuan, reportant统一ment à Yao Shunyu.

Désormais, Tencent ne conserve plus d'organisme de recherche IA专属 indépendant du système de grands modèles, toutes les forces de recherche IA sont regroupées, se concentrant sur la ligne principale unique de Hunyuan.

C'était une reconstruction complète de la chaîne, de l'Infra sous-jacente aux pipelines de données en passant par les processus d'entraînement et la structure organisationnelle, pas une réparation de l'ancien système, mais une démolition et une reconstruction, construisant une boucle de développement complète depuis le début.

Selon les mots de l'équipe de Yao Shunyu, Hy3 preview est le début du passage du grand modèle de langage Hunyuan de "lire dix mille livres" à "parcourir dix mille lieues".

Face à la réalité des deux dernières années où Hunyuan lisait mais ne pouvait pas résoudre les problèmes, la direction de cette phrase est claire : ne pas se faire plaisir sur les jeux de test, aller faire les choses dans le monde réel.

IV. Preview, pas Answer

Revenons au produit lui-même.

Architecture MoE融合pensée rapide et lente, 295B paramètres totaux, 21B paramètres activés, prend en charge jusqu'à 256K de contexte. Entraînement commencé fin janvier 2026, mise en ligne en avril.

Moins de trois mois, de zéro à utilisable. C'est en soi un signal important de l'accélération du développement de Hunyuan.

Le développement de modèles dans l'industrie comprend généralement la préparation de données de haute qualité, le pré-entraînement, le post-entraînement et l'apprentissage par renforcement/ajustement fin. Si on inclut l'exploration architecturale préalable et l'optimisation post-évaluation, le cycle complet d'une version majeure from scratch prend environ 6 à 12 mois.

Tencent fait l'inverse, n'a pas cherché à suivre la foule pour des modèles homogènes, a conçu en Co-design en combinant les besoins des scénarios métier core de Tencent comme les réseaux sociaux, les jeux, la publicité. L'avantage est que les énormes investissements de Tencent dans l'IA peuvent être rapidement validés par le marché.

L'inverse total du Hunyuan passé.Avant : d'abord monter dans les classements, puis chercher des scénarios, trouver des scénarios et découvrir que c'est inutilisable. Maintenant : d'abord entrer dans les scénarios, puis montrer au monde.

Et avant sa publication, Hy3 preview avait déjà terminé les tests et l'adaptation协同 dans des produits core de Tencent comme Yuanbao, WorkBuddy, CodeBuddy, ima, QQ, le modèle et le produit avançant de pair dès la phase de conception.

C'est le Co-design, entraîner et utiliser simultanément, laisser les retours produits forcer l'itération du modèle.

Dans un sens, c'est une réponse directe à la phrase de Martin Lau "pas de chef de produit dans le produit".

Pour l'interne de Tencent, les changements apportés par Hy3 preview pourraient être plus importants que ce que perçoit l'extérieur. Le Hunyuan passé, les lignes métier n'osaient pas, ne voulaient pas l'utiliser, cherchaient chacune leur issue, un mur séparait l'équipe modèle et l'équipe produit.

Cette fois, Hunyuan est vraiment devenu la fondation modèle des métiers internes de Tencent, plus un projet de prestige nécessitant la cooperation des lignes métier pour monter dans les classements.

Quand les métiers internes sont prêts à miser l'expérience de leur produit sur Hunyuan, c'est en soi un signal.

Mais Preview signifie Preview. Le sens est franc, c'est la première version, à affiner avec les vrais utilisateurs et métiers, itérer avec les retours.

L'attitude est correcte, la direction est là, le produit est en ligne. Quant au résultat, l'examen vient juste de commencer.

V. La langouste est le pont, Hunyuan est la fondation

En fait, avant la mise en ligne de Hy3 preview, Tencent a fait autre chose facile à忽略.

Début de cette année, OpenClaw a explosé, la fièvre de la langouste a balayé toute l'industrie de l'IA. La vitesse de réaction de Tencent a une fois de plus surpris,几乎是 la première et la plus complète grande entreprise à embrasser la langouste.

WorkBuddy, QClaw, Lighthouse, une série de produits basés sur le protocole langouste mis en ligne密集, la matrice de produits de Tencent intégrée de manière globale en peu de temps.

Maintenant, en regardant en arrière, la fièvre de la langouste s'est calmée. Mais pour Tencent, la valeur de cela n'était pas la langouste elle-même,更像 un dispositif de transition.

Elle a fait deux choses. Premièrement,让 la force produit分散ée de Tencent sur les différentes lignes métier se reformer en synergie, WeChat, Yuanbao, services aux entreprises, outils développeurs,协同起来 pour la première fois sur cette couche de protocole public qu'est la langouste. Deuxièmement, et plus crucial, elle a gagné du temps pour Hunyuan.

Quand les utilisateurs affluaient via les diverses entrées d'agents, Tencent utilisait d'abord l'écosystème de la langouste pour les accueillir, tandis que Hunyuan reconstruisait dans l'ombre, de l'Infra au modèle.

Les entrées d'Agent peuvent être nombreuses. Mais ce qui détermine in fine si l'utilisateur reste ou non, c'est la capacité du modèle sous-jacent. La langouste est le pont, Hunyuan est la fondation. Le pont est construit, la fondation a finalement suivi.

VI. La fenêtre n'attendra personne

Avril de cette année est probablement le mois le plus encombré de l'histoire de l'IA en Chine.

Alibaba a publié trois modèles stratégiques en 72 heures, Kimi a publié et open-source le modèle Kimi K2.6, capacités综合comprehension d'agents généraux, code, vision considérablement améliorées, ByteDance Seed continue d'itérer, l'expansion de l'écosystème Doubao ne s'arrête pas. DeepSeek V4 serait également annoncé pour fin avril.(Lecture参考: Liang Wenfeng et Yao Shunyu, rendent copie en avril)

Hunyuan a choisi de rendre copie pendant cette fenêtre, doit faire face non seulement à une compétition technique, mais à une question现实: Combien de temps reste-t-il à la fenêtre ?

Tencent a le plus grand écosystème social de Chine, le plus de points de contact utilisateurs, les scénarios d'application les plus riches. WeChat a plus de 1,4 milliard d'utilisateurs actifs mensuels, QQ, Tencent Meeting, Tencent Docs, Enterprise WeChat, sont des points d'entrée naturels pour l'IA.

Mais pour que ces ressources fonctionnent, il faut que le modèle sous-jacent puisse supporter.

Pendant plus d'un an, les capacités produit de Hunyuan étaient faibles, Tencent a dû emprunter la popularité et la force de DeepSeek, a dû regarder Doubao le distancer côté utilisateurs.

Hy3 preview montre que Yao Shunyu a entendu la critique de Pony Ma. Entendu, et a agi.

Moins de 90 jours, démonter l'ancienne ligne, reconstruire l'Infra, supprimer AI Lab, intégrer l'équipe, recruter des talents core, Co-design avec les produits, livrer une version utilisable.

Cette vitesse est elle-même la preuve d'un changement d'efficacité organisationnelle.

Mais il y a une distance entre entendre et faire.

La vitesse à laquelle Hunyuan rattrape ne dépend pas in fine du nombre de paramètres d'une Preview, mais de si l'efficacité organisationnelle de cette reconstruction peut durer.

Cette fois, la copie de Yao Shunyu porte l'inscription Preview. Visiblement, il y a d'autres grosses annonces à venir.

Les mots de 【Hors de la page】 :

Le plus gros problème de Hunyuan par le passé n'était pas que le modèle n'était pas assez gros, c'était que l'organisation n'était pas adaptée.

Un grand modèle que ses propres métiers ne voulaient pas utiliser, peu importe le nombre de paramètres, c'était de l'auto-satisfaction.

Le changement le plus important de Hy3 preview n'est pas que les paramètres ont changé, c'est que le mur a été démoli, le mur entre le modèle et le produit, entre la recherche et l'ingénierie, entre Hunyuan et l'écosystème Tencent.

Démolir ce mur est bien plus difficile qu'empiler des paramètres.

Mais la signification de cela ne réside pas seulement chez Tencent. Dans cette course aux grands modèles, les paramètres, les algorithmes, les talents peuvent tous être rattrapés.

Ce qui est vraiment difficile à reproduire, c'est si une entreprise a la détermination de se réécrire pour l'IA.

Questions liées

QQuel était le principal problème identifié avec le modèle Hunyuan de Tencent avant la réorganisation ?

ALe principal problème était que le modèle avait une capacité de généralisation limitée. Il excellait dans les tests de référence (benchmarks) grâce au réglage fin supervisé (SFT), mais échouait dans les scénarios réels, ce qui le rendait inutilisable pour les produits internes. L'organisation était également inadéquate, l'équipe IA manquait de direction et agissait comme un acteur de soutien plutôt que central.

QQui est Yao Shunyu et quel rôle a-t-il joué dans la transformation du modèle Hunyuan ?

AYao Shunyu est un scientifique en IA de 27 ans, diplômé de Yao Class (Tsinghua) et titulaire d'un doctorat de Princeton. Il a rejoint Tencent en septembre 2025 et a été nommé scientifique en chef de l'IA, responsable des départements AI Infra et du Grand Modèle de Langage. Il a diagnostiqué les problèmes de Hunyuan, a poussé à une réorganisation majeure (y compris la suppression du AI Lab) et a supervisé le développement rapide du nouveau modèle Hy3 preview en 88 jours.

QQuelle stratégie Tencent a-t-elle utilisée pour maintenir ses produits IA compétitifs pendant que Hunyuan était en développement ?

ATencent a adopté une stratégie pragmatique en intégrant massivement et rapidement le modèle externe DeepSeek-R1 dans sa suite de produits (comme Yuanbao, WeChat Search, QQ Browser) en février 2025. Cela a permis à des applications comme Yuanbao de voir leur audience quotidienne multipliée par 20 et de gagner en popularité, maintenant ainsi la compétitivité de Tencent pendant que Hunyuan était restructuré en interne.

QQu'est-ce que la 'Co-conception' (Co-design) mentionnée dans le développement de Hy3 preview ?

ALa 'Co-conception' signifie que le modèle Hy3 preview a été conçu et développé en étroite collaboration avec les équipes produits de Tencent (comme Yuanbao, WorkBuddy, CodeBuddy). Au lieu de former d'abord un modèle puis de chercher des applications, le modèle et les produits ont été développés simultanément. Les retours des produits réels ont été utilisés pour itérer et améliorer le modèle, garantissant ainsi son utilité pratique dès le départ.

QQuel est le signification symbolique de la 'preview' dans le nom 'Hy3 preview' ?

ALe terme 'preview' indique que cette version est une première itération, une préversion. Il souligne une approche humble et pragmatique : le modèle est délibérément publié pour être testé et affiné grâce aux retours des utilisateurs réels et des scénarios business de Tencent. C'est le début d'un processus d'apprentissage continu ('parcourir des milliers de lieues') plutôt qu'une réponse définitive.

Lectures associées

Bitcoin monte, mais les institutions en veulent-elles moins ? Un cadre de Coinbase donne son avis

Selon John D’Agostino, responsable de la stratégie institutionnelle chez Coinbase, les institutions ayant acheté du Bitcoin à des niveaux élevés (100 000 $ et 125 000 $) montrent un intérêt encore plus marqué depuis que le prix est redescendu autour de 60 000 $. Dans une interview récente avec CNBC, il a indiqué qu'aucun signe de vente de panique n'était observé parmi les grands acteurs. Au contraire, de nombreux investisseurs institutionnels, tels que des family offices, des fonds souverains et des entités gouvernementales du Moyen-Orient, voient la récente correction comme une opportunité d'achat à des prix plus bas. D’Agostino souligne que ces institutions ont passé des années à étudier le Bitcoin et ont tendance à s'intéresser davantage à l'actif lorsque son prix baisse. Malgré le repli récent du Bitcoin, qui a chuté sous les 60 000 $ après avoir dépassé 70 000 $, l'exposition via les ETF spot Bitcoin reste élevée, avec plus de 750 milliards de dollars. Selon lui, tant les investisseurs de détail qu'institutionnels considèrent le Bitcoin comme un actif à long terme. Il reconnaît que des facteurs tels qu'un environnement de aversion au risque, la rotation des capitaux, des taux d'intérêt élevés et des incertitudes géopolitiques ont pu peser sur le cours, mais estime que ces fluctuations sont normales pour une classe d'actifs se comportant comme une matière première. L'infrastructure de marché améliorée et le cadre réglementaire en évolution rendent, selon lui, l'environnement actuel plus solide que lors des précédents replis.

bitcoinistIl y a 3 mins

Bitcoin monte, mais les institutions en veulent-elles moins ? Un cadre de Coinbase donne son avis

bitcoinistIl y a 3 mins

Bitmine continue d'accumuler de l'Ethereum de manière agressive tandis que les autres réduisent la voilure

La société de trésorerie Bitmine a poursuivi son accumulation agressive d'Ethereum (ETH) la semaine dernière, achetant 126 971 ETH. Son portefeuille total comprend désormais 5,54 millions d'ETH (évalués à 1 630 $ chacun), représentant 4,59% de l'offre totale. Dans un récent rapport, Bitmine a détaillé des actifs de 9,6 milliards de dollars, incluant également 203 Bitcoin, des participations dans Beast Industries et Eightco Holdings, ainsi que 247 millions de dollars en cash. Malgré le récent repli du marché, le président Thomas 'Tom' Lee y voit le début du "printemps crypto", anticipant une demande accrue pour des réseaux décentralisés comme Ethereum avec l'avancée des systèmes d'IA. La société a également indiqué avoir mis en jeu (stake) environ 4,72 millions d'ETH (environ 7,7 milliards de dollars), générant un rendement de 2,99% sur sept jours et un revenu annuel estimé à 230 millions de dollars. Contrairement à de nombreux autres trésoreries d'actifs numériques qui ont cessé d'accumuler ou ont vendu, Bitmine continue ses acquisitions. Elle possède désormais la deuxième plus grande trésorerie mondiale de crypto-monnaies et la plus grande en ETH. La société a également annoncé un projet d'émission d'actions privilégiées pour lever des fonds destinés à acheter davantage d'ETH, à réaliser des investissements stratégiques et à développer son infrastructure de staking.

TheNewsCryptoIl y a 1 h

Bitmine continue d'accumuler de l'Ethereum de manière agressive tandis que les autres réduisent la voilure

TheNewsCryptoIl y a 1 h

Apple convoite l'IA embarquée, et un outsider émerge : le premier modèle cognitif voit le jour, 4B paramètres rivalisent avec GPT-5.4

Apple a mis en avant une renaissance de Siri propulsée par l’IA lors de la WWDC, tandis qu’Amazon a dû freiner l’utilisation interne de modèles volumineux en raison de coûts de calcul explosifs. Face à ce défi des “tokens”, Andrej Karpathy a suggéré de créer un “noyau cognitif” — un modèle déchargé des connaissances factuelles mais conservant des capacités de raisonnement. La société chinoise Nextie a concrétisé cette vision avec **Alpha**, un **modèle cognitif de 4B paramètres** qui, dans des tâches d’intelligence collective (débat, réflexion, vote), atteint des performances équivalentes à celles de modèles de milliers de milliards de paramètres comme GPT-5.4. Conçu pour être déployé en périphérie (sur MacBook ou robots embarqués), Alpha réduit radicalement les coûts de calcul et ouvre la voie à des agents **proactifs** capables d’agir de manière autonome, au lieu de simples réponses aux requêtes. L’équipe, issue de Microsoft XiaoIce, s’était déjà distinguée avec un petit modèle performant. Nextie se positionne sur le créneau des systèmes multi-agents, un domaine validé par des investissements récents comme celui d’OpenAI dans Isara. En résumé, ce modèle cognitif ne change pas seulement l’échelle des paramètres, mais aussi **l’équation économique** de l’IA, rendant viable une intelligence continue et proactive à faible coût.

marsbitIl y a 2 h

Apple convoite l'IA embarquée, et un outsider émerge : le premier modèle cognitif voit le jour, 4B paramètres rivalisent avec GPT-5.4

marsbitIl y a 2 h

Hoskinson affirme que Cardano peut surpasser Bitcoin en résolvant le problème de confiance des cryptos

Charles Hoskinson, fondateur de Cardano, affirme que la plateforme vise bien plus qu'une simple part du marché des cryptomonnaies : elle ambitionne de devenir l'infrastructure mondiale de la confiance. Lors d'un livestream, il a présenté l'objectif à long terme d'ADA comme étant la réduction de la dépendance aux tiers de confiance dans le commerce mondial, un secteur qui génère des coûts annuels de centaines de milliards de dollars. La solution proposée est la "réflexivité vérifiable", où chaque transaction ou élément porte sa propre preuve de validité, éliminant le besoin d'un intermédiaire. Hoskinson explique que les blockchains servent de couche de stockage pour ces transactions, tandis que les contrats intelligents et les preuves à connaissance nulle en permettent l'utilité. Il met en avant les atouts de Cardano pour y parvenir : le protocole Ouroboros pour une décentralisation accrue, le modèle UTXO étendu pour la détermination locale, Hydra pour la mise à l'échelle, et une approche modulaire via des chaînes partenaires comme Midnight. Le défi majeur reste la gouvernance, nécessaire pour créer un système autonome capable de survivre, même en cas de perte de confiance en son fondateur. Si Cardano réussit à construire ce système de confiance vérifiable, Hoskinson estime que sa cryptomonnaie pourrait devenir "la monnaie de la confiance mondiale" et dépasser un jour Bitcoin. Au moment de la publication, ADA s'échangeait à 0,16 dollar.

bitcoinistIl y a 2 h

Hoskinson affirme que Cardano peut surpasser Bitcoin en résolvant le problème de confiance des cryptos

bitcoinistIl y a 2 h

Arthur Hayes dans un nouvel article : La bulle de l'IA approche de son éclatement, le marché crypto sous pression à court terme

Arthur Hayes, cofondateur de BitMEX, analyse dans cet article les tensions géopolitiques actuelles et leurs implications sur les marchés financiers. Il estime que la hausse des prix du pétrole, liée au conflit entre les États-Unis et l'Iran autour du détroit d'Hormuz, exercera une pression inflationniste et influencera la campagne présidentielle américaine de novembre. Pour reconquérir les électeurs préoccupés par le coût de la vie, Hayes prédit que Donald Trump pourrait adopter un discours critique envers l'industrie de l'intelligence artificielle, promettant régulation et taxation. Une telle rhétorique, même tactique, pourrait provoquer un éclatement de la bulle des actions AI, d'autant plus que le secteur est déjà vulnérable à la hausse des coûts énergétiques et à l'introduction en bourse massive prévue de SpaceX, Anthropic et OpenAI. Hayes explique que la liquidité monétaire récente a été entièrement absorbée par le boom de l'IA, laissant peu de capitaux pour le bitcoin. Une correction sévère des actions AI entraînerait donc probablement une pression vendeuse sur l'ensemble des actifs risqués, y compris les cryptomonnaies. En conséquence, son fonds, Maelstrom, a vendu ses actions AI, réduit ses positions cryptos secondaires et se concentre désormais sur le pétrole et le gaz, ainsi que sur le bitcoin et l'ether en vue d'une reprise future après un éventuel krach et une nouvelle réponse monétaire accommodante des banques centrales.

marsbitIl y a 3 h

Arthur Hayes dans un nouvel article : La bulle de l'IA approche de son éclatement, le marché crypto sous pression à court terme

marsbitIl y a 3 h

Trading

Spot
Futures
活动图片