La route de DeepSeek vers 10 000 milliards de dollars : utiliser l'open source pour débloquer un écosystème matériel de mille milliards de dollars

marsbitPublié le 2026-05-25Dernière mise à jour le 2026-05-25

Résumé

**Résumé : La stratégie ambitieuse de DeepSeek visant 10 000 milliards de dollars** DeepSeek ne chercherait pas seulement à créer des modèles d'IA performants, mais à transformer radicalement l'écosystème matériel de l'IA grâce à une série d'innovations architecturales. L'objectif ultime serait de construire une infrastructure AI à moindre coût, permettant ainsi l'émergence d'un nouvel écosystème matériel viable en Chine et au-delà. Sa feuille de route technique, incluant des innovations comme le MoE, MLA, DSA, CSA, Engram et TileLang, est systématiquement axée sur un objectif : réduire la dépendance aux composants critiques et coûteux (comme le HBM, les puces de pointe, CUDA) et optimiser l'utilisation des ressources disponibles. Par exemple, ses techniques de compression du KV Cache réduisent drastiquement les besoins en mémoire HBM, favorisant l'utilisation de stockages moins chers comme les SSD NAND ou la LPDDR. Ces innovations bénéficieraient directement aux fabricants chinois de mémoire (comme YMTC, CXMT) et aux fabricants de GPU/ASIC locaux, en rendant leurs produits plus compétitifs pour exécuter des charges de travail d'IA avancées. En parallèle, des projets comme TileLang visent à affaiblir le "fossé" de CUDA en permettant une portabilité du code sur différentes architectures matérielles. En résumé, la stratégie de DeepSeek semble être un jeu à long terme : plutôt que de monétiser directement des applications, il s'agirait de devenir un catalyseur essentiel pour...

Titre original : DeepSeek's 10 trillion USD grand strategy

Auteur original : @bookwormengr

Traduction originale : Peggy, BlockBeats

Note de la rédaction : Au cours de la dernière année, les discussions autour de DeepSeek se sont principalement concentrées sur les performances du modèle, la stratégie open source et la guerre des prix. Mais si l'on comprend DeepSeek uniquement en termes de « vente d'abonnements », de « multimodalité » ou de « capacité d'agent de codage », on risque de sous-estimer ce qu'il cherche vraiment à changer.

Cet article avance un jugement plus radical : l'objectif de DeepSeek n'est peut-être pas de monétiser à court terme au niveau applicatif, mais plutôt, grâce à une série d'innovations architecturales fondamentales, de remodeler la structure des coûts de l'entraînement et de l'inférence en IA, et de contribuer indirectement à la formation d'un nouvel écosystème matériel. De MoE, MLA à DSA, CSA, mHC, Engram, en passant par Dual Path et TileLang, la feuille de route technologique de DeepSeek tourne toujours autour d'une question centrale : dans un contexte de limitations concernant la HBM, les procédés avancés, l'emballage et l'écosystème CUDA, comment obtenir des modèles plus performants avec moins de puissance de calcul haut de gamme.

Ce qui mérite le plus d'attention dans cet article, ce n'est pas de savoir « si DeepSeek peut gagner quelques milliards de dollars grâce à ses API ou ses abonnements », mais s'il est en train de lier les capacités des modèles, les architectures mémoire et l'écosystème matériel national. La compression du KV Cache réduit la dépendance à la HBM, la NAND et les SSD peuvent gérer la mise en cache à long terme, la LPDDR peut être utilisée pour le chargement en flux des poids et le stockage Engram, tandis que TileLang tente d'affaiblir l'avantage compétitif de CUDA. Si ces innovations continuent de se diffuser, les bénéficiaires ne seront pas seulement DeepSeek lui-même, mais aussi les acteurs du stockage, des ASIC, des GPU, des puces réseau et de toute la chaîne d'infrastructure IA.

Bien sûr, les affirmations concernant un « écosystème industriel de 10 000 milliards de dollars » et une « valorisation de 1 000 milliards de dollars » dans l'article relèvent encore largement de la spéculation. Mais elles offrent une voie importante pour comprendre DeepSeek : l'open source ne signifie pas nécessairement renoncer à la commercialisation, et les bas prix ne sont pas forcément qu'une subvention du marché. Pour DeepSeek, la vraie affaire n'est peut-être pas au niveau applicatif, mais dans l'aide apportée pour rendre plus de matériels utilisables et permettre une offre d'IA à moindre coût. Autrement dit, ce qu'il vend n'est peut-être pas le modèle lui-même, mais la faisabilité de la prochaine génération d'infrastructure IA.

Voici l'article original :

Avez-vous déjà pensé à la façon dont DeepSeek compte réellement gagner de l'argent, et potentiellement beaucoup d'argent ?

Il n'a pas lancé d'offre d'abonnement compétitive pour le codage comme GLM, MoonShot et MiniMax ; il n'a pas de modèle multimodal, audio ou vidéo. Jusqu'à présent, il n'a même pas son propre « harness », c'est-à-dire un cadre d'exécution externe pour l'appel de modèles, l'intégration d'outils et l'exécution de tâches – bien qu'ils aient récemment commencé à recruter pour des postes liés, se préparant à construire ce système.

Dans le même temps, DeepSeek semble rester fermement et durablement du côté de l'open source, et n'hésite même pas à partager publiquement ses « secrets ». N'est-ce pas fou ? Ne s'agit-il pas de brûler de l'argent gratuitement ? Les investisseurs prêts à lui injecter 100 milliards de dollars jettent-ils leur argent par les fenêtres ?

Je pense personnellement que la réponse est exactement l'inverse.

Je vais maintenant, sur la base de ce que DeepSeek a déjà fait jusqu'à présent, avancer quelques observations et analyser la stratégie qu'il semble suivre. L'objectif du PDG de DeepSeek, Liang Wenfeng, pourrait être bien plus grand que la simple concurrence actuelle entre modèles. Il vise peut-être un prix beaucoup plus important : DeepSeek a l'opportunité d'atteindre une valorisation de 1 000 milliards de dollars, tout en favorisant la création d'une nouvelle industrie d'une valeur de 10 000 milliards de dollars.

Article de TechInAsia sur le dernier tour de table de DeepSeek

Revisiter le « voyage du héros » de DeepSeek

DeepSeek a toujours navigué à contre-courant. Il n'a pas choisi de lancer continuellement des modèles légèrement plus performants pour ensuite se précipiter à les commercialiser sous forme d'applications directement monétisables, comme des abonnements pour le codage. Le 27 janvier 2025, j'avais posté un tweet très partagé racontant ce que je voyais comme le « voyage du héros » de DeepSeek. Aujourd'hui, cette histoire est devenue encore plus intéressante.

Lorsque d'autres essayaient encore de construire des modèles denses, DeepSeek a choisi le Mixture of Experts (MoE), plus difficile à entraîner.

Ils ont adopté une approche de « premier principe », inventant le nouvel algorithme GRPO pour remplacer l'algorithme dominant mais plus coûteux en mise en œuvre, le PPO, en apprentissage par renforcement.

Ils ont découvert que le Reinforcement Learning from Verified Rewards (RLVR) était une stratégie clé pour améliorer les capacités de raisonnement des modèles.

Ils ont également proposé une stratégie simple de décodage spéculatif via la « prédiction multi-token » (Multi Token Prediction), tout en densifiant le signal d'entraînement.

Ils ont perfectionné le pipeline « ZERO bubble » pour améliorer l'efficacité d'utilisation des ressources GPU limitées.

Ils ont publié un équilibreur de charge d'experts, rendant le déploiement des modèles MoE plus accessible à tous. Grâce notamment à la stratégie « Wide Expert Parallel », les modèles peuvent servir avec des batchs plus importants, réduisant ainsi considérablement les coûts d'inférence.

Ils ont inventé les mécanismes MLA, DSA, CSA, HCA, etc., pour réduire les besoins en KV Cache et maintenir la demande de calcul, qui augmente avec la longueur du contexte, aussi proche que possible d'un niveau constant.

Ils ont inventé Engram, échangeant de la mémoire contre de l'efficacité de calcul.

Ils ont également inventé le mHC, permettant un entraînement stable même lors de l'augmentation de la taille des modèles. Et il y a bien d'autres exemples.

Dans la structure narrative la plus universelle du « voyage du héros », le héros ne décide jamais dès le début où son périple le mènera. Il découvre peu à peu sa véritable et grande mission en apprenant tout au long du chemin, et l'accomplit face à de nombreux obstacles. Il rencontre de nombreux détracteurs, mais choisit de les ignorer. Il rencontre également de nombreux acteurs malveillants. Il a des faiblesses ou des lacunes évidentes, mais finit par les surmonter pour accomplir sa mission. Il fait face à des défis apparemment insurmontables, mais trouve des moyens de s'allier et apprend à utiliser judicieusement des ressources limitées et précieuses. C'est ce qui fait que le public veut encourager le héros. C'est aussi pourquoi DeepSeek a gagné des adeptes, le respect mondial et des opposants.

Comme je vais l'expliquer en détail, DeepSeek est sur cette voie depuis longtemps et a progressivement découvert sa destinée ultime : son objectif n'est pas de vendre des abonnements pour le codage, mais de stimuler un écosystème matériel d'IA chinois d'une valeur de 10 000 milliards de dollars, tout en atteignant pour lui-même une valorisation de 1 000 milliards de dollars. Dans ce processus, il créera également des opportunités pour de nombreux nouveaux entrants dans l'écosystème matériel occidental.

Commençons par quelques calculs intéressants sur le KV Cache

Voyez ce tweet très opportun de @SemiAnalysis_ récemment :

DeepSeek a mieux résolu ce problème que quiconque !

Faisons d'abord quelques calculs intéressants sur le KV Cache. Ne vous inquiétez pas, même si vous n'aimez pas les maths. Nous utiliserons le calculateur de KV Cache récemment publié pour voir combien d'économies de KV Cache apporte DeepSeek V4 Pro, et le comparer aux derniers modèles GLM et Qwen.

Ici, je calcule pour une longueur de contexte de 1 million, en supposant une précision KV de 8 bits et une précision d'indexeur de 16 bits. Vous pouvez également essayer vous-même ce calculateur : https://kvcache.ai/tools/kv-cache-calculator/

Vous pouvez aussi essayer le calculateur vous-même !

Avec une longueur de contexte de 1 million :

· DeepSeek V4 ne nécessite que 5,48 Go de HBM ;

· GLM-5 nécessite 60 Go de HBM ;

· Qwen3-235B-A22B nécessite jusqu'à 89 Go de HBM.

Il est important de noter que :

· DeepSeek est un modèle de 1,6 trillion de paramètres ;

· GLM-5 fait environ 700 milliards de paramètres et a déjà adopté MLA et DSA de DeepSeek, mais pas encore le dernier mécanisme d'attention compressée ;

· Qwen3-235B-A22B fait environ 235 milliards de paramètres et utilise le mécanisme d'attention GQA.

DeepSeek a apporté des contributions fondamentales à l'atténuation de la pression sur la mémoire. Si ces innovations sont largement adoptées, elles réduiront considérablement les coûts d'exécution des agents à long cycle et débloqueront la prochaine vague de nouvelles applications.

Comparaison de l'occupation du KV Cache pour un contexte de 1 million de tokens et différentes tailles de modèles

La méthodologie derrière la « folie »

Le fait que la taille du KV Cache puisse être si petite sans sacrifier la qualité du modèle est précisément la raison pour laquelle DeepSeek peut offrir une mise en cache longue durée à un prix extrêmement bas – moins de 3% du prix du cache hit de Sonnet 4.6, et DeepSeek peut conserver le cache pendant plusieurs heures.

Pour les tâches à long cycle, un KV Cache plus petit signifie qu'il peut être déchargé de manière plus économique sur un SSD et rechargé si nécessaire. Cela réduit ainsi la dépendance à la HBM. Du point de vue de l'industrie matérielle chinoise d'IA, la HBM est non seulement rare, mais aussi l'un des types de mémoire les plus difficiles à fabriquer.

De plus, DeepSeek a développé des techniques pour charger le KV Cache plus rapidement depuis un SSD, comme décrit dans son article Dual Path.

DeepSeek V4 compresse tellement le KV Cache que cette étape pourrait même ne plus être nécessaire.

Alors, qui bénéficie le plus directement de la compression du KV Cache ?

Qui fournit des SSD à grande échelle ? N'oubliez pas que YMTC (Yangtze Memory Technologies Co.) est en train de devenir un géant dans le domaine de la 3D NAND. La NAND peut aider DeepSeek à éviter le recalcul du KV. En retour, DeepSeek crée un énorme marché pour la NAND et les SSD – ce qui profitera non seulement à YMTC, mais aussi à d'autres acteurs concernés.

Cependant, il ne s'agit pas seulement de NAND et de SSD.

La mémoire LPDDR a également un énorme potentiel. Elle peut servir d'espace de stockage pour les poids des modèles et les transmettre en flux continu vers la HBM lorsque nécessaire, atténuant ainsi la pression sur la demande en HBM. L'équipe SGLang a publié un bon blog à ce sujet. L'image ci-dessous montre comment ce schéma fonctionne.

Bien que DeepSeek n'ait pas conçu spécifiquement pour ce schéma, son architecture MoE, le fait qu'il possède lui-même de nombreux modèles experts, et ses poids 4 bits facilitent la mise en œuvre de ce schéma.

Cette illustration montre comment la mémoire pourrait être utilisée et comment les poids du modèle pourraient être transmis en flux continu de la LPDDR vers la HBM. Je vous recommande vivement de lire le blog de SGLang.

Cette innovation, combinée à un KV Cache extrêmement compact et sans perte, réduirait considérablement la demande en HBM.

Alors, qui produit de la LPDDR en Chine ? La réponse est CXMT, ChangXin Memory Technologies. Ils ne sont en retard que d'environ une demi-génération en vitesse LPDDR et d'une génération en densité, l'écart n'est pas énorme.

En plus d'avoir suffisamment de NAND, l'écosystème chinois d'IA aura également un approvisionnement suffisant en LPDDR dans un avenir proche. Cela peut-il soulager la pression sur la puissance de calcul ? Réponse : Oui. Continuez à lire.

Une utilisation intelligente de la mémoire peut également soulager la pression sur les GPU/ASIC

L'utilisation de la NAND pour stocker le KV Cache est assez simple à comprendre : elle permet de conserver le KV Cache plus longtemps, réduit la pression sur la HBM, évite de recalculer le KV Cache, et allège ainsi la charge de calcul des GPU et ASIC.

La LPDDR peut-elle jouer un rôle similaire ? Outre le fait de servir d'espace de stockage permettant de transmettre les poids « à la demande » vers la HBM, peut-elle également réduire davantage la pression de calcul ?

Réponse : Oui.

La LPDDR peut être utilisée pour stocker une grande quantité de ce qu'on appelle Engram. Dans l'article d'Engram de DeepSeek, ils soulignent que le MoE peut étendre la capacité du modèle par calcul conditionnel, mais le Transformer lui-même manque d'un mécanisme natif de « recherche de connaissances ». Par conséquent, le Transformer a tendance à simuler de manière inefficace le processus de récupération par le calcul.

Pour résoudre ce problème, DeepSeek a proposé le module Engram. Il modernise l'embedding N-gram classique en le transformant en un mécanisme de recherche basé sur le hachage en O(1), créant ainsi une voie d'éparsification complémentaire qu'ils appellent la mémoire conditionnelle (conditional memory).

Cette méthode peut économiser des calculs, mais nécessite également de la mémoire pour porter la table d'embedding, qui peut elle-même être très volumineuse.

Fondamentalement, il s'agit d'un schéma classique d'« échange mémoire contre calcul ». Mais l'idée clé est que, du point de vue du coût de lecture par bit, le côté « mémoire » est beaucoup moins cher – une recherche en LPDDR est bien moins coûteuse qu'un passage complet des données à travers plusieurs couches de Transformer pour un calcul direct. Par conséquent, à grande échelle, c'est un échange très rentable.

C'est ainsi que DeepSeek échange une partie de la mémoire contre des économies de calcul.

Un compromis qui en vaut la peine

N'ayant pas la même densité de transistors sur puce, ni l'EUV, les GPU et ASIC chinois seront probablement en retard sur les GPU occidentaux en termes de puissance FLOPs brute sur le long terme. Ils ont également un retard notable en matière d'emballage avancé. Par conséquent, ce type de compromis en vaut vraiment la peine, surtout si la Chine peut produire de la mémoire NAND et LPDDR en grande quantité.

Revenons sur la stratégie à long terme de DeepSeek

À la lumière de ces innovations, l'objectif de DeepSeek ne semble pas être de réaliser quelques milliards de dollars de profit à court terme. Beaucoup de ses choix passés le démontrent : pas de multimodalité à ce jour, pas de modèle vocal, encore moins de modèle vidéo.

Il participe en réalité à un jeu à long terme, patient, qui pourrait atteindre 10 000 milliards de dollars : favoriser la formation d'un écosystème matériel d'IA alternatif.

Cela ne vise pas seulement à permettre aux fabricants de mémoire chinois de devenir des acteurs clés sur le marché matériel chinois et mondial de l'IA, mais aussi à réduire fondamentalement les besoins en ressources, rendant l'entraînement et le service des modèles d'IA plus rentables. Ainsi, de nombreux fabricants de GPU, d'ASIC et de puces réseau pourraient devenir des options viables.

Dans le même temps, ces innovations profiteront également à l'écosystème open source occidental et aux nouveaux fabricants de matériel.

Tous les signes sont déjà là. Revisitons en détail les innovations proposées par DeepSeek jusqu'à présent :

1. Le Mixture of Experts (MoE) et le MLA introduits dans DeepSeek V2

DeepSeek a introduit le MoE et le MLA dans V2. Le MoE a réduit la quantité de calcul nécessaire pour entraîner des modèles très intelligents d'environ 40 à 50 % ; le MLA a réduit le KV Cache de 90 %.

Cela a rendu très efficace le déchargement du KV Cache sur un SSD.

Ces idées sont apparues pour la première fois dans l'article DeepSeek V2 publié par DeepSeek en mai 2024. Elles ont ensuite posé les bases de l'entraînement de DeepSeek V3. À l'époque, DeepSeek a réussi à entraîner un système performant proche des modèles propriétaires en utilisant seulement 2 048 GPU H800 aux performances réduites.

2. DSA : Introduit dans DeepSeek V3.2 Exp pour réduire les coûts de calcul dans les scénarios à contexte long et atténuer la pression sur la bande passante HBM.

Le rôle central de DSA est de s'assurer que la quantité de calcul n'augmente pas continuellement avec la longueur du contexte. Regardez le graphique ci-dessous : le temps de traitement de DeepSeek-V3.2 reste fondamentalement stable à mesure que la longueur du contexte augmente.

3. mHC : Proposé par DeepSeek en décembre 2025 dans l'article « mHC : Manifold-Constrained Hyper-Connections ».

Le mHC est une innovation de DeepSeek au niveau de l'architecture macroscopique, qui reconçoit la façon dont l'information circule entre les couches du Transformer.

Depuis ResNet, les modèles utilisaient généralement des connexions résiduelles standard, c'est-à-dire x + F(x). L'approche mHC consiste à étendre le flux résiduel en plusieurs canaux d'information parallèles et à permettre au modèle de les mélanger de manière apprenable. La clé est qu'il contraint la matrice de mélange à être une matrice doublement stochastique, c'est-à-dire qu'elle est limitée au polyèdre de Birkhoff via une projection Sinkhorn-Knopp. Mathématiquement, cela garantit que l'amplitude du signal reste stable, quelle que soit la profondeur de l'empilement du modèle.

Cela résout le problème d'instabilité catastrophique rencontré par les Hyper-Connections non contraintes. Les Hyper-Connections ont été initialement proposées par ByteDance, mais sans contraintes, l'amplification du signal explosait jusqu'à 3 000 fois à une échelle de 27 milliards de paramètres, conduisant finalement à un échec complet de l'entraînement.

Le coût de calcul du mHC est faible : il n'entraîne qu'une augmentation d'environ 6,7 % du temps d'entraînement réel, car il ne modifie pas les FLOPs des couches d'attention ou FFN, mais seulement la façon dont les sorties de ces couches sont acheminées entre les couches.

Mais les gains de performance sont assez nets : à l'échelle de 27 milliards de paramètres, mHC améliore de 7,2 points sur les tâches de raisonnement BIG-Bench Hard, de 3,2 points sur DROP, de 2,8 points sur la tâche mathématique GSM8K et de 1,4 point sur la tâche de connaissances générales MMLU. Et ces gains sont obtenus avec la même taille de modèle et un budget de calcul presque identique.

Fondamentalement, le mHC offre au réseau une topologie de routage de l'information inter-couches plus riche et plus expressive, permettant une intelligence par paramètre plus élevée sans ajouter de FLOPs significatifs.

Le mHC est une conception architecturale complexe, mais il permet un entraînement plus stable et une intelligence par paramètre plus élevée.

4. CSA, HSA : Introduits par DeepSeek en avril 2026 dans V4.

L'objectif de CSA et HSA est de réduire encore de 90 % les besoins en KV Cache en compressant les tokens KV, tout en réduisant considérablement les FLOPs nécessaires, atténuant ainsi simultanément la pression sur la HBM et les GPU/ASIC.

5. Engram : Introduit par DeepSeek au premier trimestre 2026, consistant essentiellement à échanger de la mémoire, c'est-à-dire de la mémoire LPDDR, contre de l'efficacité de calcul.

Comme le montre le graphique détaillé ci-dessous, pour un budget total de paramètres identique, Engram apporte une amélioration notable des performances.

6. Engram : Introduit par DeepSeek au premier trimestre 2026, consistant essentiellement à échanger de la mémoire, c'est-à-dire de la mémoire LPDDR, contre de l'efficacité de calcul.

Comme le montre le graphique détaillé ci-dessous, pour un budget total de paramètres identique, Engram apporte une amélioration notable des performances.

Ce sont les recommandations que DeepSeek partage avec les fabricants de matériel dans son article V4. Je suis sûr que, dans les échanges en privé, ils donnent encore plus de retours.

7. L'investissement dans TileLang pointe également dans la même direction : DeepSeek ne résout pas seulement ses propres goulots d'étranglement en matière de calcul, mais favorise la capacité de l'écosystème matériel chinois à rivaliser avec l'écosystème occidental.

Avec TileLang, les développeurs peuvent écrire le kernel (le code de bas niveau pour les calculs) une seule fois, puis le faire fonctionner avec succès sur plusieurs plateformes matérielles, à condition qu'un backend TileLang correspondant existe.

Je m'attends à ce que d'autres laboratoires d'IA chinois se joignent progressivement à cet effort. Cela aidera les fabricants de matériel chinois à faire face indirectement au soi-disant « avantage compétitif de CUDA ». En même temps, cela libérera également le potentiel de plus de matériel occidental, comme AMD.

Il convient de noter que de nombreuses plateformes matérielles d'IA chinoises offrent déjà une compatibilité CUDA ou une couche de traduction CUDA. Par exemple, Moore Threads, MetaX, Biren et Tianshu Zhixin sont des fabricants de puces chinois offrant un degré élevé de compatibilité CUDA via des couches de traduction. Théoriquement, ils n'ont donc pas nécessairement besoin de TileLang.

Apprentissage par renforcement à grande échelle et RSI

À mesure que DeepSeek obtient plus de sources de puissance de calcul, c'est-à-dire plus d'options matérielles, et que les besoins en ressources de calcul des modèles eux-mêmes diminuent, il pourra avancer des projets d'entraînement plus ambitieux, en particulier l'entraînement postérieur par renforcement.

L'apprentissage par renforcement nécessite de générer un grand nombre de trajectoires, c'est-à-dire des billions de tokens. Ce processus devient rapidement extrêmement coûteux. De plus, pour entraîner des modèles avec un contexte de 1 million de tokens, il faut générer des trajectoires de même longueur. Ce n'est qu'en entraînant des modèles sur ces trajectoires ultra-longues que l'on peut vraiment soutenir les tâches à long cycle.

De plus, avec l'augmentation des options matérielles, les ressources matérielles que DeepSeek peut mobiliser augmenteront également, ce qui stimulera la recherche automatisée, c'est-à-dire la RSI. La RSI fait référence à l'IA qui conçoit et exécute elle-même des expériences. Cette méthode implique beaucoup d'essais et d'erreurs, et les coûts augmentent rapidement. Mais la RSI est cruciale pour explorer l'espace complet de conception des modèles. Avant de progresser vers l'AGI, puis vers l'ASI, DeepSeek doit posséder des capacités RSI.

Ce que DeepSeek fait aujourd'hui, toute l'industrie le fera demain

Les innovations de DeepSeek autour du MoE, du MLA, du DSA, etc., ont déjà été adoptées progressivement par d'autres laboratoires d'IA dans le monde et en Chine.

Par exemple, ZAI, le développeur de la série de modèles GLM, utilise le MLA et le DSA. Kimi, c'est-à-dire Moonshot, a également adopté le MLA et n'a pas hésité à déclarer que son architecture était basée sur la conception de l'architecture DeepSeek. Réciproquement, DeepSeek utilise l'optimiseur Muon, qui a été initialement adopté à grande échelle par Kimi (Moonshot) pour l'entraînement.

Il est important de noter que :

Le MoE a été initialement proposé par Google en 2017, l'auteur clé étant Noam Shazeer. La contribution de DeepSeek a été de l'appliquer à grande échelle et d'inventer ses propres astuces associées.

Muon, l'optimiseur MomentUm Orthogonalized by Newton-Schulz, a été proposé par le chercheur en apprentissage automatique Keller Jordan fin 2024. L'équipe Kimi (Moonshot) a été la première à l'utiliser pour l'entraînement à grande échelle.

Et la question de gagner de l'argent ?

Nous pouvons regarder l'exemple intéressant d'OpenAI.

OpenAI a obtenu des bons de souscription/options pour acheter des actions AMD et Cerebras à un prix bas, ces droits étant liés à l'atteinte de jalons de consommation de puissance de calcul. Pour AMD et Cerebras, c'était une affaire très rentable. Parce qu'une fois qu'OpenAI s'engage à utiliser leur matériel, leurs chances de succès à long terme augmentent considérablement.

Il y a ce passage dans l'annonce d'AMD :

« Dans le cadre de l'accord, et pour mieux aligner les intérêts stratégiques des deux parties, AMD a émis à OpenAI des bons de souscription pour acheter jusqu'à 160 millions d'actions ordinaires d'AMD, qui seront attribués progressivement en fonction de l'atteinte de jalons spécifiques. Le premier lot sera attribué lors du déploiement initial de 1 gigawatt, et les lots suivants le seront à mesure que les achats s'étendront jusqu'à 6 gigawatts. Les conditions d'attribution sont également liées à l'atteinte par AMD d'objectifs de cours boursiers spécifiques, ainsi qu'à l'atteinte par OpenAI de jalons technologiques et commerciaux nécessaires pour permettre un déploiement à grande échelle par AMD. »

Je m'attends à ce que DeepSeek conclue des accords similaires avec plusieurs fabricants chinois de mémoire, d'ASIC, de CPU et de piles technologiques réseau, et collabore étroitement avec eux pour que leurs piles matérielles puissent prendre en charge les charges de travail d'IA de pointe.

Étant donné que la capitalisation boursière totale des actions d'IA occidentales, y compris les alliés d'Asie de l'Est, dépasse déjà largement 10 000 milliards de dollars, cette approche de « rémunération par actions via la coopération » donnera à DeepSeek l'opportunité d'aider la Chine à construire une industrie tout aussi vaste et d'en tirer sa part, atteignant finalement sa propre valorisation de 1 000 milliards de dollars.

Cela permettra non seulement à DeepSeek de gagner beaucoup plus d'argent que les activités traditionnelles d'abonnement applicatif, mais aussi de réaliser son objectif déclaré de « rendre l'AGI bénéfique pour tous ». Liang Wenfeng est un grand admirateur de Jim Simons et un joueur de capitaux suffisamment intelligent pour ne pas manquer cela.

Si vous regardez en arrière tout ce que DeepSeek a fait jusqu'à présent, c'est la seule explication qui a vraiment du sens.

Il s'agit des actions clés de l'IA. Le graphique n'inclut pas encore les hyperscalers (fournisseurs de cloud à très grande échelle) ni de nombreuses autres sociétés connexes.

Lien vers l'article original

Questions liées

QQuel est l'objectif principal de DeepSeek selon l'article, au-delà de la simple vente de modèles ?

ASelon l'article, l'objectif principal de DeepSeek n'est pas de générer des revenus à court terme via des applications ou des abonnements, mais de remodeler la structure des coûts de l'IA en innovant au niveau de l'infrastructure. Son but ultime est de favoriser la formation d'un écosystème matériel alternatif pour l'IA, estimé à 10 000 milliards de dollars, et d'atteindre une valorisation de 1 000 milliards de dollars pour DeepSeek lui-même.

QComment DeepSeek réduit-il la pression sur la mémoire HBM (High Bandwidth Memory) ?

ADeepSeek réduit la pression sur la mémoire HBM grâce à une série d'innovations comme MLA, DSA, CSA et HCA, qui compressent considérablement le KV Cache (jusqu'à 90-95%). Cela permet de décharger plus facilement le cache vers des SSD et de charger à la demande les poids du modèle depuis la mémoire LPDDR, moins chère et plus abondante.

QQuel est le rôle des technologies comme NAND/SSD et LPDDR dans la stratégie de DeepSeek ?

ALes technologies NAND/SSD et LPDDR jouent un rôle clé dans la stratégie de DeepSeek pour contourner les limitations en HBM et en puissance de calcul brute. Les SSD sont utilisés pour stocker à long terme le KV Cache compressé, évitant ainsi des recalculs coûteux. La LPDDR sert de mémoire secondaire pour stocker les poids du modèle et les tables d'Engram, permettant un chargement en flux vers la HBM et réalisant un échange 'mémoire contre efficacité de calcul'.

QQu'est-ce que TileLang et comment s'inscrit-il dans la vision de DeepSeek ?

ATileLang est un langage de programmation développé par DeepSeek permettant d'écrire des noyaux de calcul (kernels) une seule fois et de les faire fonctionner sur différentes plateformes matérielles. Il s'inscrit dans la vision de DeepSeek en contribuant à affaiblir le 'fossé' créé par l'écosystème CUDA de NVIDIA, rendant ainsi plus viables les alternatives matérielles chinoises et occidentales, et favorisant un écosystème matériel diversifié pour l'IA.

QComment DeepSeek pourrait-il monétiser sa stratégie selon l'article, à l'instar d'OpenAI ?

AL'article suggère que DeepSeek pourrait monétiser sa stratégie en concluant des accords similaires à ceux d'OpenAI avec AMD et Cerebras. DeepSeek pourrait obtenir des bons de souscription ou des options sur actions (warrants/equity) de fabricants chinois de mémoire, d'ASIC, de CPU et de composants réseau, en échange de son engagement à utiliser et à optimiser leurs matériels pour ses charges de travail d'IA de pointe. Cela alignerait ses intérêts financiers avec la réussite de cet écosystème matériel.

Lectures associées

Pouls du marché du BTC : Semaine 22

Bitcoin a enregistré une baisse sur la semaine dernière, passant de 79 000 $ à un creux local près de 74 000 $ avant de rebondir vers 77 000 $. La dynamique des prix a reculé de 21,7 %, reflétant une activité plus modérée et une pression de vente accrue. Cependant, les indicateurs CVD Spot et Perpetual ont fortement augmenté, suggérant un allégement de la pression vendeuse et un sentiment de marché plus équilibré. Le volume Spot et l'intérêt ouvert sur les futures ont diminué, indiquant un appétit spéculatif réduit. Des signes de regain d'appétit pour le risque émergent, avec une forte hausse des paiements de financement des positions longues. Sur les marchés d'options, le Skew à 25 Delta a légèrement augmenté, signalant une demande accrue de protection contre les baisses. Dans le secteur TradFi, la MVRV des ETF spot américains et leurs flux nets se sont améliorés, bien que leur volume de transactions ait chuté, traduisant un ralentissement de l'activité spéculative. L'activité du réseau (adresses actives, volume des transferts) a légèrement diminué, évoquant une phase de consolidation. Les mesures de liquidité indiquent un profil plus stable et une conviction accrue des investisseurs. Les mesures de rentabilité signalent une augmentation potentielle du stress du marché, avec un déclin significatif du ratio de profit non réalisé net et une augmentation de la réalisation des pertes par rapport aux prises de bénéfices. En résumé, le marché montre des signes de modération et de consolidation, caractérisés par une activité réduite, un sentiment prudent et un mélange d'appétit pour le risque. Cette image nuancée souligne l'importance d'une surveillance continue.

insights.glassnodeIl y a 12 mins

Pouls du marché du BTC : Semaine 22

insights.glassnodeIl y a 12 mins

Top 5 Des Actifs Crypto Toujours En Dessous De 0,05 $ Avec Une Solidité Financière Avérée — Ozak AI N°1 À 7 Millions De $

Les crypto-monnaies à prix élevés affichent des rendements plus faibles, poussant les investisseurs à rechercher des actifs numériques peu coûteux mais à fort potentiel de croissance. Parmi eux, cinq crypto-actifs, tous sous les 0,05 USD et bénéficiant d'un financement solide, se distinguent selon l'analyste : Ozak AI (OZK), BitTorrent (BTT), Siacoin (SC), VeChain (VET) et Kaspa (KAS). Ozak AI (OZK), leader de la liste, est en phase de prévente à 0,01 USD et a déjà levé plus de 7 millions de dollars. Sa technologie fusionne l'IA et la blockchain pour créer des outils d'analyse prédictive en temps réel, fonctionnant sur une infrastructure décentralisée (DePIN). Des partenariats stratégiques, notamment avec Zeni et Spheron, renforcent son écosystème. Les quatre autres actifs présentent également des fondamentaux robustes : BitTorrent (0,00000039 USD) pour sa large adoption ; Siacoin (0,00142 USD), l'un des plus anciens projets de stockage décentralisé ; VeChain (0,010 USD) pour ses cas d'usage en supply chain ; et Kaspa (0,046 USD) pour son protocole Proof-of-Work rapide et sa communauté active. En conclusion, la force de financement de ces actifs sous 0,05 USD indique une capacité à soutenir leur développement à long terme. Ozak AI, avec son avance technologique et sa dynamique de prévente, établit un nouveau standard dans cette catégorie, le positionnant comme le premier de cette sélection.

TheNewsCryptoIl y a 55 mins

Top 5 Des Actifs Crypto Toujours En Dessous De 0,05 $ Avec Une Solidité Financière Avérée — Ozak AI N°1 À 7 Millions De $

TheNewsCryptoIl y a 55 mins

Les avocats de FTX paient 54 millions de dollars pour régler les litiges concernant leurs services rendus à la plateforme – Détails

Dans un développement notable, le cabinet d'avocats américain Fenwick & West a accepté de payer 54 millions de dollars pour régler des allégations liées à ses services juridiques fournis à la plateforme de crypto-monnaie FTX, aujourd'hui défunte. Le règlement proposé, déposé devant un tribunal fédéral de Miami, résout les accusations de clients de FTX qui soutenaient que le cabinet avait facilité les malversations liées à l'une des plus grandes fraudes financières de l'histoire des États-Unis. Fenwick & West, qui était le principal conseiller externe de FTX, rejette toute connaissance des activités frauduleuses et affirme avoir effectué son travail avec intégrité. Ce règlement de 54 millions de dollars est le plus important dans une seconde vague de résolutions d'actions collectives liées à FTX. D'autres accords incluent des paiements de l'ancien auditeur Prager Metis et de l'ancien joueur des Miami Heat, Udonis Haslem. FTX s'est effondré en novembre 2022 après la révélation de la diversion de fonds clients vers sa société sœur, Alameda Research. Son fondateur, Sam Bankman-Fried, a été condamné à 25 ans de prison. Le processus de redressement de FTX se poursuit, avec des distributions visant à rembourser les créanciers, certaines catégories de clients ayant déjà recouvré la quasi-totalité de leurs fonds.

bitcoinistIl y a 2 h

Les avocats de FTX paient 54 millions de dollars pour régler les litiges concernant leurs services rendus à la plateforme – Détails

bitcoinistIl y a 2 h

Loi "Tao (τ)" de Huawei, et la liste exhaustive de ses sociétés clés

Le 25 mai 2026, He Tingbo, directrice du département des semi-conducteurs de Huawei, a officiellement présenté la « Loi de Tau » lors de la conférence ISCAS 2026. Cette initiative représente la première fois que la Chine propose un nouveau principe directeur pour le développement de l'industrie des semi-conducteurs à l'échelle mondiale. Contrairement à la loi de Moore, qui se concentre sur la miniaturisation géométrique des transistors, la Loi de Tau met l'accent sur la « miniaturisation temporelle ». Son objectif principal est de réduire continuellement le temps de propagation des signaux (la constante de temps τ) dans les circuits, sans dépendre exclusivement de la réduction extrême de la largeur des lignes. Le chemin de réalisation clé est le « repliement logique ». Cette technologie transforme la disposition des circuits d'une structure bidimensionnelle plane en une pile multicouche, remplaçant les longues interconnexions horizontales par des connexions verticales courtes. Cela permet de raccourcir considérablement le temps constant τ. Huawei a déjà conçu et mis en production de masse 381 puces suivant ce principe au cours des six dernières années. La société prévoit de lancer une puce Kirin utilisant la technologie de repliement logique à l'automne 2026. D'ici 2031, les puces haut de gamme basées sur la Loi de Tau devraient atteindre des performances équivalentes à un procédé de 1,4 nm. La mise en œuvre de la Loi de Tau repose sur plusieurs piliers industriels : 1. **Logiciels de conception (EDA)** : Essentiels pour l'optimisation des circuits. Des entreprises comme **Huada Jiutian**, **Primarius Technologies** et **Semi-Engine** fournissent des outils pour la conception, la simulation et la vérification. 2. **Chiplet et Packaging Avancé** : Le repliement logique nécessite des technologies d'empilement 3D et d'interconnexion verticale. Des sociétés telles que **Tongfu Microelectronics**, **JCET Group** et **Huatian Technology** sont des acteurs clés dans l'emballage avancé et les architectures Chiplet. 3. **Fonderie de fabrication** : L'optimisation doit être intégrée dans les procédés de fabrication. **SMIC**, leader national, ainsi que **Hua Hong Semiconductor** et **Nexchip**, sont les fonderies les plus susceptibles de produire les futures puces basées sur cette nouvelle approche. La Loi de Tau marque un virage stratégique pour Huawei et l'industrie chinoise des semi-conducteurs, privilégiant l'innovation architecturale et la co-optimisation conception/procédé pour franchir les limites de la miniaturisation traditionnelle.

marsbitIl y a 3 h

Loi "Tao (τ)" de Huawei, et la liste exhaustive de ses sociétés clés

marsbitIl y a 3 h

Trading

Spot
Futures

Articles tendance

Qu'est ce que $S$

Comprendre SPERO : Un aperçu complet Introduction à SPERO Alors que le paysage de l'innovation continue d'évoluer, l'émergence des technologies web3 et des projets de cryptomonnaie joue un rôle central dans la façon dont se dessine l'avenir numérique. Un projet qui a attiré l'attention dans ce domaine dynamique est SPERO, désigné comme SPERO,$$s$. Cet article vise à rassembler et à présenter des informations détaillées sur SPERO, afin d'aider les passionnés et les investisseurs à comprendre ses fondations, ses objectifs et ses innovations dans les domaines du web3 et de la crypto. Qu'est-ce que SPERO,$$s$ ? SPERO,$$s$ est un projet unique dans l'espace crypto qui cherche à tirer parti des principes de décentralisation et de la technologie blockchain pour créer un écosystème qui favorise l'engagement, l'utilité et l'inclusion financière. Le projet est conçu pour faciliter les interactions entre pairs de nouvelles manières, offrant aux utilisateurs des solutions et des services financiers innovants. Au cœur de SPERO,$$s$, l'objectif est d'autonomiser les individus en fournissant des outils et des plateformes qui améliorent l'expérience utilisateur dans l'espace des cryptomonnaies. Cela inclut la possibilité de méthodes de transaction plus flexibles, la promotion d'initiatives dirigées par la communauté et la création de voies pour des opportunités financières via des applications décentralisées (dApps). La vision sous-jacente de SPERO,$$s$ tourne autour de l'inclusivité, visant à combler les lacunes au sein de la finance traditionnelle tout en exploitant les avantages de la technologie blockchain. Qui est le créateur de SPERO,$$s$ ? L'identité du créateur de SPERO,$$s$ reste quelque peu obscure, car il existe peu de ressources publiques fournissant des informations détaillées sur son ou ses fondateurs. Ce manque de transparence peut découler de l'engagement du projet envers la décentralisation—une éthique que de nombreux projets web3 partagent, privilégiant les contributions collectives plutôt que la reconnaissance individuelle. En centrant les discussions autour de la communauté et de ses objectifs collectifs, SPERO,$$s$ incarne l'essence de l'autonomisation sans désigner des individus spécifiques. Ainsi, comprendre l'éthique et la mission de SPERO reste plus important que d'identifier un créateur unique. Qui sont les investisseurs de SPERO,$$s$ ? SPERO,$$s$ est soutenu par une diversité d'investisseurs allant des capital-risqueurs aux investisseurs providentiels dédiés à favoriser l'innovation dans le secteur crypto. L'objectif de ces investisseurs s'aligne généralement avec la mission de SPERO—priorisant les projets qui promettent des avancées technologiques sociétales, l'inclusivité financière et la gouvernance décentralisée. Ces fondations d'investisseurs s'intéressent généralement à des projets qui non seulement offrent des produits innovants, mais qui contribuent également positivement à la communauté blockchain et à ses écosystèmes. Le soutien de ces investisseurs renforce SPERO,$$s$ en tant que concurrent notable dans le domaine en rapide évolution des projets crypto. Comment fonctionne SPERO,$$s$ ? SPERO,$$s$ utilise un cadre multifacette qui le distingue des projets de cryptomonnaie conventionnels. Voici quelques-unes des caractéristiques clés qui soulignent son unicité et son innovation : Gouvernance décentralisée : SPERO,$$s$ intègre des modèles de gouvernance décentralisée, permettant aux utilisateurs de participer activement aux processus de décision concernant l'avenir du projet. Cette approche favorise un sentiment de propriété et de responsabilité parmi les membres de la communauté. Utilité du token : SPERO,$$s$ utilise son propre token de cryptomonnaie, conçu pour servir diverses fonctions au sein de l'écosystème. Ces tokens permettent des transactions, des récompenses et la facilitation des services offerts sur la plateforme, améliorant ainsi l'engagement et l'utilité globaux. Architecture en couches : L'architecture technique de SPERO,$$s$ supporte la modularité et l'évolutivité, permettant une intégration fluide de fonctionnalités et d'applications supplémentaires à mesure que le projet évolue. Cette adaptabilité est primordiale pour maintenir la pertinence dans le paysage crypto en constante évolution. Engagement communautaire : Le projet met l'accent sur des initiatives dirigées par la communauté, utilisant des mécanismes qui incitent à la collaboration et aux retours d'expérience. En cultivant une communauté forte, SPERO,$$s$ peut mieux répondre aux besoins des utilisateurs et s'adapter aux tendances du marché. Accent sur l'inclusion : En proposant des frais de transaction bas et des interfaces conviviales, SPERO,$$s$ vise à attirer une base d'utilisateurs diversifiée, y compris des individus qui n'ont peut-être pas engagé auparavant dans l'espace crypto. Cet engagement envers l'inclusion s'aligne avec sa mission globale d'autonomisation par l'accessibilité. Chronologie de SPERO,$$s$ Comprendre l'histoire d'un projet fournit des aperçus cruciaux sur sa trajectoire de développement et ses jalons. Voici une chronologie suggérée cartographiant les événements significatifs dans l'évolution de SPERO,$$s$ : Phase de conceptualisation et d'idéation : Les idées initiales formant la base de SPERO,$$s$ ont été conçues, s'alignant étroitement avec les principes de décentralisation et de concentration sur la communauté au sein de l'industrie blockchain. Lancement du livre blanc du projet : Suite à la phase conceptuelle, un livre blanc complet détaillant la vision, les objectifs et l'infrastructure technologique de SPERO,$$s$ a été publié pour susciter l'intérêt et les retours de la communauté. Construction de la communauté et engagements précoces : Des efforts de sensibilisation actifs ont été entrepris pour construire une communauté d'adopteurs précoces et d'investisseurs potentiels, facilitant les discussions autour des objectifs du projet et recueillant du soutien. Événement de génération de tokens : SPERO,$$s$ a organisé un événement de génération de tokens (TGE) pour distribuer ses tokens natifs aux premiers soutiens et établir une liquidité initiale au sein de l'écosystème. Lancement de la première dApp : La première application décentralisée (dApp) associée à SPERO,$$s$ a été mise en ligne, permettant aux utilisateurs d'interagir avec les fonctionnalités principales de la plateforme. Développement continu et partenariats : Des mises à jour et des améliorations continues des offres du projet, y compris des partenariats stratégiques avec d'autres acteurs de l'espace blockchain, ont façonné SPERO,$$s$ en un acteur compétitif et évolutif sur le marché crypto. Conclusion SPERO,$$s$ se dresse comme un témoignage du potentiel du web3 et de la cryptomonnaie pour révolutionner les systèmes financiers et autonomiser les individus. Avec un engagement envers la gouvernance décentralisée, l'engagement communautaire et des fonctionnalités conçues de manière innovante, il ouvre la voie vers un paysage financier plus inclusif. Comme pour tout investissement dans l'espace crypto en rapide évolution, les investisseurs et utilisateurs potentiels sont encouragés à mener des recherches approfondies et à s'engager de manière réfléchie avec les développements en cours au sein de SPERO,$$s$. Le projet illustre l'esprit d'innovation de l'industrie crypto, invitant à une exploration plus approfondie de ses nombreuses possibilités. Bien que le parcours de SPERO,$$s$ soit encore en cours, ses principes fondamentaux pourraient en effet influencer l'avenir de nos interactions avec la technologie, la finance et entre nous dans des écosystèmes numériques interconnectés.

101 vues totalesPublié le 2024.12.17Mis à jour le 2024.12.17

Qu'est ce que $S$

Qu'est ce que AGENT S

Agent S : L'avenir de l'interaction autonome dans Web3 Introduction Dans le paysage en constante évolution de Web3 et des cryptomonnaies, les innovations redéfinissent constamment la manière dont les individus interagissent avec les plateformes numériques. Un projet pionnier, Agent S, promet de révolutionner l'interaction homme-machine grâce à son cadre agentique ouvert. En ouvrant la voie à des interactions autonomes, Agent S vise à simplifier des tâches complexes, offrant des applications transformantes dans l'intelligence artificielle (IA). Cette exploration détaillée plongera dans les subtilités du projet, ses caractéristiques uniques et les implications pour le domaine des cryptomonnaies. Qu'est-ce qu'Agent S ? Agent S se présente comme un cadre agentique ouvert révolutionnaire, spécifiquement conçu pour relever trois défis fondamentaux dans l'automatisation des tâches informatiques : Acquisition de connaissances spécifiques au domaine : Le cadre apprend intelligemment à partir de diverses sources de connaissances externes et d'expériences internes. Cette approche double lui permet de construire un riche répertoire de connaissances spécifiques au domaine, améliorant ainsi sa performance dans l'exécution des tâches. Planification sur de longs horizons de tâches : Agent S utilise une planification hiérarchique augmentée par l'expérience, une approche stratégique qui facilite la décomposition et l'exécution efficaces de tâches complexes. Cette fonctionnalité améliore considérablement sa capacité à gérer plusieurs sous-tâches de manière efficace et efficiente. Gestion d'interfaces dynamiques et non uniformes : Le projet introduit l'Interface Agent-Ordinateur (ACI), une solution innovante qui améliore l'interaction entre les agents et les utilisateurs. En utilisant des Modèles de Langage Multimodaux de Grande Taille (MLLMs), Agent S peut naviguer et manipuler sans effort diverses interfaces graphiques. Grâce à ces fonctionnalités pionnières, Agent S fournit un cadre robuste qui aborde les complexités impliquées dans l'automatisation de l'interaction humaine avec les machines, préparant le terrain pour d'innombrables applications en IA et au-delà. Qui est le créateur d'Agent S ? Bien que le concept d'Agent S soit fondamentalement innovant, des informations spécifiques sur son créateur restent insaisissables. Le créateur est actuellement inconnu, ce qui souligne soit le stade naissant du projet, soit le choix stratégique de garder les membres fondateurs sous le radar. Quoi qu'il en soit, l'accent reste mis sur les capacités et le potentiel du cadre. Qui sont les investisseurs d'Agent S ? Étant donné qu'Agent S est relativement nouveau dans l'écosystème cryptographique, des informations détaillées concernant ses investisseurs et soutiens financiers ne sont pas explicitement documentées. Le manque d'aperçus publiquement disponibles sur les fondations d'investissement ou les organisations soutenant le projet soulève des questions sur sa structure de financement et sa feuille de route de développement. Comprendre le soutien est crucial pour évaluer la durabilité du projet et son impact potentiel sur le marché. Comment fonctionne Agent S ? Au cœur d'Agent S se trouve une technologie de pointe qui lui permet de fonctionner efficacement dans divers environnements. Son modèle opérationnel est construit autour de plusieurs caractéristiques clés : Interaction homme-ordinateur semblable à l'humain : Le cadre offre une planification IA avancée, s'efforçant de rendre les interactions avec les ordinateurs plus intuitives. En imitant le comportement humain dans l'exécution des tâches, il promet d'élever l'expérience utilisateur. Mémoire narrative : Utilisée pour tirer parti des expériences de haut niveau, Agent S utilise la mémoire narrative pour suivre les historiques de tâches, améliorant ainsi ses processus de prise de décision. Mémoire épisodique : Cette fonctionnalité fournit aux utilisateurs un accompagnement étape par étape, permettant au cadre d'offrir un soutien contextuel au fur et à mesure que les tâches se déroulent. Support pour OpenACI : Avec la capacité de fonctionner localement, Agent S permet aux utilisateurs de garder le contrôle sur leurs interactions et flux de travail, s'alignant avec l'éthique décentralisée de Web3. Intégration facile avec des API externes : Sa polyvalence et sa compatibilité avec diverses plateformes IA garantissent qu'Agent S peut s'intégrer sans effort dans des écosystèmes technologiques existants, en faisant un choix attrayant pour les développeurs et les organisations. Ces fonctionnalités contribuent collectivement à la position unique d'Agent S dans l'espace crypto, alors qu'il automatise des tâches complexes en plusieurs étapes avec un minimum d'intervention humaine. À mesure que le projet évolue, ses applications potentielles dans Web3 pourraient redéfinir la manière dont les interactions numériques se déroulent. Chronologie d'Agent S Le développement et les jalons d'Agent S peuvent être encapsulés dans une chronologie qui met en évidence ses événements significatifs : 27 septembre 2024 : Le concept d'Agent S a été lancé dans un document de recherche complet intitulé “Un cadre agentique ouvert qui utilise les ordinateurs comme un humain”, présentant les bases du projet. 10 octobre 2024 : Le document de recherche a été rendu publiquement disponible sur arXiv, offrant une exploration approfondie du cadre et de son évaluation de performance basée sur le benchmark OSWorld. 12 octobre 2024 : Une présentation vidéo a été publiée, fournissant un aperçu visuel des capacités et des caractéristiques d'Agent S, engageant davantage les utilisateurs et investisseurs potentiels. Ces jalons dans la chronologie illustrent non seulement les progrès d'Agent S, mais indiquent également son engagement envers la transparence et l'engagement communautaire. Points clés sur Agent S Alors que le cadre Agent S continue d'évoluer, plusieurs attributs clés se distinguent, soulignant sa nature innovante et son potentiel : Cadre innovant : Conçu pour offrir une utilisation intuitive des ordinateurs semblable à l'interaction humaine, Agent S propose une approche nouvelle de l'automatisation des tâches. Interaction autonome : La capacité d'interagir de manière autonome avec les ordinateurs via une interface graphique signifie un bond vers des solutions informatiques plus intelligentes et efficaces. Automatisation des tâches complexes : Avec sa méthodologie robuste, il peut automatiser des tâches complexes en plusieurs étapes, rendant les processus plus rapides et moins sujets aux erreurs. Amélioration continue : Les mécanismes d'apprentissage permettent à Agent S de s'améliorer grâce à ses expériences passées, améliorant continuellement sa performance et son efficacité. Polyvalence : Son adaptabilité à travers différents environnements d'exploitation comme OSWorld et WindowsAgentArena garantit qu'il peut servir un large éventail d'applications. Alors qu'Agent S se positionne dans le paysage Web3 et crypto, son potentiel à améliorer les capacités d'interaction et à automatiser les processus représente une avancée significative dans les technologies IA. Grâce à son cadre innovant, Agent S incarne l'avenir des interactions numériques, promettant une expérience plus fluide et efficace pour les utilisateurs à travers divers secteurs. Conclusion Agent S représente un saut audacieux en avant dans le mariage de l'IA et de Web3, avec la capacité de redéfinir notre interaction avec la technologie. Bien qu'il soit encore à ses débuts, les possibilités de son application sont vastes et convaincantes. Grâce à son cadre complet abordant des défis critiques, Agent S vise à mettre les interactions autonomes au premier plan de l'expérience numérique. À mesure que nous plongeons plus profondément dans les domaines des cryptomonnaies et de la décentralisation, des projets comme Agent S joueront sans aucun doute un rôle crucial dans la façon dont la technologie et la collaboration homme-machine évolueront à l'avenir.

799 vues totalesPublié le 2025.01.14Mis à jour le 2025.01.14

Qu'est ce que AGENT S

Comment acheter S

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Sonic (S) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Sonic (S).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Sonic (S)Après avoir acheté vos Sonic (S), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Sonic (S)Tradez facilement Sonic (S) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

1.6k vues totalesPublié le 2025.01.15Mis à jour le 2025.03.21

Comment acheter S

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de S (S) sont présentées ci-dessous.

活动图片