DeepSeek V4 enfin publié, brise le monopole des modèles propriétaires les plus puissants et annonce un partenariat avec les puces Huawei

marsbitPublié le 2026-04-24Dernière mise à jour le 2026-04-24

Résumé

DeepSeek V4 est désormais disponible en deux versions : DeepSeek-V4-Pro, un modèle haute performance avec 1,6 T de paramètres et 49B d'activation, et DeepSeek-V4-Flash, une version plus légère et économique avec 284B de paramètres et 13B d'activation. Les deux versions prennent en charge un contexte d’1 million de tokens, une capacité auparavant réservée aux modèles exclusifs comme Gemini. DeepSeek-V4-Pro rivalise avec les meilleurs modèles propriétaires en matière de capacités d'agent, de connaissances générales et de raisonnement. Il est déjà utilisé en interne et surpasse Sonnet 4.5, approchant les performances d'Opus 4.6 en mode non-réfléchi. DeepSeek-V4-Flash offre des performances similaires pour des tâches simples à un coût réduit. Le modèle introduit un nouveau mécanisme d'attention permettant une compression des tokens et réduisant significativement les besoins en calcul et en mémoire. De plus, DeepSeek annonce un futur support des puces Huawei pour le calcul et met à jour ses API, tout en retirant progressivement les anciens noms de modèles. La version est open-source et disponible sur Hugging Face et ModelScope.

À l'instant, DeepSeek-V4 est arrivé !

La version préliminaire est officiellement lancée et open source simultanément.

Deux versions au total :

DeepSeek-V4-Pro : Équivalent aux modèles propriétaires de pointe, 1,6 T, 49B activés, longueur de contexte 1M ;

DeepSeek-V4-Flash : Version économique plus petite et plus rapide, 284B, 13B activés, longueur de contexte 1M.

La déclaration officielle est : Des capacités d'Agent, des connaissances mondiales et des performances de raisonnement toutes à la pointe en Chine et dans le domaine open source.

Et :

Actuellement, DeepSeek-V4 est déjà le modèle Agentic Coding utilisé en interne par les employés de l'entreprise. Selon les retours d'évaluation, l'expérience d'utilisation est meilleure que Sonnet 4.5, et la qualité de livraison est proche d'Opus 4.6 en mode non-réflexion. Mais il reste un écart avec le mode réflexion d'Opus 4.6.

Actuellement, le site officiel et l'application sont mis à jour, le service API est également synchronisé.

Concernant la puissance de calcul nationale qui préoccupe tout le monde, point important, support de la puissance de calcul Huawei au second semestre.

Choix haut de gamme et économique, deux versions lancées ensemble

Cette fois, V4 sort deux versions d'un coup.

V4-Pro, performances comparables aux modèles propriétaires de pointe.

L'officiel donne trois critères :

Capacités d'Agent considérablement améliorées : Dans l'évaluation Agentic Coding, V4-Pro a atteint le meilleur niveau actuel des modèles open source, et excelle également dans d'autres évaluations liées à l'Agent. En évaluation interne, en mode Agent Coding, l'expérience V4 est meilleure que Sonnet 4.5, la qualité de livraison est proche d'Opus 4.6 en mode non-réflexion, mais un écart subsiste avec le mode réflexion d'Opus 4.6.

Connaissances mondiales riches : DeepSeek-V4-Pro dans les évaluations de connaissances mondiales devance largement les autres modèles open source, juste légèrement inférieur au modèle propriétaire de pointe Gemini-Pro-3.1.

Performances de raisonnement de classe mondiale : Dans les évaluations de mathématiques, STEM et code compétitif, DeepSeek-V4-Pro surpasse tous les modèles open source actuellement évalués publiquement, obtenant des résultats excellents comparables aux modèles propriétaires de pointe mondiaux.

V4-Flash, version économique plus petite et plus rapide. Capacités de raisonnement proches de Pro, connaissances mondiales légèrement inférieures, mais paramètres et activation plus petits, API moins chère.

Pour les tâches d'Agent, DeepSeek-V4-Flash est à égalité avec DeepSeek-V4-Pro sur les tâches simples, mais un écart subsiste sur les tâches de haute difficulté.

Sur le test de lavage de voiture, V4 passe également rapidement.

Et dans le scénario biologique classique du « père désespéré », DeepSeek-V4 n'a pas saisi du premier coup le point clé du daltonisme rouge-vert (selon les lois génétiques, si une femme est daltonienne rouge-vert, son père biologique l'est nécessairement aussi).

Le contexte d'un million devient standard

Il est à noter que, à partir d'aujourd'hui, le contexte 1M est standard pour tous les services officiels de DeepSeek.

Il y a un an, le contexte 1M était l'atout exclusif de Gemini ; tous les autres modèles propriétaires avaient soit 128K soit 200K ; côté open source, presque personne ne pouvait jouer à ce niveau.

DeepSeek a directement fait passer le contexte d'un million d'une « fonctionnalité haut de gamme » à une « commodité de base ».

Et en open source. Comment ils ont fait, le communiqué de presse donne directement la réponse —

V4 a créé un nouveau mécanisme d'attention, avec compression au niveau du token, combiné avec l'attention sparse DSA. Comparé aux méthodes traditionnelles, les besoins en calcul et mémoire sont considérablement réduits.

DSA n'est pas nouveau. Introduit il y a six mois lors de la mise à jour V3.2-Exp, l'attention extérieure était faible à l'époque, car les scores étaient presque identiques à V3.1-Terminus, semblant être une version intermédiaire sans grand contenu.

En y regardant maintenant, c'était les fondations de V4.

Optimisation spéciale des capacités d'Agent

Côté Agent, V4 a été adapté et optimisé pour les produits Agent mainstream comme Claude Code, OpenClaw, OpenCode, CodeBuddy, les tâches de code et de génération de documents sont améliorées.

Le communiqué inclut également un exemple de page interne de PPT générée par V4-Pro sous un framework Agent.

Prix de l'API

Côté API, V4-Pro et V4-Flash sont mis en ligne simultanément, supportant deux interfaces : OpenAI ChatCompletions et Anthropic.

base_url inchangé, il suffit de changer le paramètre model en deepseek-v4-pro ou deepseek-v4-flash pour l'appel.

Les deux versions ont un contexte maximum de 1M, supportent simultanément le mode non-réflexion et le mode réflexion. En mode réflexion, l'intensité peut être ajustée via le paramètre reasoning_effort, deux niveaux high et max. L'officiel recommande de passer directement à max pour les scénarios Agent complexes.

Il y a un point important — support de la puissance de calcul Huawei au second semestre.

De plus, les anciens noms de modèles seront retirés.

deepseek-chat et deepseek-reasoner seront désactivés dans trois mois (24 juillet 2026), actuellement ces noms pointent respectivement vers les modes non-réflexion et réflexion de V4-Flash.

Impact faible pour les développeurs individuels, changement d'un paramètre model. Les entreprises en environnement de production doivent migrer durant ces trois mois.

One more thing

À la fin du communiqué, DeepSeek cite lui-même une phrase.

« Ne pas être séduit par la louange, ne pas être effrayé par la calomnie, avancer selon sa voie, se rectifier avec droiture. »

Ceci vient de Xunzi « Contre les douze maîtres ». Littéralement, ne pas être tenté par les éloges, ne pas être effrayé par les diffamation, avancer selon la voie que l'on croit, se corriger.

Dans le contexte d'aujourd'hui, c'est intéressant.

Ces six derniers mois, des rumeurs sur quand V4 sortirait, s'il était retardé, s'il était déjà dépassé par d'autres, si Claude avait déjà réussi à distiller les données, etc., ont circulé plusieurs fois dans les cercles d'IA chinois et anglais. Début d'année, certains affirmaient même avec conviction que V4 sortirait avant le Nouvel An chinois, résultat attendu fin avril.

Ils n'ont jamais répondu.

Puis un vendredi après-midi, ils sortent V4, open source simultané, mise en ligne du site et de l'app, mise à jour de l'API, et écrivent même dans le communiqué que les employés internes ont déjà abandonné Claude.

Pas de roadmap, pas de live, pas d'interview.

Ces quatre mots « avancer selon sa voie » semblent être un slogan. Mais si vous regardez le chemin des six derniers mois : la version Exp « sans grand亮点 » de V3.2, le sparse attention DSA qui a préparé V4 pendant six mois, le contexte 1M passé d'atout à standard.

DeepSeek l'a déjà fait.

Liens open source du modèle DeepSeek-V4 :

[1]https://huggingface.co/collections/deepseek-ai/deepseek-v4

[2]https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

Rapport technique DeepSeek-V4 : https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

Cet article provient du compte public WeChat « Quantum Bit », auteur : Quantum Bit

Questions liées

QQuels sont les deux modèles de DeepSeek-V4 annoncés et quelles sont leurs principales caractéristiques ?

ADeepSeek a annoncé deux modèles : DeepSeek-V4-Pro, un modèle haut de gamme avec 1,6 T de paramètres, 49B d'activation et une longueur de contexte de 1M, conçu pour rivaliser avec les meilleurs modèles propriétaires ; et DeepSeek-V4-Flash, une version économique plus petite et plus rapide avec 284B de paramètres, 13B d'activation et la même longueur de contexte de 1M.

QQuelle est la capacité de contexte standard pour les modèles DeepSeek-V4 et pourquoi est-ce significatif ?

ALa capacité de contexte standard pour tous les modèles DeepSeek-V4 est de 1 million de tokens (1M). C'est significatif car il y a un an, cela était une caractéristique exclusive de pointe, mais DeepSeek l'a rendue aussi courante qu'une "utility de base", la rendant accessible via une nouvelle mécanique d'attention et en l'ouvrant en open source.

QQuel partenariat important en matière de puissance de calcul DeepSeek a-t-il annoncé pour la seconde moitié de l'année ?

ADeepSeek a annoncé un partenariat important pour supporter la puissance de calcul de Huawei dans la seconde moitié de l'année.

QComment DeepSeek-V4 se positionne-t-il par rapport aux modèles propriétaires leaders comme Claude Opus selon l'évaluation interne ?

ASelon l'évaluation interne, dans le mode Agent Coding, l'expérience utilisateur de DeepSeek-V4 est supérieure à celle de Sonnet 4.5 et la qualité de livraison est proche de celle d'Opus 4.6 en mode non-réfléchi, mais il reste un écart avec le mode réfléchi d'Opus 4.6.

QQuels sont les changements à venir pour les noms des anciens modèles d'API DeepSeek ?

ALes anciens noms de modèles 'deepseek-chat' et 'deepseek-reasoner' seront désactivés dans trois mois (le 24 juillet 2026). Actuellement, ces noms pointent respectivement vers les modes non-réfléchi et réfléchi de V4-Flash. Les développeurs et entreprises doivent migrer vers les nouveaux noms de modèles.

Lectures associées

Liste des altcoins les plus populaires selon les recherches des dernières heures publiée !

La plateforme CoinGecko a publié une liste des cryptomonnaies les plus recherchées par les utilisateurs au cours des dernières heures. Le jeton Pudgy Penguins ($PENGU) est en tête, suivi de Catecoin (CATE) et de Bless ($BLESS). Sur les 24 dernières heures, CATE a enregistré une hausse de prix impressionnante de 126,2%, tandis que $BLESS a augmenté de 86,1% et $PENGU de 3,9%. What IF (IF) a également progressé de 41,9%. Le classement complet des actifs les plus consultés sur CoinGecko, avec leur capitalisation boursière, est le suivant : 1. Pudgy Penguins ($PENGU) – 389,13 millions de dollars 2. Catecoin (CATE) – 19,62 millions de dollars 3. Bless ($BLESS) – 32,72 millions de dollars 4. Aerodrome Finance (AERO) – 385,03 millions de dollars 5. Hyperliquid (HYPE) – 11,43 milliards de dollars 6. Ethereum (ETH) – 224,17 milliards de dollars 7. Chainlink (LINK) – 6,17 milliards de dollars 8. Aave (AAVE) – 1,42 milliard de dollars 9. What IF (IF) – 31,24 millions de dollars 10. Polkadot (DOT) – 1,34 milliard de dollars 11. Bitcoin (BTC) – 1,27 trillion de dollars 12. Virtual Protocol (VIRTUAL) – 366,19 millions de dollars 13. Algorand (ALGO) – 758,15 millions de dollars 14. Cash Cat (CASHCAT) – 41,81 millions de dollars 15. Solana (SOL) – 42,38 milliards de dollars. *Ceci ne constitue pas un conseil en investissement.

cryptonews.ruIl y a 28 mins

Liste des altcoins les plus populaires selon les recherches des dernières heures publiée !

cryptonews.ruIl y a 28 mins

Pour 100 000 $ par mois : Truth Social vend l'accès aux publications de Trump à des sociétés d'investissement

Le groupe Trump Media and Technology Group (TMTG) a lancé le 1er août 2026 « Truth API », un service d’accès payant en temps réel aux publications des comptes les plus influents de Truth Social, notamment celui de l’ancien président Donald Trump. Destiné aux investisseurs institutionnels et aux firmes de trading haute fréquence, l’abonnement pourrait coûter jusqu’à 100 000 dollars par mois. TMTG justifie cette initiative par la création d’une source de revenus stable et la monétisation de ses actifs. Cette commercialisation d’un accès prioritaire aux posts présidentiels a suscité des critiques de la part de législateurs américains, dont des sénateurs démocrates et républicains, qui demandent des enquêtes sur d’éventuelles violations des règles de marché et dénoncent un accès privilégié vendu à prix d’or. L’analyse pointe un risque systémique similaire à celui observé en 2013, lorsqu’un tweet piraté avait provoqué une chute brutale des marchés. Le service Truth API, sans mécanisme avéré de vérification en temps réel, pourrait transformer le compte de Trump en une cible pour des manipulations, soulevant la question de la responsabilité en cas de diffusion de fausses informations influençant les marchés financiers.

cryptonews.ruIl y a 1 h

Pour 100 000 $ par mois : Truth Social vend l'accès aux publications de Trump à des sociétés d'investissement

cryptonews.ruIl y a 1 h

La stratégie maintient le dividende privilégié du STRC à 12 % alors que le prix reste encore en dessous du pair

Les actions préférées STRC de Strategy, dont le prix de clôture était de 89,46 $ fin juillet (bien en dessous de leur valeur nominale de 100 $), maintiendront leur dividende à 12 % pour le mois d'août. Le président exécutif Michael Saylor a confirmé cette information, notant que le dividende est désormais versé deux fois par mois. Malgré une perte nette importante au deuxième trimestre (8,22 milliards de $), principalement due à une perte non réalisée sur ses réserves de Bitcoin, Strategy a constitué une réserve de trésorerie de 3,75 milliards de $ pour garantir le paiement des dividendes préférés. La direction réitère son objectif de faire remonter le cours de STRC vers 99-100 $ à terme et continue de racheter ces titres tant qu'ils se négocient en dessous du pair. Parallèlement, Saylor a évoqué une annonce potentielle concernant les avoirs en Bitcoin de l'entreprise, laissant entendre une possible évolution de sa stratégie de trésorerie.

cointelegraphIl y a 2 h

La stratégie maintient le dividende privilégié du STRC à 12 % alors que le prix reste encore en dessous du pair

cointelegraphIl y a 2 h

Les retraits de Bitcoin se poursuivent : 8 ans de stockage en portefeuille froid Coldcard se sont terminés par un solde nul

Le portefeuille matériel Coldcard a été compromis, entraînant une nouvelle vague de retraits depuis les appareils vulnérables. Selon Galaxy Research, environ 1 367,05 BTC (88,6 millions de dollars) ont été dérobés à partir de 4 585 adresses. Le problème ne réside pas dans le firmware, qui a été corrigé, mais dans les phrases seed générées entre mars 2021 et les mises à jour correctives. Ces phrases, créées en raison d'une erreur de programmation ayant conduit à l'utilisation d'un générateur de nombres aléatoires logiciel (Yasmarang) au lieu du générateur matériel STM32, sont prévisibles et vulnérables à une attaque par force brute hors ligne. Les propriétaires concernés doivent impérativement générer une nouvelle phrase seed sur un firmware corrigé et transférer leurs actifs, sous peine de rester exposés. L'histoire d'un investisseur de 39 ans illustre l'impact dévastateur : après avoir accumulé 2 BTC (130 000 dollars) sur huit ans via un travail physique, en les conservant comme protection contre l'hyperinflation dans son pays, il a tout perdu en quelques minutes. Son cas montre que même les stratégies de conservation à long terme les plus prudentes ("cold storage") ne sont pas infaillibles. D'un point de vue historique, cet incident rappelle les faiblesses passées des générateurs de nombres aléatoires dans la cryptographie. Il remet en question l'idée reçue selon laquelle le stockage hors ligne garantit automatiquement une sécurité absolue. La communauté espère que le fabricant pourra aider à récupérer les fonds volés.

cryptonews.ruIl y a 2 h

Les retraits de Bitcoin se poursuivent : 8 ans de stockage en portefeuille froid Coldcard se sont terminés par un solde nul

cryptonews.ruIl y a 2 h

En Corée du Sud, les volumes d'échanges de 15 altcoins explosent !

Les principales plateformes d'échange de cryptomonnaies sud-coréennes, Upbit et Bithumb, rapportent une forte augmentation du volume des transactions pour plusieurs altcoins. Sur les dernières 24 heures, le volume total des altcoins les plus populaires a atteint environ 347,7 millions de dollars. MetaDAO (META) arrive en tête, avec un volume de 65,84 millions de dollars uniquement sur Upbit, représentant 12,39% du volume spot total de la bourse. Euler ($EUL) suit avec 47,65 millions de dollars, et le $XRP, toujours populaire auprès des investisseurs sud-coréens, a atteint 38,11 millions de dollars. La liste complète des 15 altcoins montre une activité intense, notamment pour ThunderCore (TT, 35,64M$), Babylon (BABY, 25,15M$) et Geodnet (GEOD, 20,28M$). Cet engouement marqué pour des actifs numériques au-delà du Bitcoin illustre la dynamique spéculative sur le marché sud-coréen. *Ceci n'est pas un conseil en investissement.

cryptonews.ruIl y a 4 h

En Corée du Sud, les volumes d'échanges de 15 altcoins explosent !

cryptonews.ruIl y a 4 h

Trading

Spot

Catégories populaires

Indepth Research1,444 actualités

DeepSeek V4 enfin publié, brise le monopole des modèles propriétaires les plus puissants et annonce un partenariat avec les puces Huawei

Résumé

Choix haut de gamme et économique, deux versions lancées ensemble

Le contexte d'un million devient standard

Optimisation spéciale des capacités d'Agent

Prix de l'API

One more thing

Questions liées

Lectures associées

Liste des altcoins les plus populaires selon les recherches des dernières heures publiée !

Pour 100 000 $ par mois : Truth Social vend l'accès aux publications de Trump à des sociétés d'investissement

La stratégie maintient le dividende privilégié du STRC à 12 % alors que le prix reste encore en dessous du pair

Les retraits de Bitcoin se poursuivent : 8 ans de stockage en portefeuille froid Coldcard se sont terminés par un solde nul

En Corée du Sud, les volumes d'échanges de 15 altcoins explosent !

Trading

Catégories populaires

Tags tendances