DeepSeek V4 enfin publié, brise le monopole des modèles propriétaires les plus puissants et annonce un partenariat avec les puces Huawei

marsbitPublié le 2026-04-24Dernière mise à jour le 2026-04-24

Résumé

DeepSeek V4 est désormais disponible en deux versions : DeepSeek-V4-Pro, un modèle haute performance avec 1,6 T de paramètres et 49B d'activation, et DeepSeek-V4-Flash, une version plus légère et économique avec 284B de paramètres et 13B d'activation. Les deux versions prennent en charge un contexte d’1 million de tokens, une capacité auparavant réservée aux modèles exclusifs comme Gemini. DeepSeek-V4-Pro rivalise avec les meilleurs modèles propriétaires en matière de capacités d'agent, de connaissances générales et de raisonnement. Il est déjà utilisé en interne et surpasse Sonnet 4.5, approchant les performances d'Opus 4.6 en mode non-réfléchi. DeepSeek-V4-Flash offre des performances similaires pour des tâches simples à un coût réduit. Le modèle introduit un nouveau mécanisme d'attention permettant une compression des tokens et réduisant significativement les besoins en calcul et en mémoire. De plus, DeepSeek annonce un futur support des puces Huawei pour le calcul et met à jour ses API, tout en retirant progressivement les anciens noms de modèles. La version est open-source et disponible sur Hugging Face et ModelScope.

À l'instant, DeepSeek-V4 est arrivé !

La version préliminaire est officiellement lancée et open source simultanément.

Deux versions au total :

DeepSeek-V4-Pro : Équivalent aux modèles propriétaires de pointe, 1,6 T, 49B activés, longueur de contexte 1M ;

DeepSeek-V4-Flash : Version économique plus petite et plus rapide, 284B, 13B activés, longueur de contexte 1M.

La déclaration officielle est : Des capacités d'Agent, des connaissances mondiales et des performances de raisonnement toutes à la pointe en Chine et dans le domaine open source.

Et :

Actuellement, DeepSeek-V4 est déjà le modèle Agentic Coding utilisé en interne par les employés de l'entreprise. Selon les retours d'évaluation, l'expérience d'utilisation est meilleure que Sonnet 4.5, et la qualité de livraison est proche d'Opus 4.6 en mode non-réflexion. Mais il reste un écart avec le mode réflexion d'Opus 4.6.

Actuellement, le site officiel et l'application sont mis à jour, le service API est également synchronisé.

Concernant la puissance de calcul nationale qui préoccupe tout le monde, point important, support de la puissance de calcul Huawei au second semestre.

Choix haut de gamme et économique, deux versions lancées ensemble

Cette fois, V4 sort deux versions d'un coup.

V4-Pro, performances comparables aux modèles propriétaires de pointe.

L'officiel donne trois critères :

Capacités d'Agent considérablement améliorées : Dans l'évaluation Agentic Coding, V4-Pro a atteint le meilleur niveau actuel des modèles open source, et excelle également dans d'autres évaluations liées à l'Agent. En évaluation interne, en mode Agent Coding, l'expérience V4 est meilleure que Sonnet 4.5, la qualité de livraison est proche d'Opus 4.6 en mode non-réflexion, mais un écart subsiste avec le mode réflexion d'Opus 4.6.

Connaissances mondiales riches : DeepSeek-V4-Pro dans les évaluations de connaissances mondiales devance largement les autres modèles open source, juste légèrement inférieur au modèle propriétaire de pointe Gemini-Pro-3.1.

Performances de raisonnement de classe mondiale : Dans les évaluations de mathématiques, STEM et code compétitif, DeepSeek-V4-Pro surpasse tous les modèles open source actuellement évalués publiquement, obtenant des résultats excellents comparables aux modèles propriétaires de pointe mondiaux.

V4-Flash, version économique plus petite et plus rapide. Capacités de raisonnement proches de Pro, connaissances mondiales légèrement inférieures, mais paramètres et activation plus petits, API moins chère.

Pour les tâches d'Agent, DeepSeek-V4-Flash est à égalité avec DeepSeek-V4-Pro sur les tâches simples, mais un écart subsiste sur les tâches de haute difficulté.

Sur le test de lavage de voiture, V4 passe également rapidement.

Et dans le scénario biologique classique du « père désespéré », DeepSeek-V4 n'a pas saisi du premier coup le point clé du daltonisme rouge-vert (selon les lois génétiques, si une femme est daltonienne rouge-vert, son père biologique l'est nécessairement aussi).

Le contexte d'un million devient standard

Il est à noter que, à partir d'aujourd'hui, le contexte 1M est standard pour tous les services officiels de DeepSeek.

Il y a un an, le contexte 1M était l'atout exclusif de Gemini ; tous les autres modèles propriétaires avaient soit 128K soit 200K ; côté open source, presque personne ne pouvait jouer à ce niveau.

DeepSeek a directement fait passer le contexte d'un million d'une « fonctionnalité haut de gamme » à une « commodité de base ».

Et en open source. Comment ils ont fait, le communiqué de presse donne directement la réponse —

V4 a créé un nouveau mécanisme d'attention, avec compression au niveau du token, combiné avec l'attention sparse DSA. Comparé aux méthodes traditionnelles, les besoins en calcul et mémoire sont considérablement réduits.

DSA n'est pas nouveau. Introduit il y a six mois lors de la mise à jour V3.2-Exp, l'attention extérieure était faible à l'époque, car les scores étaient presque identiques à V3.1-Terminus, semblant être une version intermédiaire sans grand contenu.

En y regardant maintenant, c'était les fondations de V4.

Optimisation spéciale des capacités d'Agent

Côté Agent, V4 a été adapté et optimisé pour les produits Agent mainstream comme Claude Code, OpenClaw, OpenCode, CodeBuddy, les tâches de code et de génération de documents sont améliorées.

Le communiqué inclut également un exemple de page interne de PPT générée par V4-Pro sous un framework Agent.

Prix de l'API

Côté API, V4-Pro et V4-Flash sont mis en ligne simultanément, supportant deux interfaces : OpenAI ChatCompletions et Anthropic.

base_url inchangé, il suffit de changer le paramètre model en deepseek-v4-pro ou deepseek-v4-flash pour l'appel.

Les deux versions ont un contexte maximum de 1M, supportent simultanément le mode non-réflexion et le mode réflexion. En mode réflexion, l'intensité peut être ajustée via le paramètre reasoning_effort, deux niveaux high et max. L'officiel recommande de passer directement à max pour les scénarios Agent complexes.

Il y a un point important — support de la puissance de calcul Huawei au second semestre.

De plus, les anciens noms de modèles seront retirés.

deepseek-chat et deepseek-reasoner seront désactivés dans trois mois (24 juillet 2026), actuellement ces noms pointent respectivement vers les modes non-réflexion et réflexion de V4-Flash.

Impact faible pour les développeurs individuels, changement d'un paramètre model. Les entreprises en environnement de production doivent migrer durant ces trois mois.

One more thing

À la fin du communiqué, DeepSeek cite lui-même une phrase.

« Ne pas être séduit par la louange, ne pas être effrayé par la calomnie, avancer selon sa voie, se rectifier avec droiture. »

Ceci vient de Xunzi « Contre les douze maîtres ». Littéralement, ne pas être tenté par les éloges, ne pas être effrayé par les diffamation, avancer selon la voie que l'on croit, se corriger.

Dans le contexte d'aujourd'hui, c'est intéressant.

Ces six derniers mois, des rumeurs sur quand V4 sortirait, s'il était retardé, s'il était déjà dépassé par d'autres, si Claude avait déjà réussi à distiller les données, etc., ont circulé plusieurs fois dans les cercles d'IA chinois et anglais. Début d'année, certains affirmaient même avec conviction que V4 sortirait avant le Nouvel An chinois, résultat attendu fin avril.

Ils n'ont jamais répondu.

Puis un vendredi après-midi, ils sortent V4, open source simultané, mise en ligne du site et de l'app, mise à jour de l'API, et écrivent même dans le communiqué que les employés internes ont déjà abandonné Claude.

Pas de roadmap, pas de live, pas d'interview.

Ces quatre mots « avancer selon sa voie » semblent être un slogan. Mais si vous regardez le chemin des six derniers mois : la version Exp « sans grand亮点 » de V3.2, le sparse attention DSA qui a préparé V4 pendant six mois, le contexte 1M passé d'atout à standard.

DeepSeek l'a déjà fait.

Liens open source du modèle DeepSeek-V4 :

[1]https://huggingface.co/collections/deepseek-ai/deepseek-v4

[2]https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

Rapport technique DeepSeek-V4 : https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

Cet article provient du compte public WeChat « Quantum Bit », auteur : Quantum Bit

Questions liées

QQuels sont les deux modèles de DeepSeek-V4 annoncés et quelles sont leurs principales caractéristiques ?

ADeepSeek a annoncé deux modèles : DeepSeek-V4-Pro, un modèle haut de gamme avec 1,6 T de paramètres, 49B d'activation et une longueur de contexte de 1M, conçu pour rivaliser avec les meilleurs modèles propriétaires ; et DeepSeek-V4-Flash, une version économique plus petite et plus rapide avec 284B de paramètres, 13B d'activation et la même longueur de contexte de 1M.

QQuelle est la capacité de contexte standard pour les modèles DeepSeek-V4 et pourquoi est-ce significatif ?

ALa capacité de contexte standard pour tous les modèles DeepSeek-V4 est de 1 million de tokens (1M). C'est significatif car il y a un an, cela était une caractéristique exclusive de pointe, mais DeepSeek l'a rendue aussi courante qu'une "utility de base", la rendant accessible via une nouvelle mécanique d'attention et en l'ouvrant en open source.

QQuel partenariat important en matière de puissance de calcul DeepSeek a-t-il annoncé pour la seconde moitié de l'année ?

ADeepSeek a annoncé un partenariat important pour supporter la puissance de calcul de Huawei dans la seconde moitié de l'année.

QComment DeepSeek-V4 se positionne-t-il par rapport aux modèles propriétaires leaders comme Claude Opus selon l'évaluation interne ?

ASelon l'évaluation interne, dans le mode Agent Coding, l'expérience utilisateur de DeepSeek-V4 est supérieure à celle de Sonnet 4.5 et la qualité de livraison est proche de celle d'Opus 4.6 en mode non-réfléchi, mais il reste un écart avec le mode réfléchi d'Opus 4.6.

QQuels sont les changements à venir pour les noms des anciens modèles d'API DeepSeek ?

ALes anciens noms de modèles 'deepseek-chat' et 'deepseek-reasoner' seront désactivés dans trois mois (le 24 juillet 2026). Actuellement, ces noms pointent respectivement vers les modes non-réfléchi et réfléchi de V4-Flash. Les développeurs et entreprises doivent migrer vers les nouveaux noms de modèles.

Lectures associées

Actions cycliques ou actions de croissance ? Le rapport trimestriel Q2 de Coinbase révèle la "divergence d'évaluation"

Coinbase a publié ses résultats financiers du deuxième trimestre 2026, affichant une baisse des revenus. Le chiffre d'affaires total a atteint 1,22 milliard de dollars, en baisse de 19% sur un an, et a manqué les attentes du marché. Les revenus provenant des transactions ont également diminué, atteignant 599 millions de dollars, les transactions des particuliers ayant reculé de 30% sur un an. La société a enregistré une perte nette de 359 millions de dollars, marquant son troisième trimestre consécutif de pertes. Malgré un marché global difficile, Coinbase met en avant certaines performances positives : sa part de marché globale des transactions cryptographiques a atteint un record de 10,3%, et ses revenus liés aux marchés de prédiction ont plus que doublé. Cependant, cette croissance est principalement portée par de nouveaux services comme les produits dérivés et les marchés de prédiction, tandis que le volume des transactions au comptant, cœur historique de son activité, continue de se contracter. L'analyse de la valorisation de Coinbase oscille entre deux perspectives. D'un côté, en tant qu'action cyclique, sa performance est fortement liée au marché baissier des cryptomonnaies, expliquant les difficultés actuelles. De l'autre, en tant qu'action de croissance, son potentiel futur semble sous-évalué. La diversification de ses revenus progresse, avec les abonnements et services représentant près de la moitié du revenu net. Ses activités prometteuses dans les stablecoins (notamment via USDC) et dans l'économie des agents autonomes sur sa blockchain Base, positionnée comme leader dans le domaine de l'AIFi, pourraient générer des revenus significatifs à l'avenir. Le défi pour Coinbase reste de traverser la phase de marché difficile tout en développant ces nouveaux moteurs de croissance.

marsbitIl y a 16 mins

Actions cycliques ou actions de croissance ? Le rapport trimestriel Q2 de Coinbase révèle la "divergence d'évaluation"

marsbitIl y a 16 mins

Action cyclique ou action de croissance ? Les résultats du Q2 de Coinbase révèlent une "divergence d'évaluation"

Coinbase a publié ses résultats du deuxième trimestre 2026, affichant un revenu total de 1,22 milliard de dollars, en baisse de 19% sur un an et inférieur aux attentes du marché. La société a enregistré une perte nette de 359 millions de dollars, marquant son troisième trimestre consécutif dans le rouge. Malgré une part de marché globale des transactions crypto atteignant un record de 10,3%, les revenus des transactions, en particulier ceux des particuliers, ont considérablement chuté, revenant aux niveaux de 2023. La société met en avant la croissance de ses nouvelles activités, comme les marchés de prédiction et les revenus des services d'abonnement, qui représentent désormais 48% de son revenu net. Les revenus des stablecoins, principalement USDC, constituent sa deuxième source de revenus. Cependant, ces nouvelles branches ne compensent pas encore le déclin de son activité principale de trading spot. L'article soulève la question de l'évaluation de Coinbase : doit-elle être considérée comme une action cyclique, tributaire des marchés haussiers du crypto, ou comme une action de croissance ? Son avenir pourrait reposer sur le développement de sa plateforme de stablecoins et de son rôle de leader dans l'économie des agents autonomes (AI-Fi) via Base, où la majorité des transactions sont déjà traitées. Bien que ces domaines prometteurs n'apportent pas encore de contributions financières significatives, ils pourraient générer des revenus importants à long terme.

Odaily星球日报Il y a 21 mins

Action cyclique ou action de croissance ? Les résultats du Q2 de Coinbase révèlent une "divergence d'évaluation"

Odaily星球日报Il y a 21 mins

Enquête sur les parts de marché mondiales : les entreprises japonaises en tête dans le secteur des matériaux pour semi-conducteurs

Enquête sur les parts de marché mondiales en 2025 : les entreprises japonaises restent dominantes dans les matériaux semi-conducteurs, avec Shin-Etsu Chemical en tête pour les plaquettes de silicium et trois firmes nippones (Tokyo Ohka Kogyo, JSR, Shin-Etsu) occupant le podium des photorésines, détenant ensemble 60,5 % du marché. Leur force contraste avec leur présence limitée dans les mémoires et GPU, où les coréennes SK Hynix et Samsung dominent. Cependant, dans d'autres secteurs clés comme l'automobile, la progression japonaise stagne. Toyota conserve la première place mondiale, mais avec seulement 12,3 % de part de marché, et aucune entreprise japonaise ne figure parmi le top 5 des véhicules électriques, dominé par BYD et Tesla. Dans la construction navale, Imabari Shipbuilding grimpe à la 3ᵉ place mondiale (7,2 %), tirée par les commandes de grands porte-conteneurs. Mais les leaders sont désormais le chinois CSSC (17,8 %) et le coréen HD Hyundai Heavy Industries (13,7 %). Le gouvernement japonais vise un doublement de la production d'ici 2035, ce qui nécessitera des investissements massifs et une réponse à la pénurie de main-d'œuvre. L'enjeu pour les entreprises japonaises est de poursuivre des investissements à haut risque pour maintenir leur avance dans les matériaux semi-conducteurs face aux géants qui investissent massivement, comme Samsung et SK Hynix.

marsbitIl y a 47 mins

Enquête sur les parts de marché mondiales : les entreprises japonaises en tête dans le secteur des matériaux pour semi-conducteurs

marsbitIl y a 47 mins

STRC a décroché : La première communication financière post-décrochage, comment Strategy répare sa dynamique capitalistique ?

Le fournisseur de trésorerie Bitcoin Strategy a publié ses résultats pour le deuxième trimestre 2026, enregistrant une perte nette de 8,22 milliards de dollars en raison de la volatilité du BTC, malgré une légère hausse de son chiffre d'affaires. La principale préoccupation des investisseurs reste la capacité de l'entreprise à rétablir la durabilité de son modèle de financement après le décrochage de son instrument de prédilection, le STRC, qui échange toujours en dessous de sa valeur nominale cible. Strategy continue d'accumuler des BTC, détenant désormais 843 775 unités, mais sa stratégie de capital a évolué. Elle adopte désormais une gestion active et bilatérale, utilisant non seulement ses réserves de liquidités et ses rachats d'actions pour gérer les pressions, mais aussi un nouveau « programme de monétisation » ayant déjà vendu pour 218 millions de dollars de BTC. La priorité absolue reste de ramener le STRC à sa valeur nominale. La direction s'engage à ne pas émettre de nouvelles actions STRC à escompte et mise sur l'augmentation de ses réserves de trésorerie (3,75 milliards de dollars) et sur un programme de rachat de titres de 1 milliard de dollars pour restaurer la confiance. Un objectif de réalignement d'ici le 8 septembre a été fixé. L'avenir du modèle de Strategy dépend à court terme du succès de la ré-ancre du STRC, et à long terme d'une reprise du prix du Bitcoin, fondement ultime de sa logique de croissance.

marsbitIl y a 1 h

STRC a décroché : La première communication financière post-décrochage, comment Strategy répare sa dynamique capitalistique ?

marsbitIl y a 1 h

Le premier rapport financier après le décrochage majeur du STRC, comment Strategy répare-t-elle la roue du capital ?

STRA, la société trésorerie Bitcoin, a publié ses résultats financiers du deuxième trimestre 2026. Malgré des revenus de 122 millions de dollars (en hausse de 6.9%), elle a enregistré une perte nette de 8.22 milliards de dollars, principalement due à des pertes non réalisées sur ses réserves de Bitcoin, évaluées à 550 milliards de dollars pour 843 775 BTC. Le rapport se concentre sur la réponse de STRA à la crise de son instrument de financement privilégié, le STRC, qui s'est décroché de sa valeur nominale cible de 100 dollars, tombant jusqu'à 74.57 dollars. La priorité absolue de l'entreprise est de ramener le STRC à son ancrage. Pour cela, elle ne procédera à aucune nouvelle émission à prix réduit, maintient son taux de dividende à 12% et utilise un programme de rachat de 10 milliards de dollars pour acquérir des STRC décotés sur le marché. STRA vise une stabilisation d'ici début septembre. Parallèlement, STRA opère un changement stratégique majeur dans la gestion de son capital. Elle passe d'un modèle linéaire "lever des fonds -> acheter du BTC" à une gestion active et multidirectionnelle de ses quatre piliers : Bitcoin, liquidités en dollars, actions ordinaires (MSTR) et titres de crédit numérique (STRC). Le Bitcoin n'est plus seulement une réserve à accumuler mais peut être monétisé si nécessaire. L'entreprise optimise activement sa structure de dette et joue sur les opportunités d'arbitrage entre ses différents actifs. En résumé, la capacité de STRA à relancer sa "roue du capital" dépend à court terme de la réussite du réancrage du STRC, et à long terme de la reprise d'une tendance haussière du prix du Bitcoin, fondement ultime de son modèle économique.

Odaily星球日报Il y a 1 h

Le premier rapport financier après le décrochage majeur du STRC, comment Strategy répare-t-elle la roue du capital ?

Odaily星球日报Il y a 1 h

Trading

Spot

DeepSeek V4 enfin publié, brise le monopole des modèles propriétaires les plus puissants et annonce un partenariat avec les puces Huawei

Résumé

Choix haut de gamme et économique, deux versions lancées ensemble

Le contexte d'un million devient standard

Optimisation spéciale des capacités d'Agent

Prix de l'API

One more thing

Questions liées

Lectures associées

Actions cycliques ou actions de croissance ? Le rapport trimestriel Q2 de Coinbase révèle la "divergence d'évaluation"

Action cyclique ou action de croissance ? Les résultats du Q2 de Coinbase révèlent une "divergence d'évaluation"

Enquête sur les parts de marché mondiales : les entreprises japonaises en tête dans le secteur des matériaux pour semi-conducteurs

STRC a décroché : La première communication financière post-décrochage, comment Strategy répare sa dynamique capitalistique ?

Le premier rapport financier après le décrochage majeur du STRC, comment Strategy répare-t-elle la roue du capital ?

Trading

Catégories populaires

Tags tendances