Tendances technologiques

Explorer les dernières innovations, les mises à niveau de protocoles, les solutions inter-chaînes et les mécanismes de sécurité dans l'espace blockchain. Adoption d'une perspective centrée sur les développeurs pour analyser les tendances technologiques émergentes et les percées potentielles.

Capacité de calcul limitée : pourquoi DeepSeek-V4 est-il open source ?

Face à des contraintes de calcul, DeepSeek a choisi de rendre son modèle DeepSeek-V4 open source, tout en proposant une version Pro aux capacités avancées mais limitée en débit en raison de ressources de calcul haute performance insuffisantes. Le modèle exploite une architecture MoE (Mixture of Experts) avec 1,6T de paramètres au total mais seulement 49B activés lors de l'inférence, permettant une gestion de contexte longue (1 million de tokens). Une version Flash, avec 284B de paramètres totaux et seulement 13B activés, est conçue pour une adoption massive sur du matériel moins performant, visant ainsi les PME et développeurs. Le modèle excelle dans des tâches exigeantes comme la génération de code et le raisonnement complexe, rivalisant avec des modèles fermés leaders. DeepSeek a également collaboré avec des fabricants de puces chinoises (Huawei, Cambricon, Hygon) pour optimiser l'exécution sur du matériel local, bien que des défis persistent en termes de performance pure et d’approvisionnement. Cette stratégie intervient dans un contexte de concurrence intense sur le marché chinois des modèles de langage et de départs clés dans l’équipe R&D. DeepSeek cherche également à lever des fonds à une valorisation élevée, et cette version open source constitue une démonstration de sa résilience technologique et de son orientation pragmatique vers une IA accessible malgré les limites actuelles du calcul.

marsbit04/26 00:38

Capacité de calcul limitée : pourquoi DeepSeek-V4 est-il open source ?

marsbit04/26 00:38

a16z : Le syndrome de l'« amnésie » de l'IA, l'apprentissage continu peut-il le guérir ?

Résumé : Les modèles de langage actuels souffrent d’une forme d’amnésie : une fois entraînés, leurs paramètres sont figés, les empêchant d’intégrer de nouvelles connaissances après leur déploiement. Pour pallier cela, des méthodes comme l’apprentissage en contexte (ICL) ou les systèmes de mémoire externe (RAG) sont utilisées, mais elles ne permettent pas une véritable internalisation des informations. L’article explore la question de l’apprentissage continu (continual learning), une piste de recherche cruciale pour permettre aux modèles de mettre à jour leurs paramètres de manière ciblée et durable. Trois approches sont présentées : l’apprentissage par contexte (non paramétrique), l’ajout de modules spécialisés (semi-paramétrique) et la mise à jour directe des poids (paramétrique). Si les méthodes non paramétriques sont matures et efficaces, elles butent sur des limites structurelles : impossibilité de généraliser véritablement, difficulté à traiter des connaissances implicites ou à résoudre des problèmes nécessitant une compression profonde (comme des preuves mathématiques novatrices). Les défis techniques et de sécurité liés aux mises à jour paramétriques (oubli catastrophique, auditabilité, alignement) restent importants, mais des solutions émergent (apprentissage métacognitif, architecture éparse, auto-amélioration). Une combinaison de ces approches pourrait permettre aux IA de passer d’une simple mémoire externe à une véritable capacité d’apprentissage continu.

marsbit04/25 04:43

a16z : Le syndrome de l'« amnésie » de l'IA, l'apprentissage continu peut-il le guérir ?

marsbit04/25 04:43

a16z : Mettre à l'échelle l'IA sans vérification cryptographique est une dette dangereuse

**IA sans vérification cryptographique : une dette dangereuse à grande échelle** Les agents IA évoluent rapidement d'outils d'assistance à de véritables acteurs économiques, mais leur manque d'identité standardisée et de moyens de vérification cryptographique représente un risque croissant. Sans couche d'identité portable et interopérable (comme un "SSL pour agents"), ces systèmes ne peuvent pas prouver de manière fiable qui ils représentent, ce qu'ils sont autorisés à faire ou comment être payés. Les blockchains offrent une solution via des registres publics vérifiables, des portefeuilles programmables et des stablecoins pour les règlements. Le défi ne réside plus dans l'intelligence mais dans la gouvernance et la vérification. Si les agents prennent le contrôle de systèmes réels sans garanties cryptographiques, l'autorité humaine devient fragile. La transparence des données d'entraînement, des instructions et des actions est essentielle pour éviter une gouvernance opaque dictée par ceux qui contrôlent les modèles. Les paiements cryptographiques (comme les stablecoins) deviennent la couche de règlement privilégiée pour les transactions entre agents, permettant des économies sans tête ("headless") avec des frais minimes et sans besoin d'intervention humaine. Cependant, sans vérification, la mise à l'échelle des agents accumule une "dette IA" dangereuse : les systèmes optimisent les métriques tout en déviant silencieusement des intentions humaines. Les outils cryptographiques émergents (portefeuilles dédiés, cadres de délégation) permettent aux utilisateurs de définir des limites claires et de conserver le contrôle. Sans cela, la délégation massive à des agents non vérifiés risque d'érode la responsabilité et la confiance.

marsbit04/23 13:32

a16z : Mettre à l'échelle l'IA sans vérification cryptographique est une dette dangereuse

marsbit04/23 13:32

活动图片