Après trois ans d'attente, un nouvel article long de Lilian Weng, diplômée de l'Université de Pékin, fait le buzz

marsbitPublié le 2026-06-26Dernière mise à jour le 2026-06-26

Résumé

Après trois ans d'attente, Lilian Weng, ancienne vice-présidente d'OpenAI, a publié un long article analysant les "Scaling Laws" qui régissent le développement des grands modèles d'IA. Elle révèle que ces lois, fondement de milliards de dollars d'investissements, sont plus fragiles qu'imaginé. L'article souligne un désaccord clé : OpenAI (2020) préconisait une croissance plus rapide de la taille des modèles par rapport aux données, tandis que DeepMind (2022) défendait une croissance proportionnelle, ce qui a influencé l'entraînement de modèles comme GPT-3 et Chinchilla. Cette divergence proviendrait de différences dans le comptage des paramètres et de l'échelle limitée des premières expériences. Pire, la méthodologie même de l'étude Chinchilla, devenue une référence, contenait des bugs dans l'optimisation, découverts deux ans plus tard. Enfin, Weng pointe un problème fondamental : l'épuisement des données textuelles de haute qualité, remettant en cause l'hypothèse de données illimitées des lois classiques. Cela explique le virage de l'industrie vers l'apprentissage par renforcement, le calcul lors des tests et les données synthétiques. En conclusion, l'avenir de l'IA dépendra moins de la simple puissance de calcul que d'une compréhension plus fine et prudente de ces principes d'échelle.

Le blog, en pause depuis trois ans, vient enfin d'être mis à jour par Lilian Weng.

Il y a quelques instants, un article long, attendu depuis plus de trois ans par Lilian Weng, ancienne vice-présidente d'OpenAI, a fait le tour du web.

Dans ce billet de blog intitulé « Scaling Laws, Carefully », elle démonte méticuleusement les lois d'échelle (Scaling Laws) –

Cette loi sur laquelle l'industrie de l'IA a parié des dizaines de milliards de dollars est bien plus fragile que quiconque ne l'imaginait.

En une minute : de quoi parle cet article de dix mille mots

Une formule unique a gouverné toute l'industrie pendant cinq ans. Les lois d'échelle (Scaling Laws) énoncent que « plus le modèle est grand, plus les données sont nombreuses, plus la puissance de calcul est élevée, et meilleures seront les performances, et ce selon une proportion fixe ». Cela a transformé l'IA d'une alchimie en un business quantifiable, orientant indirectement des centaines de milliards de dollars d'investissements.

OpenAI et DeepMind ont donné des réponses opposées. Face à la même question « Comment allouer le budget de calcul ? », OpenAI déclarait en 2020 que la taille du modèle devait croître plus vite que celle des données, tandis que DeepMind affirmait en 2022 qu'elles devaient croître de concert. Il s'est avéré plus tard que l'origine de cette divergence résidait dans une différence de comptabilisation d'un paramètre, combinée à des expériences d'une ampleur insuffisante.

La formule du vainqueur cache également un bug. La proportion optimale de DeepMind, copiée par toute l'industrie pendant deux ans, s'est révélée, lors d'une réplication ligne par ligne en 2024, contenir une erreur : la fonction de perte utilisait une moyenne au lieu d'une somme, faisant s'arrêter prématurément l'optimiseur et produisant des paramètres loin d'être la solution optimale.

Il faut être très prudent lorsqu'on extrapole les règles des petits modèles aux grands modèles. Cette courbe a été ajustée sur des modèles relativement petits. Lorsqu'elle est extrapolée à l'échelle des milliers de milliards de paramètres, une simple différence d'arrondi peut conduire à des conclusions très éloignées. Le blog inclut un simulateur interactif permettant de le constater en déplaçant un curseur.

Un problème plus fondamental existe encore : les données sont presque épuisées. La formule suppose implicitement un approvisionnement infini en données, mais le texte de haute qualité est limité. C'est pourquoi toute l'industrie s'est tournée collectivement vers l'apprentissage par renforcement, le calcul au moment du test et les données synthétiques.

Une ligne droite, centaines de milliards de dollars

Il est bien connu que l'essence des lois d'échelle peut se résumer simplement en une phrase –

Plus le modèle est grand, plus les données sont nombreuses, plus la puissance de calcul est importante, meilleures sont les performances. Et ce « mieux » n'est pas aléatoire ; il suit une loi mathématique précise.

En traçant la perte de l'entraînement du modèle sur une échelle logarithmique, elle décroît en ligne droite avec l'augmentation du nombre de paramètres N du modèle, de la quantité de données D et de la puissance de calcul C.

Écrite sous forme de formule : L(x) = E + A/x^α, où x peut être N, D ou C, E est la perte théorique optimale (l'entropie intrinsèque des données), A et α sont des constantes ajustées.

Pour entraîner un modèle de N paramètres sur D tokens, la puissance de calcul totale C ≈ 6ND – 2ND pour la propagation avant, 4ND pour la rétropropagation.

Cette ligne droite signifie que l'amélioration des performances est prédictible.

En entraînant d'abord quelques petits modèles, en ajustant cette ligne droite, et en extrapolant vers la droite, on peut estimer les performances d'un grand modèle sans avoir à dépenser des centaines de millions de dollars pour l'entraîner complètement.

Avant cela, l'apprentissage profond était souvent moqué comme de « l'alchimie », sachant ce qui fonctionnait sans comprendre pourquoi.

En 2020, Kaplan d'OpenAI a publié cette loi de puissance, arrachant pour la première fois l'alchimie au terrain du « prédictible ».

Voilà ce qui donne à toutes les entreprises de grands modèles la confiance d'investir des sommes colossales.

Mais la recommandation la plus cruciale de la formule, comment répartir le budget de calcul entre la taille du modèle et les données, a reçu des réponses opposées de la part d'OpenAI et de DeepMind.

Un même problème

OpenAI et DeepMind produisent des réponses opposées

En 2020, l'équipe de Kaplan chez OpenAI a conclu : la taille optimale du modèle N_opt ∝ C^0.73.

Traduction : si la puissance de calcul est multipliée par 10, 5.5 fois vont au modèle et 1.8 fois aux données – la taille du modèle doit croître beaucoup plus vite que celle des données.

Ceci a directement guidé le protocole d'entraînement de GPT-3.

Le modèle de 175 milliards de paramètres n'a été nourri que de 300 milliards de tokens (un token est l'unité minimale traitée par le modèle, correspondant à peu près à 1-2 mots).

Selon les standards ultérieurs, c'était un entraînement largement insuffisant.

En 2022, l'équipe de Chinchilla chez DeepMind a tiré la conclusion opposée : N_opt ∝ C^0.50, le modèle et les données doivent croître de manière proportionnelle.

Les ingénieurs l'ont ensuite simplifié en un chiffre bien connu : le ratio optimal token/paramètre est d'environ 20:1.

Puis DeepMind a mené un face-à-face.

Leur Gopher, 280 milliards de paramètres nourris avec 300 milliards de tokens. Chinchilla, 70 milliards de paramètres nourris avec 1.4 trillion de tokens. Les deux modèles ont utilisé la même puissance de calcul.

Chinchilla a écrasé son adversaire.

Un modèle plus petit mais « bien nourri » a dominé un adversaire plus grand mais « sous-alimenté ».

Le consensus de toute l'industrie s'est donc inversé : de « agrandir le modèle » à « la plupart des modèles sont sous-entraînés ».

0.73 contre 0.50, la même question, des réponses opposées, qui vous conduisent à allouer votre budget de calcul dans deux directions complètement différentes.

La cause : un simple « problème de comptabilité »

En 2024, deux chercheurs ont publié un article de synthèse dans la revue TMLR, poussant l'enquête au bout.

La conclusion est désopilante.

Première cause : les deux parties ne comptent pas les paramètres de la même manière.

Dans un modèle, il existe une couche de paramètres appelée « embedding », responsable de la conversion des mots en vecteurs numériques compréhensibles par le modèle. Dans les petits modèles, cette couche représente une part très importante du nombre total de paramètres, pouvant atteindre un tiers pour des modèles de quelques dizaines de millions de paramètres.

Kaplan a exclu les paramètres d'embedding de son comptage, tandis que Chinchilla les a inclus.

Une simple différence de comptabilisation des paramètres suffit à déformer l'exposant de la loi de puissance ajustée.

Ils ont donné une formule de correction concise : N = N_\E + ω·N_\E^(1/3), où N_\E est le nombre de paramètres hors embedding, et ω est une constante. Pour les petits modèles, le second terme a un poids important, l'influence de l'embedding est significative ; plus le modèle est grand, plus le second terme tend vers zéro, et les deux méthodes de comptage convergent.

Deuxième cause : l'expérience de Kaplan était trop petite en échelle.

Le plus grand modèle testé par Kaplan ne dépassait pas 1.5 milliard de paramètres, tandis que l'expérience de Chinchilla s'étendait au-delà de 16 milliards. Sur une échelle logarithmique, de minuscules déviations d'ajustement sont considérablement amplifiées lors de l'extrapolation.

En reprenant la formule de Chinchilla avec une comptabilisation unifiée des paramètres, ils ont découvert une loi clé –

L'exposant de la loi de puissance change avec l'augmentation de l'échelle de calcul. Dans la plage expérimentale limitée de Kaplan, l'exposant est effectivement proche de 0.73 ; mais lorsque l'échelle augmente, l'exposant converge vers 0.50.

Kaplan ne s'est pas « trompé », il avait raison dans le cadre de son expérience.

Mais il a extrapolé une règle valable localement en une conclusion globale.

Un problème de comptabilisation d'un paramètre, ajouté à une expérimentation d'échelle insuffisante, a conduit deux équipes de premier plan à donner des recommandations opposées d'allocation des ressources.

Toute l'industrie a ajusté ses recettes d'entraînement pendant deux ans sur la base de cette conclusion.

Même le vainqueur a des bugs

Kaplan a été corrigé par Chinchilla, c'est le récit standard que tout le monde connaît.

Mais Weng est allée plus loin – la méthodologie même de Chinchilla présente des problèmes.

L'article de Chinchilla a utilisé trois méthodes indépendantes pour valider croisée sa conclusion :

Méthode 1 : taille de modèle fixe, variation de la quantité de données.

Méthode 2 : tracé des courbes d'iso-puissance (IsoFLOP profiles).

Méthode 3 : ajustement direct des paramètres sur la formule de perte L(N,D) = E + A/N^α + B/D^β.

Trois voies pointant vers la même conclusion, semblant très solides.

La dérivation mathématique de la méthode 3 est particulièrement élégante : en optimisant L(N,D) sous la contrainte C ≈ 6ND, on obtient une solution analytique fermée N_opt ∝ (C/6)^(β/(α+β)). Lorsque α ≈ β, l'exposant est approximativement 0.5, c'est-à-dire une croissance proportionnelle du modèle et des données. Voici l'origine mathématique du 0.50.

En 2024, l'équipe de l'institut de recherche en IA Epoch AI a extrait manuellement les points de données bruts des graphiques de l'article de Chinchilla et a rejoué l'ajustement de la méthode 3.

Deux bugs, l'un plus ahurissant que l'autre.

Bug 1 : la fonction de perte a utilisé une moyenne au lieu d'une somme.

Pour ajuster ces cinq paramètres, Chinchilla devait minimiser l'écart entre la perte prédite et la perte réelle.

L'objectif d'optimisation complet était : min Σ Huber_δ(log L̂(Nᵢ,Dᵢ) − log Lᵢ), où la perte Huber est une fonction de perte peu sensible aux valeurs aberrantes (δ = 10⁻³), utilisée avec l'optimiseur L-BFGS-B pour chercher la solution optimale.

Le problème réside dans un détail : ils ont pris la moyenne (mean) de la perte Huber pour chaque échantillon plutôt que la somme (sum). La moyenne sur quelques centaines d'échantillons comprime la valeur de la perte à un niveau extrêmement faible.

L'optimiseur L-BFGS-B intègre un critère de convergence automatique. Lorsque la valeur de la perte est suffisamment petite, il s'arrête. Voyant une valeur si faible, il a pensé à tort avoir convergé et s'est arrêté directement.

L'optimiseur n'a pas du tout terminé son exécution. Les paramètres de sortie n'étaient pas la vraie valeur optimale.

Bug 2 : les paramètres clés n'ont été conservés qu'avec deux décimales.

Dans l'article de Chinchilla, deux exposants centraux contrôlant la forme de la loi de puissance n'ont été conservés qu'avec deux chiffres après la virgule.

Cela semble être un arrondi anodin.

Mais en déduisant d'autres constantes à partir de ces nombres approximatifs, l'erreur a été amplifiée de manière exponentielle. L'intervalle de confiance final était anormalement étroit, si étroit qu'il nécessitait une précision atteignable seulement après plus de 600 000 expériences, alors qu'ils n'en ont effectué que moins de 500.

Une formule érigée en référence par toute l'industrie cachait un bug lié à une fonction de perte non exécutée jusqu'au bout, et ce bug est resté caché pendant deux longues années.

Weng a inclus dans son blog un simulateur interactif avec trois curseurs contrôlant respectivement la précision de la perte, le bruit de la perte et l'intervalle d'ajustement.

À chaque mouvement, la loi d'échelle ajustée change d'aspect.

La conclusion d'OpenAI souffre d'un biais de localité, celle de DeepMind présente des imperfections méthodologiques. Le débat académique le plus important de l'industrie de l'IA présente des fissures des deux côtés.

Les données sont presque épuisées

Les trois sections précédentes traitaient des problèmes de méthode d'ajustement : comment compter les paramètres, comment calculer la perte, combien de décimales conserver.

Mais même si tous ces problèmes étaient corrigés, les lois d'échelle classiques présentent une menace encore plus fondamentale –

Elles supposent que chaque donnée d'entraînement est unique, non répétée, non entraînée sur plusieurs époques, et présupposent que vous disposez de données illimitées.

La réalité est que les données textuelles de haute qualité devraient être épuisées par les grands laboratoires entre 2026 et 2028.

La répétition de l'entraînement sur les mêmes données est inévitable, le postulat de la formule classique s'effondre.

Une expérience à grande échelle en 2023 a entraîné environ 400 modèles, de quelques dizaines de millions à 9 milliards de paramètres, avec un maximum de 1500 répétitions (époques) d'entraînement.

L'idée centrale était d'introduire le concept de « quantité effective de données » pour remplacer la quantité réelle –

Si vous avez U données uniques répétées R fois, la quantité effective de données n'est pas U×R, mais est convertie selon une courbe de décroissance exponentielle : D_eff = U·(1 - e^(-R)). La première répétition permet encore d'apprendre beaucoup de choses nouvelles, mais à la cinquième, dixième répétition, le gain d'apprentissage marginal tend vers zéro.

Ils ont également découvert une conclusion contre-intuitive : les paramètres excédentaires se « déprécient » plus vite que les données répétées. Autrement dit, avec un budget limité, il est plus rentable de répéter l'entraînement plusieurs fois que d'augmenter la taille du modèle.

Un nouvel article de mai 2026 a adopté une approche différente.

Au lieu de convertir la quantité effective de données, ils ont directement ajouté un terme de pénalisation explicite pour le surapprentissage à la formule de perte classique – plus le modèle revoit les mêmes données, plus la pénalité est grande, et cette pénalité est liée à la taille du modèle.

Leur formule complète est la suivante :

Le dernier terme de pénalisation en rouge est crucial.

R est le nombre de répétitions, N/U est le ratio entre le nombre de paramètres du modèle et la quantité de données uniques (à quel point le modèle est « excédentaire » par rapport aux données), P, δ, κ sont des paramètres ajustés à partir des expériences. Plus les répétitions sont nombreuses, plus le modèle est grand, plus la pénalité est lourde.

La découverte centrale de cet article est : les grands modèles sont plus sensibles à la répétition des données. En ré-entraînant les mêmes données 10 fois, un modèle de 500 millions de paramètres pourrait encore tenir le coup, mais les performances d'un modèle de 5 milliards de paramètres se dégraderaient beaucoup plus sérieusement.

Une autre découverte directement utile en ingénierie : renforcer la décroissance de poids (weight decay) peut atténuer significativement le surapprentissage induit par l'entraînement répété.

C'est pourquoi, entre 2025 et 2026, l'attention de toute l'industrie s'est collectivement tournée vers trois voies pour contourner le mur des données –

L'apprentissage par renforcement, DeepSeek R1, la série o d'OpenAI, laissant le modèle s'auto-affronter dans des tâches vérifiables comme les mathématiques et la programmation pour générer des signaux d'entraînement.

Le calcul au moment du test (test-time computation), sans augmenter le coût de l'entraînement, permettant au modèle de « réfléchir » davantage lorsqu'il répond à une question pour obtenir de meilleures performances.

Les données synthétiques, utilisant les modèles forts existants pour générer de nouvelles données afin d'entraîner la prochaine génération de modèles.

Le sous-texte des trois voies est le même : la simple loi de puissance basée sur « l'augmentation de l'échelle » n'est plus suffisante.

De l'Université de Pékin à OpenAI, puis à sa propre entreprise

Lilian Weng, licence à l'Université de Pékin, doctorat à l'Université de l'Indiana à Bloomington.

Il est intéressant de noter que son domaine de doctorat n'était pas l'apprentissage profond, mais la science des réseaux et les systèmes complexes, étudiant comment l'information se propage dans les réseaux sociaux.

Après son doctorat, elle a d'abord travaillé en science des données chez Dropbox, puis dans la fintech Affirm, avant de rejoindre OpenAI en 2018.

À son arrivée chez OpenAI, le premier projet de Weng concernait la robotique. Elle a été l'une des contributrices clés de Dactyl, la main robotique qui a appris à résoudre un Rubik's Cube en deux ans.

Elle a ensuite rejoint l'équipe de recherche appliquée. Après la sortie de GPT-4, elle a été chargée de constituer l'équipe Safety Systems, qui comptait plus de 80 scientifiques, ingénieurs et experts politiques à son départ.

En août 2024, son titre est devenu VP de la recherche et de la sécurité, et trois mois plus tard, elle a annoncé son départ.

En 2017, Weng, alors novice en apprentissage profond, a ouvert un blog personnel appelé Lil'Log, initialement pour organiser ses notes d'apprentissage.

Elle a dit un jour : « Expliquer clairement un concept est la meilleure façon de vérifier si on le comprend vraiment. »

Le résultat : neuf ans d'écriture, couvrant l'apprentissage par renforcement, les modèles de diffusion, les agents de grands modèles, chaque article partant des principes fondamentaux, des dizaines de pages de texte long accompagnées de ses propres schémas.

Ce blog est ensuite devenu l'un des blogs techniques personnels les plus cités dans le domaine de l'IA, directement utilisé comme matériel pédagogique par de nombreuses universités.

En février 2025, elle a cofondé Thinking Machines Lab avec l'ancienne CTO d'OpenAI, Mira Murati. Les autres cofondateurs incluent le cofondateur d'OpenAI John Schulman, les anciens VP de recherche Barret Zoph et Luke Metz. a16z a mené un tour d'amorçage de 2 milliards de dollars, valorisant l'entreprise à 12 milliards.

Et tandis que l'entreprise avançait à grande vitesse, elle a pris le temps d'écrire cet article long sur les lois d'échelle, en attente depuis trois ans.

Les ChatGPT, Claude, Gemini que vous utilisez quotidiennement s'appuient tous sur ces formules pour déterminer comment entraîner la prochaine génération.

L'utilité de la prochaine génération d'IA ne dépendra pas de qui possède le plus de GPU, mais de qui traitera ces détails avec plus de précision.

Références :

https://x.com/lilianweng/status/2070237256070389897?s=20

https://lilianweng.github.io/posts/2026-06-24-scaling-laws/

Cet article provient du compte WeChat officiel « 新智元 » (New Zhiyuan), auteur : ASI启示录, éditeur : Moïse (traduction du nom approximative)

Cryptos en tendance

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

BrevisBREV

ZRX（0X）ZRX

PancakeSwapCAKE

Questions liées

QQuel est le principal message de l'article de Lilian Weng concernant les lois d'échelle (Scaling Laws) en IA ?

AL'article de Lilian Weng souligne que les 'Scaling Laws' (lois d'échelle), pierre angulaire du développement des grands modèles de langage, sont bien plus fragiles qu'on ne le pense généralement. Elle démontre que les conclusions fondatrices d'OpenAI et de DeepMind sur la répartition optimale des ressources (modèle vs données) étaient contradictoires ou basées sur des méthodologies présentant des défauts, mettant en garde contre une extrapolation trop confiante de ces lois au-delà de leur contexte expérimental initial, notamment face à la raréfaction des données de haute qualité.

QQuelle était la divergence fondamentale entre les conclusions d'OpenAI (2020) et de DeepMind (2022) sur l'application des Scaling Laws ?

AEn 2020, l'équipe d'OpenAI menée par Kaplan concluait que pour un budget de calcul donné, la taille du modèle devait augmenter beaucoup plus vite que le volume de données (N_opt ∝ C^0.73). En 2022, l'équipe 'Chinchilla' de DeepMind a infirmé cela, montrant que le modèle et les données doivent croître proportionnellement (N_opt ∝ C^0.50), recommandant un ratio optimal d'environ 20 tokens par paramètre. Cette divergence a orienté les stratégies d'entraînement dans des directions opposées.

QSelon l'article, quels sont les deux problèmes méthodologiques spécifiques identifiés dans l'étude 'Chinchilla' de DeepMind ?

ADeux problèmes méthodologiques majeurs ont été identifiés rétrospectivement dans l'étude 'Chinchilla' : 1) La fonction de perte utilisée pour l'ajustement des paramètres calculait une moyenne au lieu d'une somme, conduisant l'optimiseur L-BFGS-B à s'arrêter prématurément, n'atteignant pas le minimum réel. 2) Les paramètres clés de l'équation de puissance n'étaient rapportés qu'avec deux décimales, ce qui a propagé des erreurs d'arrondi et donné des intervalles de confiance irréalistiquement étroits par rapport au nombre limité d'expériences menées.

QQuelle est la limite fondamentale des Scaling Laws 'classiques' mise en avant par Lilian Weng, au-delà des problèmes de méthodologie ?

ALa limite fondamentale est que les lois d'échelle classiques supposent implicitement une source de données unique et infinie. En réalité, les données textuelles de haute qualité disponibles sont finies et devraient être épuisées entre 2026 et 2028. Cela rend inévitable la répétition des données d'entraînement sur plusieurs cycles ('epochs'), une situation que la formule originale ne prend pas en compte, remettant en cause sa validité à long terme.

QQuelles sont les trois principales voies de recherche que l'industrie explore pour dépasser la limite des données, selon la fin de l'article ?

AFace à l'épuisement anticipé des données de haute qualité, l'industrie se tourne principalement vers trois axes de recherche : 1) L'Apprentissage par Renforcement (Reinforcement Learning), permettant aux modèles de s'améliorer par auto-évaluation sur des tâches vérifiables. 2) Le calcul au moment du test (Test-Time Computation), où le modèle 'réfléchit' plus longuement pour répondre sans coût d'entraînement supplémentaire. 3) Les données synthétiques, générées par des modèles performants pour entraîner la génération suivante.

Lectures associées

Analyse de la durabilité de la tendance haussière de STABLE après sa dernière hausse de prix de 5 %

Alors que le marché des cryptomonnaies montre une faiblesse générale, STABLE a résisté, défendant le support à 0,33 $ et atteignant un plus haut local à 0,365 $. Au moment de la rédaction, l'altcoin se négocie autour de 0,362 $, en hausse de 5,5 % sur 24 heures, avec un volume de transactions en hausse de 25 %. Les graphiques quotidiens montrent une structure haussière, le prix évoluant au-dessus des moyennes mobiles à 20 et 50 jours. L'indicateur Stochastic Momentum Index (SMI) affiche une trajectoire ascendante, signalant une amélioration de l'élan. L'activité au spot confirme une demande soutenue, avec un Netflow négatif pendant sept jours consécutifs et des sorties nettes récentes de 162 000 $. Cependant, des inquiétudes subsistent quant à la solidité du réseau. La divergence Prix/DAA (Adresses Actives) reste négative depuis sept jours, indiquant une faible participation des utilisateurs qui n'a pas suivi la hausse des prix. Cette faiblesse structurelle historique augmente le risque de correction. Sous l'effet de la demande actuelle, STABLE pourrait consolider au-dessus de 0,36 $ et tenter de tester la résistance à 0,40 $. Toutefois, si les haussiers échouent et que le prix ne se maintient pas au-dessus de 0,36 $, un repli vers le support immédiat à 0,32 $ est probable.

ambcryptoIl y a 2 mins

Analyse de la durabilité de la tendance haussière de STABLE après sa dernière hausse de prix de 5 %

ambcryptoIl y a 2 mins

Tornado Cash ciblé par une nouvelle attaque de gouvernance : une fausse proposition visait un trésor communautaire de 23 millions de dollars

Le 25 juin 2026, une proposition de gouvernance suspecte (n°67) est apparue sur le DAO de Tornado Cash. Présentée comme une mise à jour des frais et de la tokenomie, elle demandait le remboursement de 50 TORN pour les frais de gaz, semblant légitime. Cependant, son code n'était pas vérifié sur Etherscan. Alerté, le chercheur Sergey Shemyakov a demandé un audit. Le chercheur en sécurité Pascal Caversaccio a découvert la vérité : la proposition contenait une fonction malveillante visant à remplacer discrètement l'adresse administrative du protocole par une adresse contrôlée par l'attaquant (très similaire à l'adresse légitime). Si elle avait été adoptée, l'attaquant aurait pu drainer la trésorerie du DAO (environ 23 millions de dollars en TORN) et vider les fonds des relais. L'adresse de l'attaquant avait reçu des fonds via le protocole de confidentialité Railgun quelques jours auparavant, masquant son origine. La communauté a massivement voté contre la proposition (27 163 TORN contre, 0 pour), et avec une participation insuffisante, elle devrait échouer. Cet incident rappelle une attaque similaire sur Tornado Cash en mai 2023, où l'attaquant avait volé 2,17 millions de dollars. Les attaques de gouvernance DAO (comme sur Beanstalk ou Build Finance) restent un risque majeur dans le Web3. Pour se protéger, les utilisateurs doivent : suivre les alertes des chercheurs, rejeter les propositions au code non vérifié, et déléguer leurs droits de vote s'ils ne participent pas activement. Pour les développeurs, l'implémentation d'un délai d'exécution (timelock) après un vote est une mesure de sécurité fondamentale, absente chez Tornado Cash par choix de conception.

Foresight NewsIl y a 11 mins

Tornado Cash ciblé par une nouvelle attaque de gouvernance : une fausse proposition visait un trésor communautaire de 23 millions de dollars

Foresight NewsIl y a 11 mins

Analyse de la chute de prix de 12 % de Sonic [S] et pourquoi davantage de ventes pourraient suivre

Sonic (S) a perdu 12 % de sa valeur en 24 heures, une baisse qui pourrait se poursuivre. Bien que l'activité sur la blockchain ait fortement augmenté – avec une hausse de 23 % des utilisateurs actifs quotidiens (DAU) et plus de 228 000 transactions – cette dynamique semble liée à des ventes plutôt qu'à une nouvelle demande. Une preuve clé est la baisse de la valeur totale bloquée (TVL), avec un retrait de 4,47 millions de dollars, indiquant une fuite des capitaux. Le volume des échanges décentralisés (DEX) a certes bondi, mais dans un contexte de prix en baisse, cela signale une pression vendeuse dominante. Les flux nets positifs sur le marché au comptant suggèrent une accumulation discrète, mais cette pression d'achat est trop faible pour contrer les ventes. Par conséquent, S reste exposé à d'autres pertes à court terme.

ambcryptoIl y a 1 h

Analyse de la chute de prix de 12 % de Sonic [S] et pourquoi davantage de ventes pourraient suivre

ambcryptoIl y a 1 h

Les stablecoins deviennent le prochain défi politique pour la Fed de Wash

Lors d'une conférence sur le rôle international du dollar, le gouverneur de la Réserve fédérale, Christopher Waller, a intégré les stablecoins (comme l'USDT et l'USDC) dans l'agenda de recherche de la Fed concernant la politique monétaire du dollar. Cela marque un changement important : les stablecoins ne sont plus considérés uniquement comme des instruments cryptographiques, mais comme un canal potentiel de transmission du dollar à l'échelle mondiale. Avec une capitalisation combinée dépassant 2500 milliards de dollars, les flux liés aux stablecoins peuvent désormais influencer la demande d'actifs à court terme (comme les bons du Trésor), le financement bancaire et l'accès à la liquidité en dollars. La question centrale pour les autorités est de savoir si la croissance des stablecoins provient d'une nouvelle demande internationale de dollars ou du remplacement de dépôts bancaires domestiques. Les recherches de la Fed et d'autres institutions soulignent que les émetteurs privés de stablecoins, en gérant d'importantes réserves en actifs dollar, sont devenus un élément du système de distribution de la liquidité mondiale. Leur développement peut renforcer la portée du dollar, mais pose également des questions potentielles sur la stabilité bancaire, la demande de titres d'État à court terme et les risques de liquidité en période de stress. La prochaine phase consistera à observer comment le système financier traditionnel absorbe ce phénomène, notamment via les tests des dépôts tokenisés par les banques et la capacité des émetteurs à gérer les risques liés aux réserves et aux rachats. Les stablecoins sont désormais un sujet de politique monétaire à part entière.

marsbitIl y a 1 h

Les stablecoins deviennent le prochain défi politique pour la Fed de Wash

marsbitIl y a 1 h

Après avoir brûlé 90 milliards de dollars, Zuckerberg décide d'ouvrir un casino où l'on ne peut pas parier

Après avoir enregistré des pertes colossales de près de 900 milliards de dollars dans le métavers, Mark Zuckerberg lance Arena, une nouvelle application de marché prédictif. Contrairement à des plateformes établies comme Polymarket ou Kalshi, Arena n’utilisera pas d’argent réel mais un système de points, évoquant un « casino sans argent ». Cette approche vise manifestement à contourner la régulation financière croissante, notamment après la première poursuite pour délit d’initié sur un marché prédictif intentée par la CFTC en 2026. Cependant, elle soulève une question fondamentale : un marché prédictif sans enjeu financier peut-il vraiment produire des prévisions précises ? L’auteur compare cela à un restaurant gastronomique servant des plats à base d’air – l’attrait et la crédibilité sont absents. Meta a une longue histoire de reproduction de fonctionnalités populaires (Stories, Reels, Threads) pour capitaliser sur son immense audience. Mais ici, en retirant l’argent, il risque de retirer l’essence même qui rend ces marchés utiles. L’application précédente de Meta, Forecast, avait déjà échoué et été retirée. Peut-être l’objectif n’est-il pas la précision, mais simplement d’engager les utilisateurs autour d’événements, transformant la prédiction en un jeu social. Dans ce scénario, Arena servirait de porte d’entrée, popularisant le concept avant que les utilisateurs les plus sérieux ne se tournent vers des plateformes avec de l’argent réel. Le projet apparaît ainsi comme une expérience prudente, voire une réaction à ses échecs coûteux passés.

marsbitIl y a 1 h

Après avoir brûlé 90 milliards de dollars, Zuckerberg décide d'ouvrir un casino où l'on ne peut pas parier

marsbitIl y a 1 h

Trading

Spot

Futures

Articles tendance

Qu'est ce que $S$

Comprendre SPERO : Un aperçu complet Introduction à SPERO Alors que le paysage de l'innovation continue d'évoluer, l'émergence des technologies web3 et des projets de cryptomonnaie joue un rôle central dans la façon dont se dessine l'avenir numérique. Un projet qui a attiré l'attention dans ce domaine dynamique est SPERO, désigné comme SPERO,$$s$. Cet article vise à rassembler et à présenter des informations détaillées sur SPERO, afin d'aider les passionnés et les investisseurs à comprendre ses fondations, ses objectifs et ses innovations dans les domaines du web3 et de la crypto. Qu'est-ce que SPERO,$$s$ ? SPERO,$$s$ est un projet unique dans l'espace crypto qui cherche à tirer parti des principes de décentralisation et de la technologie blockchain pour créer un écosystème qui favorise l'engagement, l'utilité et l'inclusion financière. Le projet est conçu pour faciliter les interactions entre pairs de nouvelles manières, offrant aux utilisateurs des solutions et des services financiers innovants. Au cœur de SPERO,$$s$, l'objectif est d'autonomiser les individus en fournissant des outils et des plateformes qui améliorent l'expérience utilisateur dans l'espace des cryptomonnaies. Cela inclut la possibilité de méthodes de transaction plus flexibles, la promotion d'initiatives dirigées par la communauté et la création de voies pour des opportunités financières via des applications décentralisées (dApps). La vision sous-jacente de SPERO,$$s$ tourne autour de l'inclusivité, visant à combler les lacunes au sein de la finance traditionnelle tout en exploitant les avantages de la technologie blockchain. Qui est le créateur de SPERO,$$s$ ? L'identité du créateur de SPERO,$$s$ reste quelque peu obscure, car il existe peu de ressources publiques fournissant des informations détaillées sur son ou ses fondateurs. Ce manque de transparence peut découler de l'engagement du projet envers la décentralisation—une éthique que de nombreux projets web3 partagent, privilégiant les contributions collectives plutôt que la reconnaissance individuelle. En centrant les discussions autour de la communauté et de ses objectifs collectifs, SPERO,$$s$ incarne l'essence de l'autonomisation sans désigner des individus spécifiques. Ainsi, comprendre l'éthique et la mission de SPERO reste plus important que d'identifier un créateur unique. Qui sont les investisseurs de SPERO,$$s$ ? SPERO,$$s$ est soutenu par une diversité d'investisseurs allant des capital-risqueurs aux investisseurs providentiels dédiés à favoriser l'innovation dans le secteur crypto. L'objectif de ces investisseurs s'aligne généralement avec la mission de SPERO—priorisant les projets qui promettent des avancées technologiques sociétales, l'inclusivité financière et la gouvernance décentralisée. Ces fondations d'investisseurs s'intéressent généralement à des projets qui non seulement offrent des produits innovants, mais qui contribuent également positivement à la communauté blockchain et à ses écosystèmes. Le soutien de ces investisseurs renforce SPERO,$$s$ en tant que concurrent notable dans le domaine en rapide évolution des projets crypto. Comment fonctionne SPERO,$$s$ ? SPERO,$$s$ utilise un cadre multifacette qui le distingue des projets de cryptomonnaie conventionnels. Voici quelques-unes des caractéristiques clés qui soulignent son unicité et son innovation : Gouvernance décentralisée : SPERO,$$s$ intègre des modèles de gouvernance décentralisée, permettant aux utilisateurs de participer activement aux processus de décision concernant l'avenir du projet. Cette approche favorise un sentiment de propriété et de responsabilité parmi les membres de la communauté. Utilité du token : SPERO,$$s$ utilise son propre token de cryptomonnaie, conçu pour servir diverses fonctions au sein de l'écosystème. Ces tokens permettent des transactions, des récompenses et la facilitation des services offerts sur la plateforme, améliorant ainsi l'engagement et l'utilité globaux. Architecture en couches : L'architecture technique de SPERO,$$s$ supporte la modularité et l'évolutivité, permettant une intégration fluide de fonctionnalités et d'applications supplémentaires à mesure que le projet évolue. Cette adaptabilité est primordiale pour maintenir la pertinence dans le paysage crypto en constante évolution. Engagement communautaire : Le projet met l'accent sur des initiatives dirigées par la communauté, utilisant des mécanismes qui incitent à la collaboration et aux retours d'expérience. En cultivant une communauté forte, SPERO,$$s$ peut mieux répondre aux besoins des utilisateurs et s'adapter aux tendances du marché. Accent sur l'inclusion : En proposant des frais de transaction bas et des interfaces conviviales, SPERO,$$s$ vise à attirer une base d'utilisateurs diversifiée, y compris des individus qui n'ont peut-être pas engagé auparavant dans l'espace crypto. Cet engagement envers l'inclusion s'aligne avec sa mission globale d'autonomisation par l'accessibilité. Chronologie de SPERO,$$s$ Comprendre l'histoire d'un projet fournit des aperçus cruciaux sur sa trajectoire de développement et ses jalons. Voici une chronologie suggérée cartographiant les événements significatifs dans l'évolution de SPERO,$$s$ : Phase de conceptualisation et d'idéation : Les idées initiales formant la base de SPERO,$$s$ ont été conçues, s'alignant étroitement avec les principes de décentralisation et de concentration sur la communauté au sein de l'industrie blockchain. Lancement du livre blanc du projet : Suite à la phase conceptuelle, un livre blanc complet détaillant la vision, les objectifs et l'infrastructure technologique de SPERO,$$s$ a été publié pour susciter l'intérêt et les retours de la communauté. Construction de la communauté et engagements précoces : Des efforts de sensibilisation actifs ont été entrepris pour construire une communauté d'adopteurs précoces et d'investisseurs potentiels, facilitant les discussions autour des objectifs du projet et recueillant du soutien. Événement de génération de tokens : SPERO,$$s$ a organisé un événement de génération de tokens (TGE) pour distribuer ses tokens natifs aux premiers soutiens et établir une liquidité initiale au sein de l'écosystème. Lancement de la première dApp : La première application décentralisée (dApp) associée à SPERO,$$s$ a été mise en ligne, permettant aux utilisateurs d'interagir avec les fonctionnalités principales de la plateforme. Développement continu et partenariats : Des mises à jour et des améliorations continues des offres du projet, y compris des partenariats stratégiques avec d'autres acteurs de l'espace blockchain, ont façonné SPERO,$$s$ en un acteur compétitif et évolutif sur le marché crypto. Conclusion SPERO,$$s$ se dresse comme un témoignage du potentiel du web3 et de la cryptomonnaie pour révolutionner les systèmes financiers et autonomiser les individus. Avec un engagement envers la gouvernance décentralisée, l'engagement communautaire et des fonctionnalités conçues de manière innovante, il ouvre la voie vers un paysage financier plus inclusif. Comme pour tout investissement dans l'espace crypto en rapide évolution, les investisseurs et utilisateurs potentiels sont encouragés à mener des recherches approfondies et à s'engager de manière réfléchie avec les développements en cours au sein de SPERO,$$s$. Le projet illustre l'esprit d'innovation de l'industrie crypto, invitant à une exploration plus approfondie de ses nombreuses possibilités. Bien que le parcours de SPERO,$$s$ soit encore en cours, ses principes fondamentaux pourraient en effet influencer l'avenir de nos interactions avec la technologie, la finance et entre nous dans des écosystèmes numériques interconnectés.

113 vues totalesPublié le 2024.12.17Mis à jour le 2024.12.17

Qu'est ce que AGENT S

Agent S : L'avenir de l'interaction autonome dans Web3 Introduction Dans le paysage en constante évolution de Web3 et des cryptomonnaies, les innovations redéfinissent constamment la manière dont les individus interagissent avec les plateformes numériques. Un projet pionnier, Agent S, promet de révolutionner l'interaction homme-machine grâce à son cadre agentique ouvert. En ouvrant la voie à des interactions autonomes, Agent S vise à simplifier des tâches complexes, offrant des applications transformantes dans l'intelligence artificielle (IA). Cette exploration détaillée plongera dans les subtilités du projet, ses caractéristiques uniques et les implications pour le domaine des cryptomonnaies. Qu'est-ce qu'Agent S ? Agent S se présente comme un cadre agentique ouvert révolutionnaire, spécifiquement conçu pour relever trois défis fondamentaux dans l'automatisation des tâches informatiques : Acquisition de connaissances spécifiques au domaine : Le cadre apprend intelligemment à partir de diverses sources de connaissances externes et d'expériences internes. Cette approche double lui permet de construire un riche répertoire de connaissances spécifiques au domaine, améliorant ainsi sa performance dans l'exécution des tâches. Planification sur de longs horizons de tâches : Agent S utilise une planification hiérarchique augmentée par l'expérience, une approche stratégique qui facilite la décomposition et l'exécution efficaces de tâches complexes. Cette fonctionnalité améliore considérablement sa capacité à gérer plusieurs sous-tâches de manière efficace et efficiente. Gestion d'interfaces dynamiques et non uniformes : Le projet introduit l'Interface Agent-Ordinateur (ACI), une solution innovante qui améliore l'interaction entre les agents et les utilisateurs. En utilisant des Modèles de Langage Multimodaux de Grande Taille (MLLMs), Agent S peut naviguer et manipuler sans effort diverses interfaces graphiques. Grâce à ces fonctionnalités pionnières, Agent S fournit un cadre robuste qui aborde les complexités impliquées dans l'automatisation de l'interaction humaine avec les machines, préparant le terrain pour d'innombrables applications en IA et au-delà. Qui est le créateur d'Agent S ? Bien que le concept d'Agent S soit fondamentalement innovant, des informations spécifiques sur son créateur restent insaisissables. Le créateur est actuellement inconnu, ce qui souligne soit le stade naissant du projet, soit le choix stratégique de garder les membres fondateurs sous le radar. Quoi qu'il en soit, l'accent reste mis sur les capacités et le potentiel du cadre. Qui sont les investisseurs d'Agent S ? Étant donné qu'Agent S est relativement nouveau dans l'écosystème cryptographique, des informations détaillées concernant ses investisseurs et soutiens financiers ne sont pas explicitement documentées. Le manque d'aperçus publiquement disponibles sur les fondations d'investissement ou les organisations soutenant le projet soulève des questions sur sa structure de financement et sa feuille de route de développement. Comprendre le soutien est crucial pour évaluer la durabilité du projet et son impact potentiel sur le marché. Comment fonctionne Agent S ? Au cœur d'Agent S se trouve une technologie de pointe qui lui permet de fonctionner efficacement dans divers environnements. Son modèle opérationnel est construit autour de plusieurs caractéristiques clés : Interaction homme-ordinateur semblable à l'humain : Le cadre offre une planification IA avancée, s'efforçant de rendre les interactions avec les ordinateurs plus intuitives. En imitant le comportement humain dans l'exécution des tâches, il promet d'élever l'expérience utilisateur. Mémoire narrative : Utilisée pour tirer parti des expériences de haut niveau, Agent S utilise la mémoire narrative pour suivre les historiques de tâches, améliorant ainsi ses processus de prise de décision. Mémoire épisodique : Cette fonctionnalité fournit aux utilisateurs un accompagnement étape par étape, permettant au cadre d'offrir un soutien contextuel au fur et à mesure que les tâches se déroulent. Support pour OpenACI : Avec la capacité de fonctionner localement, Agent S permet aux utilisateurs de garder le contrôle sur leurs interactions et flux de travail, s'alignant avec l'éthique décentralisée de Web3. Intégration facile avec des API externes : Sa polyvalence et sa compatibilité avec diverses plateformes IA garantissent qu'Agent S peut s'intégrer sans effort dans des écosystèmes technologiques existants, en faisant un choix attrayant pour les développeurs et les organisations. Ces fonctionnalités contribuent collectivement à la position unique d'Agent S dans l'espace crypto, alors qu'il automatise des tâches complexes en plusieurs étapes avec un minimum d'intervention humaine. À mesure que le projet évolue, ses applications potentielles dans Web3 pourraient redéfinir la manière dont les interactions numériques se déroulent. Chronologie d'Agent S Le développement et les jalons d'Agent S peuvent être encapsulés dans une chronologie qui met en évidence ses événements significatifs : 27 septembre 2024 : Le concept d'Agent S a été lancé dans un document de recherche complet intitulé “Un cadre agentique ouvert qui utilise les ordinateurs comme un humain”, présentant les bases du projet. 10 octobre 2024 : Le document de recherche a été rendu publiquement disponible sur arXiv, offrant une exploration approfondie du cadre et de son évaluation de performance basée sur le benchmark OSWorld. 12 octobre 2024 : Une présentation vidéo a été publiée, fournissant un aperçu visuel des capacités et des caractéristiques d'Agent S, engageant davantage les utilisateurs et investisseurs potentiels. Ces jalons dans la chronologie illustrent non seulement les progrès d'Agent S, mais indiquent également son engagement envers la transparence et l'engagement communautaire. Points clés sur Agent S Alors que le cadre Agent S continue d'évoluer, plusieurs attributs clés se distinguent, soulignant sa nature innovante et son potentiel : Cadre innovant : Conçu pour offrir une utilisation intuitive des ordinateurs semblable à l'interaction humaine, Agent S propose une approche nouvelle de l'automatisation des tâches. Interaction autonome : La capacité d'interagir de manière autonome avec les ordinateurs via une interface graphique signifie un bond vers des solutions informatiques plus intelligentes et efficaces. Automatisation des tâches complexes : Avec sa méthodologie robuste, il peut automatiser des tâches complexes en plusieurs étapes, rendant les processus plus rapides et moins sujets aux erreurs. Amélioration continue : Les mécanismes d'apprentissage permettent à Agent S de s'améliorer grâce à ses expériences passées, améliorant continuellement sa performance et son efficacité. Polyvalence : Son adaptabilité à travers différents environnements d'exploitation comme OSWorld et WindowsAgentArena garantit qu'il peut servir un large éventail d'applications. Alors qu'Agent S se positionne dans le paysage Web3 et crypto, son potentiel à améliorer les capacités d'interaction et à automatiser les processus représente une avancée significative dans les technologies IA. Grâce à son cadre innovant, Agent S incarne l'avenir des interactions numériques, promettant une expérience plus fluide et efficace pour les utilisateurs à travers divers secteurs. Conclusion Agent S représente un saut audacieux en avant dans le mariage de l'IA et de Web3, avec la capacité de redéfinir notre interaction avec la technologie. Bien qu'il soit encore à ses débuts, les possibilités de son application sont vastes et convaincantes. Grâce à son cadre complet abordant des défis critiques, Agent S vise à mettre les interactions autonomes au premier plan de l'expérience numérique. À mesure que nous plongeons plus profondément dans les domaines des cryptomonnaies et de la décentralisation, des projets comme Agent S joueront sans aucun doute un rôle crucial dans la façon dont la technologie et la collaboration homme-machine évolueront à l'avenir.

873 vues totalesPublié le 2025.01.14Mis à jour le 2025.01.14

Comment acheter S

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Sonic (S) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Sonic (S).Solde ：utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers ：pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P ：tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Sonic (S)Après avoir acheté vos Sonic (S), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Sonic (S)Tradez facilement Sonic (S) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

1.8k vues totalesPublié le 2025.01.15Mis à jour le 2026.06.02

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de S (S) sont présentées ci-dessous.

Après trois ans d'attente, un nouvel article long de Lilian Weng, diplômée de l'Université de Pékin, fait le buzz

Résumé

En une minute : de quoi parle cet article de dix mille mots

Une ligne droite, centaines de milliards de dollars

Un même problème

OpenAI et DeepMind produisent des réponses opposées

La cause : un simple « problème de comptabilité »

Même le vainqueur a des bugs

Les données sont presque épuisées

De l'Université de Pékin à OpenAI, puis à sa propre entreprise

Cryptos en tendance

Questions liées

Lectures associées

Analyse de la durabilité de la tendance haussière de STABLE après sa dernière hausse de prix de 5 %

Tornado Cash ciblé par une nouvelle attaque de gouvernance : une fausse proposition visait un trésor communautaire de 23 millions de dollars

Analyse de la chute de prix de 12 % de Sonic [S] et pourquoi davantage de ventes pourraient suivre

Les stablecoins deviennent le prochain défi politique pour la Fed de Wash

Après avoir brûlé 90 milliards de dollars, Zuckerberg décide d'ouvrir un casino où l'on ne peut pas parier

Trading

Articles tendance

Qu'est ce que $S$

Qu'est ce que AGENT S

Comment acheter S

Discussions

Catégories populaires

Tags tendances