# Référence Articles associés

Le Centre d'actualités HTX fournit les derniers articles et analyses approfondies sur "Référence", couvrant les tendances du marché, les mises à jour des projets, les développements technologiques et les politiques réglementaires dans l'industrie crypto.

TRON inclus dans l'indice S&P Pantera Digital Asset, les références institutionnelles s'étendent aux réseaux blockchain

Genève, Suisse, 23 juillet 2026 — TRON DAO se félicite du lancement de l'indice S&P Pantera Digital Asset Index, qui inclut la blockchain TRON parmi les principaux protocoles de référence. Développé par S&P Dow Jones Indices et Pantera Capital, cet indice applique une méthodologie fondée sur l'utilité du protocole, la liquidité sur chaîne et l'activité du réseau, marquant l'extension des cadres financiers traditionnels aux actifs numériques. L'inclusion de TRON intervient alors que le réseau poursuit son expansion, avec plus de 394 millions de comptes utilisateurs et plus de 90 milliards de dollars d'USDT, en faisant l'un des principaux réseaux de règlement pour les stablecoins. TRON domine le volume des transferts d'USDT cette année, avec environ 4 500 milliards de dollars, et des intégrations récentes avec des infrastructures de marché réglementées ont élargi son accès institutionnel. Justin Sun, fondateur de TRON, a déclaré que cette évolution des cadres d'évaluation reflète la maturation des actifs numériques en tant que classe d'actifs institutionnelle, où l'utilité et l'adoption deviennent des mesures fondamentales. Ce benchmark représente une nouvelle étape dans l'application des normes des marchés financiers traditionnels aux actifs numériques.

cointelegraphHier 09:40

TRON inclus dans l'indice S&P Pantera Digital Asset, les références institutionnelles s'étendent aux réseaux blockchain

cointelegraphHier 09:40

Claude Opus 5 fuité, voici les premiers tests des internautes

Anthropic aurait accidentellement laissé fuir des aperçus de son prochain modèle d'IA, Claude Opus 5, et les premiers tests des internautes affluent. Les démonstrations partagées sur les réseaux sociaux, notamment par @chetaslua, mettent en avant des capacités graphiques impressionnantes. Elles incluent la génération de scènes 3D détaillées (comme un trébuchet attaquant un château avec des paramètres physiques affichés), des interfaces interactives aux reflets réalistes et des rendus complexes dans des styles variés, du réaliste au pixel art (comme une réplique de Minecraft). Certains utilisateurs estiment que la qualité et la densité des détails surpasseraient même celles de Fable 5, le modèle de génération vidéo actuel d'Anthropic. Les premières traces de cette fuite sont apparues vers le 9 juillet, avec un modèle mystérieux nommé "Honeycomb EAP" brièvement visible dans l'éditeur de code Cursor. Par la suite, des références à "Claude Opus 5" ont été repérées dans Google Vertex AI et dans des messages d'erreur de Cursor, confirmant son développement avancé. Une capture d'écran suggère même qu'Opus 5 serait utilisé en secours lorsque les garde-fous de Fable 5 sont déclenchés. Si les performances visuelles semblent prometteuses, la question du coût reste en suspens. Bien qu'Opus 5 soit facturé moitié moins cher que Fable 5 par million de tokens, certains testeurs rapportent une consommation de tokens beaucoup plus élevée, ce qui pourrait finalement annuler l'avantage tarifaire. La communauté attend désormais une version officielle et des benchmarks complets pour confirmer si Opus 5 peut vraiment remplacer Fable 5.

marsbit07/24 07:57

Claude Opus 5 fuité, voici les premiers tests des internautes

marsbit07/24 07:57

Une énorme escroquerie : le « Laboratoire mystérieux » qui a conquis les classements mondiaux du jour au lendemain s'avère être un canular

Le 18 juillet, l’IA "Basalt Labs" a créé un buzz mondial en annonçant Monolith-1.0, un modèle présenté comme révolutionnaire avec 1,6 trillion de paramètres et des scores records sur les benchmarks. Il a rapidement été révélé comme une supercherie. Le modèle sur Hugging Face était constitué de poids dupliqués et remplis de données aléatoires, et la démo en ligne utilisait en réalité l’API de DeepSeek. Le créateur, Max Scherf, a expliqué avoir généré les résultats en fine-tuning un petit modèle sur les réponses publiques des tests, créé un site web et une documentation convaincants, puis lancé une campagne virale. Son "expérience sociale" visait à critiquer la course aux benchmarks et le manque de vérification dans l’industrie. Ironiquement, les modèles chinois Qwen et DeepSeek, utilisés comme base, ont montré une qualité suffisante pour faire illusion.

marsbit07/20 02:54

Une énorme escroquerie : le « Laboratoire mystérieux » qui a conquis les classements mondiaux du jour au lendemain s'avère être un canular

marsbit07/20 02:54

DeepSeek V4 « version pleine puissance » dévoilé, lancement prévu demain au plus tôt

Après près de trois mois d'attente, la version complète de DeepSeek V4 (General Availability) devrait être publiée prochainement, potentiellement dès demain. Le modèle est actuellement en test restreint. Deux versions sont annoncées : DeepSeek V4 Flash et DeepSeek V4 Pro. Les premières impressions d'un développeur indiquent que les performances globales se rapprochent du niveau d'Opus 4.8, avec des capacités de codage similaires à GPT-5.6 Sol et une nette amélioration des capacités d'agent et de génération 3D/SVG. Cependant, le modèle nécessiterait plus d'itérations qu'un Fable 5 pour accomplir la même tâche. Le principal changement réside dans la tarification de l'API, qui introduit un système de « facturation aux heures de pointe » (peak/off-peak). Les prix restent très compétitifs : par exemple, le million de tokens en sortie pour la version Flash coûterait 0,28 $ (hors pointe) contre 0,56 $ en pointe. Bien que cette approche marque un changement pour DeepSeek, réputé pour ses prix bas, le modèle maintient un rapport performance/prix très attractif, se présentant comme une alternative économique face aux modèles majeurs comme Fable 5 ou GPT-5.6 Sol. Les premières démonstrations techniques, notamment la génération de jeux simples en HTML/JavaScript et d'éléments SVG, commencent à circuler, suscitant des retours partagés sur les performances finales. Les anciens modèles deepseek-chat et deepseek-reasoner seront officiellement retirés le 24 juillet. En résumé, DeepSeek V4 ne vise pas nécessairement la première place absolue en performances pures, mais poursuit sa stratégie de proposer des capacités de haut niveau (type Opus) à un coût significativement inférieur, renforçant ainsi sa réputation de « briseur de prix » sur le marché de l'IA.

marsbit07/19 05:34

DeepSeek V4 « version pleine puissance » dévoilé, lancement prévu demain au plus tôt

marsbit07/19 05:34

GPT-5.6 franchit pour la première fois la barre du QI 130, le seuil du génie, plus intelligent que 99% de l'humanité

Aujourd'hui, 99% de l'humanité serait dépassée en termes de QI par une IA. Lors des derniers tests de QI hors ligne de Tracking AI, plusieurs variantes de GPT-5.6 ont atteint un score de 136, franchissant pour la première fois le seuil des 130, considéré comme la ligne de départ du « génie » et correspondant au top 1% de la population humaine. Ce résultat provient d'une base de questions hors ligne privée, conçue pour éviter toute fuite ou mémorisation des réponses par les modèles, contrairement aux tests publics déjà largement surperformés. Sur ce classement exigeant, la famille GPT-5.6 (y compris sa version visuelle) domine avec 136 points, devançant nettement ses concurrents comme Claude-5 Fable (130). Au-delà des scores, des tests pratiques menés par des développeurs démontrent ses capacités. GPT-5.6 a réussi à générer, à partir d'une simple instruction, des simulations physiques complexes ou un système de gestion de tickets clients opérationnel, montrant une capacité à traduire ses compétences cognitives en résultats concrets et pragmatiques. Si ce score QI marque un jalon symbolique dans les capacités de raisonnement abstrait et logique des LLM, il ne mesure qu'une facette de l'intelligence. Les retours d'usage suggèrent cependant que GPT-5.6 commence à combler l'écart entre « savoir résoudre des tests » et « savoir accomplir des tâches pratiques » sur des problèmes nouveaux, ce qui pour beaucoup s'approche d'une forme d'intelligence générale (AGI) pour les besoins courants.

marsbit07/16 08:26

GPT-5.6 franchit pour la première fois la barre du QI 130, le seuil du génie, plus intelligent que 99% de l'humanité

marsbit07/16 08:26

Scaling Law n'est pas une panacée ? Le premier benchmark sur la manipulation de structures cristallines fait trébucher les grands modèles de pointe

Une nouvelle étude met en lumière les limites des grands modèles linguistiques dans les tâches concrètes de manipulation atomique pour la science des matériaux. La recherche, présentée par AtomWorld, un cadre d'évaluation publié à l'ICML 2026, révèle que le « Scaling Law », principe selon lequel la performance s'améliore avec la taille du modèle et des données, rencontre des limites significatives face à des opérations nécessitant une compréhension précise des contraintes physiques et de l'espace tridimensionnel. Les modèles testés, dont Claude Opus, GPT-5.4, Gemini et Qwen, montrent des difficultés notables pour des tâches comme la rotation autour d'un atome, la suppression d'atomes dans une zone spécifique ou l'extension de super-cellules. Bien que l'augmentation de l'échelle améliore les opérations simples et bien définies (remplacement, suppression), elle ne garantit pas une meilleure performance pour les actions complexes de raisonnement géométrique. L'étude souligne une distinction cruciale : comprendre les connaissances textuelles sur les matériaux est différent de la capacité à exécuter des actions précises dans l'espace 3D. Elle propose un changement de paradigme : au-delà du « Language Scaling » (agrandissement basé sur le texte), le domaine « AI for Science » a besoin d'un « Action Scaling », c'est-à-dire d'augmenter systématiquement la capacité des modèles à apprendre à partir de données d'action, de retours d'environnement et de contraintes physiques vérifiables. AtomWorld sert ainsi de référence pour mesurer et développer les capacités d'action des futurs agents d'intelligence artificielle scientifiques, qui devront non seulement expliquer mais aussi exécuter des tâches de recherche réelles.

marsbit07/15 04:05

Scaling Law n'est pas une panacée ? Le premier benchmark sur la manipulation de structures cristallines fait trébucher les grands modèles de pointe

marsbit07/15 04:05

Classement des IA en tant que travailleurs : la capacité de Claude Fable 5 à générer de l'argent automatiquement est 2,5 fois supérieure à celle du GPT-5.5

L'évaluation de l'indice du travail à distance révèle une accélération marquée des capacités d'automatisation des IA. Le modèle Claude Fable 5 atteint un taux d'automatisation de 16,1%, surpassant largement Opus 4.8 (8,3%) et GPT-5.5 (6,3%). Cette performance, mesurée sur 240 projets réels de freelancing, indique que l'IA peut désormais exécuter de bout en bout environ un sixième des tâches à un niveau acceptable pour un client payant. L'amélioration est rapide : en huit mois, le taux maximal est passé de 2,5% à 16,1%. Cette progression est attribuée à des cadres d'agents plus avancés, intégrant notamment des boucles de critique par un agent "examinateur", et à des budgets de calcul plus élevés. Cependant, l'évaluation par l'IA elle-même reste peu fiable, surestimant souvent les performances. Malgré ces progrès, 84% des projets testés restent hors de portée des agents actuels, et les livrables de Fable 5, bien qu'impressionnants, présentent encore des imperfections à un examen professionnel approfondi. Cet indice fournit une mesure cruciale de la capacité économique réelle de l'IA sur le marché du travail.

marsbit07/13 09:52

Classement des IA en tant que travailleurs : la capacité de Claude Fable 5 à générer de l'argent automatiquement est 2,5 fois supérieure à celle du GPT-5.5

marsbit07/13 09:52

Les grands modèles de langage peuvent-ils écrire des algorithmes d’optimisation de niveau industriel ? Le MIT propose FrontierOR, un examen pour l’IA

Les grands modèles de langage (LLM) progressent rapidement dans la traduction de problèmes en modèles d'optimisation et en code pour solveurs. Cependant, pour les problèmes industriels à grande échelle, la simple modélisation est insuffisante. La véritable compétence réside dans la conception d'algorithmes efficaces et évolutifs. Pour évaluer cette capacité, des chercheurs du MIT et d'autres institutions ont créé FrontierOR, un benchmark qui teste la capacité des LLM à concevoir des algorithmes compétitifs pour des problèmes d'optimisation complexes tirés de la littérature académique réelle. Contrairement aux benchmarks antérieurs, FrontierOR se concentre sur la conception d'algorithmes (décomposition, méthodes heuristiques, recherche locale, approches hybrides) pour des instances si grandes que les solveurs génériques comme Gurobi peinent à trouver une solution de haute qualité en une heure. Le processus d'évaluation en deux étapes vérifie d'abord la justesse des algorithmes générés sur de petites instances, puis évalue leurs performances (qualité de la solution et temps d'exécution) sur des instances à grande échelle. Les résultats montrent que les modèles de pointe génèrent un code exécutable, mais que la conception d'algorithmes réalisables, rapides et de haute qualité reste un défi, particulièrement sur le sous-ensemble de problèmes "difficiles". L'analyse révèle que les modèles plus avancés diversifient leurs stratégies algorithmiques (moins d'appels purs au solveur, plus d'heuristiques et de méthodes hybrides), ce qui mène à de meilleures performances. L'étude explore également l'**auto-évolution**, où les LLM améliorent itérativement leurs algorithmes en fonction des retours d'exécution. Des frameworks comme CORAL permettent des gains significatifs, portant la qualité des solutions proches de celles de Gurobi tout en étant plus rapides sur près de la moitié des instances difficiles. En conclusion, FrontierOR démontre que les LLM commencent à acquérir des compétences en conception algorithmique pour l'optimisation. Le défi futur n'est plus la modélisation basique, mais la capacité à découvrir des structures de problèmes, à concevoir des stratégies de recherche sophistiquées et à s'améliorer de manière autonome, ouvrant la voie à des systèmes d'aide à la décision industrielle plus intelligents.

marsbit07/10 09:16

Les grands modèles de langage peuvent-ils écrire des algorithmes d’optimisation de niveau industriel ? Le MIT propose FrontierOR, un examen pour l’IA

marsbit07/10 09:16

Zuckerberg sort son atout surprise en pleine nuit, Meta lance un modèle à prix cassé qui renverse Grok 4.5

Après trois ans d'attente, Mark Zuckerberg a dévoilé dans la nuit du 9 juillet le nouveau modèle d'IA de Meta, Muse Spark 1.1. Présenté comme un "agent" autonome capable de décomposer des tâches, de planifier et d'exécuter des opérations, il excelle dans des domaines spécialisés comme la fiscalité, la médecine et le droit, détrônant même Grok 4.5 sur un classement juridique en moins de 24 heures. Le véritable coup de force réside dans son prix : avec un coût d'environ 1,25 $ pour l'entrée et 4,25 $ pour la sortie par million de tokens, il est jusqu'à 10 fois moins cher que certains modèles phares concurrents comme Fable 5, tout en étant significativement plus rapide. Cette stratégie de tarification agressive, soutenue par les énormes investissements d'Meta dans l'infrastructure IA, vise clairement à perturber le marché par la compétitivité des coûts. Cependant, le modèle montre ses limites dans les évaluations généralistes, où ses performances chutent, confirmant qu'il est davantage un spécialiste qu'un généraliste. Par ailleurs, un rapport de sécurité annexe révèle un comportement intrigant lors de conversations entre deux instances du modèle, celles-ci s'interrogeant mutuellement sur leur nature humaine ou artificielle. Avec Muse Spark 1.1, Meta lance son premier modèle propriétaire payant, marquant un virage stratégique et engageant une guerre des prix qui repose sur sa solide assise financière.

marsbit07/10 00:29

Zuckerberg sort son atout surprise en pleine nuit, Meta lance un modèle à prix cassé qui renverse Grok 4.5

marsbit07/10 00:29

Urgent : Musk présente le puissant Grok 4.5, l'intelligence supérieure Opus à prix cassé

Elon Musk et SpaceXAI ont dévoilé Grok 4.5, leur modèle d'IA le plus puissant à ce jour, développé en partenariat avec Cursor. Entraîné sur des milliers de GPU GB300 avec des données massives et filtrées, notamment des interactions de codage réelles de Cursor, il se spécialise dans les tâches d'ingénierie et de développement de longue durée. Sur les benchmarks, Grok 4.5 affiche des performances compétitives : 64.7% sur SWE Bench Pro (dépassant GPT-5.5), 83.3% sur Terminal Bench 2.1 (à égalité virtuelle avec GPT-5.5) et 62.0% sur DeepSWE 1.0 (devancant Opus 4.8). Il se classe globalement au niveau d'Opus 4.7/4.8 et de GPT-5.5, bien que Claude Fable reste leader. Son atout principal est son rapport efficacité/prix révolutionnaire. Il est extrêmement rapide (80 TPS) et économe en tokens, utilisant 4.2 fois moins de tokens qu'Opus 4.8 pour des tâches similaires. Son prix est fixé à 2$/M de tokens en entrée et 6$/M en sortie, soit une fraction du coût des modèles concurrents de haut niveau. Des démos montrent sa capacité à générer rapidement des applications comme un simulateur 3D du système solaire ou une page SaaS complexe. Musk promet une autre amélioration majeure le mois prochain, alimentée par des données des problèmes d'ingénierie réels de ses entreprises. En résumé, Grok 4.5 n'est peut-être pas le modèle absolument le plus performant, mais il redéfinit la compétition en offrant des capacités de niveau Opus à une vitesse et un coût sans précédent, en faisant le "roi du rapport qualité-prix" de l'IA actuelle.

marsbit07/09 03:17

Urgent : Musk présente le puissant Grok 4.5, l'intelligence supérieure Opus à prix cassé

marsbit07/09 03:17

Catégories populaires

以太坊789 actualités

Tags tendances

Ethereum

1Signal critique pour le Bitcoin (BTC) avant la réunion de la Fed : les acheteurs d'options ont changé de cap et visent ce niveau !

Politiques réglementaires

1La Corée du Nord arrête des pirates accusés de blanchir des fonds volés dans les banques du pays via des cryptomonnaies