Pourquoi nous nous acharnons sur le nettoyage de données « ingrat et laborieux » ?

marsbitPublié le 2026-01-24Dernière mise à jour le 2026-01-24

Résumé

Pourquoi insistons-nous sur le nettoyage des données, un travail « fastidieux et ingrat » ? L’auteur, responsable des données chez RootData, partage les résultats de la 2e édition de leur programme de récompenses : 140 participants, 1 220 retours soumis, et 564 données validées (taux d’approbation de 46,2%). L’initiative a permis d’enrichir les profils de 300+ acteurs clés (dirigeants de MOMO.FUN, Subhub, boop, etc.), de corriger 120 informations sur les déblocages de jetons (dates de TGE, règles mal communiquées), et d’affiner 150 points de données existants (ex. : fondateur incorrectement identifié, compte Twitter obsolète). L’objectif est de renforcer la transparence dans le Web3, un défi complexe mais essentiel pour garantir le « droit à l’information des investisseurs ». Les données non vérifiées ou incohérentes (comme les variations dans les plateformes de suivi de déblocages) nuisent à la confiance. RootData constate aussi des changements fréquents d’équipes autour du TGE, un indicateur crucial pour les investisseurs. Pour pérenniser cet effort, RootData publie régulièrement des rapports sur les financements frauduleux, mène des études approfondies (ex. : rapport sur les décisions de listage), et améliore la vérification des profils LinkedIn. La plateforme collabore également avec des acteurs majeurs comme Binance pour valider les données. À terme, l’ambition est de transformer des points de données épars en rapports structurés, voire en stratégies d’investissement, ...

Auteur : @BlockCookies

Bonjour à tous, je suis le responsable des activités de données chez RootData.

La 2e édition de l'événement à récompenses de RootData s'est achevée avec succès. En publiant ce bilan, plutôt que de simples chiffres froids, j'aimerais davantage discuter avec vous de : Pourquoi promouvoir la « transparence des données » dans le Web3 est-il une tâche extrêmement difficile, mais qu'il faut absolument que quelqu'un accomplisse ?

Tout d'abord, voici les données de cet événement : Plus de 140 utilisateurs indépendants ont participé, fournissant 1220 retours, finalisant 564 données valides, avec un taux moyen d'approbation de 46,2 %.

Aperçu général des données de la 2e édition de l'événement à récompenses

Cet événement a permis à RootData de compléter les informations sur près de 300 « personnes derrière l'Alpha », comme les équipes dirigeantes de MOMO.FUN, Subhub, boop, etc. Ces personnes n'indiquent généralement pas leur poste dans leur bio X ou LinkedIn, mais peuvent participer à des événements ou être actives dans des communautés.

Nous avons également corrigé environ 120 informations de déverrouillage de jetons. Certaines concernaient une date de TGE peu précise, d'autres des règles de déverrouillage non divulguées immédiatement ; tous ces problèmes ont été résolus grâce à la force de la communauté.

De plus, nous avons optimisé en profondeur 150 points d'information existants. Par exemple, nous avons découvert que le fondateur de Fanable était incorrectement enregistré comme étant une personne homonyme hors Web3, et que son directeur général Sergio avait quitté ses fonctions ; le projet AINFT avait déjà changé de compte Twitter...

Pourquoi promouvons-nous la transparence dans le domaine du Web3 ? Ces données peuvent sembler banales, et RootData est本身 un expert de l'agrégation de données off-chain. Alors pourquoi dépenser notre propre argent et mobiliser la communauté pour ce genre de « travail ingrat » ?

Honnêtement, quand mon patron @yubopan1 m'a confié cette tâche, j'ai aussi hésité. Mais une de ses phrases m'a profondément touché :« De l'ère des ICO à l'affaire FTX, la plus grande tragédie pour les utilisateurs est de ne pas obtenir un 'droit à l'information équitable' en matière d'investissement. Avec la conformité croissante de la crypto, les plateformes de données doivent être en première ligne, faire office de miroir révélateur. »

En tant que responsable des données, je peux sentir profondément que son jugement est correct :Une seule source ne suffit pas à garantir l'exactitude. Des données non vérifiées par multiple sources ne permettent pas à RootData de devenir une plateforme digne de confiance pour les investisseurs.

Rien qu'en prenant l'exemple des données de déverrouillage de jetons, c'est très « fragmenté » : pour un même projet, sur 5 plateformes de déverrouillage principales sur le marché, les données peuvent avoir 5 versions différentes.

Comme on le sait, le listing sur Binance nécessite de soumettre au moins 3 membres de l'équipe. RootData a recensé plus de 18 000 personnalités de l'industrie. Combien mettent à jour leur CV en urgence juste avant le TGE, et combien « partent silencieusement » après avoir obtenu le financement ?

Lors de cet événement, nous avons constaté :De nombreux projets connaissent des changements fréquents de membres clés autour du TGE. Pour les investisseurs, c'est souvent un « indicateur » de la direction que prend le projet. Si personne ne vérifie et ne divulgue ces informations, elles seront noyées dans le flux d'information explosif quotidien.

Pour garantir que la « transparence » ne reste pas qu'un slogan, les solutions que nous mettons actuellement en œuvre incluent :

  • La publication mensuelle des renseignements sur les financements frauduleux.
  • Des études approfondies régulières, comme le récent « Rapport sur les décisions de listing des exchanges ».
  • L'augmentation de la fréquence de collecte et de vérification des dynamiques des profils LinkedIn.

De plus, nous maintenons une attitude d'audit rigoureuse. Lors de cet événement, un utilisateur a fourni des informations détaillées sur l'équipe de développement de River, mais sa source n'était qu'une publication d'un compte tiers sur Binance Square. Bien que le contenu fût détaillé, faute de soutien officiel ou de vérification croisée multiple, nous avons choisi de ne pas l'approuver.

Cet événement était axé sur l'« Alpha de Binance », et nous avons également tenté de communiquer avec l'équipe de Binance. Nous ne voulions pas cibler spécifiquement un exchange, au contraire, nous espérons nous tenir aux côtés des géants de l'industrie.

Nous avons contacté l'équipe de Binance pour confirmer certains points clés, et leur retour a été très positif : « Si vous avez besoin de confirmer des informations concernant l'Alpha, n'hésitez pas à nous contacter à tout moment. »

La correction ponctuelle de données n'est qu'un début. À l'avenir, RootData transformera les « points de données discrets » en « rapports de transparence à la logique rigoureuse », voire en stratégies d'investissement concrètes.

La transparence est un combat de longue haleine, et une voie incontournable pour que le Web3 devienne mainstream. Nous avons besoin que plus de « chasseurs de données » nous rejoignent pour dissiper ensemble le brouillard. N'hésitez pas à discuter et à laisser vos commentaires.

Questions liées

QPourquoi RootData s'engage-t-il dans le nettoyage de données en Web3, malgré les difficultés ?

ARootData croit que la transparence des données est cruciale pour garantir le 'droit à l'information des investisseurs', souvent compromis depuis l'ère des ICO jusqu'au scandale FTX. Bien que complexe, cette démarche est essentielle pour construire une plateforme fiable et accompagner la maturation du Web3.

QQuels résultats la 2ème édition de l'événement de prime RootData a-t-elle obtenus ?

AL'événement a mobilisé plus de 140 participants, généré 1220 retours et validé 564 données efficaces, soit un taux d'approbation de 46,2%. Il a permis d'ajouter 300+ profils de leaders, de corriger 120 informations sur les déblocages de jetons et d'optimiser 150 points de données existants.

QQuels défis spécifiques en matière de transparence des données RootData a-t-il identifiés ?

ARootData constate une incohérence frappante des données, comme 5 versions différentes des calendriers de déblocage de jetons pour un même projet sur différentes plateformes. Il note également des changements fréquents des membres clés des projets autour du TGE, des informations souvent non divulguées.

QComment RootData garantit-il la fiabilité des informations collectées ?

ARootData applique une vérification rigoureuse et multicouche. Par exemple, il rejette les informations provenant de sources uniques non officielles (comme un compte tiers sur Binance Square) sans corroboration par d'autres sources ou validation officielle.

QQuelles sont les prochaines étapes pour RootData dans sa quête de transparence ?

ARootData vise à transformer les points de données discrets en 'rapports de transparence à la logique rigoureuse' et même en stratégies d'investissement concrètes. Il souhaite également collaborer avec des acteurs majeurs comme Binance pour confirmer les informations critiques.

Lectures associées

Un plugin open source déclenche une guerre secrète des grands modèles : Derrière la popularité de Claude-mem se cache le secret de profit que les géants de l'IA ne veulent pas révéler

Le plugin open source Claude-mem, apparu discrètement en septembre 2025, a connu une explosion de popularité en avril 2026 avec plus de 62 000 étoiles sur GitHub. Bien plus qu’un simple outil contre « l’amnésie » des IA, il contourne astucieusement le modèle économique des géants de l’IA en réduisant de 95 % la consommation de tokens — ces unités de calcul facturées aux utilisateurs. Claude-mem agit comme un « barrage numérique » local : il surveille et compresse les historiques de conversation dans une base SQLite, évitant ainsi de renvoyer inutilement de longs contextes à chaque nouvelle interaction. Cette approche élimine ce que l’article nomme la « taxe contexte », une source de revenus opaque pour les entreprises comme Anthropic. La combinaison de Claude-mem avec OpenClaw, un outil d’automatisation, a permis à des développeurs d'exploiter massivement les API à moindre coût, déclenchant une réaction brutale : Anthropic a bloqué les accès tiers et même procédé à des suspensions de comptes. Face à cette opposition, le créateur de Claude-mem, empêché de monétiser son projet via une licence AGPL stricte, s’est tourné vers la cryptomonnaie en lançant le jeton $CMEM sur Solana — une tentative de la ferveur communautaire en valeur financière, bien que très risquée. L’affaire révèle les batailles souterraines du secteur : la maîtrise des coûts de calcul, la souveraineté des données locales et les dangers de la dépendance aux API fermées seront des enjeux clés dans la guerre de l’IA.

marsbitIl y a 2 h

Un plugin open source déclenche une guerre secrète des grands modèles : Derrière la popularité de Claude-mem se cache le secret de profit que les géants de l'IA ne veulent pas révéler

marsbitIl y a 2 h

Trading

Spot
Futures
活动图片