Pourquoi nous nous acharnons sur le nettoyage de données « ingrat et laborieux » ?

marsbitPublié le 2026-01-24Dernière mise à jour le 2026-01-24

Résumé

Pourquoi insistons-nous sur le nettoyage des données, un travail « fastidieux et ingrat » ? L’auteur, responsable des données chez RootData, partage les résultats de la 2e édition de leur programme de récompenses : 140 participants, 1 220 retours soumis, et 564 données validées (taux d’approbation de 46,2%). L’initiative a permis d’enrichir les profils de 300+ acteurs clés (dirigeants de MOMO.FUN, Subhub, boop, etc.), de corriger 120 informations sur les déblocages de jetons (dates de TGE, règles mal communiquées), et d’affiner 150 points de données existants (ex. : fondateur incorrectement identifié, compte Twitter obsolète). L’objectif est de renforcer la transparence dans le Web3, un défi complexe mais essentiel pour garantir le « droit à l’information des investisseurs ». Les données non vérifiées ou incohérentes (comme les variations dans les plateformes de suivi de déblocages) nuisent à la confiance. RootData constate aussi des changements fréquents d’équipes autour du TGE, un indicateur crucial pour les investisseurs. Pour pérenniser cet effort, RootData publie régulièrement des rapports sur les financements frauduleux, mène des études approfondies (ex. : rapport sur les décisions de listage), et améliore la vérification des profils LinkedIn. La plateforme collabore également avec des acteurs majeurs comme Binance pour valider les données. À terme, l’ambition est de transformer des points de données épars en rapports structurés, voire en stratégies d’investissement, ...

Auteur : @BlockCookies

Bonjour à tous, je suis le responsable des activités de données chez RootData.

La 2e édition de l'événement à récompenses de RootData s'est achevée avec succès. En publiant ce bilan, plutôt que de simples chiffres froids, j'aimerais davantage discuter avec vous de : Pourquoi promouvoir la « transparence des données » dans le Web3 est-il une tâche extrêmement difficile, mais qu'il faut absolument que quelqu'un accomplisse ?

Tout d'abord, voici les données de cet événement : Plus de 140 utilisateurs indépendants ont participé, fournissant 1220 retours, finalisant 564 données valides, avec un taux moyen d'approbation de 46,2 %.

Aperçu général des données de la 2e édition de l'événement à récompenses

Cet événement a permis à RootData de compléter les informations sur près de 300 « personnes derrière l'Alpha », comme les équipes dirigeantes de MOMO.FUN, Subhub, boop, etc. Ces personnes n'indiquent généralement pas leur poste dans leur bio X ou LinkedIn, mais peuvent participer à des événements ou être actives dans des communautés.

Nous avons également corrigé environ 120 informations de déverrouillage de jetons. Certaines concernaient une date de TGE peu précise, d'autres des règles de déverrouillage non divulguées immédiatement ; tous ces problèmes ont été résolus grâce à la force de la communauté.

De plus, nous avons optimisé en profondeur 150 points d'information existants. Par exemple, nous avons découvert que le fondateur de Fanable était incorrectement enregistré comme étant une personne homonyme hors Web3, et que son directeur général Sergio avait quitté ses fonctions ; le projet AINFT avait déjà changé de compte Twitter...

Pourquoi promouvons-nous la transparence dans le domaine du Web3 ? Ces données peuvent sembler banales, et RootData est本身 un expert de l'agrégation de données off-chain. Alors pourquoi dépenser notre propre argent et mobiliser la communauté pour ce genre de « travail ingrat » ?

Honnêtement, quand mon patron @yubopan1 m'a confié cette tâche, j'ai aussi hésité. Mais une de ses phrases m'a profondément touché :« De l'ère des ICO à l'affaire FTX, la plus grande tragédie pour les utilisateurs est de ne pas obtenir un 'droit à l'information équitable' en matière d'investissement. Avec la conformité croissante de la crypto, les plateformes de données doivent être en première ligne, faire office de miroir révélateur. »

En tant que responsable des données, je peux sentir profondément que son jugement est correct :Une seule source ne suffit pas à garantir l'exactitude. Des données non vérifiées par multiple sources ne permettent pas à RootData de devenir une plateforme digne de confiance pour les investisseurs.

Rien qu'en prenant l'exemple des données de déverrouillage de jetons, c'est très « fragmenté » : pour un même projet, sur 5 plateformes de déverrouillage principales sur le marché, les données peuvent avoir 5 versions différentes.

Comme on le sait, le listing sur Binance nécessite de soumettre au moins 3 membres de l'équipe. RootData a recensé plus de 18 000 personnalités de l'industrie. Combien mettent à jour leur CV en urgence juste avant le TGE, et combien « partent silencieusement » après avoir obtenu le financement ?

Lors de cet événement, nous avons constaté :De nombreux projets connaissent des changements fréquents de membres clés autour du TGE. Pour les investisseurs, c'est souvent un « indicateur » de la direction que prend le projet. Si personne ne vérifie et ne divulgue ces informations, elles seront noyées dans le flux d'information explosif quotidien.

Pour garantir que la « transparence » ne reste pas qu'un slogan, les solutions que nous mettons actuellement en œuvre incluent :

  • La publication mensuelle des renseignements sur les financements frauduleux.
  • Des études approfondies régulières, comme le récent « Rapport sur les décisions de listing des exchanges ».
  • L'augmentation de la fréquence de collecte et de vérification des dynamiques des profils LinkedIn.

De plus, nous maintenons une attitude d'audit rigoureuse. Lors de cet événement, un utilisateur a fourni des informations détaillées sur l'équipe de développement de River, mais sa source n'était qu'une publication d'un compte tiers sur Binance Square. Bien que le contenu fût détaillé, faute de soutien officiel ou de vérification croisée multiple, nous avons choisi de ne pas l'approuver.

Cet événement était axé sur l'« Alpha de Binance », et nous avons également tenté de communiquer avec l'équipe de Binance. Nous ne voulions pas cibler spécifiquement un exchange, au contraire, nous espérons nous tenir aux côtés des géants de l'industrie.

Nous avons contacté l'équipe de Binance pour confirmer certains points clés, et leur retour a été très positif : « Si vous avez besoin de confirmer des informations concernant l'Alpha, n'hésitez pas à nous contacter à tout moment. »

La correction ponctuelle de données n'est qu'un début. À l'avenir, RootData transformera les « points de données discrets » en « rapports de transparence à la logique rigoureuse », voire en stratégies d'investissement concrètes.

La transparence est un combat de longue haleine, et une voie incontournable pour que le Web3 devienne mainstream. Nous avons besoin que plus de « chasseurs de données » nous rejoignent pour dissiper ensemble le brouillard. N'hésitez pas à discuter et à laisser vos commentaires.

Questions liées

QPourquoi RootData s'engage-t-il dans le nettoyage de données en Web3, malgré les difficultés ?

ARootData croit que la transparence des données est cruciale pour garantir le 'droit à l'information des investisseurs', souvent compromis depuis l'ère des ICO jusqu'au scandale FTX. Bien que complexe, cette démarche est essentielle pour construire une plateforme fiable et accompagner la maturation du Web3.

QQuels résultats la 2ème édition de l'événement de prime RootData a-t-elle obtenus ?

AL'événement a mobilisé plus de 140 participants, généré 1220 retours et validé 564 données efficaces, soit un taux d'approbation de 46,2%. Il a permis d'ajouter 300+ profils de leaders, de corriger 120 informations sur les déblocages de jetons et d'optimiser 150 points de données existants.

QQuels défis spécifiques en matière de transparence des données RootData a-t-il identifiés ?

ARootData constate une incohérence frappante des données, comme 5 versions différentes des calendriers de déblocage de jetons pour un même projet sur différentes plateformes. Il note également des changements fréquents des membres clés des projets autour du TGE, des informations souvent non divulguées.

QComment RootData garantit-il la fiabilité des informations collectées ?

ARootData applique une vérification rigoureuse et multicouche. Par exemple, il rejette les informations provenant de sources uniques non officielles (comme un compte tiers sur Binance Square) sans corroboration par d'autres sources ou validation officielle.

QQuelles sont les prochaines étapes pour RootData dans sa quête de transparence ?

ARootData vise à transformer les points de données discrets en 'rapports de transparence à la logique rigoureuse' et même en stratégies d'investissement concrètes. Il souhaite également collaborer avec des acteurs majeurs comme Binance pour confirmer les informations critiques.

Lectures associées

Analyse de la croissance de Notion : D'un outil de prise de notes à 100 millions d'utilisateurs, comment Notion a construit sa triple roue de croissance via le produit, les modèles et la communauté

Notion est passé d'un outil de prise de notes à une plateforme de gestion des connaissances et de collaboration comptant 100 millions d'utilisateurs, grâce à un système de croissance à trois niveaux. La croissance a été principalement tirée par le produit (PLG) : sa structure modulaire offre une grande adaptabilité, sa stratégie gratuite a facilité l'adoption et ses fonctionnalités de partage et de collaboration ont généré une diffusion virale naturelle. Le deuxième moteur est l'économie des modèles. Face à la liberté parfois déroutante du produit, les modèles (officiels et créés par les utilisateurs) fournissent des solutions concrètes, réduisant les coûts d'activation pour les nouveaux venus et créant un canal de croissance via les moteurs de recherche. Ils ont également permis l'émergence d'une communauté de créateurs qui soutient l'écosystème. Le troisième moteur est la croissance communautaire. La communauté Notion va au-delà du support technique : elle produit des tutoriels, organise des événements locaux via des ambassadeurs et participe à la traduction culturelle du produit. Elle transforme les utilisateurs en éducateurs et en promoteurs, réduisant ainsi les coûts d'expansion mondiale. Le marketing de contenu de Notion se concentre sur l'éducation aux méthodes de travail plutôt que sur la vente de fonctionnalités. Son passage au marché professionnel s'est fait "par le bas", les équipes adoptant d'abord l'outil avant que les entreprises ne formalisent son usage. À l'ère de l'IA, Notion intègre ces capacités dans ses flux de travail existants, renforçant sa valeur et ouvrant la voie à une évolution potentielle vers un système d'exploitation du travail. La force durable de Notion réside dans cet écosystème difficile à répliquer : la combinaison d'un produit flexible, d'un vaste patrimoine de connaissances utilisateur, d'une économie de modèles dynamique et d'une communauté engagée crée un effet de levier et une fidélité qui vont bien au-delà de simples fonctionnalités logicielles.

marsbitIl y a 1 h

Analyse de la croissance de Notion : D'un outil de prise de notes à 100 millions d'utilisateurs, comment Notion a construit sa triple roue de croissance via le produit, les modèles et la communauté

marsbitIl y a 1 h

Guide de test pratique de la carte AI de WeChat : L'ère du AI Shopping est-elle arrivée ?

**Titre :** Guide de test de la carte AI de WeChat : l'ère du "AI Shopping" est-elle arrivée ? **Résumé :** WeChat Pay a lancé une "carte AI dédiée", présentée comme permettant à des agents IA (comme WorkBuddy) d'effectuer des paiements pour répondre aux besoins des utilisateurs. Cependant, les tests révèlent que cela ne permet pas une consommation "entièrement automatique". En réalité, la carte AI est un portefeuille séparé du portefeuille WeChat principal. L'utilisateur doit la recharger avec des fonds spécifiques. Chaque paiement initié par l'IA nécessite une confirmation manuelle sur le téléphone de l'utilisateur. La carte isole les dépenses liées à l'IA pour une meilleure gestion. L'activation se fait via le chatbot WorkBuddy. Les cas d'usage annoncés sont l'achat de contenu payant, l'utilisation d'API/outils payants et les abonnements. Cependant, dans la pratique, il est difficile de déclencher ces paiements. Un test pour commander un thé via WorkBuddy a échoué. L'agent a dû utiliser une compétence externe ("Assistant de vie Meituan"), ce qui a consommé beaucoup de crédits (plus que l'allocation quotidienne gratuite). Après autorisation et paiement via la carte AI, l'agent a acheté un bon d'achat incorrect, pas le produit désiré. L'échec ne vient pas de la fonction de paiement elle-même, qui fonctionne, mais de la chaîne d'exécution de l'agent IA : compréhension précise du besoin, appel correct à des plateformes tierces, sélection du bon produit, etc. La carte AI ne gère que l'étape finale du paiement. Le mécanisme actuel est prudent : fonds limités à la carte AI, confirmation obligatoire pour chaque transaction, pas d'accès direct au portefeuille principal. Cela minimise les risques (mauvais achats, abonnements non désirés). **Conclusion/Recommandations :** Il est possible d'expérimenter cette fonction, mais avec prudence : commencez par de petites recharges, vérifiez toujours les détails (produit, prix) avant de confirmer le paiement, et ne présumez pas que l'agent IA a parfaitement compris une demande complexe (notamment pour la livraison, les coupons spécifiques).

marsbitIl y a 1 h

Guide de test pratique de la carte AI de WeChat : L'ère du AI Shopping est-elle arrivée ?

marsbitIl y a 1 h

Un portefeuille lié à Arthur Hayes et des baleines accumulent des dizaines de millions en ETH

L'activité des baleines d'Ethereum est à nouveau sous les projecteurs. Le tracker on-chain Lookonchain a signalé qu'un portefeuille lié à Arthur Hayes a accumulé 1 400 ETH supplémentaires, d'une valeur d'environ 2,51 millions de dollars. Cela s'ajoute à une transaction précédente de 3 000 ETH potentiellement liée au même individu. Bien que l'attribution publique des portefeuilles doive être interprétée avec prudence en l'absence de confirmation directe, cette activité attire l'attention des traders. Les achats de baleines sont souvent interprétés comme un signal potentiel de stabilisation du marché lorsque les prix sont déprimés, suggérant que les acteurs importants perçoivent de la valeur. Cependant, ces mouvements isolés doivent s'inscrire dans un schéma d'accumulation plus large pour avoir un impact significatif. Le marché reste volatile et l'ETH doit encore reconquérir ses résistances techniques. Pour les observateurs, l'aspect positif serait que cette demande on-chain commence à absorber la pression vendeuse. Le prochain point de vigilance sera de vérifier si ces retraits d'ETH des plateformes d'échange centralisées indiquent un positionnement à plus long terme ou des mouvements plus temporaires. En résumé, l'activité des baleines est un élément à suivre, mais elle doit être confirmée par une amélioration de l'action des prix et une demande élargie pour soutenir une reprise durable.

bitcoinistIl y a 3 h

Un portefeuille lié à Arthur Hayes et des baleines accumulent des dizaines de millions en ETH

bitcoinistIl y a 3 h

Trading

Spot
Futures
活动图片