Auteur : 137Labs
Fin juin 2026, Chainalysis a publié un cadre de données intitulé « Blockchain Tracing Ontology (Ontologie du traçage blockchain) », visant à établir un système de description des données plus uniforme pour l'analyse blockchain. Comparé aux lancements précédents de nouveaux produits ou fonctionnalités, ce document ressemble davantage à une initiative de normalisation sectorielle : il tente de redéfinir les concepts fondamentaux de l'analyse des données on-chain et d'établir un modèle de données explicable, vérifiable et reproductible pour le traçage blockchain.
Après sa publication, cette proposition est rapidement devenue un sujet d'attention dans les domaines de l'analyse blockchain et de la conformité des actifs numériques. Bien qu'elle en soit encore au stade de la discussion publique et de l'initiative sectorielle, elle amène déjà à reconsidérer la question : l'analyse on-chain a-t-elle besoin d'un ensemble de normes de données plus unifiées et transparentes ?
Un problème de longue date : pourquoi différentes entreprises parviennent-elles à des résultats d'analyse différents ?
Les données blockchain sont naturellement publiques et transparentes, mais leur interprétation manque toujours de normes unifiées.
Actuellement, la plupart des plateformes d'analyse on-chain utilisent la technique du « Clustering d'adresses (Regroupement d'adresses) », déduisant par le comportement transactionnel quelles adresses sont probablement contrôlées par la même entité. Cependant, les algorithmes, règles et sources de preuves adoptés par différentes institutions ne sont pas uniformes, ce qui peut aboutir à des attributions totalement différentes pour une même adresse selon les plateformes.
Par exemple, un analyste pourrait estimer qu'une adresse appartient à une grande plateforme d'échange, tandis qu'un autre la marquerait comme un portefeuille inconnu ; un même ensemble d'adresses pourrait également être réparti dans des Clusters différents selon les plateformes. Ces divergences ont un impact limité sur l'analyse de marché, mais dès qu'il s'agit d'enquêtes judiciaires, de gel d'actifs, de lutte contre le blanchiment d'argent ou de recueil de preuves pour l'application de la loi, elles peuvent susciter d'importantes controverses.
Pour un tribunal, conclure simplement que « ceci est un portefeuille d'une certaine plateforme d'échange » est loin d'être suffisant. Une question plus importante est : pourquoi peut-on aboutir à une telle conclusion ?
Ce que Chainalysis propose n'est pas un nouvel algorithme, mais un « langage »
En voyant le mot « Ontologie », beaucoup pourraient penser à tort que Chainalysis propose à nouveau un nouvel algorithme de clustering. Ce n'est pas le cas.
L'Ontologie est un concept du domaine de l'ingénierie des connaissances, désignant un système unifié de concepts et de modèles de relations, visant à normaliser la définition des différents objets et leurs modes de liaison. La recherche sur Internet, les bases de connaissances médicales, voire les graphes de connaissances de l'intelligence artificielle, utilisent abondamment l'Ontologie pour garantir une compréhension unifiée des données.
Ce que Chainalysis souhaite faire, c'est établir un « langage commun » similaire pour l'analyse blockchain.
Autrement dit, il ne s'agit pas d'imposer à toutes les entreprises d'adopter le même algorithme de clustering, mais plutôt de les inciter à exprimer les résultats d'analyse selon une structure de données unifiée, rendant le processus d'analyse plus transparent et facilitant la compréhension, la vérification et la reproduction par des tiers.
Le « Cluster » ne suffit plus
Par le passé, le secteur utilisait couramment le « Cluster (regroupement d'adresses) » comme unité fondamentale d'analyse, considérant que plusieurs adresses appartenaient à un même portefeuille ou à une même entité.
Bien que cette méthode soit simple et intuitive, ses limites deviennent de plus en plus évidentes avec le développement des infrastructures blockchain.
Aujourd'hui, l'architecture des portefeuilles d'une grande plateforme d'échange peut inclure des millions d'adresses, assumant des fonctions totalement différentes comme les dépôts, les retraits, la gestion des portefeuilles chauds/froids, la consolidation ou la monnaie rendue. Si on les regroupe simplement dans un seul Cluster, il devient difficile de décrire avec précision la structure complexe des portefeuilles.
C'est pourquoi Chainalysis introduit dans sa proposition le nouveau concept de « Segment de portefeuille (Wallet Segment) ».
Dans le nouveau modèle, une entité peut posséder plusieurs portefeuilles, chaque portefeuille pouvant être divisé en plusieurs Segments, et chaque Segment contenant des adresses spécifiques. Cette structure hiérarchique reflète plus fidèlement que le Cluster traditionnel le mode de gestion des portefeuilles des grandes institutions et permet de décrire plus finement les relations de contrôle entre différentes adresses.
De la « crédibilité du résultat » vers la « crédibilité du processus »
Plus important que le modèle lui-même est le changement intervenant au niveau de la seconde couche de conception.
L'analyse on-chain traditionnelle s'intéresse davantage au résultat final – à qui appartient l'adresse, où vont les fonds, s'ils sont liés à des activités illégales.
La nouvelle Ontologie met davantage l'accent sur le processus d'inférence lui-même.
Pour chaque résultat d'analyse, plusieurs questions doivent être explicitement abordées :
- Sur quelles preuves on-chain cette conclusion s'appuie-t-elle ?
- Quelles règles d'analyse ont été utilisées ?
- Des informations off-chain sont-elles citées ?
- Quel est le niveau de confiance de cette inférence ?
- Un tiers peut-il revalider ce processus ?
En d'autres termes, il ne suffit pas de dire « quoi », il faut aussi expliquer « pourquoi ».
Chainalysis nomme cette partie la couche « Preuve (Evidence) » et « Niveau de confiance (Confidence) ».
À l'avenir, une adresse étiquetée comme portefeuille d'échange ne sera plus un simple label, mais sera accompagnée des justifications complètes de l'inférence, incluant les modèles de transaction, les relations entre adresses, les informations publiques, les dossiers d'enquête, etc., ainsi qu'un niveau de confiance correspondant. Cette conception répond mieux aux exigences d'explicabilité des preuves judiciaires et facilite la vérification croisée entre différentes institutions.
Les leçons de l'affaire Bitcoin Fog
En réalité, cette proposition n'est pas née de nulle part ; elle est étroitement liée à la célèbre affaire américaine de blanchiment d'argent Bitcoin Fog.
Bitcoin Fog fut l'un des services de mixage de bitcoins ayant duré le plus longtemps. Le ministère américain de la Justice a largement utilisé les résultats d'analyse de Chainalysis Reactor comme preuves clés durant l'enquête.
Lors du procès, le tribunal a tenu la célèbre audience Daubert, examinant rigoureusement la méthodologie d'analyse de Chainalysis, notamment :
- Le clustering d'adresses a-t-il une base scientifique ;
- La méthode d'analyse est-elle reproductible ;
- Relève-t-elle d'un « algorithme boîte noire » inexplicable ;
- D'autres experts peuvent-ils reproduire indépendamment le processus d'analyse.
Finalement, le tribunal a reconnu que la méthode d'analyse de Chainalysis présentait une fiabilité scientifique suffisante pour être utilisée comme preuve judiciaire.
Cependant, cette affaire a également révélé un problème sectoriel : si différents analystes adoptent des normes différentes, les futurs cas similaires pourraient faire face à davantage de contestations. Ainsi, établir un cadre unifié d'expression des données et de preuve est devenu un contexte important pour la promotion de l'Ontologie par Chainalysis.
L'analyse blockchain ne peut identifier directement une identité réelle
Il est à noter que Chainalysis souligne particulièrement un point dans cette proposition : l'analyse on-chain ne peut pas directement identifier une personne dans le monde réel.
Les données on-chain ne peuvent révéler que les relations entre adresses et les chemins de flux de fonds. Quant au contrôleur réel derrière une adresse, cela dépend généralement de preuves off-chain, telles que les informations KYC des plateformes d'échange, les données obtenues par décision de justice, les journaux de serveur obtenus par les autorités, etc.
Cela signifie que l'analyse blockchain fournit une inférence de données de haute qualité, et non une preuve ultime établissant directement l'identité. Une chaîne de preuves judiciaire complète nécessite la combinaison des données on-chain et de l'enquête off-chain.
De la qualité des données vers une norme sectorielle
Au-delà de l'Ontologie elle-même, le cadre global proposé développe systématiquement des aspects liés à la qualité des données, à la transparence de l'analyse et à l'admissibilité judiciaire. On voit que Chainalysis souhaite inciter le secteur à se concentrer non seulement sur les résultats d'analyse, mais aussi sur la capacité du processus d'analyse à être expliqué, vérifié et reproduit.
Cela montre également que l'avenir de la concurrence sectorielle pourrait ne plus se jouer seulement sur « qui couvre plus d'adresses » ou « qui identifie plus d'étiquettes », mais sur « qui a la meilleure qualité de données », « qui analyse de manière plus transparente » et « dont les preuves sont plus facilement acceptées par les tribunaux ».
Pour les régulateurs, les services répressifs et les grandes institutions financières, un système capable d'expliquer la logique d'analyse, de supporter un audit indépendant et de permettre une vérification reproductible est évidemment plus digne de confiance qu'un « modèle boîte noire » ne fournissant que des résultats.
Que signifie cette proposition ?
D'un point de vue plus large, ce que Chainalysis publie cette fois n'est pas une simple mise à jour logicielle, mais ressemble davantage à une tentative de faire évoluer le secteur de l'analyse blockchain d'une approche « guidée par l'expérience » vers une approche « guidée par des normes ».
Si cette Ontologie est finalement largement adoptée par le secteur, différents analystes, plateformes d'échange, organismes de régulation et même autorités judiciaires pourront partager des résultats d'analyse dans un modèle de données unifié, réduisant les coûts de communication, améliorant la cohérence des preuves et fournissant une base plus fiable pour l'application transfrontalière de la loi, les enquêtes de lutte contre le blanchiment d'argent et la régulation des actifs numériques.
Bien sûr, l'établissement de normes n'est pas instantané. Trouver un équilibre entre secret commercial et transparence, inciter différentes institutions à adopter des normes uniformes, et perfectionner continuellement le modèle de preuve nécessiteront une exploration collective du secteur.
Mais une chose est sûre : à mesure que les actifs numériques s'intègrent progressivement au système financier mondial, l'enjeu de la concurrence dans l'analyse blockchain évolue. À l'avenir, ce qui déterminera vraiment la valeur du secteur ne sera pas seulement la précision des algorithmes, mais aussi l'explicabilité du processus d'analyse, la qualité des données et la crédibilité des preuves. Et c'est précisément la nouvelle orientation que Chainalysis espère ouvrir avec sa Blockchain Tracing Ontology.





