Autor: 137Labs
A finales de junio de 2026, Chainalysis hizo público un marco de datos denominado Blockchain Tracing Ontology (Ontología del Rastreo en Blockchain), con el que pretende establecer un sistema de descripción de datos más unificado para el análisis de blockchain. A diferencia de los nuevos productos o funciones lanzados anteriormente, este documento se asemeja más a una iniciativa de estandarización sectorial: intenta redefinir los conceptos básicos del análisis de datos on-chain y establecer un modelo de datos interpretable, verificable y reproducible para el rastreo en blockchain.
Tras su publicación, esta propuesta se convirtió rápidamente en un tema de interés en el ámbito del análisis de blockchain y la normativa sobre activos digitales. Aunque actualmente se encuentra aún en una fase de discusión pública e iniciativa sectorial, ya ha llevado a muchos a replantearse: ¿necesita el análisis on-chain un conjunto de estándares de datos más unificados y transparentes?
Un problema de larga data: ¿Por qué diferentes compañías obtienen resultados de análisis distintos?
Los datos de blockchain son intrínsecamente transparentes y públicos, pero ha existido una falta de estándares unificados sobre cómo interpretarlos.
En la actualidad, la mayoría de las plataformas de análisis on-chain utilizan la tecnología de "Agrupación de Direcciones" (Address Clustering), deduciendo a partir del comportamiento transaccional qué direcciones podrían estar controladas por el mismo sujeto. Sin embargo, los algoritmos, reglas y fuentes de evidencia empleadas por diferentes instituciones no son consistentes, por lo que la misma dirección puede corresponder a resultados de atribución completamente distintos en diferentes plataformas.
Por ejemplo, una firma de análisis podría considerar que una dirección pertenece a un gran exchange, mientras que otra la etiquetaría como una wallet desconocida; un mismo conjunto de direcciones también podría clasificarse en distintos clusters en diferentes plataformas. Estas diferencias tienen un impacto limitado en el análisis de mercado, pero cuando se trata de investigaciones judiciales, congelación de activos, lucha contra el blanqueo de capitales o pruebas en procesos legales, pueden generar importantes controversias.
Para un tribunal, no es suficiente presentar simplemente la conclusión de que "esta es la wallet de cierto exchange"; es más importante responder a otra pregunta: ¿Por qué se puede llegar a tal conclusión?
Lo que propone Chainalysis no es un nuevo algoritmo, sino un "lenguaje"
Muchos, al ver la palabra "Ontología" (Ontology), pueden malinterpretar que Chainalysis ha propuesto un nuevo algoritmo de agrupación. En realidad, no es así.
La Ontología es un concepto del campo de la ingeniería del conocimiento, que se refiere a un sistema unificado de conceptos y un modelo de relaciones para estandarizar las definiciones de diferentes objetos y la forma en que se relacionan. La búsqueda en internet, las bases de conocimiento médico e incluso los grafos de conocimiento de la inteligencia artificial utilizan ampliamente la ontología para garantizar que los datos puedan entenderse de manera uniforme.
Lo que Chainalysis pretende hacer es establecer un "lenguaje común" similar para el análisis de blockchain.
En otras palabras, no se trata de dictar que todas las empresas deben usar el mismo algoritmo de agrupación, sino de que todas expresen sus resultados de análisis de acuerdo con una estructura de datos unificada, haciendo el proceso de análisis más transparente y facilitando que terceros lo comprendan, verifiquen y reproduzcan.
El "Cluster" ya no es suficiente
En el pasado, la industria adoptaba comúnmente el "Cluster" o grupo de direcciones como unidad básica de análisis, asumiendo que múltiples direcciones pertenecían conjuntamente a una wallet o una entidad.
Aunque este método es simple e intuitivo, sus limitaciones se han hecho cada vez más evidentes con el desarrollo de la infraestructura blockchain.
Hoy en día, el sistema de wallets de un gran exchange puede contener millones de direcciones, y diferentes direcciones desempeñan funciones completamente distintas, como depósitos, retiros, gestión de carteras frías/calientes, consolidación de fondos o cambio. Si se sigue agrupándolas todas simplemente en un único Cluster, resulta difícil describir con precisión la compleja estructura de la cartera.
Por ello, Chainalysis introduce en su propuesta el nuevo concepto de "Wallet Segment" (Segmento de Cartera).
En el nuevo modelo, una Entidad (Entity) puede poseer múltiples Wallets (carteras), cada una de las cuales puede dividirse en múltiples Wallet Segments, y cada Segment contiene direcciones específicas. Esta estructura jerárquica refleja de manera más fiel la gestión de carteras de las grandes instituciones que el tradicional Cluster, y permite describir con mayor detalle las relaciones de control entre diferentes direcciones.
De la "fiabilidad del resultado" a la "fiabilidad del proceso"
Un cambio más importante que el modelo en sí proviene del segundo nivel de diseño.
El análisis on-chain tradicional se centraba más en el resultado final: a quién pertenece una dirección, hacia dónde fluyen los fondos, si está involucrada en actividades ilícitas.
La nueva Ontología enfatiza más el propio proceso de inferencia.
Para cada resultado de análisis, se debería responder explícitamente a varias preguntas:
- ¿En qué evidencia on-chain se basa esta conclusión?
- ¿Qué reglas de análisis se han utilizado?
- ¿Se ha utilizado información off-chain?
- ¿Cuál es el nivel de confianza de esta inferencia?
- ¿Puede un tercero volver a verificar este proceso?
En otras palabras, no solo se debe decir a los demás "qué es", sino también explicar "por qué".
Chainalysis denomina a esta parte la capa de Evidencia (Evidence) y Confianza (Confidence).
En el futuro, que una dirección sea etiquetada como la wallet de un exchange no será solo una simple etiqueta, sino que irá acompañada de una base de inferencia completa, incluyendo patrones de transacción, relaciones entre direcciones, información pública, registros de investigación, etc., junto con un nivel de confianza correspondiente. Este diseño se ajusta más a los requisitos de explicabilidad que exigen las pruebas judiciales y facilita la validación cruzada entre diferentes instituciones.
La revelación del caso Bitcoin Fog
De hecho, esta propuesta no surge de la nada, sino que está estrechamente relacionada con el famoso caso estadounidense de blanqueo de capitales Bitcoin Fog.
Bitcoin Fog fue uno de los servicios de mezcla de bitcoins (mixers) de mayor duración en la historia. El Departamento de Justicia de EE.UU. utilizó ampliamente los resultados del análisis de Chainalysis Reactor como prueba clave durante la investigación.
Durante el juicio, el tribunal celebró la famosa audiencia Daubert, sometiendo a un estricto escrutinio los métodos de análisis de Chainalysis, incluyendo:
- Si la agrupación de direcciones tiene base científica;
- Si el método de análisis puede repetirse y verificarse;
- Si se trata de un "algoritmo de caja negra" inexplicable;
- Si otros expertos pueden reproducir de forma independiente el proceso de análisis.
Finalmente, el tribunal reconoció que los métodos de análisis de Chainalysis poseían suficiente fiabilidad científica para ser utilizados como prueba judicial.
Sin embargo, este caso también puso de manifiesto un problema de toda la industria: si diferentes instituciones de análisis emplean estándares distintos, casos similares en el futuro podrían enfrentar más cuestionamientos. Por lo tanto, establecer un marco unificado de expresión de datos y evidencia se convirtió en un importante antecedente para que Chainalysis impulsara esta Ontología.
El análisis de blockchain no puede identificar directamente la identidad real
Es importante destacar que Chainalysis hace especial hincapié en un punto en esta propuesta: el análisis on-chain por sí solo no puede identificar directamente a individuos en el mundo real.
Los datos on-chain solo pueden revelar relaciones entre direcciones y rutas de flujo de fondos. En cuanto al controlador real detrás de una dirección, normalmente sigue siendo necesario depender de evidencia off-chain, como información KYC de los exchanges, datos obtenidos por orden judicial, registros de servidores obtenidos por las autoridades, etc.
Esto significa que el análisis de blockchain proporciona una inferencia de datos de alta calidad, no una prueba definitiva que demuestre directamente la identidad. Una cadena de evidencia judicial completa y sólida requiere la combinación de datos on-chain con investigaciones off-chain.
De la calidad de los datos al estándar del sector
Además de la Ontología en sí, el marco general propuesto también expone de manera sistemática aspectos en torno a la calidad de los datos, la transparencia del análisis y la admisibilidad judicial. Se puede observar que Chainalysis desea impulsar a la industria a que no solo se centre en los resultados del análisis en sí, sino en si el proceso de análisis puede ser explicado, verificado y reproducido.
Esto también indica que el foco de la competencia futura en la industria podría dejar de ser "quién cubre más direcciones" o "quién identifica más etiquetas", para pasar a ser "quién tiene datos de mayor calidad", "quién realiza análisis más transparentes", "cuya evidencia es más fácilmente admitida por los tribunales".
Para los reguladores, los departamentos de aplicación de la ley y las grandes instituciones financieras, un sistema capaz de explicar la lógica del análisis, que admita auditorías independientes y posea capacidad de verificación repetible, es sin duda más confiable que un "modelo de caja negra" que solo genera resultados.
¿Qué implica esta propuesta?
Desde una perspectiva más amplia, lo que Chainalysis ha publicado esta vez no es una simple actualización de software, sino que se asemeja más a un intento de impulsar a la industria del análisis de blockchain para que pase de estar "impulsada por la experiencia" a estar "impulsada por estándares".
Si esta Ontología termina siendo ampliamente aceptada por la industria, diferentes instituciones de análisis, exchanges, organismos reguladores e incluso el poder judicial podrán, potencialmente, compartir resultados de análisis bajo un modelo de datos unificado, reduciendo los costes de comunicación, mejorando la consistencia de las pruebas y proporcionando una base más fiable para la aplicación transfronteriza de la ley, las investigaciones de lucha contra el blanqueo de capitales y la regulación de activos digitales.
Por supuesto, el establecimiento de estándares no es algo que se logre de la noche a la mañana. Cómo equilibrar el secreto comercial y la transparencia, cómo impulsar la adopción de normas unificadas por diferentes instituciones y cómo perfeccionar continuamente el modelo de evidencia, siguen siendo aspectos que requieren una exploración conjunta de la industria.
Pero lo que es seguro es que, a medida que los activos digitales se integran gradualmente en el sistema financiero global, el foco de la competencia en el análisis de blockchain está cambiando: lo que realmente determinará el valor de la industria en el futuro no será solo la precisión de los algoritmos, sino también la explicabilidad del proceso de análisis, la calidad de los datos y la fiabilidad de la evidencia. Y esta es precisamente la nueva dirección que Chainalysis espera abrir con la Blockchain Tracing Ontology.





