Tác giả: 137Labs
Cuối tháng 6 năm 2026, Chainalysis đã công bố một khuôn khổ dữ liệu có tên là "Blockchain Tracing Ontology (Bản thể học Truy vết Blockchain)", với hy vọng thiết lập một hệ thống mô tả dữ liệu thống nhất hơn cho phân tích blockchain. So với các sản phẩm hoặc tính năng mới được phát hành trước đây, tài liệu này giống một đề xuất tiêu chuẩn ngành hơn: nó cố gắng định nghĩa lại các khái niệm cơ bản của phân tích dữ liệu trên chuỗi và thiết lập một mô hình dữ liệu có thể giải thích, xác minh và tái lập được cho việc truy vết blockchain.
Đề xuất này sau khi phát hành đã nhanh chóng trở thành chủ đề được quan tâm trong lĩnh vực phân tích blockchain và tuân thủ tài sản kỹ thuật số. Mặc dù hiện vẫn đang trong giai đoạn thảo luận công khai và đề xuất ngành, nhưng nó đã khiến mọi người bắt đầu suy nghĩ lại: liệu phân tích trên chuỗi có cần một bộ tiêu chuẩn dữ liệu thống nhất và minh bạch hơn hay không.
Một vấn đề lâu dài: Tại sao các công ty khác nhau lại đưa ra kết quả phân tích khác nhau?
Dữ liệu blockchain vốn dĩ công khai minh bạch, nhưng cách giải thích những dữ liệu này lại luôn thiếu một tiêu chuẩn thống nhất.
Hiện tại, hầu hết các nền tảng phân tích trên chuỗi đều sử dụng công nghệ "Phân cụm địa chỉ (Address Clustering)", thông qua hành vi giao dịch để suy luận những địa chỉ nào có thể do cùng một chủ thể kiểm soát. Tuy nhiên, các thuật toán, quy tắc và nguồn bằng chứng được các tổ chức khác nhau áp dụng không đồng nhất, do đó, cùng một địa chỉ trên các nền tảng khác nhau có thể được quy về kết quả sở hữu hoàn toàn khác biệt.
Ví dụ, một tổ chức phân tích có thể cho rằng một địa chỉ nào đó thuộc về một sàn giao dịch lớn, trong khi tổ chức khác lại đánh dấu nó là ví không xác định; cùng một loạt địa chỉ, trên các nền tảng khác nhau cũng có thể được phân chia vào các Cụm (Cluster) khác nhau. Sự khác biệt này ảnh hưởng hạn chế đến phân tích thị trường, nhưng một khi liên quan đến điều tra tư pháp, đóng băng tài sản, chống rửa tiền hoặc thu thập chứng cứ cho hành pháp, nó có thể mang lại tranh cãi lớn hơn.
Đối với tòa án, việc chỉ đưa ra kết luận "Đây là ví của một sàn giao dịch nào đó" là chưa đủ, quan trọng hơn là trả lời câu hỏi khác: Tại sao có thể đưa ra nhận định như vậy?
Điều Chainalysis đề xuất không phải là thuật toán mới, mà là một bộ "ngôn ngữ"
Nhiều người thấy từ "Ontology (Bản thể học)" dễ hiểu nhầm rằng Chainalysis lại đề xuất một thuật toán phân cụm mới. Thực tế không phải vậy.
Ontology là khái niệm trong lĩnh vực kỹ thuật tri thức, chỉ một hệ thống khái niệm và mô hình quan hệ thống nhất, được sử dụng để quy phạm hóa định nghĩa và cách thức liên kết giữa các đối tượng khác nhau. Tìm kiếm Internet, cơ sở tri thức y học và thậm chí đồ thị tri thức trí tuệ nhân tạo, đều sử dụng rộng rãi Ontology để đảm bảo dữ liệu có thể được hiểu thống nhất.
Điều Chainalysis muốn làm là thiết lập một "ngôn ngữ chung" tương tự cho phân tích blockchain.
Nói cách khác, nó không quy định tất cả các công ty phải sử dụng cùng một thuật toán phân cụm, mà hy vọng mọi người có thể biểu đạt kết quả phân tích theo cấu trúc dữ liệu thống nhất, giúp quá trình phân tích minh bạch hơn, đồng thời thuận tiện cho bên thứ ba hiểu, xác minh và tái lập.
"Cluster" không còn đủ dùng
Trước đây, ngành công nghiệp thường sử dụng "Cluster (cụm địa chỉ)" làm đơn vị phân tích cơ bản, tức coi nhiều địa chỉ cùng thuộc về một ví hoặc một thực thể.
Phương pháp này tuy đơn giản trực quan, nhưng với sự phát triển của cơ sở hạ tầng blockchain, hạn chế của nó ngày càng rõ ràng.
Ngày nay, hệ thống ví của một sàn giao dịch lớn có thể chứa hàng triệu địa chỉ, các địa chỉ khác nhau đảm nhận các chức năng hoàn toàn khác biệt như nạp tiền, rút tiền, quản lý ví nóng/lạnh, tập trung, tiền thừa,... Nếu vẫn đơn giản xếp tất cả chúng vào một Cluster, sẽ khó có thể mô tả chính xác cấu trúc ví phức tạp.
Do đó, Chainalysis trong đề xuất đã đưa ra khái niệm mới là "Wallet Segment (phân đoạn ví)".
Trong mô hình mới, một thực thể (Entity) có thể sở hữu nhiều ví (Wallet), mỗi ví lại có thể được chia thành nhiều Wallet Segment, và mỗi Segment mới chứa các địa chỉ cụ thể. Cấu trúc phân tầng này phản ánh chân thực hơn mô hình quản lý ví của các tổ chức lớn so với Cluster truyền thống, đồng thời cũng có thể mô tả chi tiết hơn mối quan hệ kiểm soát giữa các địa chỉ khác nhau.
Từ "kết quả đáng tin" đến "quá trình đáng tin"
So với bản thân mô hình, sự thay đổi quan trọng hơn đến từ thiết kế tầng thứ hai.
Phân tích trên chuỗi truyền thống, chú trọng nhiều hơn đến kết quả cuối cùng — địa chỉ thuộc về ai, dòng tiền chảy về đâu, có liên quan đến hoạt động bất hợp pháp hay không.
Còn Ontology mới nhấn mạnh hơn đến bản thân quá trình suy luận.
Đối với mỗi kết quả phân tích, cần phải trả lời rõ ràng một số câu hỏi:
- Kết luận này dựa trên những bằng chứng trên chuỗi nào?
- Sử dụng những quy tắc phân tích nào?
- Có tham khảo thông tin ngoài chuỗi không?
- Mức độ tin cậy của suy luận này là bao nhiêu?
- Bên thứ ba có thể xác minh lại quá trình này không?
Nói cách khác, không chỉ nói cho người khác biết "là gì", mà còn phải giải thích "tại sao".
Chainalysis gọi phần này là tầng Evidence (Bằng chứng) và Confidence (Độ tin cậy).
Trong tương lai, một địa chỉ được đánh dấu là ví sàn giao dịch sẽ không chỉ là một nhãn đơn giản, mà sẽ đi kèm theo đầy đủ cơ sở suy luận, bao gồm mẫu giao dịch, quan hệ địa chỉ, thông tin công khai, hồ sơ điều tra,... và đưa ra cấp độ tin cậy tương ứng. Thiết kế này phù hợp hơn với yêu cầu có thể giải thích được của bằng chứng tư pháp, đồng thời cũng có lợi cho việc xác minh chéo giữa các tổ chức khác nhau.
Gợi ý từ vụ án Bitcoin Fog
Trên thực tế, đề xuất này không phải được tạo ra từ không trung, mà có liên quan mật thiết đến vụ án rửa tiền Bitcoin Fog nổi tiếng ở Mỹ.
Bitcoin Fog từng là một trong những dịch vụ trộn coin có thời gian tồn tại lâu nhất trong lịch sử Bitcoin. Bộ Tư pháp Mỹ trong quá trình điều tra đã sử dụng rộng rãi kết quả phân tích của Chainalysis Reactor làm bằng chứng then chốt.
Trong thời gian xét xử, tòa án đã tổ chức phiên điều trần Daubert nổi tiếng, tiến hành xem xét nghiêm ngặt phương pháp phân tích của Chainalysis, bao gồm:
- Phân cụm địa chỉ có cơ sở khoa học hay không;
- Phương pháp phân tích có thể lặp lại để xác minh không;
- Có thuộc về "thuật toán hộp đen" không thể giải thích hay không;
- Các chuyên gia khác có thể độc lập tái lập quá trình phân tích không.
Cuối cùng, tòa án công nhận phương pháp phân tích của Chainalysis có đủ độ tin cậy khoa học, có thể được sử dụng làm bằng chứng tư pháp.
Tuy nhiên, vụ án này cũng làm lộ ra vấn đề tồn tại trong toàn ngành: nếu các tổ chức phân tích khác nhau áp dụng các tiêu chuẩn khác nhau, các vụ án tương tự trong tương lai có thể phải đối mặt với nhiều chất vấn hơn. Do đó, việc thiết lập khuôn khổ biểu đạt dữ liệu và bằng chứng thống nhất trở thành bối cảnh quan trọng để Chainalysis thúc đẩy Ontology.
Phân tích blockchain không thể trực tiếp nhận dạng danh tính thực
Đáng chú ý là, trong đề xuất lần này, Chainalysis đặc biệt nhấn mạnh một điểm: bản thân phân tích trên chuỗi không thể trực tiếp nhận dạng danh tính cá nhân trong thế giới thực.
Dữ liệu trên chuỗi chỉ có thể tiết lộ mối quan hệ giữa các địa chỉ và con đường lưu chuyển vốn, còn người kiểm soát thực sự đằng sau địa chỉ, thông thường vẫn cần dựa vào bằng chứng ngoài chuỗi, chẳng hạn như thông tin KYC từ sàn giao dịch, dữ liệu được tòa án điều tra lấy, nhật ký máy chủ do cơ quan hành pháp thu thập được,...
Điều này có nghĩa, phân tích blockchain cung cấp một suy luận dữ liệu chất lượng cao, chứ không phải là bằng chứng cuối cùng trực tiếp chứng minh danh tính. Chuỗi bằng chứng tư pháp hoàn chỉnh thực sự, cần sự kết hợp giữa dữ liệu trên chuỗi và điều tra ngoài chuỗi.
Từ chất lượng dữ liệu đến tiêu chuẩn ngành
Ngoài bản thân Ontology, khuôn khổ tổng thể được đề xuất lần này còn xoay quanh chất lượng dữ liệu, tính minh bạch của phân tích và khả năng được chấp nhận về mặt tư pháp đã được trình bày có hệ thống. Có thể thấy, Chainalysis hy vọng thúc đẩy ngành quan tâm không chỉ bản thân kết quả phân tích, mà là quá trình phân tích có thể được giải thích, xác minh và tái lập hay không.
Điều này cũng cho thấy, trọng tâm cạnh tranh trong tương lai của ngành, có thể không còn là "ai phủ sóng nhiều địa chỉ hơn", "ai nhận dạng được nhiều nhãn hơn", mà là "chất lượng dữ liệu của ai cao hơn", "phân tích của ai minh bạch hơn", "bằng chứng của ai dễ được tòa án chấp nhận hơn".
Đối với cơ quan quản lý, bộ phận hành pháp cũng như các tổ chức tài chính lớn, một hệ thống có thể giải thích logic phân tích, hỗ trợ kiểm toán độc lập, có khả năng xác minh lặp lại, rõ ràng đáng tin cậy hơn một "mô hình hộp đen" chỉ có thể xuất ra kết quả.
Đề xuất này có ý nghĩa gì?
Từ góc nhìn dài hạn hơn, những gì Chainalysis phát hành lần này không phải là một bản nâng cấp phần mềm thông thường, mà giống như đang thúc đẩy ngành phân tích blockchain từ "được dẫn dắt bởi kinh nghiệm" đến "được dẫn dắt bởi tiêu chuẩn".
Nếu Ontology này cuối cùng được ngành chấp nhận rộng rãi, các tổ chức phân tích, sàn giao dịch, cơ quan quản lý và thậm chí cơ quan tư pháp khác nhau, có thể hy vọng chia sẻ kết quả phân tích dưới mô hình dữ liệu thống nhất, giảm chi phí giao tiếp, nâng cao tính nhất quán của bằng chứng, đồng thời cũng cung cấp nền tảng đáng tin cậy hơn cho hành pháp xuyên biên giới, điều tra chống rửa tiền và giám sát tài sản kỹ thuật số.
Tất nhiên, việc xây dựng tiêu chuẩn không thể một sớm một chiều. Làm thế nào để cân bằng giữa bí mật thương mại và tính minh bạch, làm thế nào để thúc đẩy các tổ chức khác nhau áp dụng quy phạm thống nhất, làm thế nào để liên tục hoàn thiện mô hình bằng chứng, vẫn cần ngành cùng nhau khám phá.
Nhưng có thể chắc chắn rằng, khi tài sản kỹ thuật số dần hòa nhập vào hệ thống tài chính toàn cầu, trọng tâm cạnh tranh của phân tích blockchain đang thay đổi: điều thực sự quyết định giá trị ngành trong tương lai, không chỉ là độ chính xác của thuật toán, mà còn là khả năng giải thích của quá trình phân tích, chất lượng dữ liệu và độ tin cậy của bằng chứng. Và đây cũng chính là hướng đi mới mà Chainalysis hy vọng sẽ mở ra thông qua Blockchain Tracing Ontology.





