Backtest Của Bạn Đang Nói Dối: Tại Sao Bạn Phải Sử Dụng Dữ Liệu Theo Thời Điểm

insights.glassnodeXuất bản vào 2026-03-13Cập nhật gần nhất vào 2026-03-13

Tóm tắt

Bài viết cảnh báo về sự thiếu chính xác trong backtest nếu sử dụng dữ liệu bị sửa đổi sau này, thay vì dữ liệu theo thời điểm thực (Point-in-Time - PiT). Tác giả minh họa bằng một chiến lược giao dịch giả định dựa trên dòng Bitcoin rời khỏi sàn Binance: mua khi trung bình 5 ngày thấp hơn trung bình 14 ngày, và bán khi ngược lại. Khi backtest với dữ liệu thông thường (bị điều chỉnh sau), chiến lược có vẻ hiệu quả, ngang bằng với nắm giữ. Tuy nhiên, khi chạy lại với dữ liệu PiT (chỉ sử dụng thông tin có tại thời điểm đó, không sửa đổi), hiệu suất chiến lược kém hơn hẳn, bỏ lỡ các đợt tăng giá quan trọng. Bài học rút ra: Backtest sẽ cho kết quả sai lệch nếu sử dụng dữ liệu không chính xác. Chỉ các số liệu PiT bất biến mới đảm bảo mô phỏng lịch sử một cách trung thực, tránh thiên kiến nhìn lại (look-ahead bias).

Hãy xây dựng một chiến lược giao dịch giả định đơn giản. Tiền đề rất rõ ràng và bắt nguồn từ một câu chuyện được thảo luận rộng rãi: khi coin rời khỏi các sàn giao dịch, nó có xu hướng tăng giá. Lý luận rất trực quan: coin di chuyển ra khỏi sàn giao dịch thường báo hiệu rằng những người nắm giữ đang rút về tự lưu ký, làm giảm nguồn cung có sẵn để bán. Ngược lại, coin chảy vào các sàn giao dịch có thể cho thấy người nắm giữ đang chuẩn bị bán.

Tuy nhiên, một ngày có dòng chảy ra chỉ là nhiễu động. Để xác định một xu hướng thực sự, chúng ta sẽ áp dụng đường trung bình động giao cắt trên số dư sàn giao dịch. Khi đường trung bình ngắn hạn giảm xuống dưới đường trung bình dài hạn, nó xác nhận rằng coin đã rời khỏi các sàn giao dịch một cách nhất quán, như một mô hình bền vững, chứ không phải là các sự kiện riêng lẻ.

Sử dụng số dư sàn giao dịch Binance của Glassnode, chúng ta xác định như sau:

  • Vào thị trường khi đường trung bình động 5 ngày của số dư BTC trên Binance giảm xuống dưới đường trung bình động 14 ngày của nó, báo hiệu một xu hướng dòng chảy ra bền vững.
  • Thoát thị trường khi đường trung bình 5 ngày tăng trở lại trên đường trung bình 14 ngày, báo hiệu rằng xu hướng dòng chảy ra đã đảo ngược và coin đang quay trở lại sàn giao dịch.

Sau đó, chúng ta so sánh chiến lược này với việc chỉ đơn giản nắm giữ BTC trong cùng khoảng thời gian, bắt đầu từ ngày 1 tháng 1 năm 2024 đến ngày 9 tháng 3 năm 2026, với vốn ban đầu là 1.000 đô la và phí giao dịch 0,1% được áp dụng cho mỗi giao dịch.

Đây là một chiến lược giao dịch đơn giản hóa, được thiết kế chủ yếu cho mục đích minh họa. Nó không phải là lời khuyên đầu tư, cũng không có ý khẳng định rằng số dư sàn giao dịch là một nền tảng vững chắc cho một hệ thống giao dịch.
Truy cập biểu đồ trực tiếp

Đây là cách đọc biểu đồ này:

🟫 Đường màu nâu ở dưới cùng là tín hiệu giao dịch nhị phân, chuyển đổi giữa trong thị trường (1) và ngoài thị trường (0).

🟦 Đường màu xanh lam theo dõi giá trị danh mục đầu tư của chiến lược theo thời gian.

🟩 Đường màu xanh lá cây là điểm chuẩn danh mục đầu tư mua và nắm giữ.

Chúng ta có thể quan sát thấy chiến lược số dư sàn giao dịch hoạt động khá tốt, mặc dù đôi khi chiến lược mua và nắm giữ vượt trội hơn. Tuy nhiên, trong những ngày cuối cùng của giai đoạn nghiên cứu, chiến lược số dư sàn giao dịch đã bắt kịp. Mặc dù một số nhà đầu tư có thể thấy sự kết hợp giữa mức độ biến động giảm và hiệu suất cuối cùng tương đương với mua và nắm giữ là hấp dẫn, nhưng những con số cuối cùng là gây hiểu lầm – và đây là lý do.

Vấn Đề: Đột Biến Dữ Liệu và Thiên Hướng Nhìn Trước

Các số liệu không phải là tĩnh. Nhiều số liệu được sửa đổi lại một cách hồi tố khi có thông tin mới. Điều này đặc biệt đúng với các số liệu phụ thuộc vào phân cụm địa chỉ hoặc gắn nhãn thực thể, chẳng hạn như số dư sàn giao dịch trên chuỗi. Tuy nhiên, điều này cũng xảy ra đối với các số liệu như khối lượng giao dịch hoặc giá, vì các sàn giao dịch riêng lẻ đôi khi có thể gửi dữ liệu của hó với độ trễ nhỏ.

Điều này có nghĩa là một giá trị bạn nhìn thấy hôm nay cho, ví dụ, ngày 15 tháng 1 năm 2024, có thể không phải là giá trị đã được công bố vào ngày 15 tháng 1 năm 2024. Dữ liệu đã được sửa đổi với góc nhìn hậu nghiệm. Khi bạn backtest một chiến lược trên dữ liệu đã sửa đổi này, bạn đang ngầm sử dụng thông tin không có sẵn tại thời điểm các quyết định giao dịch sẽ được đưa ra. Điều này tạo ra một thiên hướng nhìn trước (look-ahead bias).

Backtest Trung Thực: Sử Dụng Dữ Liệu Theo Thời Điểm

Do đó, hãy lặp lại chính xác cùng một backtest – cùng logic tín hiệu, cùng tham số, cùng ngày tháng, cùng phí – nhưng lần này sử dụng biến thể Dữ liệu Theo Thời Điểm (Point-in-Time - PiT) của số liệu Số dư Sàn giao dịch, có sẵn trong Glassnode Studio.

Các số liệu PiT hoàn toàn chỉ được bổ sung và không thể thay đổi. Mỗi điểm dữ liệu lịch sử chỉ phản ánh thông tin đã được biết đến tại thời điểm nó được tính toán lần đầu. Không có sửa đổi hồi tố, không có thiên hướng nhìn trước.

Mặc dù chúng ta đang sử dụng cùng một số liệu, chiến lược bây giờ tạo ra kết quả khác biệt đáng kể, như được minh họa bằng đường màu tím trong biểu đồ mới bên dưới. Hiệu suất tổng thể tệ hơn đáng kể.

Mặc dù cả hai chiến lược hoạt động tương tự trong phần lớn thời gian của năm 2024, chúng ta quan sát thấy phiên bản dựa trên PiT không nắm bắt được các đợt tăng mạnh vào tháng 11 năm 2024 và tháng 3 năm 2025 một cách hiệu quả. Kết quả là, hiệu suất tích lũy phân kỳ có ý nghĩa và cuối cùng thấp hơn đáng kể.

Truy cập biểu đồ trực tiếp

Điểm Mấu Chốt

Trong ví dụ này, chiến lược màu tím, chỉ có quyền truy cập vào thông tin như nó đã có sẵn tại thời điểm đó, hoạt động tệ hơn đáng chú ý. ► Backtest sẽ nói dối nếu được cung cấp dữ liệu sai hoặc đã sửa đổi. Chỉ các số liệu Theo Thời Điểm không thể thay đổi mới đảm bảo bạn đang phát lại lịch sử đúng như nó đã xảy ra.

Câu hỏi Liên quan

QTại sao việc sử dụng dữ liệu được sửa đổi sau này (revised data) trong backtest có thể dẫn đến kết quả sai lệch?

AVì dữ liệu được sửa đổi sau này chứa thông tin mà tại thời điểm giao dịch trong quá khứ chưa hề tồn tại, dẫn đến 'look-ahead bias' (thiên hướng nhìn trước). Điều này khiến chiến lược backtest trông có vẻ hiệu quả hơn so với thực tế, vì nó đã sử dụng thông tin từ tương lai để đưa ra quyết định trong quá khứ.

QDữ liệu Point-in-Time (PiT) là gì và tại sao nó quan trọng trong backtest?

ADữ liệu Point-in-Time (PiT) là dữ liệu bất biến, chỉ được bổ sung và không bao giờ bị sửa đổi sau này. Mỗi điểm dữ liệu phản ánh chính xác thông tin đã biết tại thời điểm nó được tính toán. Nó quan trọng vì nó loại bỏ hoàn toàn look-ahead bias, đảm bảo rằng backtest mô phỏng chính xác những gì có thể xảy ra trong thực tế khi chỉ sử dụng thông tin có sẵn tại thời điểm đó.

QTrong ví dụ về chiến lược theo dõi số dư trên sàn, tín hiệu vào lệnh và thoát lệnh được xác định như thế nào?

ATín hiệu vào lệnh (Enter the market) được kích hoạt khi đường trung bình động 5 ngày của số BTC trên sàn Binance giảm xuống DƯỚI đường trung bình động 14 ngày, báo hiệu một xu hướng rút tiền bền vững. Tín hiệu thoát lệnh (Exit the market) được kích hoạt khi đường trung bình 5 ngày tăng trở lại TRÊN đường trung bình 14 ngày, báo hiệu xu hướng đảo chiều.

QKết quả backtest khác nhau như thế nào khi sử dụng dữ liệu thông thường so với dữ liệu Point-in-Time?

AKhi sử dụng dữ liệu thông thường (có thể bị sửa đổi), chiến lược có hiệu suất khá tốt và cuối cùng gần như ngang bằng với chiến lược mua và nắm giữ. Tuy nhiên, khi sử dụng dữ liệu Point-in-Time chính xác, hiệu suất của chiến lược kém hơn đáng kể, đặc biệt là không nắm bắt được các đợt tăng mạnh vào tháng 11/2024 và tháng 3/2025 một cách hiệu quả.

QBài học chính (key takeaway) từ bài viết này là gì?

ABài học chính là backtest sẽ cho kết quả sai lệch nếu sử dụng dữ liệu sai hoặc dữ liệu đã được sửa đổi sau này. Chỉ có các số liệu bất biến, Point-in-Time mới đảm bảo rằng bạn đang mô phỏng lại lịch sử một cách trung thực như nó đã thực sự xảy ra, từ đó đưa ra đánh giá chính xác về hiệu quả của một chiến lược giao dịch.

Nội dung Liên quan

Từ bị đánh cắp đến tái xuất hiện trên thị trường, 292 triệu USD đã bị 'rửa sạch' như thế nào?

Vào ngày 18/4, tin tặc Triều Tiên đã đánh cắp 292 triệu USD từ Kelp DAO. Chỉ trong 5 ngày, hơn một nửa số tiền này đã bị rửa thông qua một quy trình công nghiệp hóa cao. Quá trình bắt đầu bằng việc chuẩn bị ví ẩn danh thông qua Tornado Cash. Tin tặc đánh cắp 116.500 rsETH, sau đó nhanh chóng sử dụng các giao thức cho vay Aave và Compound để thế chấp tài sản bị đánh cắp và vay ra 82.650 ETH - một tài sản "sạch" có tính thanh khoản. Hành động này gây ra một cuộc rút tiền hàng loạt trị giá 8 tỷ USD từ Aave. Số ETH sau đó được chuyển qua THORChain để chuyển đổi thành Bitcoin, tận dụng mô hình UTXO để phân mảnh và làm phức tạp hóa việc truy vết. Cuối cùng, tiền được chuyển thành USDT trên mạng Tron - nơi được coi là trung tâm chính cho các giao dịch bất hợp pháp. Giai đoạn cuối cùng liên quan đến các nhà môi giới OTC tại Trung Quốc và Đông Nam Á, những người chuyển đổi USDT thành tiền mặt thông qua mạng lưới thanh toán trong nước, nằm ngoài phạm vi trừng phạt của phương Tây. Số tiền này cuối cùng được sử dụng để tài trợ cho các chương trình vũ khí của Triều Tiên.

marsbit24 phút trước

Từ bị đánh cắp đến tái xuất hiện trên thị trường, 292 triệu USD đã bị 'rửa sạch' như thế nào?

marsbit24 phút trước

OpenClaw và Hermes, rốt cuộc cái nào phù hợp hơn với bạn?

Nếu năm 2025 là cuộc đua về "năng lực mô hình lớn", thì đầu 2026, trọng tâm chuyển sang một cuộc chiến cụ thể hơn: AI agent cá nhân thực sự ứng dụng thế nào. Hai dự án nổi bật là OpenClaw và Hermes Agent, đại diện cho hai triết lý khác nhau. OpenClaw, với 346,000 sao trên GitHub, nhấn mạnh quyền kiểm soát và khả năng tùy chỉnh. Nó có hệ sinh thái kỹ năng phong phú (44,000+ kỹ năng), linh hoạt lựa chọn mô hình (Claude, GPT-5.5, Kimi...), tích hợp đa nền tảng (Telegram, Discord, iMessage...), và hỗ trợ kiến trúc đa agent. Tuy nhiên, nó phức tạp để cấu hình và chi phí token cao hơn. Hermes Agent, từ Nous Research, tập trung vào tự động hóa và hiệu quả chi phí. Nó tự động học hỏi từ các tác vụ, cải thiện theo thời gian, có sẵn 40+ công cụ, chi phí token thấp hơn ~90%, và dễ dàng sử dụng ngay. Nhược điểm là tích hợp nền tảng còn hạn chế và tính năng đa agent vẫn đang phát triển. Lựa chọn phụ thuộc vào nhu cầu: OpenClaw cho người dùng kỹ thuật muốn toàn quyền kiểm soát, Hermes cho người dùng phổ thông ưu tiên sự đơn giản và chi phí thấp. Giống như so sánh Ferrari và Honda, mỗi loại phục vụ một đối tượng khác nhau.

marsbit56 phút trước

OpenClaw và Hermes, rốt cuộc cái nào phù hợp hơn với bạn?

marsbit56 phút trước

Google và Amazon cùng đầu tư khủng nuôi dưỡng đối thủ, logic kinh doanh kỳ lạ nhất thời đại AI đang thành hiện thực

Trong 4 ngày, Amazon và Google đã công bố đầu tư lần lượt 250 tỷ USD và 400 tỷ USD vào Anthropic - một công ty khởi nghiệp AI. Khoản đầu tư khổng lồ 650 tỷ USD này không chỉ là tài trợ vốn mà thực chất là "đơn đặt trước năng lực tính toán". Anthropic cam kết chi tiêu hơn 1000 tỷ USD cho các dịch vụ điện toán đám mây và chip của hai nhà đầu tư. Động thái này phản ánh cuộc chiến điện toán đám mây mới: các nhà cung cấp đang tranh giành để khóa chân các công ty model AI hàng đầu, biến chúng thành tài sản chiến lược. Với OpenAI đã gắn chặt với Microsoft, Anthropic trở thành mục tiêu duy nhất để Google và Amazon cạnh tranh. Doanh thu hàng năm của Anthropic đã đạt 300 tỷ USD, khẳng định vị thế dẫn đầu. Tuy nhiên, công ty cũng đối mặt với thách thức về tính độc lập khi bị hai đối thủ cùng sở hữu cổ phần và áp lực an ninh mạng ngày càng tăng. Trong khi đó, tại Trung Quốc, các khoản đầu tư vào mô hình nguồn mở như DeepSeek cho thấy một hướng đi khác, ít ràng buộc độc quyền hơn so với xu hướng "khép kính ba cực" tại Mỹ.

marsbit6 giờ trước

Google và Amazon cùng đầu tư khủng nuôi dưỡng đối thủ, logic kinh doanh kỳ lạ nhất thời đại AI đang thành hiện thực

marsbit6 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片