Backtest Của Bạn Đang Nói Dối: Tại Sao Bạn Phải Sử Dụng Dữ Liệu Theo Thời Điểm

insights.glassnodeXuất bản vào 2026-03-13Cập nhật gần nhất vào 2026-03-13

Tóm tắt

Bài viết cảnh báo về sự thiếu chính xác trong backtest khi sử dụng dữ liệu bị chỉnh sửa sau này, thay vì dữ liệu theo thời điểm thực tế (Point-in-Time - PiT). Tác giả minh họa bằng một chiến lược giao dịch giả định dựa trên dòng Bitcoin rời khỏi sàn Binance: mua khi trung bình 5 ngày thấp hơn trung bình 14 ngày (xu hướng rút tiền), và bán khi ngược lại. Kết quả backtest ban đầu với dữ liệu thông thường (có thể bị chỉnh sửa) cho thấy hiệu suất khả quan, gần bằng mua và nắm giữ. Tuy nhiên, khi chạy lại backtest với dữ liệu PiT (dữ liệu gốc không thay đổi, chỉ phản ánh thông tin đã biết tại thời điểm đó), hiệu suất chiến lược kém hơn đáng kể, đặc biệt là bỏ lỡ các đợt tăng giá mạnh. Bài học rút ra: Backtest sẽ cho kết quả sai lệch nếu sử dụng dữ liệu đã được hiệu chỉnh sau này, gây ra "look-ahead bias". Chỉ sử dụng số liệu PiT bất biến mới đảm bảo đánh giá lịch sử một cách trung thực.

Hãy xây dựng một chiến lược giao dịch giả định đơn giản. Tiền đề rất rõ ràng và bắt nguồn từ một câu chuyện được thảo luận rộng rãi: khi coin rời khỏi các sàn giao dịch, nó có xu hướng tăng giá. Lý luận rất trực quan: coin di chuyển ra khỏi sàn giao dịch thường báo hiệu rằng những người nắm giữ đang rút về tự lưu ký, làm giảm nguồn cung có sẵn để bán. Ngược lại, coin chảy vào các sàn giao dịch có thể cho thấy người nắm giữ đang chuẩn bị bán.

Tuy nhiên, một ngày có dòng chảy ra chỉ là nhiễu động. Để xác định một xu hướng thực sự, chúng ta sẽ áp dụng đường trung bình động giao cắt trên số dư sàn giao dịch. Khi đường trung bình ngắn hạn giảm xuống dưới đường trung bình dài hạn, nó xác nhận rằng coin đã rời khỏi các sàn giao dịch một cách nhất quán, như một mô hình bền vững, chứ không phải là các sự kiện riêng lẻ.

Sử dụng số dư sàn giao dịch Binance của Glassnode, chúng ta xác định như sau:

  • Vào thị trường khi đường trung bình động 5 ngày của số dư BTC trên Binance giảm xuống dưới đường trung bình động 14 ngày của nó, báo hiệu một xu hướng dòng chảy ra bền vững.
  • Thoát thị trường khi đường trung bình 5 ngày tăng trở lại trên đường trung bình 14 ngày, báo hiệu xu hướng dòng chảy ra đã đảo ngược và coin đang quay trở lại sàn giao dịch.

Sau đó, chúng ta so sánh chiến lược này với việc chỉ nắm giữ BTC trong cùng khoảng thời gian, bắt đầu từ ngày 1 tháng 1 năm 2024 đến ngày 9 tháng 3 năm 2026, với vốn ban đầu là 1.000 đô la và phí giao dịch 0,1% được áp dụng cho mỗi giao dịch.

Đây là một chiến lược giao dịch đơn giản hóa, được thiết kế chủ yếu cho mục đích minh họa. Nó không phải là lời khuyên đầu tư, cũng không có ý cho rằng số dư sàn giao dịch là nền tảng vững chắc cho một hệ thống giao dịch.
Truy cập biểu đồ trực tiếp

Đây là cách đọc biểu đồ này:

🟫 Đường màu nâu ở dưới cùng là tín hiệu giao dịch nhị phân, chuyển đổi giữa trong thị trường (1) và ngoài thị trường (0).

🟦 Đường màu xanh lam theo dõi giá trị danh mục đầu tư của chiến lược theo thời gian.

🟩 Đường màu xanh lá cây là điểm chuẩn danh mục đầu tư mua và nắm giữ.

Chúng ta có thể quan sát thấy chiến lược số dư sàn giao dịch hoạt động khá tốt, mặc dù đôi khi chiến lược mua và nắm giữ vượt trội hơn. Tuy nhiên, trong những ngày cuối cùng của kỳ nghiên cứu, chiến lược số dư sàn giao dịch đã bắt kịp. Mặc dù một số nhà đầu tư có thể thấy sự kết hợp giữa việc giảm biến động và hiệu suất cuối cùng tương đương với mua và nắm giữ là hấp dẫn, nhưng những con số cuối cùng là gây hiểu lầm – và đây là lý do.

Vấn Đề: Đột Biến Dữ Liệu và Định Kiến Nhìn Trước

Các số liệu không tĩnh. Nhiều số liệu được sửa đổi lại một cách hồi tố khi có thông tin mới. Điều này đặc biệt đúng với các số liệu phụ thuộc vào phân cụm địa chỉ hoặc gắn nhãn thực thể, chẳng hạn như số dư trên chuỗi của sàn giao dịch. Tuy nhiên, điều này cũng xảy ra đối với các số liệu như khối lượng giao dịch hoặc giá, vì các sàn giao dịch riêng lẻ đôi khi có thể gửi dữ liệu của họ với độ trễ nhỏ.

Điều này có nghĩa là một giá trị bạn thấy hôm nay cho, ví dụ, ngày 15 tháng 1 năm 2024, có thể không phải là giá trị đã được công bố vào ngày 15 tháng 1 năm 2024. Dữ liệu đã được sửa đổi với góc nhìn muộn màng. Khi bạn backtest một chiến lược trên dữ liệu đã sửa đổi này, bạn đang ngầm sử dụng thông tin không có sẵn tại thời điểm các quyết định giao dịch lẽ ra được đưa ra. Điều này tạo ra một định kiến nhìn trước (look-ahead bias).

Backtest Trung Thực: Sử Dụng Dữ Liệu Theo Thời Điểm (Point-in-Time)

Do đó, hãy lặp lại chính xác cùng một backtest – cùng logic tín hiệu, cùng tham số, cùng ngày tháng, cùng phí – nhưng lần này sử dụng biến thể Dữ liệu Theo Thời Điểm (Point-in-Time - PiT) của số liệu Số dư Sàn giao dịch, có sẵn trong Glassnode Studio.

Các số liệu PiT hoàn toàn chỉ được thêm vào và không thay đổi. Mỗi điểm dữ liệu lịch sử chỉ phản ánh thông tin đã được biết đến tại thời điểm nó được tính toán lần đầu. Không có sửa đổi hồi tố, không có định kiến nhìn trước.

Mặc dù chúng ta đang sử dụng cùng một số liệu, chiến lược bây giờ tạo ra kết quả khác biệt đáng kể, như được minh họa bằng đường màu tím trong biểu đồ mới bên dưới. Hiệu suất tổng thể tệ hơn đáng kể.

Mặc dù cả hai chiến lược hoạt động tương tự trong phần lớn năm 2024, chúng ta quan sát thấy phiên bản dựa trên PiT không nắm bắt được các đợt tăng mạnh vào tháng 11 năm 2024 và tháng 3 năm 2025 một cách hiệu quả. Kết quả là, hiệu suất tích lũy phân kỳ có ý nghĩa và cuối cùng thấp hơn đáng kể.

Truy cập biểu đồ trực tiếp

Điểm then chốt

Trong ví dụ này, chiến lược màu tím, chỉ có quyền truy cập vào thông tin như nó đã có sẵn tại thời điểm đó, hoạt động tệ hơn một cách đáng chú ý. ► Backtest sẽ nói dối nếu được cung cấp dữ liệu sai hoặc đã sửa đổi. Chỉ các số liệu Theo Thời Điểm (Point-in-Time) bất biến mới đảm bảo bạn đang phát lại lịch sử đúng như nó đã xảy ra.

Câu hỏi Liên quan

QTại sao bài viết cho rằng backtest có thể 'nói dối'?

ABài viết chỉ ra rằng backtest có thể 'nói dối' vì nó thường sử dụng dữ liệu đã được sửa đổi sau này (revised data), chứa thông tin không có sẵn tại thời điểm giao dịch trong quá khứ. Điều này tạo ra 'look-ahead bias' (thiên vị nhìn trước), khiến kết quả backtest trông tốt hơn thực tế.

QDữ liệu Point-in-Time (PiT) là gì và tại sao nó quan trọng?

ADữ liệu Point-in-Time (PiT) là dữ liệu bất biến, chỉ được thêm mới và không bao giờ bị sửa đổi sau đó. Mỗi điểm dữ liệu phản ánh chính xác thông tin đã biết tại thời điểm nó được tính toán. Nó quan trọng vì loại bỏ look-ahead bias, giúp mô phỏng lại lịch sử một cách trung thực và cho kết quả backtest chính xác hơn.

QChiến lược giao dịch dựa trên số dư sàn được mô tả trong bài hoạt động như thế nào?

AChiến lược này dựa trên xu hướng rút tiền khỏi sàn, được coi là tín hiệu tăng giá. Cụ thể: Vào lệnh (Mua) khi đường trung bình động 5 ngày của số dư BTC trên Binance cắt xuống DƯỚI đường trung bình động 14 ngày, báo hiệu một xu hướng rút tiền bền vững. Thoát lệnh (Bán) khi đường trung bình 5 ngày cắt lên TRÊN đường 14 ngày, báo hiệu xu hướng đảo chiều.

QKết quả backtest khác nhau thế nào khi dùng dữ liệu thông thường và dữ liệu PiT?

AKhi sử dụng dữ liệu thông thường (có thể bị sửa đổi), chiến lược cho thấy hiệu suất khá tốt, cuối cùng gần bằng với mua và nắm giữ. Tuy nhiên, khi sử dụng dữ liệu PiT chính xác, hiệu suất của chiến lược kém hơn đáng kể, đặc biệt là không tận dụng được các đợt tăng mạnh vào tháng 11/2024 và tháng 3/2025 một cách hiệu quả.

QBài học chính từ bài viết này là gì?

ABài học chính là: Backtest chỉ đáng tin cậy khi sử dụng dữ liệu Point-in-Time (theo thời điểm thực) bất biến. Việc sử dụng dữ liệu đã được sửa đổi hoặc cập nhật sau này sẽ dẫn đến look-ahead bias, khiến kết quả backtest không phản ánh chính xác hiệu suất thực tế mà chiến lược có thể đạt được trong quá khứ, và do đó 'nói dối' người kiểm tra.

Nội dung Liên quan

Nhóm của Lý Phi Phi làm rõ khái niệm 'Mô hình thế giới', Sora chỉ có thể tính là trình kết xuất

Nhóm của Giáo sư Lý Phi Phi từ World Labs và Đại học Stanford đã công bố một bài phân tích khái niệm, chỉ ra sự lạm dụng thuật ngữ "mô hình thế giới" trong AI. Bài viết phân loại các hệ thống được gọi là "mô hình thế giới" thành ba chức năng chiếu theo vòng lặp nhận thức POMDP: bộ kết xuất, bộ mô phỏng và bộ lập kế hoạch. Theo phân loại này, các mô hình tạo video như Sora của OpenAI thuộc nhóm "bộ kết xuất". Chúng tập trung tạo ra đầu ra pixel chân thực cho thị giác con người từ trạng thái hoặc mô tả, nhưng không thực sự tính toán các quy luật vật lý chính xác để dự đoán sự thay đổi trạng thái dựa trên hành động. Do đó, chúng không phải là mô hình thế giới đầy đủ hay bộ mô phỏng thế giới. Ngược lại, "bộ mô phỏng" (ví dụ: NVIDIA Omniverse) tập trung vào việc tạo ra trạng thái vật lý-chính xác cho các tính toán, còn "bộ lập kế hoạch" chuyển đổi quan sát thành hành động. Sự nhầm lẫn khái niệm này, thường được thúc đẩy bởi tiếp thị, có thể dẫn đến đánh giá sai lệch về khả năng công nghệ, ảnh hưởng đến lựa chọn kỹ thuật và đầu tư. Việc làm rõ này có giá trị thực tiễn, giúp các doanh nghiệp và nhà đầu tư đánh giá đúng năng lực của từng loại hệ thống. Tương lai có thể hướng tới sự hợp nhất của ba chức năng, nhưng hiện tại, việc nhận biết ranh giới của chúng là rất quan trọng.

marsbit45 phút trước

Nhóm của Lý Phi Phi làm rõ khái niệm 'Mô hình thế giới', Sora chỉ có thể tính là trình kết xuất

marsbit45 phút trước

Từ Web3 đến AI Agent, Quỹ đầu tư mạo hiểm tiền mã hóa lâu đời Variant cược 2 tỷ đồng vào chuyển đổi

Tác giả: Variant Fund. Biên dịch: Deep Tide TechFlow. Quỹ đầu tư mạo hiểm tiền mã hóa Variant đã công bố Quỹ mới Variant 4 trị giá 222 triệu USD. Quỹ sẽ tập trung vào đầu tư giai đoạn sớm và tham gia vào các vòng tăng trưởng sau này. Thay vì chủ đề "quyền sở hữu kỹ thuật số" như trước đây, triết lý đầu tư cốt lõi của Variant giờ đây đã nâng cấp thành "quyền tự chủ". Quyền tự chủ là về khả năng chủ động của người dùng: mức độ kiểm soát của họ đối với cuộc sống, tài sản và danh tính của chính mình. Một cách để đạt được quyền tự chủ là sở hữu các thị trường, dữ liệu, sản phẩm và cơ sở hạ tầng mà họ sử dụng hàng ngày. Variant phân biệt rõ ràng giữa quyền tự chủ và tự động hóa đơn thuần. Tự động hóa thông minh là một trong những lĩnh vực công nghệ quan trọng nhất, nhưng việc nó có tăng cường quyền tự chủ hay không phụ thuộc vào việc nó phục vụ ai: người dùng hay một thực thể khác. Lý thuyết đầu tư mới của Variant là: đầu tư vào công nghệ mở rộng quyền tự chủ, tập trung vào các thị trường, cơ sở hạ tầng và ứng dụng mới trao quyền chủ động hơn cho người dùng thông qua việc tăng cường khả năng tiếp cận, kiến thức và quyền sở hữu. Lý thuyết này bao trùm các khoản đầu tư trước đây của họ vào các blockchain hàng đầu, cơ sở hạ tầng cho nhà phát triển, thị trường tài chính mới và sản phẩm tiêu dùng, đồng thời cũng phản ánh các khoản đầu tư gần đây vào các lĩnh vực như đại lý AI và danh tính kỹ thuật số. Variant tin rằng, các tác nhân thông minh (AI Agent) và các hệ thống tài chính toàn cầu mở sẽ thay đổi cấu trúc internet: từ một nơi người dùng thường là sản phẩm, trở thành một nơi người dùng có được khả năng chủ động chưa từng có. Sự thay đổi này sẽ không chỉ dừng lại ở người dùng cá nhân mà còn bao gồm các thị trường, công cụ và dịch vụ mới dành cho nhà phát triển và doanh nghiệp.

marsbit51 phút trước

Từ Web3 đến AI Agent, Quỹ đầu tư mạo hiểm tiền mã hóa lâu đời Variant cược 2 tỷ đồng vào chuyển đổi

marsbit51 phút trước

Thời Đại Ballmer của Ethereum: Khi Mọi Người Đều Bán, Lượng Cung Lưu Hành Đang Biến Mất

**Tóm tắt bài viết "Kỷ nguyên Ballmer của Ethereum: Khi mọi người đều bán, nguồn cung lưu hành đang thu hẹp"** Tác giả Ben Lakoff so sánh giai đoạn hiện tại của Ethereum với "Kỷ nguyên Ballmer" của Microsoft - một thời kỳ bị chỉ trích, cổ phiếu trì trệ nhưng nền tảng cơ bản vẫn tăng trưởng ổn định bên dưới. Bài viết thừa nhận các luận điểm bearish là có cơ sở: lộ trình rollup làm giảm phí thu về cho ETH, năng lượng sáng tạo chuyển sang Solana, và Quỹ Ethereum bị coi là quá thận trọng. Tuy nhiên, tác giả chỉ ra rằng nguồn cung ETH lưu hành đang bị thu hẹp mạnh do: 30% ETH được stake, các công ty và quỹ ETF hút mua, và các quy định rõ ràng hơn (như phân loại phần thưởng stake không phải chứng khoán). Về tổng thể, toàn ngành crypto đang chuyển từ mối đe dọa sang một khuôn khổ pháp lý rõ ràng, với các đạo luật như GENIUS và CLARITY, thu hút vốn tổ chức. Mặc dù Ethereum có thể mất thị phần, nó vẫn là blockchain trung lập, đáng tin cậy hàng đầu cho tài sản token hóa. Chiến lược được đề xuất là đa dạng hóa: nắm giữ ETH cho giao dịch thu hẹp nguồn cung và sự chấp nhận của tổ chức; SOL cho giao dịch người dùng và khả năng mở rộng; BTC để phòng ngừa rủi ro vĩ mô; cùng một rổ nhỏ các L1 và ứng dụng thế hệ tiếp theo. Thời điểm hiện tại, khi narrative bearish là phổ biến và năng lượng tập trung vào AI, có thể chính là lúc thuận lợi để đầu tư vào crypto, một lĩnh vực đang có nền tảng pháp lý vững chắc hơn nhưng chưa được định giá cao.

marsbit1 giờ trước

Thời Đại Ballmer của Ethereum: Khi Mọi Người Đều Bán, Lượng Cung Lưu Hành Đang Biến Mất

marsbit1 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片