Bài viết gốc từ:Jason Goldberg
Biên dịch | Odaily Planet Daily (@OdailyChina); Dịch giả | Azuma (@azuma_eth)
Chúng tôi đã triển khai 22 AI Agent giao dịch tự chủ trên Hyperliquid thông qua Senpi, mỗi Agent được cấu hình với 1000 USD vốn thực.
Chúng sẽ chạy 24/7 không ngừng nghỉ — quét thị trường, mở vị thế, đặt lệnh dừng lỗ di động, quản lý rủi ro — toàn bộ quá trình không có bất kỳ sự can thiệp thủ công nào.
Sau khi đầu tư 22000 USD vốn ban đầu và thực hiện hơn 5000 giao dịch, đây là bản tóm tắt kinh nghiệm chúng tôi thu được.
Kết luận chung
“Ít giao dịch hơn” cộng với “niềm tin cao hơn”, luôn luôn bằng “kết quả tốt hơn”. Đây không phải là hiện tượng thỉnh thoảng mới xuất hiện, mà lần nào cũng đúng.
- Odaily chú thích: Fox, Bison, Ghost Fox, và Grizzly, Viper, Mamba, Anaconda sẽ xuất hiện ở phần sau v.v... đều là tên của các Agent thực thi các chiến lược khác nhau.
Như hình trên, Agent “Fox” và Agent “Ghost Fox” sử dụng cùng một công cụ quét. Fox chỉ chọn lọc thực thi một phần tín hiệu, trong khi Ghost Fox thực thi nhiều tín hiệu hơn. Kết quả là, chênh lệch tỷ suất lợi nhuận (ROI) giữa hai Agent lên tới 56 điểm phần trăm.
Lợi thế thực sự không nằm ở bản thân công cụ quét, mà ở kỷ luật chờ đợi tín hiệu chính xác.
- Tất cả các Agent có số lần giao dịch vượt quá 400 đều chịu lỗ nặng.
- Trong khi các Agent có số lần giao dịch dưới 120 thì tất cả đều trong trạng thái có lãi.
Giao dịch nhiều hơn không có nghĩa là cơ hội nhiều hơn — nó có nghĩa là nhiều giao dịch vô hiệu hơn, nhiều phí giao dịch hơn, và phơi nhiễm nhiều rủi ro nhiễu hơn.
Lợi nhuận tuân theo “Phân phối lũy thừa” (Power Law)
Trong số các Agent hoạt động tốt nhất của chúng tôi, chỉ 3–5 giao dịch đã đóng góp toàn bộ lợi nhuận, số giao dịch còn lại về cơ bản đều bị chốt lỗ nhanh chóng sau khi thua lỗ nhẹ.
Lấy Fox làm ví dụ, ba giao dịch tốt nhất (ZEC, TRUMP, FARTCOIN) tổng lãi hơn 350 USD; 46 giao dịch còn lại tổng lỗ hơn 100 USD; kết quả cuối cùng là lợi nhuận ròng khoảng 248 USD.
Đây hoàn toàn là kết quả của thiết kế chiến lược. Thiết kế của chúng tôi là: Vào lệnh dứt khoát khi niềm tin cao, cắt lỗ nhanh chóng trong vài phút nếu thua lỗ, để các vị thế có lãi tiếp tục chạy, và khóa một phần lợi nhuận đỉnh thông qua chiến lược dừng lỗ di động DSL High Water. Khi lợi nhuận trung bình gấp 10 lần thua lỗ trung bình, ngay cả khi tỷ lệ thắng chỉ 43% vẫn có thể kiếm tiền ổn định.
Những Agent cố gắng duy trì tỷ lệ thắng cao thông qua các giao dịch “an toàn” ngược lại đều thua lỗ — bởi vì mỗi giao dịch đặt mục tiêu lợi nhuận nhỏ bé vẫn phải chịu phí giao dịch và rủi ro thị trường.
Vũ khí bí mật: Hyperfeed
Fox và các Agent hoạt động ổn định khác đều được xây dựng trên Hyperfeed của Senpi.
Hyperfeed là một hệ thống theo dõi thời gian thực, có thể nhìn thấy tất cả các tài sản mà người giao dịch trên Hyperliquid đang kiếm tiền tại thời điểm hiện tại. Nó không phải là bảng xếp hạng lịch sử hay bất kỳ chỉ báo trễ nào khác, mà là hành vi giao dịch đang kiếm tiền của toàn bộ sàn giao dịch ngay lúc này.
Công cụ quét cốt lõi mà chúng tôi sử dụng, Emerging Movers, cứ mỗi 90 giây lại đọc dữ liệu mức độ tập trung thị trường từ Hyperfeed một lần. Khi tiền thông minh (smart money) đột ngột luân chuyển sang một tài sản: ví dụ một người giao dịch đột ngột tăng ít nhất 15 bậc trên bảng xếp hạng, hoặc tốc độ đóng góp lợi nhuận của ai đó đột ngột tăng lên, hoặc nhiều người giao dịch hàng đầu đồng thời tập trung mở cùng một vị thế, công cụ quét có thể bắt được tín hiệu trước khi biến động giá được định giá hoàn toàn.
Đây chính là lợi thế cấu trúc khi xây dựng chiến lược trên Hyperliquid thông qua Senpi, bạn có thể nhìn thấy thời gian thực nơi lợi nhuận của các nhà giao dịch hàng đầu đang tập trung đến, và hành động ngay lập tức. Không có sàn giao dịch nào khác cung cấp khả năng hiển thị như vậy, và cũng không có nền tảng nào khác cho phép Agent tự chủ thực thi hoạt động dựa trên điều này.
Tất cả các Agent hoạt động tốt nhất của chúng tôi đều sử dụng loại dữ liệu này:
- Fox / Vixen: Nhận diện tiền thông minh đột ngột tập trung vào một tài sản thông qua Emerging Movers;
- Grizzly: Phân tích vị thế tiền thông minh trên BTC thông qua Hyperfeed trước khi mở vị thế;
- Bison: Lấy hướng đi của tiền thông minh làm điều kiện cứng — sẽ không giao dịch nếu hướng ngược lại;
Trong khi các Agent hoạt động tệ nhất thì:
- Hoàn toàn bỏ qua tín hiệu tiền thông minh, ví dụ Viper, Mamba chỉ dựa trên phân tích kỹ thuật thuần túy;
- Sử dụng dữ liệu tiền thông minh đã hết hạn (Scorpion v1), coi các vị thế từ vài tháng trước như tín hiệu mới;
Vì vậy kết luận rất rõ ràng, các Agent giao dịch dựa trên dữ liệu Hyperfeed thời gian thực, có hiệu suất vượt trội hơn tất cả các chiến lược thuần kỹ thuật.
Chiến lược hồi quy trung bình (Mean Reversion) không hiệu quả với hợp đồng vĩnh cửu
Chúng tôi đã thử nghiệm ba phiên bản Agent khác nhau dựa trên logic “giá lệch quá xa, sẽ sớm quay trở về”, hiệu suất cụ thể như sau:
- Viper: -18%
- Mamba: -33%
- Anaconda: -22%
Kết quả là tất cả đều lỗ. Vấn đề nằm ở chỗ, thị trường hợp đồng vĩnh cửu Hyperliquid có xu hướng mạnh mẽ hơn nhiều so với khả năng hồi quy trung bình. Mua vào ở đáy trong một xu hướng giảm, là sai lầm đắt giá nhất trong thị trường này. Các Agent này liên tục mua vào tại các vùng được cho là “hỗ trợ”, nhưng giá lại tiếp tục giảm trong nhiều ngày.
Giải pháp sửa chữa chúng tôi đang thử nghiệm là thêm một công cụ lọc trạng thái thị trường vĩ mô, tức là khi xu hướng bốn giờ của BTC là giảm, thì cấm mua vào dựa trên “chiến lược hồi quy trung bình”. Kết quả ban đầu có vẻ khả quan, công cụ lọc này có thể tránh được 14 trong số 28 giao dịch thua lỗ của Mamba.
Đừng bám víu vào một mô hình duy nhất
Agent mới nhất của chúng tôi (Vixen) dựa trên dữ liệu giao dịch của Fox, sử dụng hai mô hình vào lệnh hoàn toàn khác biệt.
- Chế độ Rình mò (Stalker): Thông qua nhiều lần quét, bắt tín hiệu tiền thông minh đang âm thầm tích lũy một tài sản. Bằng cách này bạn có thể vào lệnh trước khi đám đông đổ xô vào, vài giao dịch lãi lớn nhất của Fox chính đến từ chế độ này.
- Chế độ Tấn công (Striker): Bắt các đợt biến động mạnh mẽ được xác nhận bởi khối lượng giao dịch. Vào lệnh đồng thời khi biến động bùng nổ, nhưng chỉ thực thi khi có khối lượng giao dịch thực hỗ trợ (lọc các đợt bơm giá ảo).
Dữ liệu từ Fox cho thấy, đây thực chất là hai nguồn tín hiệu Alpha hoàn toàn khác nhau. Nếu chỉ sử dụng một mô hình vào lệnh duy nhất, bạn buộc phải lựa chọn giữa hai bên, và do đó bỏ lỡ cơ hội từ mô hình kia.
Agent sẽ tự điều chỉnh — và kết quả luôn tồi tệ hơn
Một phát hiện bất ngờ là: Khi Agent liên tục thua lỗ, chúng sẽ cố gắng “tự sửa chữa”. Hành động sửa chữa phổ biến bao gồm nới lỏng điều kiện vào lệnh, tăng đòn bẩy, gỡ bỏ cơ chế bảo vệ rủi ro, nhưng kết quả là mỗi lần như vậy đều đẩy nhanh tốc độ thua lỗ.
Lấy một vài ví dụ, Dire Wolf sau khi lỗ -27%, đã kích hoạt 5 vị thế song song với đòn bẩy 25x, và nới lỏng giới hạn tốc độ đặt lệnh; một Agent khác đã xóa cơ chế chốt lãi khi trì trệ; một Agent khác thì nâng giới hạn lỗ hàng ngày từ 10% lên 25%.
Giải pháp của chúng tôi là, viết trực tiếp cơ chế bảo vệ rủi ro vào mã code của công cụ quét, thay vì phụ thuộc vào cấu hình chiến lược của bản thân Agent. Nếu công cụ quét không xuất ra tín hiệu, Agent không thể thực thi giao dịch — bất kể nó có thực hiện những điều chỉnh mạo hiểm đến đâu trong cấu hình của chính nó.
Kế hoạch tiếp theo
Chúng tôi sẽ tiếp tục chạy thí nghiệm trong 24–48 giờ nữa, sau đó tắt những Agent đã không còn khả năng thu hồi vốn, để tránh số vốn còn lại tiếp tục thất thoát.
Tiếp theo chúng tôi sẽ triển khai các phiên bản chiến lược mới, và viết các cơ chế bảo vệ vào tầng code:
- Wolverine v1.1: DSL dừng lỗ di động tốc độ HYPE (khóa lợi nhuận nhanh hơn trong các tài sản biến động mạnh);
- Mamba v2.0: Chiến lược hồi quy trung bình + Bảo vệ xu hướng vĩ mô BTC;
- Scorpion v2.0: Đồng thuận sự kiện động lượng thời gian thực (Thay thế chiến lược theo dõi cá voi đã hết hạn).
Đồng thời chúng tôi cũng sẽ:
- Thống nhất cấu hình chiến lược cho Fox, Vixen và Mantis: Ba Agent này sử dụng cùng một công cụ quét, nhưng cấu hình đã có sự trôi dạt, Fox hiện có tỷ suất lợi nhuận trên 23%, hai Agent còn lại sẽ được điều chỉnh về cùng thiết lập;
- Triển khai lại bộ đôi Fox/Vixen mới, sử dụng cấu hình chiến thắng đầy đủ của Fox, bao gồm quy tắc cấm XYZ, cơ chế chốt lãi khi trì trệ, giới hạn lỗ hàng ngày 10%, tất cả cơ chế cổng rủi ro được bật;
- Mở rộng chiến lược săn tài sản đơn lẻ: Mô hình vòng đời ba giai đoạn của Grizzly (Săn tìm → Cưỡi sóng → Rình mò → Nạp lại) hiện đã được áp dụng cho ETH (Polar), SOL (Kodiak) và HYPE (Wolverine).
Song song đó, chúng tôi vẫn đang phát triển các chiến lược hoàn toàn mới và thử nghiệm trực tiếp trên thị trường thực. Bản thân thị trường này là một phòng thí nghiệm. Mỗi chiến lược mới sẽ sở hữu 1000 USD vốn và hồ sơ giao dịch minh bạch đầy đủ.
Thí nghiệm của chúng tôi sẽ chạy thời gian thực tại strategies.senpi.ai; toàn bộ mã chiến lược được mở nguồn tại: github.com/Senpi-ai/senpi-skills
22 Agent, 22000 USD vốn thực, mỗi giao dịch hoàn toàn công khai, thí nghiệm vẫn đang tiếp diễn.








