Alumni TH Thanh Hoa U00 tuổi Vương Quan ra tác phẩm mới: Dùng 1/900 token, 1/432 sức tính toán, làm đảo lộn mô hình tiền huấn luyện Transformer

marsbitXuất bản vào 2026-05-26Cập nhật gần nhất vào 2026-05-26

Tóm tắt

Cựu sinh viên Thanh Hoa 00 hậu Vương Quan và nhóm nghiên cứu công bố mô hình HRM-Text, một phương pháp huấn luyện tiền ngôn ngữ hiệu quả sử dụng Mô hình tuần hoàn phân tầng (HRM) thay thế Transformer tiêu chuẩn. Với chỉ 1B tham số và được huấn luyện trên 40B token duy nhất, chi phí ước tính khoảng 1500 USD, HRM-Text đạt hiệu suất tương đương các mô hình nguồn mở từ 2B đến 7B tham số trên các bài kiểm tra chuẩn như MMLU (60.7%) và GSM8K (84.5%). Phương pháp này tiết kiệm đáng kể tài nguyên: sử dụng ít hơn từ 100-900 lần token huấn luyện và 96-432 lần ước tính tính toán so với baseline tiêu chuẩn. Thiết kế chính bao gồm: kiến trúc HRM với module H (chậm) và L (nhanh) cho phép cập nhật đệ quy nhiều lượt trên cùng một token để tăng độ sâu tính toán; và mục tiêu huấn luyện tập trung vào các cặp chỉ dẫn-câu trả lời, chỉ tính toán mất mát trên phần trả lời với cơ chế che PrefixLM. Thử nghiệm cho thấy HRM vượt trội về hiệu quả kiến trúc và ổn định huấn luyện so với Transformer ở cùng quy mô FLOPs. Các hướng phát triển tương lai bao gồm tách biệt "kiến thức" và "suy luận", cơ chế thời gian tính toán thích ứng, xác thực khả năng mở rộng quy mô hơn nữa, và tối ưu hóa việc triển khai PrefixLM trong các framework suy luận thực tế.

Phá vỡ mô hình tiền huấn luyện truyền thống cho mô hình lớn, đội ngũ cựu sinh viên TH Thanh Hoa Vương Quan 00 tuổi lại ra tác phẩm mới:

Họ sử dụng mô hình tuần hoàn phân tầng (HRM) thay thế Transformer tiêu chuẩn, đề xuất phương pháp tiền huấn luyện hiệu quả HRM-Text vượt xa Scaling.

Liên kết bài báo: https://arxiv.org/abs/2605.20613

Trong trường hợp chỉ sử dụng số lượng token huấn luyện ít hơn khoảng 100-900 lần so với mô hình baseline tiêu chuẩn, và khối lượng tính toán ước tính ít hơn 96-432 lần, HRM-Text vẫn đạt được hiệu suất có thể so sánh với các mô hình nguồn mở từ 2B đến 7B tham số.

Đồng thời, với 1B tham số, 40B token không lặp lại và chi phí huấn luyện khoảng 1500 USD, HRM-Text đã đạt được kết quả sau trong các bài kiểm tra chuẩn chủ đạo: MMLU 60.7%, ARC-C 81.9%, DROP 82.2%, GSM8K 84.5%, MATH 56.2%.

Hình | Hiệu quả tiền huấn luyện.

Trên cơ sở đó, họ nêu rõ: Tiên nghiệm cấu trúc và mục tiêu huấn luyện có mục tiêu, có thể giảm đáng kể ngưỡng tiền huấn luyện. Phương án huấn luyện này có thể làm cho việc huấn luyện mô hình cơ bản từ con số 0 trở nên khả thi.

HRM-Text được thiết kế như thế nào?

Tiền huấn luyện mô hình ngôn ngữ lớn (LLM), ngày càng phụ thuộc vào một số ít tổ chức sở hữu đầy đủ tài nguyên tính toán và dữ liệu. Huấn luyện một mô hình cơ bản có sức cạnh tranh, thường cần hàng nghìn tỷ token, hàng nghìn GPU, thậm chí đầu tư tính toán lên đến hàng triệu USD.

Tuy nhiên, mô hình huấn luyện hiện tại không hiệu quả, lượng lớn tính toán bị tiêu hao vào các token không liên quan như prompt, điền định dạng và nhiễu web, dẫn đến phần lớn sức tính toán huấn luyện không trực tiếp phục vụ suy luận.

Trong công trình này, nhóm nghiên cứu đã thiết kế lại kiến trúc và mục tiêu huấn luyện, giúp việc tiền huấn luyện HRM-Text trở nên hiệu quả hơn một cách tương đối.

Kiến trúc: Sử dụng mô hình tuần hoàn phân tầng với hai thang thời gian, chia tính toán thành mô-đun chậm H và mô-đun nhanh L. Transformer tiêu chuẩn chỉ thực hiện một lượt truyền thẳng cho mỗi token, HRM sẽ thực hiện cập nhật đệ quy nhiều vòng trên cùng một token. Mô-đun H và L mỗi cái chỉ chiếm một nửa số tham số của lõi đệ quy, tổng khối lượng tính toán tương đương với việc triển khai đệ quy 4 lần trên cùng một bộ tham số, từ đó nâng cao độ sâu tính toán mà không tăng số lượng tham số.

Mục tiêu huấn luyện: Không tiếp tục sử dụng tiền huấn luyện tự hồi quy toàn văn tiêu chuẩn, mà huấn luyện trực tiếp trên cặp chỉ dẫn - trả lời, chỉ tính toán tổn thất cho phần trả lời, và kết hợp mặt nạ PrefixLM, cho phép phần chỉ dẫn chú ý hai chiều, phần trả lời sinh ra theo mặt nạ nhân quả.

Hình | Kiến trúc HRM-Text.

Để nâng cao tính ổn định của huấn luyện đệ quy, nhóm nghiên cứu đã giới thiệu MagicNorm và Warmup Deep Credit Assignment.

MagicNorm là một chiến lược chuẩn hóa hỗn hợp, tận dụng tính không đối xứng giữa độ sâu tính toán truyền thẳng và truyền ngược trong truyền ngược cắt ngắn (Truncated BPTT), sử dụng PreNorm bên trong mô-đun, và thêm chuẩn hóa ở lối ra mô-đun, từ đó nâng cao tính ổn định của huấn luyện đệ quy sâu.

Warmup Deep Credit Assignment thì trong giai đoạn đầu huấn luyện chỉ truyền gradient ngược cho 2 bước đệ quy cuối cùng, sau đó mở rộng tuyến tính đến 5 bước cuối. Cơ chế huấn luyện này có thể giúp mô hình hội tụ ổn định trên đường dẫn tín dụng ngắn hơn, sau đó từ từ đưa vào quan hệ phụ thuộc dài hơn.

Hiệu quả ra sao?

Kết quả thí nghiệm cho thấy, HRM-Text thể hiện ưu thế rõ ràng về hiệu quả kiến trúc, mục tiêu huấn luyện và hiệu suất tổng thể.

1. Trong điều kiện sức tính toán huấn luyện cố định, kiến trúc tuần hoàn có hiệu quả hơn không

Kết quả cho thấy, trong điều kiện căn chỉnh FLOPs, HRM 1B vượt trội hơn Transformer 1B, Transformer 3B, Looped Transformer 1B và RINS 1B trên hầu hết các bài kiểm tra chuẩn; so sánh với TRM cũng cho thấy, huấn luyện HRM ổn định hơn.

Hình | So sánh hiệu suất và tính ổn định với mô hình Transformer. HRM duy trì động thái huấn luyện ổn định ở tất cả quy mô, trong khi mô hình Transformer ở quy mô 1 tỷ tham số xuất hiện sự bất ổn nghiêm trọng. Ngoài ra, ở quy mô 0.6B, HRM chỉ cần khối lượng tính toán ít hơn 2 lần so với mô hình Transformer, đã có thể đạt được biểu hiện cạnh tranh trên hầu hết các bài kiểm tra chuẩn.

2. Mục tiêu hoàn thành nhiệm vụ và PrefixLM có hữu ích không

Thí nghiệm loại bỏ cho thấy, trong điều kiện căn chỉnh FLOPs, MMLU của Transformer 1B từ mức 40.55 của tự hồi quy tiêu chuẩn, lần lượt tăng lên 47.72 sau khi đưa vào mục tiêu hoàn thành nhiệm vụ, lên 53.15 sau khi thêm PrefixLM, và cuối cùng lên 60.73 sau khi chuyển sang kiến trúc HRM.

Hình | So sánh hiệu suất giữa các kiến trúc mô hình và mục tiêu huấn luyện khác nhau.

3. HRM-Text so với các mô hình mở đương thời thì hiệu quả ra sao

HRM-Text 1B đạt được 60.7, 81.9, 82.2, 84.5 và 56.2 lần lượt trên MMLU, ARC-C, DROP, GSM8K và MATH. So với các mô hình mở có ngân sách huấn luyện thường lớn hơn, nó chỉ sử dụng 40 tỷ token duy nhất và 1B tham số, đã bước vào khoảng hiệu suất của các mô hình nguồn mở từ 2B đến 7B; số token huấn luyện cần thiết ít hơn tới 900 lần, chi phí tính toán ít hơn tới 432 lần.

Hình | Kết quả đánh giá HRM-Text 1B so với các mô hình hoàn toàn nguồn mở và mô hình trọng số mở cùng thời kỳ.

4. Cấu trúc tuần hoàn có mang lại độ sâu hiệu quả lớn hơn không

Kết quả cho thấy, Transformer tiêu chuẩn và Looped Transformer có xu hướng ổn định ở tầng nông hơn, trong khi HRM ở tầng sâu hơn vẫn duy trì sự thay đổi biểu diễn giữa các khối rõ ràng hơn, độ tương đồng cosin thấp hơn và giá trị KL logit lens cao hơn.

Hình | Phân tích độ sâu hiệu quả.

Hình | Phân tích Logit Lens KL theo từng tầng.

Hạn chế và hướng phát triển tương lai

Mặc dù HRM-Text thể hiện biểu hiện mạnh mẽ trong các nhiệm vụ tập trung suy luận, phương pháp này vẫn tồn tại hạn chế và đề xuất các hướng nghiên cứu tương lai.

1. Hướng tới việc tách rời "kiến thức" và "suy luận"

Hiện tại, phủ sóng kiến thức thực tế rộng hơn vẫn phụ thuộc nhiều hơn vào quy mô mô hình và độ rộng dữ liệu. HRM-Text chỉ được huấn luyện trên 40 tỷ token duy nhất, và nguồn kiến thức hiển thị chỉ chiếm một phần trong dữ liệu hỗn hợp định dạng nhiệm vụ. Trong tương lai, các nhà nghiên cứu cần thiết kế riêng biệt lõi suy luận nhỏ gọn với kho lưu trữ thực tế bên ngoài, giao phạm vi kiến thức rộng cho ngữ liệu tinh lọc, mô-đun tăng cường truy xuất hoặc bộ nhớ có thể học.

2. Thời gian tính toán thích ứng

Lịch trình tuần hoàn của HRM-Text mang lại độ sâu nối tiếp hiệu quả lớn hơn, nhưng điều này cũng có nghĩa là mô hình cần thực hiện số bước đệ quy cố định khi suy luận. Trong tương lai, một hướng đáng khám phá là đưa vào cơ chế thời gian tính toán thích ứng, cho phép các mẫu đơn giản dừng tính toán sớm hơn, và dành toàn bộ ngân sách tuần hoàn cho các mẫu khó, giảm chi phí suy luận.

3. Phạm vi xác thực quy mô hóa hiện tại vẫn còn hạn chế

Thí nghiệm scaling hiện tại chỉ bao phủ đến nhóm đối chứng Transformer 3B tham số và HRM-Text 1B tham số. Nhóm nghiên cứu cho biết, liệu ở quy mô mô hình lớn hơn có thể duy trì lợi thế hiệu quả tương tự hay không, vẫn cần được xác thực thêm bởi các công trình tiếp theo.

4. PrefixLM và khung suy luận

Hiện tại, PrefixLM trong triển khai thực tế vẫn đối mặt với một số hạn chế về mặt kỹ thuật triển khai. Mặc dù nó có thể chạy trên các khung suy luận sinh văn bản tiêu chuẩn như vLLM, điều này yêu cầu khung hỗ trợ mặt nạ chú ý tùy chỉnh trong giai đoạn prefill. Nếu mở rộng nó đến các kịch bản hội thoại nhiều vòng, cần phải thiết kế thêm cơ chế KV-cache, vừa đảm bảo các đoạn của người dùng vẫn có thể thấy hai chiều, cũng phải đảm bảo quá trình sinh ra phía trợ lý tiếp tục tuân theo ràng buộc nhân quả.

Chi tiết kỹ thuật thêm, xem bài báo gốc.

Bài viết này đến từ tài khoản công chúng WeChat "Đầu đề học thuật" (ID:SciTouTiao), tác giả: Hạ Thiên Tư

Tiền kỹ thuật số thịnh hành

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

Câu hỏi Liên quan

QHRM-Text là gì và nó khác với mô hình Transformer truyền thống như thế nào?

AHRM-Text là một mô hình tiền huấn luyện ngôn ngữ hiệu quả, được phát triển bởi nhóm nghiên cứu của Vương Quan, cựu sinh viên trẻ Đại học Thanh Hoa. Nó khác với mô hình Transformer tiêu chuẩn chủ yếu ở kiến trúc và mục tiêu huấn luyện. Về kiến trúc, HRM-Text sử dụng Mô hình Tuần hoàn Phân tầng (HRM) với hai mô-đun tỷ lệ thời gian nhanh (L) và chậm (H), thực hiện nhiều bước cập nhật đệ quy trên cùng một token để tăng độ sâu tính toán mà không tăng tham số. Về mục tiêu huấn luyện, thay vì huấn luyện tự hồi quy toàn văn bản, HRM-Text được huấn luyện trực tiếp trên các cặp chỉ dẫn-câu trả lời, chỉ tính toán tổn thất trên phần câu trả lời và sử dụng mặt nạ PrefixLM.

QHRM-Text đạt được hiệu quả vượt trội như thế nào về mặt tài nguyên tính toán và dữ liệu?

AHRM-Text đạt được hiệu quả vượt trội bằng cách giảm đáng kể nhu cầu về token huấn luyện và lượng tính toán. Theo bài báo, so với các mô hình baseline tiêu chuẩn, HRM-Text chỉ sử dụng ít hơn khoảng 100-900 lần số token huấn luyện và 96-432 lần lượng tính toán ước tính. Cụ thể, phiên bản 1B tham số của HRM-Text chỉ được huấn luyện trên 40 tỷ token không lặp lại với chi phí khoảng 1500 USD, nhưng vẫn đạt được hiệu suất tương đương với các mô hình nguồn mở có tham số từ 2B đến 7B trên các bài kiểm tra chuẩn.

QNhững kỹ thuật nào được sử dụng để ổn định quá trình huấn luyện đệ quy sâu cho HRM-Text?

AĐể ổn định quá trình huấn luyện đệ quy sâu, nhóm nghiên cứu đã giới thiệu hai kỹ thuật chính: MagicNorm và Warmup Deep Credit Assignment. MagicNorm là một chiến lược chuẩn hóa hỗn hợp, kết hợp PreNorm bên trong mô-đun với một lớp chuẩn hóa bổ sung ở đầu ra, tận dụng sự bất đối xứng giữa độ sâu tính toán tiến và lùi dưới Truncated BPTT. Warmup Deep Credit Assignment bắt đầu huấn luyện bằng cách chỉ lan truyền ngược gradient cho 2 bước đệ quy cuối cùng, sau đó mở rộng tuyến tính lên đến 5 bước, giúp mô hình hội tụ ổn định trên các đường dẫn tín dụng ngắn trước.

QKết quả thí nghiệm so sánh HRM-Text với mô hình Transformer trên các bài kiểm tra chuẩn là gì?

AKết quả thí nghiệm cho thấy HRM-Text vượt trội so với mô hình Transformer trong điều kiện FLOPs được căn chỉnh. HRM 1B hoạt động tốt hơn Transformer 1B, Transformer 3B, Looped Transformer 1B và RINS 1B trên hầu hết các bài kiểm tra chuẩn. Đặc biệt, HRM duy trì động lực huấn luyện ổn định ở mọi quy mô, trong khi mô hình Transformer ở quy mô 1B tham số xuất hiện sự bất ổn nghiêm trọng. Ở quy mô 0.6B, HRM chỉ cần ít hơn 2 lần lượng tính toán so với Transformer để đạt hiệu suất cạnh tranh.

QNghiên cứu chỉ ra những hạn chế và hướng phát triển tương lai nào cho HRM-Text?

ANghiên cứu chỉ ra một số hạn chế và đề xuất hướng phát triển tương lai: 1) Tách biệt 'Kiến thức' và 'Suy luận': Cần kết hợp lõi suy luận gọn nhẹ với bộ nhớ sự kiện bên ngoài thông qua ngữ liệu tinh chế, mô-đun tăng cường truy xuất hoặc bộ nhớ có thể học. 2) Thời gian tính toán thích ứng: Giới thiệu cơ chế thời gian tính toán thích ứng để giảm chi phí suy luận. 3) Mở rộng phạm vi xác thực: Cần xác minh hiệu quả ở các quy mô mô hình lớn hơn. 4) PrefixLM và khuôn khổ suy luận: Cần giải quyết các hạn chế kỹ thuật khi triển khai PrefixLM, như hỗ trợ mặt nạ chú ý tùy chỉnh và thiết kế cơ chế KV-cache cho đa thoại.

Nội dung Liên quan

Sau ba quý liên tiếp suy giảm, thị trường tiền điện tử có thể đón cửa sổ ổn định trong quý III?

Thị trường tiền mã hóa vừa trải qua quý tồi tệ nhất kể từ năm 2022, với vốn hóa giảm 12.6% xuống 2.1 nghìn tỷ USD, khối lượng giao dịch sụt giảm và dòng tiền rút mạnh khỏi các quỹ ETF Bitcoin. Bitcoin và Ethereum lần lượt giảm 14.2% và 25.4% trong quý, đánh dấu sự đảo ngược so với mối tương quan trước đây với các tài sản rủi ro như Nasdaq. Dòng vốn ETF chứng khoán Mỹ ghi nhận dòng ròng rút khoảng 46.7 tỷ USD trong quý II, báo hiệu áp lực bán. Tuy nhiên, dấu hiệu tích cực ban đầu xuất hiện khi các nhà đầu tư dài hạn bắt đầu tích lũy trở lại và dòng ETF có đợt thu hút ngắn hạn. Toàn bộ thị trường hiện tập trung vào cuộc họp của Cục Dự trữ Liên bang Mỹ (FOMC) vào cuối tháng 7. Các tín hiệu chính sách tiền tệ sẽ quyết định xu hướng: tín hiệu ôn hòa có thể đẩy Bitcoin lên vùng 68,000-84,000 USD, trong khi lập trường cứng rắn có thể kéo giá về vùng 50,000-56,000 USD. Tiến trình pháp lý của Đạo luật CLARITY gần như đình trệ, làm giảm kỳ vọng và gia tăng phí rủi ro cho toàn ngành. Trong bối cảnh ảm đạm, hai lĩnh vực nổi bật là thị trường dự đoán (tăng trưởng 48.7%) và bộ sưu tập kỹ thuật số được mã hóa (tăng ~143%), cho thấy sự chuyển dịch nhu cầu thực tế. Nhìn chung, thị trường thiếu động lực cho một đợt tăng trưởng mạnh dựa trên tâm lý. Các quyết định giao dịch trong quý III sẽ chủ yếu xoay quanh diễn biến giá, lựa chọn chính sách và kỳ vọng lãi suất.

marsbit2 giờ trước

Sau ba quý liên tiếp suy giảm, thị trường tiền điện tử có thể đón cửa sổ ổn định trong quý III?

marsbit2 giờ trước

Giao Dịch SpaceX, Đã Mở Khóa: SPCXON Được Giao Dịch Trên WEEX

SpaceX đã thực hiện đợt IPO lớn nhất lịch sử vào tháng 6/2026, nhưng nhiều nhà giao dịch không thể tiếp cận do các rào cản như hạn chế môi giới và khu vực. Sàn giao dịch tiền điện tử WEEX đã giới thiệu SPCXON/USDT, một công cụ token hóa cho phép tiếp cận biến động giá của SpaceX thông qua tài khoản crypto được quyết toán bằng USDT, mà không cần môi giới Mỹ hay tài khoản ngân hàng. Sản phẩm này, xây dựng trên nền tảng cổ phiếu token hóa của Ondo, dành cho các nhà giao dịch bên ngoài Hoa Kỳ. Trường hợp đầu tư dựa trên đà tăng doanh thu Starlink và các cột mốc Starship, trong khi các yếu tố cần thận trọng bao gồm định giá cao, lượng cổ phiếu lưu hành công chúng ít và sự kiện mở khóa cổ phiếu nội bộ sắp tới. Lưu ý quan trọng: SPCXON cung cấp mức tiếp xúc với hiệu quả kinh tế, không phải quyền sở hữu cổ phiếu trực tiếp, và có thể giao dịch ở mức cao hơn hoặc thấp hơn giá trị tài sản ròng. WEEX tích hợp SPCXON cùng các sản phẩm TradFi token hóa khác như MicroStrategy (MSTRON) và Micron (MUON) vào một tài khoản thống nhất, cho phép luân chuyển giữa crypto và cổ phiếu dễ dàng. Sàn cũng đang chạy chiến dịch TradFi Trading Challenge với quỹ thưởng $50,000.

TheNewsCrypto2 giờ trước

Giao Dịch SpaceX, Đã Mở Khóa: SPCXON Được Giao Dịch Trên WEEX

TheNewsCrypto2 giờ trước

BIT Trading Hours: BTC Vẫn Chịu Áp Lực Từ Đường MA 200 Tuần, Bị Từ Chối Có Thể Tái Khởi Động Đợt Giảm, Ngành Lưu Trữ và Bán Dẫn Tăng Mạnh Đêm Qua Bắt Đầu Giảm Trong Khung Giờ Giao Dịch Ban Đêm

Bitcoin (BTC) hiện giao dịch quanh mức $66,000, đối mặt với vùng kháng cự mạnh gần $68,000 - nơi tập trung nhiều lệnh mua trước đó có thể chốt lời. Về mặt kỹ thuật, BTC đang nằm giữa đường trung bình động 200 tuần (MA ~$63,333) và đường trung bình động hàm mũ 200 tuần (EMA ~$68,328). Việc không thể vượt qua mức $68,000 có thể kéo giá về kiểm tra lại vùng hỗ trợ $63,000. Thị trường hiện có tính thanh khoản thấp và được xem là đang trong đợt phục hồi nhẹ. Trên thị trường chứng khoán Mỹ, các chỉ số tương lai giảm nhẹ. Nhóm cổ phiếu bán dẫn và lưu trữ, vốn tăng mạnh vào đêm trước, đã điều chỉnh giảm trong phiên giao dịch ngoài giờ. Tuy nhiên, Super Micro Computer (SMCI) tăng mạnh sau báo cáo doanh thu và đơn đặt hàng tích cực. Dầu thô tăng (trên $91) và lợi suất trái phiếu kho bạc Mỹ tăng cao tiếp tục gây áp lực lên thị trường cổ phiếu và làm dấy lên lo ngại lạm phát. Tại châu Á, thị trường Hàn Quốc phục hồi nhẹ cùng với cổ phiếu công nghệ, trong khi Nhật Bản thận trọng do đồng Yên yếu kỷ lục. Các sự kiện quan trọng sắp tới bao gồm báo cáo thu nhập từ các gã khổng lồ công nghệ như Alphabet, Tesla, IBM; sự kiện AI của AMD; và cuộc họp chính sách tiền tệ của Ngân hàng Trung ương châu Âu.

marsbit2 giờ trước

BIT Trading Hours: BTC Vẫn Chịu Áp Lực Từ Đường MA 200 Tuần, Bị Từ Chối Có Thể Tái Khởi Động Đợt Giảm, Ngành Lưu Trữ và Bán Dẫn Tăng Mạnh Đêm Qua Bắt Đầu Giảm Trong Khung Giờ Giao Dịch Ban Đêm

marsbit2 giờ trước

Chủ tịch CFTC cũ, Chủ tịch Circle Tarbert: Một mặt khuyên bạn chủ nghĩa dài hạn, mặt kia tự mình thoái vốn 30 triệu USD

Tác giả: Zen, PANews Trước tình cảnh cổ phiếu Circle (CRCL) giảm 70% so với đỉnh và bị hạ xếp hạng, Chủ tịch Heath Tarbert - cựu Chủ tịch CFTC - trong một cuộc phỏng vấn ngày 14/7 đã kêu gọi các nhà đầu tư kiên nhẫn và tập trung vào tầm nhìn dài hạn của công ty. Tuy nhiên, hành động của ông lại trái ngược hoàn toàn. Kể từ khi Circle IPO, Tarbert đã không ngừng bán cổ phiếu CRCL thông qua kế hoạch giao dịch 10b5-1 được lập trước, thu về tổng cộng khoảng 30 triệu USD. Ông chưa từng mua lại cổ phiếu trên thị trường mở, ngay cả khi giá cổ phiếu lao dốc. Bài viết nêu bật sự mâu thuẫn giữa lời nói "chủ nghĩa dài hạn" và hành động "thoái vốn" mạnh tay của Tarbert. Sự nghiệp của ông được mô tả là điển hình của "cánh cửa xoay" chính trị-thương mại Mỹ: từ các vị trí cấp cao tại Bộ Tài chính và CFTC, ông nghỉ hưu chỉ 27 ngày trước khi gia nhập Citadel Securities - một nhà tạo lập thị trường lớn - vào thời điểm công ty này đang đối mặt với cuộc điều tra của Quốc hội sau sự kiện GameStop. Sau đó, ông chuyển sang Circle, nơi ông được cho là đã sử dụng kinh nghiệm và quan hệ quản lý để giúp công ty vượt qua các rào cản pháp lý và niêm yết thành công. Bài báo đặt câu hỏi liệu Tarbert có thực sự tin vào tương lai dài hạn của Circle hay không, khi mà ông liên tục chốt lời trong khi lại khuyên các cổ đông nhỏ lẻ giữ vị thế. Nó gợi ý rằng mô hình của ông là tận dụng tối đa kiến thức về chu kỳ chính sách và cơ hội thị trường để biến các nguồn lực và uy tín tích lũy được thành lợi thế nghề nghiệp và tài chính cá nhân, trong khi rủi ro dài hạn được chuyển sang cho các nhà đầu tư tin tưởng vào những tường thuật công khai của ông.

marsbit2 giờ trước

Chủ tịch CFTC cũ, Chủ tịch Circle Tarbert: Một mặt khuyên bạn chủ nghĩa dài hạn, mặt kia tự mình thoái vốn 30 triệu USD

marsbit2 giờ trước

Gate Research: Làn sóng "phố Wall hóa" trong các sản phẩm tài chính tiền điện tử - Cạnh tranh hay Hội tụ?

Gate Research Institute: Sự hòa hợp hay cạnh tranh trong làn sóng "phố Wall hóa" các sản phẩm tài chính tiền mã hóa? Từ tầm nhìn ban đầu về một hệ thống tài chính phi tập trung, loại bỏ trung gian của Bitcoin, thị trường tiền mã hóa đang chứng kiến sự hội tụ mạnh mẽ với tài chính truyền thống (TradFi). Các quỹ ETF Bitcoin, tài sản thế giới thực được mã hóa (RWA) và trái phiếu chính phủ trên chuỗi cho thấy các tổ chức như BlackRock, Fidelity đang đưa tài sản mã hóa vào hệ thống phát hành, định giá, lưu ký và phân phối truyền thống. Tuy nhiên, đây không phải là một trò chơi tổng bằng không. Xu hướng này thể hiện sự bổ sung lẫn nhau: TradFi cung cấp khung pháp lý, mạng lưới phân phối rộng và sự tin cậy, trong khi Crypto mang lại tính mở, thanh khoản toàn cầu 24/7 và khả năng thanh toán lập trình được. Hai hướng đi tiêu biểu minh chứng cho sự hội tụ hai chiều: các sàn giao dịch tiền mã hóa (CEX) như Gate mở rộng sang giao dịch cổ phiếu thực, ETF thông qua cơ sở hạ tầng môi giới truyền thống; trong khi các công ty môi giới truyền thống như Robinhood tích hợp tài sản mã hóa và phát triển tài sản mã hóa (như cổ phiếu mã hóa) để thu hút người dùng. Mục tiêu chung của cả hai hướng là tranh giành "tài khoản tài chính tổng hợp" thế hệ tiếp theo - một điểm vào duy nhất nơi người dùng có thể giao dịch đa dạng tài sản từ cổ phiếu, tiền mã hóa đến RWA. Sự tăng trưởng mạnh mẽ của thị trường RWA, đặc biệt là cổ phiếu mã hóa, bất chấp xu hướng thị trường giảm, cho thấy đây là một xu hướng cấu trúc thực sự. Kết luận, "phố Wall hóa" không có nghĩa là thị trường tiền mã hóa bị TradFi thôn tính. Thay vào đó, đây là một sự chuyển đổi hai chiều, nơi cả hai hệ thống đang cùng nhau định hình lại thị trường vốn thành một cấu trúc hỗn hợp hiệu quả và toàn cầu hơn, với trải nghiệm người dùng liền mạch cho nhiều loại tài sản khác nhau.

marsbit2 giờ trước

Gate Research: Làn sóng "phố Wall hóa" trong các sản phẩm tài chính tiền điện tử - Cạnh tranh hay Hội tụ?

marsbit2 giờ trước

Giao dịch

Giao ngay

Bài viết Nổi bật

HTX Learn: Tìm hiểu Về Conflux để Chia sẻ 8000 USDT

Để giúp bạn nắm bắt bản chất của Conflux, HTX Learn đã ra mắt chiến dịch Tìm hiểu & Kiếm tiền này.

Tổng lượt xem 1.1kXuất bản vào 2024.12.23Cập nhật vào 2024.12.23

HTX Learn: Tìm hiểu Về Conflux để Chia sẻ 8000 USDT

AGENT S là gì

Agent S: Tương Lai của Tương Tác Tự Động trong Web3 Giới thiệu Trong bối cảnh không ngừng phát triển của Web3 và tiền điện tử, các đổi mới đang liên tục định nghĩa lại cách mà cá nhân tương tác với các nền tảng kỹ thuật số. Một dự án tiên phong như vậy, Agent S, hứa hẹn sẽ cách mạng hóa tương tác giữa con người và máy tính thông qua khung tác nhân mở của nó. Bằng cách mở đường cho các tương tác tự động, Agent S nhằm đơn giản hóa các nhiệm vụ phức tạp, cung cấp các ứng dụng chuyển đổi trong trí tuệ nhân tạo (AI). Cuộc khám phá chi tiết này sẽ đi sâu vào những phức tạp của dự án, các tính năng độc đáo của nó và những tác động đối với lĩnh vực tiền điện tử. Agent S là gì? Agent S đứng vững như một khung tác nhân mở đột phá, được thiết kế đặc biệt để giải quyết ba thách thức cơ bản trong việc tự động hóa các nhiệm vụ máy tính: Thu thập Kiến thức Cụ thể theo Miền: Khung này học một cách thông minh từ nhiều nguồn kiến thức bên ngoài và kinh nghiệm nội bộ. Cách tiếp cận kép này giúp nó xây dựng một kho lưu trữ phong phú về kiến thức cụ thể theo miền, nâng cao hiệu suất của nó trong việc thực hiện nhiệm vụ. Lập Kế Hoạch Qua Các Tầm Nhìn Nhiệm Vụ Dài Hạn: Agent S sử dụng lập kế hoạch phân cấp tăng cường kinh nghiệm, một cách tiếp cận chiến lược giúp phân chia và thực hiện các nhiệm vụ phức tạp một cách hiệu quả. Tính năng này nâng cao đáng kể khả năng quản lý nhiều nhiệm vụ con một cách hiệu quả và hiệu suất. Xử Lý Các Giao Diện Động, Không Đều: Dự án giới thiệu Giao Diện Tác Nhân-Máy Tính (ACI), một giải pháp đổi mới giúp nâng cao tương tác giữa các tác nhân và người dùng. Sử dụng các Mô Hình Ngôn Ngữ Lớn Đa Phương Thức (MLLMs), Agent S có thể điều hướng và thao tác các giao diện người dùng đồ họa đa dạng một cách liền mạch. Thông qua những tính năng tiên phong này, Agent S cung cấp một khung vững chắc giải quyết các phức tạp liên quan đến việc tự động hóa tương tác giữa con người với máy móc, mở ra nhiều ứng dụng trong AI và hơn thế nữa. Ai là Người Tạo ra Agent S? Mặc dù khái niệm về Agent S là hoàn toàn đổi mới, thông tin cụ thể về người sáng lập vẫn còn mơ hồ. Người sáng lập hiện vẫn chưa được biết đến, điều này làm nổi bật giai đoạn sơ khai của dự án hoặc sự lựa chọn chiến lược để giữ kín các thành viên sáng lập. Bất chấp sự ẩn danh, sự chú ý vẫn tập trung vào khả năng và tiềm năng của khung này. Ai là Các Nhà Đầu Tư của Agent S? Vì Agent S còn tương đối mới trong hệ sinh thái mã hóa, thông tin chi tiết về các nhà đầu tư và những người tài trợ tài chính của nó không được ghi chép rõ ràng. Sự thiếu vắng thông tin công khai về các nền tảng đầu tư hoặc tổ chức hỗ trợ dự án dấy lên câu hỏi về cấu trúc tài trợ và lộ trình phát triển của nó. Hiểu biết về sự hỗ trợ là rất quan trọng để đánh giá tính bền vững và tác động tiềm năng của dự án. Agent S Hoạt Động Như Thế Nào? Tại cốt lõi của Agent S là công nghệ tiên tiến cho phép nó hoạt động hiệu quả trong nhiều bối cảnh khác nhau. Mô hình hoạt động của nó được xây dựng xung quanh một số tính năng chính: Tương Tác Giống Như Con Người: Khung này cung cấp lập kế hoạch AI tiên tiến, cố gắng làm cho các tương tác với máy tính trở nên trực quan hơn. Bằng cách bắt chước hành vi của con người trong việc thực hiện nhiệm vụ, nó hứa hẹn nâng cao trải nghiệm người dùng. Ký Ức Tường Thuật: Được sử dụng để tận dụng các trải nghiệm cấp cao, Agent S sử dụng ký ức tường thuật để theo dõi lịch sử nhiệm vụ, từ đó nâng cao quy trình ra quyết định của nó. Ký Ức Tình Huống: Tính năng này cung cấp cho người dùng hướng dẫn từng bước, cho phép khung này cung cấp hỗ trợ theo ngữ cảnh khi các nhiệm vụ diễn ra. Hỗ Trợ OpenACI: Với khả năng chạy cục bộ, Agent S cho phép người dùng duy trì quyền kiểm soát đối với các tương tác và quy trình làm việc của họ, phù hợp với tinh thần phi tập trung của Web3. Tích Hợp Dễ Dàng với Các API Bên Ngoài: Tính linh hoạt và khả năng tương thích với nhiều nền tảng AI khác nhau đảm bảo rằng Agent S có thể hòa nhập liền mạch vào các hệ sinh thái công nghệ hiện có, làm cho nó trở thành lựa chọn hấp dẫn cho các nhà phát triển và tổ chức. Những chức năng này cùng nhau góp phần vào vị trí độc đáo của Agent S trong không gian tiền điện tử, khi nó tự động hóa các nhiệm vụ phức tạp, nhiều bước với sự can thiệp tối thiểu của con người. Khi dự án phát triển, các ứng dụng tiềm năng của nó trong Web3 có thể định nghĩa lại cách mà các tương tác kỹ thuật số diễn ra. Thời Gian Phát Triển của Agent S Sự phát triển và các cột mốc của Agent S có thể được tóm tắt trong một dòng thời gian nêu bật các sự kiện quan trọng của nó: 27 tháng 9, 2024: Khái niệm về Agent S được ra mắt trong một bài nghiên cứu toàn diện mang tên “Một Khung Tác Nhân Mở Sử Dụng Máy Tính Như Một Con Người,” trình bày nền tảng cho dự án. 10 tháng 10, 2024: Bài nghiên cứu được công bố công khai trên arXiv, cung cấp một cái nhìn sâu sắc về khung và đánh giá hiệu suất của nó dựa trên tiêu chuẩn OSWorld. 12 tháng 10, 2024: Một video trình bày được phát hành, cung cấp cái nhìn trực quan về khả năng và tính năng của Agent S, thu hút thêm sự quan tâm từ người dùng và nhà đầu tư tiềm năng. Những dấu mốc trong dòng thời gian không chỉ minh họa sự tiến bộ của Agent S mà còn chỉ ra cam kết của nó đối với sự minh bạch và sự tham gia của cộng đồng. Những Điểm Chính Về Agent S Khi khung Agent S tiếp tục phát triển, một số thuộc tính chính nổi bật, nhấn mạnh tính đổi mới và tiềm năng của nó: Khung Đổi Mới: Được thiết kế để cung cấp cách sử dụng máy tính trực quan giống như tương tác của con người, Agent S mang đến một cách tiếp cận mới cho việc tự động hóa nhiệm vụ. Tương Tác Tự Động: Khả năng tương tác tự động với máy tính thông qua GUI đánh dấu một bước tiến tới các giải pháp tính toán thông minh và hiệu quả hơn. Tự Động Hóa Nhiệm Vụ Phức Tạp: Với phương pháp mạnh mẽ của nó, nó có thể tự động hóa các nhiệm vụ phức tạp, nhiều bước, làm cho các quy trình nhanh hơn và ít sai sót hơn. Cải Tiến Liên Tục: Các cơ chế học tập cho phép Agent S cải thiện từ các trải nghiệm trước đó, liên tục nâng cao hiệu suất và hiệu quả của nó. Tính Linh Hoạt: Khả năng thích ứng của nó trên các môi trường hoạt động khác nhau như OSWorld và WindowsAgentArena đảm bảo rằng nó có thể phục vụ một loạt các ứng dụng rộng rãi. Khi Agent S định vị mình trong bối cảnh Web3 và tiền điện tử, tiềm năng của nó để nâng cao khả năng tương tác và tự động hóa quy trình đánh dấu một bước tiến quan trọng trong công nghệ AI. Thông qua khung đổi mới của mình, Agent S minh họa cho tương lai của các tương tác kỹ thuật số, hứa hẹn một trải nghiệm liền mạch và hiệu quả hơn cho người dùng trên nhiều ngành công nghiệp khác nhau. Kết luận Agent S đại diện cho một bước nhảy vọt táo bạo trong sự kết hợp giữa AI và Web3, với khả năng định nghĩa lại cách chúng ta tương tác với công nghệ. Mặc dù vẫn còn ở giai đoạn đầu, những khả năng cho ứng dụng của nó là rộng lớn và hấp dẫn. Thông qua khung toàn diện của mình giải quyết các thách thức quan trọng, Agent S nhằm đưa các tương tác tự động lên hàng đầu trong trải nghiệm kỹ thuật số. Khi chúng ta tiến sâu hơn vào các lĩnh vực tiền điện tử và phi tập trung, các dự án như Agent S chắc chắn sẽ đóng một vai trò quan trọng trong việc định hình tương lai của công nghệ và sự hợp tác giữa con người với máy tính.

Tổng lượt xem 961Xuất bản vào 2025.01.14Cập nhật vào 2025.01.14

Làm thế nào để Mua S

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Sonic (S) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Sonic (S) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Sonic (S) của BạnSau khi mua Sonic (S), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Sonic (S)Giao dịch Sonic (S) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 1.9kXuất bản vào 2025.01.15Cập nhật vào 2026.06.02

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến của người dùng về giá của S (S) được trình bày dưới đây.

Alumni TH Thanh Hoa U00 tuổi Vương Quan ra tác phẩm mới: Dùng 1/900 token, 1/432 sức tính toán, làm đảo lộn mô hình tiền huấn luyện Transformer

Tóm tắt

HRM-Text được thiết kế như thế nào?

Hiệu quả ra sao?

Hạn chế và hướng phát triển tương lai

Tiền kỹ thuật số thịnh hành

Câu hỏi Liên quan

Nội dung Liên quan

Sau ba quý liên tiếp suy giảm, thị trường tiền điện tử có thể đón cửa sổ ổn định trong quý III?

Giao Dịch SpaceX, Đã Mở Khóa: SPCXON Được Giao Dịch Trên WEEX

BIT Trading Hours: BTC Vẫn Chịu Áp Lực Từ Đường MA 200 Tuần, Bị Từ Chối Có Thể Tái Khởi Động Đợt Giảm, Ngành Lưu Trữ và Bán Dẫn Tăng Mạnh Đêm Qua Bắt Đầu Giảm Trong Khung Giờ Giao Dịch Ban Đêm

Chủ tịch CFTC cũ, Chủ tịch Circle Tarbert: Một mặt khuyên bạn chủ nghĩa dài hạn, mặt kia tự mình thoái vốn 30 triệu USD

Gate Research: Làn sóng "phố Wall hóa" trong các sản phẩm tài chính tiền điện tử - Cạnh tranh hay Hội tụ?

Giao dịch

Bài viết Nổi bật

HTX Learn: Tìm hiểu Về Conflux để Chia sẻ 8000 USDT

AGENT S là gì

Làm thế nào để Mua S

Thảo luận

Danh mục Phổ biến

Thẻ Nổi bật