Chạy MoE trên điện thoại? Meta đề xuất MobileMoE, iPhone 16 Pro tăng tốc đến 3.8 lần

marsbitXuất bản vào 2026-06-01Cập nhật gần nhất vào 2026-06-01

Tóm tắt

Trong những năm gần đây, Mô hình Chuyên gia Hỗn hợp (MoE) đã được sử dụng rộng rãi cho các mô hình lớn trên đám mây. Tuy nhiên, trên điện thoại, Kiến trúc Ngôn ngữ Lớn (LLM) vẫn chủ yếu sử dụng kiến trúc dày đặc. Meta đã đề xuất MobileMoE, lần đầu tiên triển khai suy luận MoE hiệu quả trên điện thoại thông minh thương mại. Kết quả cho thấy, trên 14 bài kiểm tra cơ bản, MobileMoE-S/M đạt độ chính xác trung bình tương đương hoặc cao hơn với chỉ 1/2 đến 1/4 lượng tính toán suy luận so với mô hình dày đặc cơ sở, trong khi sử dụng bộ nhớ tương tự. Trong thử nghiệm thực tế, MobileMoE-S trên iPhone 16 Pro (backend GPU/MLX) tăng tốc độ đáng kể, tăng tốc lên đến 3.8 lần trong giai đoạn đầu vào. MobileMoE là một loại mô hình ngôn ngữ MoE được thiết kế cho triển khai trên thiết bị đầu cuối, thay thế các lớp feed-forward dày đặc bằng các lớp MoE trong kiến trúc Transformer decoder-only. Quy trình đào tạo bao gồm bốn giai đoạn: tiền đào tạo, đào tạo trung gian, tinh chỉnh có giám sát và đào tạo nhận thức lượng tử hóa. Các thí nghiệm cho thấy cấu hình tối ưu sử dụng 8 chuyên gia (E=8), độ hạt chuyên gia 8 (g=8), với một chuyên gia được chia sẻ. MobileMoE thiết lập một biên giới Pareto mới cho LLM trên thiết bị đầu cuối, cân bằng tốt hơn giữa độ chính xác và chi phí suy luận. Sau khi lượng tử hóa INT4, mô hình vẫn duy trì tính cạnh tranh. Khi triển khai trên Samsung Galaxy S25 và iPhone 16 Pro, MobileMoE-S cho thấy tốc độ nhanh hơn đáng kể và mức sử dụng bộ nhớ thấp hơn so với các mô hình...

Những năm gần đây, Mô hình Hỗn hợp Chuyên gia (MoE) đã được sử dụng rộng rãi cho các mô hình lớn trên đám mây. Tuy nhiên, trên thiết bị di động, Mô hình Ngôn ngữ Lớn (LLM) vẫn chủ yếu sử dụng kiến trúc dày đặc (dense). Trước đây, các ràng buộc về bộ nhớ, năng lực tính toán và độ trễ trên thiết bị di động nghiêm ngặt hơn, vẫn thiếu các nghiên cứu hệ thống về MoE phía máy khách trong phạm vi vài tỷ tham số. Ngày nay, với việc dung lượng DRAM trên thiết bị di động được nâng cao, MoE cũng bắt đầu có cơ hội được triển khai trên điện thoại thông minh.

MobileMoE do nhóm Meta đề xuất, lần đầu tiên thực hiện suy luận MoE hiệu quả trên điện thoại thông minh thương mại. Kết quả cho thấy, trong 14 bài kiểm tra cơ bản, MobileMoE-S/M với bộ nhớ gần tương đương, chỉ sử dụng lượng tính toán suy luận bằng 1/2 đến 1/4 so với đường cơ sở dày đặc, đã đạt được độ chính xác trung bình ngang bằng hoặc cao hơn. Trong thử nghiệm thực tế, MobileMoE-S cho thấy tốc độ tăng nhanh rõ rệt nhất trên GPU/MLX backend của iPhone 16 Pro, trong giai đoạn đầu vào có thể tăng tốc tối đa 3.8 lần.

Liên kết bài báo: https://arxiv.org/abs/2605.27358

Nhóm nghiên cứu cũng đề xuất một bộ quy tắc co giãn MoE phía máy khách, được sử dụng để xác định cấu trúc mô hình phù hợp hơn cho việc triển khai trên điện thoại. MobileMoE thiết lập biên giới Pareto mới cho mô hình ngôn ngữ lớn phía máy khách, đạt được kết quả tối ưu hơn trong việc cân bằng giữa độ chính xác và chi phí tính toán suy luận.

Hình| MobileMoE thiết lập biên giới Pareto mới cho mô hình ngôn ngữ lớn phía máy khách.

MobileMoE được thiết kế như thế nào?

MobileMoE có thể hiểu như sau: nó là một loại mô hình ngôn ngữ MoE được thiết kế hướng đến triển khai phía máy khách. Về tổng thể vẫn là Transformer chỉ giải mã (decoder-only), nhưng thay thế các tầng truyền thẳng dày đặc ban đầu bằng các tầng MoE. Bộ định tuyến sẽ chọn ra một số ít chuyên gia có điểm số cao nhất cho mỗi token để tham gia tính toán, đồng thời luôn có một chuyên gia được chia sẻ tham gia tính toán. Toàn bộ quy trình đào tạo được chia thành bốn bước: tiền đào tạo, đào tạo trung kỳ, tinh chỉnh có giám sát và đào tạo nhận thức lượng tử hóa.

Tiền đào tạo: Nhóm nghiên cứu đã thực hiện tiền đào tạo trên khoảng 6T token dữ liệu có giấy phép mở với độ dài ngữ cảnh 2048, dữ liệu chủ yếu từ Web, đồng thời bao phủ các lĩnh vực như toán học, mã, kiến thức và khoa học.

Đào tạo trung kỳ: Nhóm nghiên cứu đã mở rộng độ dài ngữ cảnh lên 8192, và tiếp tục nâng cao tỷ lệ dữ liệu chất lượng cao như kiến thức, mã, toán học và khoa học, tổng quy mô khoảng 500B token.

Tinh chỉnh có giám sát (SFT): Nhóm nghiên cứu đã tinh chỉnh MobileMoE-Base trên dữ liệu tinh chỉnh hướng dẫn có giấy phép mở với hơn 80 triệu mẫu.

Đào tạo nhận thức lượng tử hóa: Nhóm nghiên cứu đã lượng tử hóa các tầng tuyến tính và embedding xuống INT4, lượng tử hóa động kích hoạt xuống INT8, trong khi router vẫn giữ độ chính xác FP32.

Hình| Bốn giai đoạn đào tạo của MobileMoE.

Kết quả thực nghiệm

Kết quả thực nghiệm loại bỏ (ablation)

Nhóm nghiên cứu trước tiên so sánh ba biến số kiến trúc: số lượng chuyên gia E, độ chi tiết của chuyên gia g, và việc có thêm chuyên gia chia sẻ hay không.

Hình| Sự co giãn của số lượng chuyên gia E.

Trong điều kiện ngân sách bộ nhớ cố định, khi bộ nhớ cao hơn khoảng 0.25GB, độ lỗi của MoE bắt đầu thấp hơn mô hình dày đặc tương ứng. Tiếp tục tăng số lượng chuyên gia E, độ lỗi sẽ tiếp tục giảm, nhưng khi E tăng lên 8, lợi ích cận biên đã giảm đi rõ rệt. Thử nghiệm về độ chi tiết của chuyên gia g cho thấy, cấu hình chuyên gia có độ chi tiết mịn hơn nhìn chung tối ưu hơn, trong đó g=8 đạt được sự cân bằng tốt giữa hiệu quả và chi phí đào tạo; khi g tăng từ 8 lên 16, cải thiện độ lỗi không đầy 0.01, nhưng thời gian đào tạo tăng khoảng 50%. Trong cùng ngân sách tính toán, việc thêm chuyên gia chia sẻ giúp độ lỗi của mô hình giảm thêm.

Dựa trên kết quả thực nghiệm loại bỏ, nhóm nghiên cứu cuối cùng đã sử dụng cấu hình E=8, g=8, có chuyên gia chia sẻ, tức là 60 chuyên gia định tuyến mức độ chi tiết mịn, định tuyến Top-4 và 1 chuyên gia chia sẻ, và áp dụng cấu trúc này cho ba phiên bản MobileMoE-S/M/L.

Hình| Co giãn mô hình MoE trong điều kiện tối ưu hóa tính toán.

Hình| Hiệu quả đào tạo của kiến trúc MoE.

14 đánh giá cơ bản: Thiết lập biên giới Pareto mới cho phía máy khách

Nhóm nghiên cứu đã đánh giá lại MobileMoE cùng với các mô hình như Gemma 3, SmolLM2, Qwen3.5, OLMo 2, OLMoE-1B-7B trong thiết lập thống nhất, thuộc năm loại lập luận thường thức, kiến thức, khoa học, đọc hiểu và suy luận với tổng cộng 14 bài đánh giá cơ bản.

Hình| Quá trình tiền đào tạo của MobileMoE.

Kết quả so sánh mô hình Base cho thấy, điểm trung bình của MobileMoE-M cao hơn Qwen3.5 2B, điểm trung bình của MobileMoE-L cao hơn OLMoE-1B-7B, đồng thời quy mô mô hình yêu cầu cũng nhỏ hơn; nhóm nghiên cứu cũng đề cập, phiên bản Base của MobileMoE-L đã có điểm trung bình cao hơn phiên bản Instruct của OLMoE-1B-7B. Về quy mô đào tạo, MobileMoE sử dụng khoảng 6T token tiền đào tạo, ít hơn 9T của Llama 3.2 1B và 11T của SmolLM2 1.7B. Trong so sánh tổng thể mô hình được tinh chỉnh hướng dẫn, độ chính xác trung bình của MobileMoE-M đã tiếp cận OLMoE-1B-7B, nhưng số tham số hoạt động và tổng tham số đều ít hơn khoảng 60%.

Hình| So sánh mô hình MobileMoE-Base.

Đánh giá nâng cao: Ưu thế rõ rệt hơn ở nhiệm vụ mã và toán học

Trong các đánh giá nâng cao sau khi tinh chỉnh hướng dẫn, MobileMoE thể hiện nổi bật hơn ở các nhiệm vụ mã và toán học. Lấy MobileMoE-L làm ví dụ, điểm trung bình của nó trong cả hai loại đánh giá mã và toán học đều cao hơn Qwen3.5 2B và OLMoE-1B-7B. Tuy nhiên, nhóm nghiên cứu cũng đề cập rằng, trong hai khả năng tuân theo hướng dẫn và lập luận kiến thức, Qwen3.5 2B vẫn mạnh hơn.

Hình| So sánh mô hình Instruct trên các bài kiểm tra chuẩn nâng cao.

Lượng tử hóa và triển khai phía máy khách: Vẫn giữ tính cạnh tranh sau INT4, tăng tốc rõ rệt trên điện thoại

Sau khi lượng tử hóa, điểm trung bình tổng thể của MobileMoE-S/M/L so với phiên bản BF16 tương ứng của chúng có giảm, nhưng mức giảm dao động trong khoảng 2 đến 3 điểm. Dù vậy, hiệu suất của phiên bản INT4 của MobileMoE-L vẫn cao hơn phiên bản BF16 của OLMoE-1B-7B Instruct.

Nhóm nghiên cứu cũng đã triển khai MobileMoE lên Samsung Galaxy S25 và iPhone 16 Pro để kiểm tra. Kết quả cho thấy, trong điều kiện bộ nhớ trọng số INT4 tương đương, MobileMoE-S so với MobileLLM-Pro, tăng tốc giai đoạn đầu vào 1.8-3.8 lần, tăng tốc giai đoạn sinh token tuần tự 2.2-3.4 lần.

Về mức sử dụng bộ nhớ, trong điều kiện Samsung Galaxy S25, ngữ cảnh 8K và prompt thực tế, RSS đỉnh của MobileMoE-S là 1.49GB, thấp hơn 1.91GB của MobileLLM-Pro.

Hình| Độ trễ thời gian chạy phía máy khách.

Hạn chế và hướng phát triển tương lai

Hiện tại, trong khả năng tuân theo hướng dẫn cao cấp hơn cũng như khả năng kiến thức và lập luận, MobileMoE sau khi tinh chỉnh hướng dẫn vẫn tụt sau Qwen3.5 2B. Nhóm nghiên cứu cho rằng, khoảng cách này có thể liên quan đến việc đào tạo hậu kỳ hoàn thiện hơn. Trong tương lai, để thu hẹp khoảng cách này, phía đào tạo cần tăng cường chưng cất, đào tạo hậu kỳ hướng đến suy luận, cũng như mở rộng đa phương thức.

Ngoài ra, nhóm nghiên cứu chỉ ra rằng, việc sử dụng bộ nhớ của MoE trên điện thoại sẽ thay đổi theo nội dung đầu vào. So với đầu vào theo mẫu cố định, đầu vào thực tế thường mang lại mức sử dụng bộ nhớ cao hơn. Nếu chỉ dựa trên đầu vào theo mẫu để kiểm tra, có thể đánh giá thấp áp lực bộ nhớ trong các kịch bản triển khai thực tế. Trong tương lai, để đánh giá chính xác hơn hiệu suất bộ nhớ thực tế của MoE phía máy khách, vẫn cần dựa trên nhiều dữ liệu đo lường thực tế hơn.

Đồng thời, nhóm nghiên cứu đã hoàn thành các thử nghiệm hệ thống trên thiết bị thực với CPU và GPU backend, nhưng hướng đi NPU vẫn cần được khám phá. Đồng thời, việc sử dụng bộ nhớ thời gian chạy của MoE khá nhạy cảm với nội dung đầu vào. Trong tương lai, định tuyến động, cắt tỉa chuyên gia, lượng tử hóa độ chính xác hỗn hợp và triển khai NPU trên thiết bị di động đều là các hướng tiếp tục nâng cao hiệu quả phía máy khách.

Để biết thêm chi tiết kỹ thuật, vui lòng tham khảo bài báo gốc.

Bài viết này đến từ tài khoản WeChat công cộng “Academic Headlines” (ID: SciTouTiao), tác giả: Xia Qiansi

Câu hỏi Liên quan

QMô hình MobileMoE của Meta có những ưu điểm gì so với kiến trúc dày đặc truyền thống khi triển khai trên điện thoại?

AMobileMoE của Meta giúp tiết kiệm đáng kể lượng tính toán suy luận, chỉ cần khoảng 1/2 đến 1/4 so với mô hình dày đặc truyền thống trong khi vẫn đạt độ chính xác tương đương hoặc cao hơn. Điều này dẫn đến tốc độ xử lý nhanh hơn, ví dụ trên iPhone 16 Pro, tốc độ có thể tăng lên đến 3.8 lần trong giai đoạn nhập liệu.

QMobileMoE được thiết kế và đào tạo qua những giai đoạn nào?

AMobileMoE được đào tạo qua bốn giai đoạn chính: 1) Tiền đào tạo với độ dài ngữ cảnh 2048 và khoảng 6T token dữ liệu. 2) Đào tạo trung gian, mở rộng độ dài ngữ cảnh lên 8192 và tăng tỷ lệ dữ liệu chất lượng cao. 3) Vi tinh chỉnh có giám sát (SFT) trên hơn 80 triệu mẫu dữ liệu hướng dẫn. 4) Đào tạo nhận thức lượng tử hóa (QAT), lượng tử hóa các lớp tuyến tính và embedding về INT4, kích hoạt về INT8.

QCấu trúc kiến trúc cuối cùng được chọn cho MobileMoE (S/M/L) là gì dựa trên kết quả thử nghiệm?

ADựa trên kết quả thử nghiệm loại bỏ, cấu trúc cuối cùng được chọn cho MobileMoE-S/M/L là: số lượng chuyên gia E=8, độ hạt chuyên gia g=8, tích hợp một chuyên gia dùng chung, sử dụng định tuyến Top-4. Cấu hình này tương đương với 60 chuyên gia định tuyến hạt mịn và 1 chuyên gia dùng chung.

QMobileMoE thể hiện thế mạnh gì trong các bài đánh giá nâng cao (Advanced Benchmarks)?

ATrong các bài đánh giá nâng cao, đặc biệt sau khi vi tinh chỉnh theo hướng dẫn, MobileMoE thể hiện ưu thế rõ rệt hơn trong các nhiệm vụ về mã code và toán học. Ví dụ, MobileMoE-L đạt điểm trung bình cao hơn cả Qwen3.5 2B và OLMoE-1B-7B trong hai lĩnh vực này.

QNhững hạn chế và hướng phát triển tương lai của MobileMoE được đề cập trong bài viết là gì?

AHạn chế hiện tại bao gồm: khả năng tuân theo chỉ dẫn phức tạp và suy luận kiến thức vẫn còn thua kém so với một số mô hình như Qwen3.5 2B; bộ nhớ chiếm dụng khi chạy trên thiết bị di động nhạy cảm với nội dung đầu vào. Hướng phát triển tương lai bao gồm: củng cố đào tạo sau (như chưng cất, đào tạo hướng suy luận), mở rộng đa phương thức, khám phá triển khai trên NPU di động, và các kỹ thuật tối ưu hóa như định tuyến động, tỉa chuyên gia, lượng tử hóa độ chính xác hỗn hợp.

Nội dung Liên quan

Sau ba quý liên tiếp suy giảm, thị trường tiền điện tử có thể đón cửa sổ ổn định trong quý III?

Thị trường tiền mã hóa vừa trải qua quý tồi tệ nhất kể từ năm 2022, với vốn hóa giảm 12.6% xuống 2.1 nghìn tỷ USD, khối lượng giao dịch sụt giảm và dòng tiền rút mạnh khỏi các quỹ ETF Bitcoin. Bitcoin và Ethereum lần lượt giảm 14.2% và 25.4% trong quý, đánh dấu sự đảo ngược so với mối tương quan trước đây với các tài sản rủi ro như Nasdaq. Dòng vốn ETF chứng khoán Mỹ ghi nhận dòng ròng rút khoảng 46.7 tỷ USD trong quý II, báo hiệu áp lực bán. Tuy nhiên, dấu hiệu tích cực ban đầu xuất hiện khi các nhà đầu tư dài hạn bắt đầu tích lũy trở lại và dòng ETF có đợt thu hút ngắn hạn. Toàn bộ thị trường hiện tập trung vào cuộc họp của Cục Dự trữ Liên bang Mỹ (FOMC) vào cuối tháng 7. Các tín hiệu chính sách tiền tệ sẽ quyết định xu hướng: tín hiệu ôn hòa có thể đẩy Bitcoin lên vùng 68,000-84,000 USD, trong khi lập trường cứng rắn có thể kéo giá về vùng 50,000-56,000 USD. Tiến trình pháp lý của Đạo luật CLARITY gần như đình trệ, làm giảm kỳ vọng và gia tăng phí rủi ro cho toàn ngành. Trong bối cảnh ảm đạm, hai lĩnh vực nổi bật là thị trường dự đoán (tăng trưởng 48.7%) và bộ sưu tập kỹ thuật số được mã hóa (tăng ~143%), cho thấy sự chuyển dịch nhu cầu thực tế. Nhìn chung, thị trường thiếu động lực cho một đợt tăng trưởng mạnh dựa trên tâm lý. Các quyết định giao dịch trong quý III sẽ chủ yếu xoay quanh diễn biến giá, lựa chọn chính sách và kỳ vọng lãi suất.

marsbit4 giờ trước

Sau ba quý liên tiếp suy giảm, thị trường tiền điện tử có thể đón cửa sổ ổn định trong quý III?

marsbit4 giờ trước

Giao Dịch SpaceX, Đã Mở Khóa: SPCXON Được Giao Dịch Trên WEEX

SpaceX đã thực hiện đợt IPO lớn nhất lịch sử vào tháng 6/2026, nhưng nhiều nhà giao dịch không thể tiếp cận do các rào cản như hạn chế môi giới và khu vực. Sàn giao dịch tiền điện tử WEEX đã giới thiệu SPCXON/USDT, một công cụ token hóa cho phép tiếp cận biến động giá của SpaceX thông qua tài khoản crypto được quyết toán bằng USDT, mà không cần môi giới Mỹ hay tài khoản ngân hàng. Sản phẩm này, xây dựng trên nền tảng cổ phiếu token hóa của Ondo, dành cho các nhà giao dịch bên ngoài Hoa Kỳ. Trường hợp đầu tư dựa trên đà tăng doanh thu Starlink và các cột mốc Starship, trong khi các yếu tố cần thận trọng bao gồm định giá cao, lượng cổ phiếu lưu hành công chúng ít và sự kiện mở khóa cổ phiếu nội bộ sắp tới. Lưu ý quan trọng: SPCXON cung cấp mức tiếp xúc với hiệu quả kinh tế, không phải quyền sở hữu cổ phiếu trực tiếp, và có thể giao dịch ở mức cao hơn hoặc thấp hơn giá trị tài sản ròng. WEEX tích hợp SPCXON cùng các sản phẩm TradFi token hóa khác như MicroStrategy (MSTRON) và Micron (MUON) vào một tài khoản thống nhất, cho phép luân chuyển giữa crypto và cổ phiếu dễ dàng. Sàn cũng đang chạy chiến dịch TradFi Trading Challenge với quỹ thưởng $50,000.

TheNewsCrypto4 giờ trước

Giao Dịch SpaceX, Đã Mở Khóa: SPCXON Được Giao Dịch Trên WEEX

TheNewsCrypto4 giờ trước

BIT Trading Hours: BTC Vẫn Chịu Áp Lực Từ Đường MA 200 Tuần, Bị Từ Chối Có Thể Tái Khởi Động Đợt Giảm, Ngành Lưu Trữ và Bán Dẫn Tăng Mạnh Đêm Qua Bắt Đầu Giảm Trong Khung Giờ Giao Dịch Ban Đêm

Bitcoin (BTC) hiện giao dịch quanh mức $66,000, đối mặt với vùng kháng cự mạnh gần $68,000 - nơi tập trung nhiều lệnh mua trước đó có thể chốt lời. Về mặt kỹ thuật, BTC đang nằm giữa đường trung bình động 200 tuần (MA ~$63,333) và đường trung bình động hàm mũ 200 tuần (EMA ~$68,328). Việc không thể vượt qua mức $68,000 có thể kéo giá về kiểm tra lại vùng hỗ trợ $63,000. Thị trường hiện có tính thanh khoản thấp và được xem là đang trong đợt phục hồi nhẹ. Trên thị trường chứng khoán Mỹ, các chỉ số tương lai giảm nhẹ. Nhóm cổ phiếu bán dẫn và lưu trữ, vốn tăng mạnh vào đêm trước, đã điều chỉnh giảm trong phiên giao dịch ngoài giờ. Tuy nhiên, Super Micro Computer (SMCI) tăng mạnh sau báo cáo doanh thu và đơn đặt hàng tích cực. Dầu thô tăng (trên $91) và lợi suất trái phiếu kho bạc Mỹ tăng cao tiếp tục gây áp lực lên thị trường cổ phiếu và làm dấy lên lo ngại lạm phát. Tại châu Á, thị trường Hàn Quốc phục hồi nhẹ cùng với cổ phiếu công nghệ, trong khi Nhật Bản thận trọng do đồng Yên yếu kỷ lục. Các sự kiện quan trọng sắp tới bao gồm báo cáo thu nhập từ các gã khổng lồ công nghệ như Alphabet, Tesla, IBM; sự kiện AI của AMD; và cuộc họp chính sách tiền tệ của Ngân hàng Trung ương châu Âu.

marsbit4 giờ trước

BIT Trading Hours: BTC Vẫn Chịu Áp Lực Từ Đường MA 200 Tuần, Bị Từ Chối Có Thể Tái Khởi Động Đợt Giảm, Ngành Lưu Trữ và Bán Dẫn Tăng Mạnh Đêm Qua Bắt Đầu Giảm Trong Khung Giờ Giao Dịch Ban Đêm

marsbit4 giờ trước

Chủ tịch CFTC cũ, Chủ tịch Circle Tarbert: Một mặt khuyên bạn chủ nghĩa dài hạn, mặt kia tự mình thoái vốn 30 triệu USD

Tác giả: Zen, PANews Trước tình cảnh cổ phiếu Circle (CRCL) giảm 70% so với đỉnh và bị hạ xếp hạng, Chủ tịch Heath Tarbert - cựu Chủ tịch CFTC - trong một cuộc phỏng vấn ngày 14/7 đã kêu gọi các nhà đầu tư kiên nhẫn và tập trung vào tầm nhìn dài hạn của công ty. Tuy nhiên, hành động của ông lại trái ngược hoàn toàn. Kể từ khi Circle IPO, Tarbert đã không ngừng bán cổ phiếu CRCL thông qua kế hoạch giao dịch 10b5-1 được lập trước, thu về tổng cộng khoảng 30 triệu USD. Ông chưa từng mua lại cổ phiếu trên thị trường mở, ngay cả khi giá cổ phiếu lao dốc. Bài viết nêu bật sự mâu thuẫn giữa lời nói "chủ nghĩa dài hạn" và hành động "thoái vốn" mạnh tay của Tarbert. Sự nghiệp của ông được mô tả là điển hình của "cánh cửa xoay" chính trị-thương mại Mỹ: từ các vị trí cấp cao tại Bộ Tài chính và CFTC, ông nghỉ hưu chỉ 27 ngày trước khi gia nhập Citadel Securities - một nhà tạo lập thị trường lớn - vào thời điểm công ty này đang đối mặt với cuộc điều tra của Quốc hội sau sự kiện GameStop. Sau đó, ông chuyển sang Circle, nơi ông được cho là đã sử dụng kinh nghiệm và quan hệ quản lý để giúp công ty vượt qua các rào cản pháp lý và niêm yết thành công. Bài báo đặt câu hỏi liệu Tarbert có thực sự tin vào tương lai dài hạn của Circle hay không, khi mà ông liên tục chốt lời trong khi lại khuyên các cổ đông nhỏ lẻ giữ vị thế. Nó gợi ý rằng mô hình của ông là tận dụng tối đa kiến thức về chu kỳ chính sách và cơ hội thị trường để biến các nguồn lực và uy tín tích lũy được thành lợi thế nghề nghiệp và tài chính cá nhân, trong khi rủi ro dài hạn được chuyển sang cho các nhà đầu tư tin tưởng vào những tường thuật công khai của ông.

marsbit4 giờ trước

Chủ tịch CFTC cũ, Chủ tịch Circle Tarbert: Một mặt khuyên bạn chủ nghĩa dài hạn, mặt kia tự mình thoái vốn 30 triệu USD

marsbit4 giờ trước

Gate Research: Làn sóng "phố Wall hóa" trong các sản phẩm tài chính tiền điện tử - Cạnh tranh hay Hội tụ?

Gate Research Institute: Sự hòa hợp hay cạnh tranh trong làn sóng "phố Wall hóa" các sản phẩm tài chính tiền mã hóa? Từ tầm nhìn ban đầu về một hệ thống tài chính phi tập trung, loại bỏ trung gian của Bitcoin, thị trường tiền mã hóa đang chứng kiến sự hội tụ mạnh mẽ với tài chính truyền thống (TradFi). Các quỹ ETF Bitcoin, tài sản thế giới thực được mã hóa (RWA) và trái phiếu chính phủ trên chuỗi cho thấy các tổ chức như BlackRock, Fidelity đang đưa tài sản mã hóa vào hệ thống phát hành, định giá, lưu ký và phân phối truyền thống. Tuy nhiên, đây không phải là một trò chơi tổng bằng không. Xu hướng này thể hiện sự bổ sung lẫn nhau: TradFi cung cấp khung pháp lý, mạng lưới phân phối rộng và sự tin cậy, trong khi Crypto mang lại tính mở, thanh khoản toàn cầu 24/7 và khả năng thanh toán lập trình được. Hai hướng đi tiêu biểu minh chứng cho sự hội tụ hai chiều: các sàn giao dịch tiền mã hóa (CEX) như Gate mở rộng sang giao dịch cổ phiếu thực, ETF thông qua cơ sở hạ tầng môi giới truyền thống; trong khi các công ty môi giới truyền thống như Robinhood tích hợp tài sản mã hóa và phát triển tài sản mã hóa (như cổ phiếu mã hóa) để thu hút người dùng. Mục tiêu chung của cả hai hướng là tranh giành "tài khoản tài chính tổng hợp" thế hệ tiếp theo - một điểm vào duy nhất nơi người dùng có thể giao dịch đa dạng tài sản từ cổ phiếu, tiền mã hóa đến RWA. Sự tăng trưởng mạnh mẽ của thị trường RWA, đặc biệt là cổ phiếu mã hóa, bất chấp xu hướng thị trường giảm, cho thấy đây là một xu hướng cấu trúc thực sự. Kết luận, "phố Wall hóa" không có nghĩa là thị trường tiền mã hóa bị TradFi thôn tính. Thay vào đó, đây là một sự chuyển đổi hai chiều, nơi cả hai hệ thống đang cùng nhau định hình lại thị trường vốn thành một cấu trúc hỗn hợp hiệu quả và toàn cầu hơn, với trải nghiệm người dùng liền mạch cho nhiều loại tài sản khác nhau.

marsbit4 giờ trước

Gate Research: Làn sóng "phố Wall hóa" trong các sản phẩm tài chính tiền điện tử - Cạnh tranh hay Hội tụ?

marsbit4 giờ trước

Giao dịch

Giao ngay

Chạy MoE trên điện thoại? Meta đề xuất MobileMoE, iPhone 16 Pro tăng tốc đến 3.8 lần

Tóm tắt

MobileMoE được thiết kế như thế nào?

Kết quả thực nghiệm

Kết quả thực nghiệm loại bỏ (ablation)

14 đánh giá cơ bản: Thiết lập biên giới Pareto mới cho phía máy khách

Đánh giá nâng cao: Ưu thế rõ rệt hơn ở nhiệm vụ mã và toán học

Lượng tử hóa và triển khai phía máy khách: Vẫn giữ tính cạnh tranh sau INT4, tăng tốc rõ rệt trên điện thoại

Hạn chế và hướng phát triển tương lai

Câu hỏi Liên quan

Nội dung Liên quan

Sau ba quý liên tiếp suy giảm, thị trường tiền điện tử có thể đón cửa sổ ổn định trong quý III?

Giao Dịch SpaceX, Đã Mở Khóa: SPCXON Được Giao Dịch Trên WEEX

BIT Trading Hours: BTC Vẫn Chịu Áp Lực Từ Đường MA 200 Tuần, Bị Từ Chối Có Thể Tái Khởi Động Đợt Giảm, Ngành Lưu Trữ và Bán Dẫn Tăng Mạnh Đêm Qua Bắt Đầu Giảm Trong Khung Giờ Giao Dịch Ban Đêm

Chủ tịch CFTC cũ, Chủ tịch Circle Tarbert: Một mặt khuyên bạn chủ nghĩa dài hạn, mặt kia tự mình thoái vốn 30 triệu USD

Gate Research: Làn sóng "phố Wall hóa" trong các sản phẩm tài chính tiền điện tử - Cạnh tranh hay Hội tụ?

Giao dịch

Danh mục Phổ biến

Thẻ Nổi bật