Chạy MoE trên điện thoại? Meta đề xuất MobileMoE, iPhone 16 Pro tăng tốc đến 3.8 lần

marsbitXuất bản vào 2026-06-01Cập nhật gần nhất vào 2026-06-01

Tóm tắt

Trong những năm gần đây, Mô hình Chuyên gia Hỗn hợp (MoE) đã được sử dụng rộng rãi cho các mô hình lớn trên đám mây. Tuy nhiên, trên điện thoại, Kiến trúc Ngôn ngữ Lớn (LLM) vẫn chủ yếu sử dụng kiến trúc dày đặc. Meta đã đề xuất MobileMoE, lần đầu tiên triển khai suy luận MoE hiệu quả trên điện thoại thông minh thương mại. Kết quả cho thấy, trên 14 bài kiểm tra cơ bản, MobileMoE-S/M đạt độ chính xác trung bình tương đương hoặc cao hơn với chỉ 1/2 đến 1/4 lượng tính toán suy luận so với mô hình dày đặc cơ sở, trong khi sử dụng bộ nhớ tương tự. Trong thử nghiệm thực tế, MobileMoE-S trên iPhone 16 Pro (backend GPU/MLX) tăng tốc độ đáng kể, tăng tốc lên đến 3.8 lần trong giai đoạn đầu vào. MobileMoE là một loại mô hình ngôn ngữ MoE được thiết kế cho triển khai trên thiết bị đầu cuối, thay thế các lớp feed-forward dày đặc bằng các lớp MoE trong kiến trúc Transformer decoder-only. Quy trình đào tạo bao gồm bốn giai đoạn: tiền đào tạo, đào tạo trung gian, tinh chỉnh có giám sát và đào tạo nhận thức lượng tử hóa. Các thí nghiệm cho thấy cấu hình tối ưu sử dụng 8 chuyên gia (E=8), độ hạt chuyên gia 8 (g=8), với một chuyên gia được chia sẻ. MobileMoE thiết lập một biên giới Pareto mới cho LLM trên thiết bị đầu cuối, cân bằng tốt hơn giữa độ chính xác và chi phí suy luận. Sau khi lượng tử hóa INT4, mô hình vẫn duy trì tính cạnh tranh. Khi triển khai trên Samsung Galaxy S25 và iPhone 16 Pro, MobileMoE-S cho thấy tốc độ nhanh hơn đáng kể và mức sử dụng bộ nhớ thấp hơn so với các mô hình...

Những năm gần đây, Mô hình Hỗn hợp Chuyên gia (MoE) đã được sử dụng rộng rãi cho các mô hình lớn trên đám mây. Tuy nhiên, trên thiết bị di động, Mô hình Ngôn ngữ Lớn (LLM) vẫn chủ yếu sử dụng kiến trúc dày đặc (dense). Trước đây, các ràng buộc về bộ nhớ, năng lực tính toán và độ trễ trên thiết bị di động nghiêm ngặt hơn, vẫn thiếu các nghiên cứu hệ thống về MoE phía máy khách trong phạm vi vài tỷ tham số. Ngày nay, với việc dung lượng DRAM trên thiết bị di động được nâng cao, MoE cũng bắt đầu có cơ hội được triển khai trên điện thoại thông minh.

MobileMoE do nhóm Meta đề xuất, lần đầu tiên thực hiện suy luận MoE hiệu quả trên điện thoại thông minh thương mại. Kết quả cho thấy, trong 14 bài kiểm tra cơ bản, MobileMoE-S/M với bộ nhớ gần tương đương, chỉ sử dụng lượng tính toán suy luận bằng 1/2 đến 1/4 so với đường cơ sở dày đặc, đã đạt được độ chính xác trung bình ngang bằng hoặc cao hơn. Trong thử nghiệm thực tế, MobileMoE-S cho thấy tốc độ tăng nhanh rõ rệt nhất trên GPU/MLX backend của iPhone 16 Pro, trong giai đoạn đầu vào có thể tăng tốc tối đa 3.8 lần.

Liên kết bài báo: https://arxiv.org/abs/2605.27358

Nhóm nghiên cứu cũng đề xuất một bộ quy tắc co giãn MoE phía máy khách, được sử dụng để xác định cấu trúc mô hình phù hợp hơn cho việc triển khai trên điện thoại. MobileMoE thiết lập biên giới Pareto mới cho mô hình ngôn ngữ lớn phía máy khách, đạt được kết quả tối ưu hơn trong việc cân bằng giữa độ chính xác và chi phí tính toán suy luận.

Hình| MobileMoE thiết lập biên giới Pareto mới cho mô hình ngôn ngữ lớn phía máy khách.

MobileMoE được thiết kế như thế nào?

MobileMoE có thể hiểu như sau: nó là một loại mô hình ngôn ngữ MoE được thiết kế hướng đến triển khai phía máy khách. Về tổng thể vẫn là Transformer chỉ giải mã (decoder-only), nhưng thay thế các tầng truyền thẳng dày đặc ban đầu bằng các tầng MoE. Bộ định tuyến sẽ chọn ra một số ít chuyên gia có điểm số cao nhất cho mỗi token để tham gia tính toán, đồng thời luôn có một chuyên gia được chia sẻ tham gia tính toán. Toàn bộ quy trình đào tạo được chia thành bốn bước: tiền đào tạo, đào tạo trung kỳ, tinh chỉnh có giám sát và đào tạo nhận thức lượng tử hóa.

Tiền đào tạo: Nhóm nghiên cứu đã thực hiện tiền đào tạo trên khoảng 6T token dữ liệu có giấy phép mở với độ dài ngữ cảnh 2048, dữ liệu chủ yếu từ Web, đồng thời bao phủ các lĩnh vực như toán học, mã, kiến thức và khoa học.

Đào tạo trung kỳ: Nhóm nghiên cứu đã mở rộng độ dài ngữ cảnh lên 8192, và tiếp tục nâng cao tỷ lệ dữ liệu chất lượng cao như kiến thức, mã, toán học và khoa học, tổng quy mô khoảng 500B token.

Tinh chỉnh có giám sát (SFT): Nhóm nghiên cứu đã tinh chỉnh MobileMoE-Base trên dữ liệu tinh chỉnh hướng dẫn có giấy phép mở với hơn 80 triệu mẫu.

Đào tạo nhận thức lượng tử hóa: Nhóm nghiên cứu đã lượng tử hóa các tầng tuyến tính và embedding xuống INT4, lượng tử hóa động kích hoạt xuống INT8, trong khi router vẫn giữ độ chính xác FP32.

Hình| Bốn giai đoạn đào tạo của MobileMoE.

Kết quả thực nghiệm

Kết quả thực nghiệm loại bỏ (ablation)

Nhóm nghiên cứu trước tiên so sánh ba biến số kiến trúc: số lượng chuyên gia E, độ chi tiết của chuyên gia g, và việc có thêm chuyên gia chia sẻ hay không.

Hình| Sự co giãn của số lượng chuyên gia E.

Trong điều kiện ngân sách bộ nhớ cố định, khi bộ nhớ cao hơn khoảng 0.25GB, độ lỗi của MoE bắt đầu thấp hơn mô hình dày đặc tương ứng. Tiếp tục tăng số lượng chuyên gia E, độ lỗi sẽ tiếp tục giảm, nhưng khi E tăng lên 8, lợi ích cận biên đã giảm đi rõ rệt. Thử nghiệm về độ chi tiết của chuyên gia g cho thấy, cấu hình chuyên gia có độ chi tiết mịn hơn nhìn chung tối ưu hơn, trong đó g=8 đạt được sự cân bằng tốt giữa hiệu quả và chi phí đào tạo; khi g tăng từ 8 lên 16, cải thiện độ lỗi không đầy 0.01, nhưng thời gian đào tạo tăng khoảng 50%. Trong cùng ngân sách tính toán, việc thêm chuyên gia chia sẻ giúp độ lỗi của mô hình giảm thêm.

Dựa trên kết quả thực nghiệm loại bỏ, nhóm nghiên cứu cuối cùng đã sử dụng cấu hình E=8, g=8, có chuyên gia chia sẻ, tức là 60 chuyên gia định tuyến mức độ chi tiết mịn, định tuyến Top-4 và 1 chuyên gia chia sẻ, và áp dụng cấu trúc này cho ba phiên bản MobileMoE-S/M/L.

Hình| Co giãn mô hình MoE trong điều kiện tối ưu hóa tính toán.

Hình| Hiệu quả đào tạo của kiến trúc MoE.

14 đánh giá cơ bản: Thiết lập biên giới Pareto mới cho phía máy khách

Nhóm nghiên cứu đã đánh giá lại MobileMoE cùng với các mô hình như Gemma 3, SmolLM2, Qwen3.5, OLMo 2, OLMoE-1B-7B trong thiết lập thống nhất, thuộc năm loại lập luận thường thức, kiến thức, khoa học, đọc hiểu và suy luận với tổng cộng 14 bài đánh giá cơ bản.

Hình| Quá trình tiền đào tạo của MobileMoE.

Kết quả so sánh mô hình Base cho thấy, điểm trung bình của MobileMoE-M cao hơn Qwen3.5 2B, điểm trung bình của MobileMoE-L cao hơn OLMoE-1B-7B, đồng thời quy mô mô hình yêu cầu cũng nhỏ hơn; nhóm nghiên cứu cũng đề cập, phiên bản Base của MobileMoE-L đã có điểm trung bình cao hơn phiên bản Instruct của OLMoE-1B-7B. Về quy mô đào tạo, MobileMoE sử dụng khoảng 6T token tiền đào tạo, ít hơn 9T của Llama 3.2 1B và 11T của SmolLM2 1.7B. Trong so sánh tổng thể mô hình được tinh chỉnh hướng dẫn, độ chính xác trung bình của MobileMoE-M đã tiếp cận OLMoE-1B-7B, nhưng số tham số hoạt động và tổng tham số đều ít hơn khoảng 60%.

Hình| So sánh mô hình MobileMoE-Base.

Đánh giá nâng cao: Ưu thế rõ rệt hơn ở nhiệm vụ mã và toán học

Trong các đánh giá nâng cao sau khi tinh chỉnh hướng dẫn, MobileMoE thể hiện nổi bật hơn ở các nhiệm vụ mã và toán học. Lấy MobileMoE-L làm ví dụ, điểm trung bình của nó trong cả hai loại đánh giá mã và toán học đều cao hơn Qwen3.5 2B và OLMoE-1B-7B. Tuy nhiên, nhóm nghiên cứu cũng đề cập rằng, trong hai khả năng tuân theo hướng dẫn và lập luận kiến thức, Qwen3.5 2B vẫn mạnh hơn.

Hình| So sánh mô hình Instruct trên các bài kiểm tra chuẩn nâng cao.

Lượng tử hóa và triển khai phía máy khách: Vẫn giữ tính cạnh tranh sau INT4, tăng tốc rõ rệt trên điện thoại

Sau khi lượng tử hóa, điểm trung bình tổng thể của MobileMoE-S/M/L so với phiên bản BF16 tương ứng của chúng có giảm, nhưng mức giảm dao động trong khoảng 2 đến 3 điểm. Dù vậy, hiệu suất của phiên bản INT4 của MobileMoE-L vẫn cao hơn phiên bản BF16 của OLMoE-1B-7B Instruct.

Nhóm nghiên cứu cũng đã triển khai MobileMoE lên Samsung Galaxy S25 và iPhone 16 Pro để kiểm tra. Kết quả cho thấy, trong điều kiện bộ nhớ trọng số INT4 tương đương, MobileMoE-S so với MobileLLM-Pro, tăng tốc giai đoạn đầu vào 1.8-3.8 lần, tăng tốc giai đoạn sinh token tuần tự 2.2-3.4 lần.

Về mức sử dụng bộ nhớ, trong điều kiện Samsung Galaxy S25, ngữ cảnh 8K và prompt thực tế, RSS đỉnh của MobileMoE-S là 1.49GB, thấp hơn 1.91GB của MobileLLM-Pro.

Hình| Độ trễ thời gian chạy phía máy khách.

Hạn chế và hướng phát triển tương lai

Hiện tại, trong khả năng tuân theo hướng dẫn cao cấp hơn cũng như khả năng kiến thức và lập luận, MobileMoE sau khi tinh chỉnh hướng dẫn vẫn tụt sau Qwen3.5 2B. Nhóm nghiên cứu cho rằng, khoảng cách này có thể liên quan đến việc đào tạo hậu kỳ hoàn thiện hơn. Trong tương lai, để thu hẹp khoảng cách này, phía đào tạo cần tăng cường chưng cất, đào tạo hậu kỳ hướng đến suy luận, cũng như mở rộng đa phương thức.

Ngoài ra, nhóm nghiên cứu chỉ ra rằng, việc sử dụng bộ nhớ của MoE trên điện thoại sẽ thay đổi theo nội dung đầu vào. So với đầu vào theo mẫu cố định, đầu vào thực tế thường mang lại mức sử dụng bộ nhớ cao hơn. Nếu chỉ dựa trên đầu vào theo mẫu để kiểm tra, có thể đánh giá thấp áp lực bộ nhớ trong các kịch bản triển khai thực tế. Trong tương lai, để đánh giá chính xác hơn hiệu suất bộ nhớ thực tế của MoE phía máy khách, vẫn cần dựa trên nhiều dữ liệu đo lường thực tế hơn.

Đồng thời, nhóm nghiên cứu đã hoàn thành các thử nghiệm hệ thống trên thiết bị thực với CPU và GPU backend, nhưng hướng đi NPU vẫn cần được khám phá. Đồng thời, việc sử dụng bộ nhớ thời gian chạy của MoE khá nhạy cảm với nội dung đầu vào. Trong tương lai, định tuyến động, cắt tỉa chuyên gia, lượng tử hóa độ chính xác hỗn hợp và triển khai NPU trên thiết bị di động đều là các hướng tiếp tục nâng cao hiệu quả phía máy khách.

Để biết thêm chi tiết kỹ thuật, vui lòng tham khảo bài báo gốc.

Bài viết này đến từ tài khoản WeChat công cộng “Academic Headlines” (ID: SciTouTiao), tác giả: Xia Qiansi

Câu hỏi Liên quan

QMô hình MobileMoE của Meta có những ưu điểm gì so với kiến trúc dày đặc truyền thống khi triển khai trên điện thoại?

AMobileMoE của Meta giúp tiết kiệm đáng kể lượng tính toán suy luận, chỉ cần khoảng 1/2 đến 1/4 so với mô hình dày đặc truyền thống trong khi vẫn đạt độ chính xác tương đương hoặc cao hơn. Điều này dẫn đến tốc độ xử lý nhanh hơn, ví dụ trên iPhone 16 Pro, tốc độ có thể tăng lên đến 3.8 lần trong giai đoạn nhập liệu.

QMobileMoE được thiết kế và đào tạo qua những giai đoạn nào?

AMobileMoE được đào tạo qua bốn giai đoạn chính: 1) Tiền đào tạo với độ dài ngữ cảnh 2048 và khoảng 6T token dữ liệu. 2) Đào tạo trung gian, mở rộng độ dài ngữ cảnh lên 8192 và tăng tỷ lệ dữ liệu chất lượng cao. 3) Vi tinh chỉnh có giám sát (SFT) trên hơn 80 triệu mẫu dữ liệu hướng dẫn. 4) Đào tạo nhận thức lượng tử hóa (QAT), lượng tử hóa các lớp tuyến tính và embedding về INT4, kích hoạt về INT8.

QCấu trúc kiến trúc cuối cùng được chọn cho MobileMoE (S/M/L) là gì dựa trên kết quả thử nghiệm?

ADựa trên kết quả thử nghiệm loại bỏ, cấu trúc cuối cùng được chọn cho MobileMoE-S/M/L là: số lượng chuyên gia E=8, độ hạt chuyên gia g=8, tích hợp một chuyên gia dùng chung, sử dụng định tuyến Top-4. Cấu hình này tương đương với 60 chuyên gia định tuyến hạt mịn và 1 chuyên gia dùng chung.

QMobileMoE thể hiện thế mạnh gì trong các bài đánh giá nâng cao (Advanced Benchmarks)?

ATrong các bài đánh giá nâng cao, đặc biệt sau khi vi tinh chỉnh theo hướng dẫn, MobileMoE thể hiện ưu thế rõ rệt hơn trong các nhiệm vụ về mã code và toán học. Ví dụ, MobileMoE-L đạt điểm trung bình cao hơn cả Qwen3.5 2B và OLMoE-1B-7B trong hai lĩnh vực này.

QNhững hạn chế và hướng phát triển tương lai của MobileMoE được đề cập trong bài viết là gì?

AHạn chế hiện tại bao gồm: khả năng tuân theo chỉ dẫn phức tạp và suy luận kiến thức vẫn còn thua kém so với một số mô hình như Qwen3.5 2B; bộ nhớ chiếm dụng khi chạy trên thiết bị di động nhạy cảm với nội dung đầu vào. Hướng phát triển tương lai bao gồm: củng cố đào tạo sau (như chưng cất, đào tạo hướng suy luận), mở rộng đa phương thức, khám phá triển khai trên NPU di động, và các kỹ thuật tối ưu hóa như định tuyến động, tỉa chuyên gia, lượng tử hóa độ chính xác hỗn hợp.

Nội dung Liên quan

DeepSeek Có Thể Giúp Trung Quốc Tiết Kiệm 1 Nghìn Tỷ Đô La Mỹ?

Vào nửa cuối năm 2026, Nvidia sẽ giao nền tảng AI mạnh nhất từ trước đến nay: Vera Rubin VR200 NVL72, với chi phí vật tư khoảng 7,8 triệu USD, trong đó bộ nhớ (HBM4 và LPDDR5X) chiếm tới 2 triệu USD. Bài viết phân tích cách DeepSeek, thông qua các công nghệ như nén bộ nhớ ngữ cảnh dài (MLA), mô hình hỗn hợp chuyên gia (MoE) và tái sử dụng bộ nhớ cache, có thể tăng hiệu suất xử lý token lên gấp 4 lần trên cùng phần cứng, giảm đáng kể sự phụ thuộc vào phần cứng đắt đỏ như GPU và HBM. Khi nhu cầu token AI của Trung Quốc dự kiến đạt hàng nghìn tỷ mỗi ngày, việc tăng hiệu quả này có khả năng tiết kiệm một lượng lớn đầu tư cơ sở hạ tầng. Ước tính, với mức tăng hiệu suất 4 lần, có thể tiết kiệm số tiền tương đương việc xây dựng ít đi hàng chục nghìn trung tâm điện toán AI, tổng giá trị lên tới khoảng 1 nghìn tỷ USD trong tương lai. Chiến lược của DeepSeek không phải là thay thế phần cứng tính toán mà là tối ưu hóa việc sử dụng nó, dịch chuyển giá trị sang các khâu như kiến trúc mô hình, hệ thống suy luận và quản lý bộ nhớ - những lĩnh vực mà chuỗi cung ứng trong nước có lợi thế hơn. Điều này làm giảm sự phụ thuộc vào các linh kiện công nghệ cao bị hạn chế và giúp phổ biến AI với chi phí thấp hơn cho các ngành công nghiệp Trung Quốc.

marsbit31 phút trước

DeepSeek Có Thể Giúp Trung Quốc Tiết Kiệm 1 Nghìn Tỷ Đô La Mỹ?

marsbit31 phút trước

Variant: Bitcoin, Ethereum và ZCash Có Khả Năng Cao Trở Thành Kho Lưu Trữ Giá Trị Chính

Tác giả Alana Levin từ Variant đề xuất một khung phân tích mới cho các blockchain lớp 1 (L1), xem chúng chủ yếu như tài sản lưu trữ giá trị (SOV). Bài viết nêu ra sáu tiêu chí cốt lõi để đánh giá một SOV tốt: độ bền công nghệ, sự khan hiếm, khả năng chống kiểm duyệt, năng suất kinh tế, sức mạnh "memetic" (ý niệm xã hội), và tính thanh khoản. Theo khung này, ba tài sản L1 nổi bật có tiềm năng trở thành phương tiện lưu trữ giá trị chính: * **Bitcoin (BTC):** Thống trị về mặt "memetic" với biệt danh "vàng kỹ thuật số", thu hút niềm tin rộng rãi từ cá nhân đến các quốc gia. * **Ethereum (ETH):** Có lợi thế về độ bền công nghệ nhờ khả năng nâng cấp linh hoạt và lộ trình phát triển minh bạch, giúp nó thích ứng với các thách thức tương lai. * **ZCash (ZEC):** Vượt trội về khả năng chống kiểm duyệt và bảo mật thông qua tính năng giao dịch riêng tư (shielding), cung cấp khả năng bảo vệ tài sản lâu dài trước các rủi ro tịch thu hoặc giám sát. Tác giả nhấn mạnh rằng thị trường lưu trữ giá trị truyền thống (như vàng với vốn hóa 31 nghìn tỷ USD) là rất lớn. Các tài sản kỹ thuật số với những ưu điểm vượt trội về chủ quyền và tự chủ hiện chỉ chiếm một phần nhỏ trong thị trường này, mở ra một cơ hội tăng trưởng đáng kể. Nhiều phương tiện lưu trữ giá trị có thể cùng tồn tại và phát triển.

marsbit33 phút trước

Variant: Bitcoin, Ethereum và ZCash Có Khả Năng Cao Trở Thành Kho Lưu Trữ Giá Trị Chính

marsbit33 phút trước

Lật đổ lối tư duy chính thống trong việc xử lý ảo giác: Siêu nhận thức mới chính là giải pháp đột phá giúp mô hình lớn phá vỡ ảo giác

Bài viết "Lật đổ lối tư duy chính thống trong việc xử lý ảo giác: Siêu nhận thức là giải pháp mới để đại mô hình ngôn ngữ đột phá ảo giác" trình bày nghiên cứu của Google, đề xuất một hướng tiếp cận mới để giải quyết vấn đề AI tạo ra thông tin sai lệch (ảo giác). Thay vì tập trung vào việc khiến AI biết mọi thứ hoặc im lặng khi không chắc chắn (gây ra "thuế khả dụng" - utility tax), nghiên cứu nhấn mạnh tầm quan trọng của **siêu nhận thức (metacognition)**. Cốt lõi là dạy AI nhận thức và **trung thực biểu đạt mức độ chắc chắn bên trong** của nó về từng câu trả lời (sự không chắc chắn trung thực - faithful uncertainty). Điều này có nghĩa là AI nên sử dụng ngôn ngữ thận trọng khi nội bộ không chắc chắn, và chỉ khẳng định chắc chắn khi nó thực sự tự tin. Cách tiếp cận này được cho là khả thi hơn việc loại bỏ mọi lỗi sai, vì nó chỉ yêu cầu sự căn chỉnh giữa trạng thái nội bộ và đầu ra ngôn ngữ, thay vì phải căn chỉnh hoàn hảo với thực tế bên ngoài. Bài viết cũng chỉ ra rằng trong kỷ nguyên AI Agent, siêu nhận thức là chìa khóa để ra quyết định thông minh về việc khi nào cần sử dụng công cụ bên ngoài (như tìm kiếm), tránh lạm dụng và tin tưởng mù quáng. Các thách thức chính bao gồm nghịch lý tự khởi động (bootstrap paradox), việc huấn luyện căn chỉnh (RLHF) có thể phá hỏng tín hiệu không chắc chắn nội bộ, và khó khăn trong việc đánh giá xem AI có thực sự sở hữu siêu nhận thức hay chỉ đang biểu diễn nó. Thông điệp cuối cùng: Thay vì theo đuổi một AI hoàn hảo không thể đạt được, hãy hướng tới một AI trung thực về những gì nó biết và không biết, từ đó xây dựng niềm tin thực sự với người dùng.

marsbit37 phút trước

Lật đổ lối tư duy chính thống trong việc xử lý ảo giác: Siêu nhận thức mới chính là giải pháp đột phá giúp mô hình lớn phá vỡ ảo giác

marsbit37 phút trước

Muốn phòng ngừa thì mua vàng-dầu, muốn bùng nổ thì mua AI, Bitcoin 'hết thời' bước vào thị trường gấu

Bitcoin gần đây liên tục giảm, có lúc xuống mức thấp nhất trong hai tháng, khoảng 66.123 USD. Nhiều lý do được đưa ra như dòng tiền ETF rút ra, căng thẳng địa chính trị, hay việc Strategy bán bớt cổ phần. Tuy nhiên, theo phân tích của Bloomberg, những điều này chỉ là bề nổi. Vấn đề cốt lõi sâu xa hơn: Bitcoin đang thua trong một cuộc cạnh tranh tài sản. Trước đây, khi lãi suất thấp, Bitcoin là lựa chọn cho nhà đầu tư bất mãn với lạm phát và các tài sản truyền thống. Hiện tại, thị trường đã thay đổi. Bitcoin bị mắc kẹt ở "vùng đất trung gian bất tiện", thua trên cả ba mặt trận: 1. **Phòng ngừa lạm phát:** Vàng và cổ phiếu năng lượng thắng thế vì có tài sản hữu hình và sức định giá rõ ràng. 2. **Tìm kiếm tăng trưởng:** Các công ty AI có doanh thu và lợi nhuận thực tế trở nên hấp dẫn hơn so với Bitcoin không tạo ra dòng tiền. 3. **Tiếp xúc với crypto:** Nhà đầu tư giờ có nhiều lựa chọn khác như sàn giao dịch, stablecoin, hạ tầng thanh toán - những tài sản gắn trực tiếp với tỷ lệ ứng dụng thực tế của ngành. Tóm lại, Bitcoin không còn là tài sản phòng ngừa tốt nhất, cũng không phải tài sản tăng trưởng tốt nhất, và cũng không còn là tài sản crypto duy nhất. Một minh chứng rõ ràng: cảnh báo gần đây về rủi ro lạm phát dai dẳng của Cục Dự trữ Liên bang Mỹ trước đây có thể là tín hiệu mua Bitcoin, nhưng giờ thị trường không phản ứng theo cách đó. Nhà đầu tư chuyển sang các tài sái có liên kết trực tiếp với năng lượng và hàng hóa. Các sự kiện như ETF rút vốn hay Strategy bán bớt cổ phần chỉ là "triệu chứng" phản ánh một thực tế cơ bản: vốn hiện có nhiều điểm đến hơn, và nhà đầu tư đang đòi hỏi cao hơn ở Bitcoin. Họ muốn biết lợi nhuận cụ thể và lý do chọn Bitcoin thay vì các tài sản khác. Logic thị trường gấu mới cho Bitcoin không còn là "nó là bong bóng" mà là: **tính khan hiếm tự thân giờ đây là chưa đủ.**

华尔街日报41 phút trước

Muốn phòng ngừa thì mua vàng-dầu, muốn bùng nổ thì mua AI, Bitcoin 'hết thời' bước vào thị trường gấu

华尔街日报41 phút trước

Lỡ nhịp làn sóng tăng giá cổ phiếu AI, giờ phải làm sao?

Tác giả: Think AI, Aaron Làn sóng cổ phiếu AI đã tăng mạnh trong ba năm rưỡi mà chưa có dấu hiệu dừng lại. Nhiều nhà đầu tư đã bỏ lỡ cơ hội này, từ các cá nhân đến các tổ chức lớn. Dữ liệu cho thấy năm 2025, chỉ khoảng 18.9% nhà đầu tư nhỏ lẻ tại Trung Quốc có lãi, trong khi tỷ lệ thua lỗ lên tới 81.1%. Ngay cả các quỹ lớn như Bridgewater cũng giảm sở hữu đáng kể cổ phiếu công nghệ lớn như NVIDIA, Alphabet trước khi chúng tăng mạnh. Ngay cả Warren Buffett cũng phần nào bỏ lỡ đà tăng này. Bài viết chỉ ra rằng AI không phải là một khái niệm ngắn hạn, mà là một cuộc cách mạng cơ sở hạ tầng giống như điện hay internet. Do đó, vẫn còn nhiều cơ hội dọc theo toàn bộ chuỗi cung ứng AI, từ hạ tầng tính toán, nền tảng mô hình lớn đến các ứng dụng AI theo ngành. Các nhà lãnh đạo như Mã Hóa Đằng (Tencent) nhấn mạnh tầm quan trọng của việc tìm kiếm cơ hội phù hợp với lợi thế bản thân thay vì chạy theo xu hướng một cách mù quáng. Mã Vân (Alibaba) thì cho rằng thời đại AI mới chỉ bắt đầu và đây là cơ hội cấp độ cách mạng công nghiệp, vì vậy không bao giờ là quá muộn để tham gia. Thông điệp chính là: thay vì hoảng loạn vì bỏ lỡ làn sóng đầu tiên, các nhà đầu tư nên giữ tâm lý ổn định, chuẩn bị kỹ lưỡng và tìm kiếm cơ hội cấu trúc trong các làn sóng tiếp theo của cuộc cách mạng AI. Cơ hội cuối cùng sẽ thuộc về những người kiên định và có sự chuẩn bị.

marsbit1 giờ trước

Lỡ nhịp làn sóng tăng giá cổ phiếu AI, giờ phải làm sao?

marsbit1 giờ trước

Giao dịch

Giao ngay

Hợp đồng Tương lai

Chạy MoE trên điện thoại? Meta đề xuất MobileMoE, iPhone 16 Pro tăng tốc đến 3.8 lần

Tóm tắt

MobileMoE được thiết kế như thế nào?

Kết quả thực nghiệm

Kết quả thực nghiệm loại bỏ (ablation)

14 đánh giá cơ bản: Thiết lập biên giới Pareto mới cho phía máy khách

Đánh giá nâng cao: Ưu thế rõ rệt hơn ở nhiệm vụ mã và toán học

Lượng tử hóa và triển khai phía máy khách: Vẫn giữ tính cạnh tranh sau INT4, tăng tốc rõ rệt trên điện thoại

Hạn chế và hướng phát triển tương lai

Câu hỏi Liên quan

Nội dung Liên quan

DeepSeek Có Thể Giúp Trung Quốc Tiết Kiệm 1 Nghìn Tỷ Đô La Mỹ?

Variant: Bitcoin, Ethereum và ZCash Có Khả Năng Cao Trở Thành Kho Lưu Trữ Giá Trị Chính

Lật đổ lối tư duy chính thống trong việc xử lý ảo giác: Siêu nhận thức mới chính là giải pháp đột phá giúp mô hình lớn phá vỡ ảo giác

Muốn phòng ngừa thì mua vàng-dầu, muốn bùng nổ thì mua AI, Bitcoin 'hết thời' bước vào thị trường gấu

Lỡ nhịp làn sóng tăng giá cổ phiếu AI, giờ phải làm sao?

Giao dịch

Danh mục Phổ biến

Thẻ Nổi bật