Một bài viết để hiểu rõ nhóm lợi nhuận và cấu trúc ngành của hệ thống lưu trữ AI

marsbitXuất bản vào 2026-05-14Cập nhật gần nhất vào 2026-05-14

Tóm tắt

Tác giả: Godot Hệ thống lưu trữ AI được chia thành 6 tầng: SRAM trên chip, HBM, DRAM bo mạch chủ, lớp tổng hợp CXL, SSD doanh nghiệp, NAS và lưu trữ đám mây dạng đối tượng. Các tầng càng xa đơn vị tính toán thì dung lượng càng lớn. Tổng quy mô thị trường năm 2025 đạt khoảng 2290 tỷ USD, trong đó DRAM chiếm một nửa, HBM 15%, SSD 11%. Các hồ lợi nhuận được chia thành ba loại: 1) Hồ độc quyền biên lợi nhuận cao ở tầng silicon (HBM, SRAM nhúng, SSD QLC); 2) Hồ mới nổi biên lợi nhuận cao ở tầng kết nối (CXL); 3) Hồ lợi suất theo quy mô ở tầng dịch vụ (NAS, lưu trữ đám mây). **Tầng chính và động lực tăng trưởng:** * **L0 SRAM trên chip:** Lợi nhuận chủ yếu thuộc về TSMC do nhu cầu wafer cho chip AI. * **L1 HBM:** Hồ lợi nhuận lớn nhất thời AI, tăng trưởng mạnh (CAGR ~40%), dẫn đầu bởi SK Hynix (57-62%), Samsung và Micron. Lợi nhuận cực cao (vd: SK Hynix đạt 72% trong Q1/2026) nhờ công nghệ TSV, đóng gói tiên tiến và cung khan hiếm. * **L2 DRAM bo mạch chủ:** Thị trường lớn nhất (1218.3 tỷ USD năm 2025), vẫn do bộ ba Samsung, SK Hynix, Micron thống trị. Lợi nhuận được hỗ trợ bởi việc chuyển hướng sản lượng sang HBM. * **L3 Lớp tổng hợp CXL:** Thị trường mới nổi với tốc độ tăng trưởng nhanh (CAGR 37%), cho phép chia sẻ bộ nhớ trong cả tủ rack. Các nhà cung cấp chính vẫn là bộ ba DRAM, với Astera Labs chi phối thị trường retimer CXL (55% thị phần, lợi nhuận cao). * **L4 SSD doanh nghiệp:** Hưởng lợi từ AI suy luận, đặc biệt là SSD QLC dung lượng lớn. Thị trường tăng trưởng...

Tác giả: Cát Đa Godot

Lưu trữ AI có thể được chia thành sáu tầng,

1) SRAM trên chip

2) HBM

3) DRAM trên bo mạch chủ

4) Tầng hợp nhất CXL

5) Ổ cứng SSD cấp doanh nghiệp

6) NAS và lưu trữ đối tượng đám mây

Cấp độ này được phân chia dựa trên vị trí của bộ nhớ, càng xuống dưới càng xa khối xử lý tính toán và dung lượng lưu trữ càng lớn.

Năm 2025, tổng quy mô của sáu tầng này (SRAM nằm trên chip xử lý, cần loại trừ giá trị nhúng) vào khoảng 2290 tỷ USD, trong đó DRAM chiếm một nửa, HBM chiếm 15%, SSD chiếm 11%.

Về tình hình lợi nhuận, mỗi tầng đều cực kỳ tập trung vào một số ít đơn vị thống lĩnh, ba tầng đầu phổ biến có thị phần trên 90%.

Có thể chia các nhóm lợi nhuận này thành ba loại,

1) Nhóm lợi nhuận cao độc quyền ở tầng wafer (HBM, SRAM nhúng, SSD QLC)

2) Nhóm lợi nhuận cao mới nổi ở tầng kết nối (CXL)

3) Nhóm lợi nhuận kép từ quy mô ở tầng dịch vụ (NAS, lưu trữ đối tượng đám mây)

Ba loại nhóm có tính chất khác nhau, tốc độ tăng trưởng khác nhau và hào rào bảo vệ cũng khác nhau.

Tại sao lưu trữ lại phân tầng?

Bởi vì trên chip CPU phụ trách điều khiển và chip GPU phụ trách tính toán, chỉ có bộ nhớ đệm tạm thời, tức là bộ nhớ cache SRAM trên chip. Không gian bộ nhớ cache này quá nhỏ, chỉ có thể chứa một số tham số tạm thời, không đủ cho các mô hình lớn.

Bên ngoài hai chip này, cần phải kết nối thêm bộ nhớ lớn hơn để lưu trữ mô hình lớn, cũng như ngữ cảnh suy luận.

Tính toán rất nhanh, việc di chuyển dữ liệu giữa các tầng lưu trữ khác nhau có độ trễ và tiêu hao năng lượng, đây mới là vấn đề lớn nhất.

Vì vậy, hiện có ba hướng phát triển,

1) Tích lũy HBM, đặt bộ nhớ gần GPU hơn để rút ngắn khoảng cách di chuyển

2) CXL hợp nhất bộ nhớ ở cấp giá đỡ để chia sẻ dung lượng

3) Hàn tính toán và lưu trữ trên cùng một wafer, tích hợp tính toán và lưu trữ

Ba hướng này sẽ quyết định hình dạng của từng nhóm lợi nhuận trong năm năm tới.

Dưới đây là chi tiết từng tầng,

L0 SRAM trên chip: Nhóm lợi nhuận độc quyền của TSMC

SRAM (Static Random-access Memory, Bộ nhớ truy cập ngẫu nhiên tĩnh) là bộ nhớ cache bên trong CPU/GPU, được nhúng trong mỗi chip, không được giao dịch riêng lẻ.

Thị trường wafer SRAM độc lập chỉ có quy mô 10–17 tỷ USD, dẫn đầu là Infineon (khoảng 15%), Renesas (khoảng 13%), ISSI (khoảng 10%), thị trường nhỏ.

Nhóm lợi nhuận này thuộc về TSMC, vì mỗi thế hệ chip AI cần thêm SRAM, buộc phải mua nhiều wafer hơn.

Trong khi hơn 70% wafer công nghệ tiên tiến toàn cầu nằm trong tay TSMC. Diện tích SRAM trên mỗi chip H100, B200, TPU v5, v.v., cuối cùng đều trở thành doanh thu của TSMC.

L1 HBM: Nhóm lợi nhuận lớn nhất trong thời đại AI

HBM (High Bandwidth Memory, Bộ nhớ băng thông cao) là quy trình xếp chồng DRAM (Dynamic Random-access Memory, Bộ nhớ truy cập ngẫu nhiên động) theo chiều dọc bằng công nghệ TSV (Through-Silicon Via), sau đó dán cạnh GPU thông qua đóng gói CoWoS để tạo thành bộ nhớ băng thông cao.

HBM gần như một mình quyết định kích thước mô hình mà bộ tăng tốc AI có thể chạy. SK Hynix, Micron, Samsung chiếm thị phần gần như 100%.

Tính đến Quý I năm 2026, cấu trúc thị phần mới nhất là: SK Hynix 57% đến 62%, Samsung 22%, Micron 21%. SK Hynix đã giành được phần lớn hợp đồng mua hàng từ NVIDIA và các doanh nghiệp khác, trở thành nhà cung cấp chiếm ưu thế hiện tại.

Cuộc họp báo cáo tài chính Quý I năm tài chính 2026 của Micron đề cập rằng TAM (Thị trường tiềm năng tổng) của HBM sẽ tăng với tốc độ tăng trưởng kép hàng năm (CAGR) khoảng 40%, từ khoảng 350 tỷ USD năm 2025 lên 1000 tỷ USD vào năm 2028, mốc thời gian đạt 1000 tỷ USD sớm hơn hai năm so với dự báo trước đó.

Lợi thế cốt lõi của HBM nằm ở tỷ suất lợi nhuận cực cao. Quý I năm 2026, tỷ suất lợi nhuận hoạt động của SK Hynix đạt mức kỷ lục 72%.

Lý do lợi nhuận cao,

1) Quy trình sản xuất TSV sẽ hy sinh một phần công suất DRAM truyền thống, khiến HBM duy trì trạng thái cung không đủ cầu;

2) Tỷ lệ sản phẩm tốt của đóng gói tiên tiến khó cải thiện, thị phần của Samsung trước đây giảm từ 40% xuống 22% cũng chịu ảnh hưởng từ điều này;

3) Các nhà cung cấp chính mở rộng sản xuất thận trọng, và đạt được mức tăng giá bình quân (ASP) của DRAM trên 60% so với quý trước trong Quý I năm 2026, thể hiện vị thế rõ ràng của thị trường người bán.

Trong ba gã khổng lồ, SK Hynix được thúc đẩy mạnh mẽ bởi HBM, lợi nhuận hoạt động cả năm 2025 đạt 47.21 nghìn tỷ Won, lần đầu tiên trong lịch sử vượt qua Samsung Electronics, và trong Quý I năm 2026 với tỷ suất lợi nhuận hoạt động 72%, thậm chí vượt qua mức lợi nhuận của TSMC (58.1%) và NVIDIA (65%).

Micron có kỳ vọng tăng trưởng rất cao, Ngân hàng Mỹ (BofA) vào tháng 5 năm 2026 đã điều chỉnh mạnh mục tiêu giá của nó lên 950 USD. Samsung, với việc sản xuất hàng loạt HBM4 liên tục được thúc đẩy, có không gian phục hồi thị phần lớn nhất.

L2 DRAM trên bo mạch chủ

Tầng này là thanh RAM thông thường mà chúng ta thường nói.

DRAM trên bo mạch chủ bao gồm các sản phẩm bộ nhớ thông thường như DDR5, LPDDR, GDDR, MR-DIMM, hiện là phần chiếm tỷ trọng doanh số thị trường cao nhất trong hệ thống lưu trữ AI, tổng quy mô thị trường DRAM toàn cầu năm 2025 đạt khoảng 1218.3 tỷ USD.

Samsung, SK Hynix, Micron ba công ty vẫn chiếm phần lớn thị trường. Theo dữ liệu mới nhất Quý IV năm 2025, Samsung đứng đầu với thị phần 36.6%, SK Hynix xếp thứ hai với 32.9%, Micron xếp thứ ba với 22.9%.

Hiện tại, việc chuyển hướng công suất sang HBM có lợi nhuận cao hơn đã giúp bộ nhớ duy trì lợi nhuận cao và quyền định giá. Mặc dù tỷ suất lợi nhuận của sản phẩm đơn lẻ DRAM thông thường trên bo mạch chủ không bằng HBM, nhưng tổng quy mô thị trường của nó là lớn nhất.

L3 Tầng hợp nhất CXL

CXL (Compute Express Link) cho phép hợp nhất DRAM từ bo mạch chủ của một máy chủ đơn lẻ thành toàn bộ giá đỡ.

Sau CXL 3.x, trong tương lai tất cả bộ nhớ trong một tủ máy có thể được chia sẻ và điều phối bởi nhiều GPU, phân bổ theo nhu cầu. Giải quyết vấn đề KV cache, cơ sở dữ liệu vector, chỉ số RAG không đủ chứa và khó di chuyển trong suy luận AI.

Mô-đun bộ nhớ CXL năm 2024 chỉ có 16 tỷ USD, dự kiến 237 tỷ USD vào năm 2033. Có vẻ như vẫn là cấu trúc độc quyền của Samsung, SK Hynix, Micron.

Ở tầng này, Astera Labs làm bộ định thời lại (Retimer) và bộ điều khiển bộ nhớ thông minh giữa CXL và PCIe, chiếm khoảng 55% thị phần của phân khúc thị trường này. Doanh thu quý mới nhất là 3.08 tỷ USD, tăng +93% so với cùng kỳ, biên lợi nhuận phi GAAP là 76.4%, lợi nhuận ròng tăng +85% so với cùng kỳ. Có thể nói là cực kỳ lợi nhuận cao.

L4 SSD cấp doanh nghiệp: Người hưởng lợi lớn nhất trong thời đại suy luận

SSD NVMe cấp doanh nghiệp là chiến trường chính cho checkpoint huấn luyện AI, chỉ số RAG, offload KV cache, cache trọng số mô hình. SSD dung lượng lớn QLC đã hoàn toàn đẩy HDD ra khỏi hồ dữ liệu AI.

Thị trường SSD cấp doanh nghiệp năm 2025 vào khoảng 261 tỷ USD, CAGR 24%, dự kiến 760 tỷ USD vào năm 2030.

Cấu trúc thị trường ư? Đúng vậy, vẫn do ba gã khổng lồ nắm giữ.

Thị phần tính theo doanh thu Quý IV năm 2025, Samsung 36.9%, SK Hynix (bao gồm Solidigm) 32.9%, Micron 14.0%, Kioxia 11.7%, SanDisk 4.4%. Năm công ty đầu tiên chiếm tổng cộng khoảng 90%.

Thay đổi lớn nhất ở tầng này là sự bùng nổ của SSD QLC trong các kịch bản suy luận AI. Công ty con của SK Hynix là Solidigm và Kioxia đã sản xuất sản phẩm có dung lượng đĩa đơn 122 TB, KV cache và chỉ số RAG trong suy luận AI đang chuyển dần từ HBM sang SSD.

Từ góc độ nhóm lợi nhuận, SSD cấp doanh nghiệp không có biên lợi nhuận cực cao như HBM, nhưng được hưởng lợi kép từ việc được thúc đẩy bởi dung lượng và sự mở rộng của suy luận.

SK Hynix và Kioxia là các công ty tương đối thuần túy trong lĩnh vực này. Samsung và SK Hynix đồng thời hưởng lợi ba tầng HBM + DRAM + NAND, là các công ty nền tảng lưu trữ AI toàn diện hơn.

L5 NAS và lưu trữ đối tượng đám mây: Nhóm lợi nhuận kép từ lực hút dữ liệu

NAS và lưu trữ đối tượng đám mây là lớp ngoài cùng của hồ dữ liệu AI, ngữ liệu huấn luyện, sao lưu lưu trữ, hợp tác xuyên nhóm. Năm 2025, NAS khoảng 396 tỷ USD (CAGR 17%), lưu trữ đối tượng đám mây khoảng 91 tỷ USD (CAGR 16%).

Các nhà sản xuất chính về lưu trữ tệp cấp doanh nghiệp là NetApp, Dell, HPE, Huawei; cho doanh nghiệp vừa và nhỏ thì có Synology, QNAP. Lưu trữ đối tượng đám mây được ước tính dựa trên thị phần IaaS, AWS khoảng 31–32%, Azure khoảng 23–24%, Google Cloud khoảng 11–12%, ba công ty chiếm tổng cộng khoảng 65–70%.

Lợi nhuận của tầng này chủ yếu đến từ việc lưu trữ dài hạn + xuất dữ liệu khỏi mạng + khóa chặt hệ sinh thái.

Tóm tắt lại,

1) DRAM có quy mô lớn nhất nhưng biên lợi nhuận thấp nhất 30–40%; HBM có quy mô chỉ bằng một phần ba DRAM nhưng biên lợi nhuận gấp đôi 60%+; bộ định thời lại CXL có quy mô nhỏ nhất nhưng biên lợi nhuận cao nhất 76%+. Các tầng càng gần tính toán càng khan hiếm và có lợi nhuận cao.

2) Sự gia tăng của nhóm lợi nhuận chủ yếu đến từ ba nơi, HBM (CAGR 28%), SSD cấp doanh nghiệp (CAGR 24%), hợp nhất hóa CXL (CAGR 37%).

3) Mỗi tầng có các rào cản kinh doanh khác nhau, HBM dựa vào rào cản công nghệ, TSV, CoWoS, leo dốc tỷ lệ sản phẩm tốt; các sản phẩm CXL dựa vào IP và chứng nhận, chuỗi cung ứng đơn lẻ cho bộ định thời lại; dịch vụ dựa vào chi phí chuyển đổi.

Câu hỏi Liên quan

QBài viết mô tả AI lưu trữ có bao nhiêu tầng và tiêu chí phân tầng là gì?

ABài viết mô tả AI lưu trữ có 6 tầng, được phân chia dựa trên vị trí lưu trữ so với đơn vị tính toán. Các tầng gồm: 1) SRAM trên chip, 2) HBM, 3) DRAM trên bo mạch chủ, 4) Tầng gộp CXL, 5) SSD cấp doanh nghiệp, 6) Lưu trữ NAS và đối tượng đám mây. Càng xuống tầng dưới, dung lượng lưu trữ càng lớn nhưng càng xa đơn vị tính toán.

QLớp lưu trữ nào có quy mô thị trường lớn nhất trong năm 2025 và lợi nhuận cao nhất dựa trên bài viết?

ATrong năm 2025, DRAM trên bo mạch chủ có quy mô thị trường lớn nhất, khoảng 1218,3 tỷ USD, chiếm khoảng một nửa tổng doanh số 2290 tỷ USD của các tầng lưu trữ AI (đã loại trừ giá trị nhúng của SRAM). Tuy nhiên, lớp có biên lợi nhuận (gross margin) cao nhất là HBM, với lợi nhuận hoạt động của SK Hynix đạt 72% vào quý 1 năm 2026, cao hơn cả TSMC và NVIDIA. Các công cụ định thời lại (retimer) CXL của Astera Labs cũng có biên lợi nhuận rất cao, khoảng 76,4%.

QBa xu hướng chính để giải quyết vấn đề độ trễ và tiêu thụ năng lượng khi di chuyển dữ liệu giữa các tầng lưu trữ là gì?

ABa xu hướng chính được đề cập để giải quyết vấn đề độ trễ và tiêu thụ năng lượng khi di chuyển dữ liệu là: 1) Tăng cường sử dụng HBM, tức đặt bộ nhớ gần GPU hơn để rút ngắn khoảng cách di chuyển. 2) Sử dụng CXL để gộp chung (pool) bộ nhớ ở cấp độ giá đỡ (rack-level), cho phép chia sẻ dung lượng. 3) Phát triển kiến trúc 'Tính toán trong bộ nhớ' (Computing-in-Memory), nơi tính toán và lưu trữ được tích hợp trên cùng một wafer bán dẫn.

QTại sao lợi nhuận của HBM lại cao như vậy theo phân tích trong bài?

ALợi nhuận của HBM cực kỳ cao do ba lý do chính: 1) Quy trình sản xuất TSV (Through-Silicon Via) làm giảm một phần sản lượng DRAM truyền thống, khiến HBM luôn trong tình trạng cung không đủ cầu. 2) Việc nâng cao tỷ lệ sản xuất thành phẩm (yield) cho đóng gói tiên tiến rất khó khăn (ví dụ Samsung từng giảm thị phần vì vấn đề này). 3) Các nhà cung cấp chính mở rộng sản xuất thận trọng, duy trì quyền định giá mạnh, thể hiện qua việc giá bán trung bình (ASP) của DRAM tăng hơn 60% so với quý trước vào quý 1/2026.

QBài viết phân loại các 'hồ lợi nhuận' (profit pool) trong AI lưu trữ thành ba loại chính nào và đặc điểm của chúng?

ABài viết phân loại các hồ lợi nhuận trong AI lưu trữ thành ba loại: 1) Hồ lợi nhuận độc quyền với biên lợi nhuận cao ở tầng wafer silicon: bao gồm HBM, SRAM nhúng và SSD QLC. 2) Hồ lợi nhuận mới nổi với biên lợi nhuận cao ở tầng kết nối: chủ yếu là CXL. 3) Hồ lợi nhuận từ dịch vụ với lợi tức theo quy mô (scale): bao gồm NAS và lưu trữ đối tượng đám mây. Ba loại hồ này có bản chất, tốc độ tăng trưởng và 'hào bảo vệ' (moat) cạnh tranh khác nhau.

Nội dung Liên quan

Jensen Huang: Vera Rubin Đã Được Sản Xuất Hàng Loạt, AI Agent Là Hướng Đi Trọng Tâm, Thách Thức Intel Và Nhắm Đến Cổng Vào AI PC Thế Hệ Tiếp Theo

Ngày 1/6, CEO NVIDIA Jensen Huang đã có bài phát biểu quan trọng tại GTC Đài Bắc 2026, công bố hàng loạt sản phẩm và định hướng mới. Kiến trúc Vera Rubin đã chính thức được sản xuất hàng loạt, với khách hàng đầu tiên là OpenAI, Anthropic và SpaceX. NVIDIA tập trung mạnh vào phát triển AI Agent, đồng thời giới thiệu CPU Vera dành riêng cho các tác nhân AI. Một điểm nhấn lớn là tham vọng của NVIDIA trong thị trường AI PC thế hệ tiếp theo. Họ sẽ hợp tác với MediaTek phát triển chip RTX SPARK cho máy tính Windows, do TSMC sản xuất, dự kiến ra mắt vào mùa thu năm nay. Động thái này được xem như một thách thức trực tiếp đối với Intel và hướng tới việc cung cấp nền tảng tính toán hoàn chỉnh cho toàn bộ hệ sinh thái Windows. NVIDIA cũng công bố mô hình AI mới Nemotron 3 Ultra và nền tảng DSX - một "hướng dẫn hành động" hoàn chỉnh để xây dựng các nhà máy AI. Trong lĩnh vực ô tô tự hành, nền tảng DRIVE Hyperion đã được nhiều hãng xe Trung Quốc như BYD, Geely, Zeekr, Xiaomi và Pony.ai áp dụng. NVIDIA còn giới thiệu mô hình suy luận mở Alpamayo 2 cho taxi tự lái. Về robot hình người, NVIDIA hợp tác toàn cầu, bao gồm công ty Trung Quốc Unitree, và giới thiệu nền tảng tham chiếu Isaac GR00T cùng bộ công cụ phát triển mã nguồn mở, nhằm xây dựng hệ sinh thái cho kỷ nguyên robot.

marsbit11 phút trước

Jensen Huang: Vera Rubin Đã Được Sản Xuất Hàng Loạt, AI Agent Là Hướng Đi Trọng Tâm, Thách Thức Intel Và Nhắm Đến Cổng Vào AI PC Thế Hệ Tiếp Theo

marsbit11 phút trước

Cuộc Phỏng Vấn Với Bậc Thầy Vĩ Mô Raoul Pal: Điểm Kỳ Dị Kinh Tế Đang Đến Gần, Đừng Dễ Dàng Xuống Xe Trong 4 Năm Tới

Nhà đầu tư vĩ mô Raoul Pal chia sẻ quan điểm về tương lai kinh tế và cơ hội đầu tư trong bối cảnh AI phát triển bùng nổ. Ông nhận định cuộc đua AI giữa các quốc gia và doanh nghiệp là sự kiện vốn hóa lớn nhất lịch sử, dẫn dắt dòng tiền và có thể tiến tới "điểm kỳ dị kinh tế" - khi tốc độ công nghệ vượt quá khả năng vận hành của hệ thống kinh tế truyền thống. Về tiền mã hóa, Pal cho rằng đây vẫn là kênh đầu tư có tỷ suất sinh lời rủi ro tốt nhất về dài hạn. Ông nhấn mạnh tiềm năng vô hạn khi AI Agents (tác nhân AI) gia nhập và sử dụng mạng lưới blockchain, biến các Layer1 như ETH, Solana, Sui thành nền tảng hạ tầng then chốt. Ông xem đây là "cổ phần cơ bản" cho mọi người trong nền kinh tế số tương lai. Pal khuyên nhà đầu tư nên kiên nhẫn nắm giữ dài hạn thay vì cố gắng giao dịch thời điểm, vì lịch sử cho thấy chiến lược "mua và giữ" thường mang lại kết quả vượt trội. Ông lạc quan về triển vọng 2026-2027 với sự gia tăng thanh khoản toàn cầu, sự tham gia của ngân hàng, tiến bộ về mặt pháp lý và vị thế định giá hấp dẫn hiện tại của tài sản mã hóa so với các thị trường truyền thống.

链捕手12 phút trước

Cuộc Phỏng Vấn Với Bậc Thầy Vĩ Mô Raoul Pal: Điểm Kỳ Dị Kinh Tế Đang Đến Gần, Đừng Dễ Dàng Xuống Xe Trong 4 Năm Tới

链捕手12 phút trước

Chạy MoE trên điện thoại? Meta đề xuất MobileMoE, iPhone 16 Pro tăng tốc đến 3.8 lần

Trong những năm gần đây, Mô hình Chuyên gia Hỗn hợp (MoE) đã được sử dụng rộng rãi cho các mô hình lớn trên đám mây. Tuy nhiên, trên điện thoại, Kiến trúc Ngôn ngữ Lớn (LLM) vẫn chủ yếu sử dụng kiến trúc dày đặc. Meta đã đề xuất MobileMoE, lần đầu tiên triển khai suy luận MoE hiệu quả trên điện thoại thông minh thương mại. Kết quả cho thấy, trên 14 bài kiểm tra cơ bản, MobileMoE-S/M đạt độ chính xác trung bình tương đương hoặc cao hơn với chỉ 1/2 đến 1/4 lượng tính toán suy luận so với mô hình dày đặc cơ sở, trong khi sử dụng bộ nhớ tương tự. Trong thử nghiệm thực tế, MobileMoE-S trên iPhone 16 Pro (backend GPU/MLX) tăng tốc độ đáng kể, tăng tốc lên đến 3.8 lần trong giai đoạn đầu vào. MobileMoE là một loại mô hình ngôn ngữ MoE được thiết kế cho triển khai trên thiết bị đầu cuối, thay thế các lớp feed-forward dày đặc bằng các lớp MoE trong kiến trúc Transformer decoder-only. Quy trình đào tạo bao gồm bốn giai đoạn: tiền đào tạo, đào tạo trung gian, tinh chỉnh có giám sát và đào tạo nhận thức lượng tử hóa. Các thí nghiệm cho thấy cấu hình tối ưu sử dụng 8 chuyên gia (E=8), độ hạt chuyên gia 8 (g=8), với một chuyên gia được chia sẻ. MobileMoE thiết lập một biên giới Pareto mới cho LLM trên thiết bị đầu cuối, cân bằng tốt hơn giữa độ chính xác và chi phí suy luận. Sau khi lượng tử hóa INT4, mô hình vẫn duy trì tính cạnh tranh. Khi triển khai trên Samsung Galaxy S25 và iPhone 16 Pro, MobileMoE-S cho thấy tốc độ nhanh hơn đáng kể và mức sử dụng bộ nhớ thấp hơn so với các mô hình so sánh. Hướng phát triển trong tương lai bao gồm củng cố quá trình hậu đào tạo, mở rộng đa phương thức và tối ưu hóa việc triển khai trên NPU di động để tiếp tục cải thiện hiệu quả.

marsbit15 phút trước

Chạy MoE trên điện thoại? Meta đề xuất MobileMoE, iPhone 16 Pro tăng tốc đến 3.8 lần

marsbit15 phút trước

Đà Hồi Phục Yếu Ớt Của Bitcoin Khó Che Giấu Xu Hướng Điều Chỉnh, Tín Hiệu Đỉnh HYPE Cảnh Báo Rủi Ro Ngắn Hạn | Phân Tích Đặc Biệt

**Bitcoin Phục hồi yếu khó che giấu xu hướng điều chỉnh, tín hiệu đỉnh HYPE cảnh báo rủi ro ngắn hạn** **Phân tích cấu trúc Bitcoin (BTC):** - **Khung ngày:** BTC đã phá vỡ đường trung bình của kênh tăng (vàng) hình thành từ tháng 2/2026, cho thấy cấu trúc kỹ thuật suy yếu. Giá hiện trong kênh giảm ngắn hạn (xanh) và đang trong đợt phục hồi yếu hướng lên vùng kháng cự trên của kênh này (75.000-76.000 USD). - **Dự báo:** Đợt phục hồi này có thể chỉ là điều chỉnh kỹ thuật. Nếu không vượt qua được vùng 75.000-76.000 USD, giá có khả năng tiếp tục xu hướng giảm, thử thách vùng hỗ trợ mạnh 69.500-70.500 USD và thậm chí là đường xu hướng dưới của kênh tăng dài hạn. - **Chiến lược:** Ưu tiên chiến lược bán ra ở vùng kháng cự (Kế hoạch A) hoặc theo đà bán nếu giá phá vỡ hỗ trợ (Kế hoạch B), với khối lượng giao dịch dưới 30% và quản lý rủi ro chặt chẽ. **Phân tích cấu trúc HYPE:** - **Khung 4 giờ:** HYPE đã hoàn thành mô hình tăng 7 sóng từ đáy tháng 5. Điểm cuối cùng (47) cho thấy dấu hiệu phân kỳ động lượng tiềm ẩn và tín hiệu cảnh báo đỉnh mạnh từ mô hình giao dịch. - **Dự báo:** Nếu tín hiệu đỉnh tại điểm 47 được xác nhận cùng với phân kỳ, đây có thể là đỉnh ngắn hạn. Cần theo dõi phản ứng giá tại vùng hỗ trợ then chốt 62.5 - 64.75 USD. - **Chiến lược:** Chỉ xem xét mua vào nhẹ nếu giá hồi về vùng hỗ trợ 62.5-64.75 USD và có tín hiệu ổn định kết hợp. Nếu vùng này bị phá vỡ, điều chỉnh có thể mở rộng xuống 54-56.3 USD. **Lưu ý chung:** Thị trường biến động, cần điều chỉnh chiến lược linh hoạt. Mọi phân tích chỉ mang tính tham khảo, không phải lời khuyên đầu tư. Luôn sử dụng lệnh dừng lỗ và quản lý vốn nghiêm ngặt.

marsbit31 phút trước

Đà Hồi Phục Yếu Ớt Của Bitcoin Khó Che Giấu Xu Hướng Điều Chỉnh, Tín Hiệu Đỉnh HYPE Cảnh Báo Rủi Ro Ngắn Hạn | Phân Tích Đặc Biệt

marsbit31 phút trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

Làm thế nào để Mua ONE

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Harmony (ONE) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Harmony (ONE) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Harmony (ONE) của BạnSau khi mua Harmony (ONE), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Harmony (ONE)Giao dịch Harmony (ONE) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 487Xuất bản vào 2024.12.12Cập nhật vào 2025.03.21

Làm thế nào để Mua ONE

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của ONE (ONE) được trình bày dưới đây.

活动图片