Nghiên cứu mới của AMD đảo lộn nhận thức: FP4 huấn luyện không ổn định, nguyên nhân không phải do tính ngẫu nhiên không đủ

marsbitXuất bản vào 2026-05-27Cập nhật gần nhất vào 2026-05-27

Tóm tắt

Bài viết nghiên cứu mới của AMD và Đại học Bang Pennsylvania lật ngược nhận thức trước đây về việc huấn luyện mô hình lớn bằng định dạng FP4. Trái với suy nghĩ phổ biến rằng sự bất ổn đến từ tính ngẫu nhiên không đủ, nghiên cứu xác định nguyên nhân chính là lỗi cấu trúc từ việc thu nhỏ tỷ lệ (micro-scaling) tích lũy và khuếch đại dọc theo đường truyền gradient trọng số (Wgrad) nhạy cảm. Các thí nghiệm kiểm soát trên phần cứng AMD Instinct MI355X với định dạng MXFP4 cho thấy: khi thay thế phép tính Wgrad từ FP8 sang MXFP4, chất lượng hội tụ suy giảm đáng kể. Các chiến lược thêm tính ngẫu nhiên như làm tròn ngẫu nhiên hoặc phép xoay Hadamard ngẫu nhiên thậm chí còn gây ra phân kỳ. Ngược lại, phép xoay Hadamard xác định đã ổn định quá trình huấn luyện bằng cách áp dụng cùng một phép biến đổi mỗi bước, giữ cho mẫu lỗi nhất quán và tránh tích lũy. Với giải pháp này, nghiên cứu đã hoàn thành việc tiền huấn luyện đầy đủ cho Llama 3.1-8B trên C4, đạt được tốc độ huấn luyện nhanh hơn 9-10% so với đường cơ sở FP8, với chi phí token chỉ tăng thêm 8-9%. Đây là minh chứng đầu tiên về việc huấn luyện mô hình lớn hoàn chỉnh bằng FP4 trên phần cứng nguyên bản. Nghiên cứu có ý nghĩa quan trọng: (1) Cung cấp chẩn đoán nguyên nhân rõ ràng, hướng dẫn tập trung vào lỗi cấu trúc thay vì tính ngẫu nhiên; (2) Mở rộng phạm vi sử dụng FP4 từ suy luận sang huấn luyện, tiềm năng tăng gấp đôi hiệu suất phần cứng hiện có; (3) Dựa trên tiêu chuẩn mở OCP Microscaling, đảm bảo khả năng di chuyển giữa các ...

Như chúng ta đều biết, chi phí huấn luyện mô hình lớn (LLM) là cực kỳ cao.

Nhưng mọi người cũng biết rằng, việc giảm độ chính xác (precision) có thể giảm đáng kể chi phí huấn luyện. DeepSeek-V3 sử dụng FP8 để huấn luyện, đã giảm chi phí xuống còn 5,6 triệu USD, khiến cả ngành phải kinh ngạc.

Sau thành công của FP8, ngành công nghiệp vẫn không ngừng thăm dò giới hạn của độ chính xác thấp: từ FP8 xuống FP4, chi phí huấn luyện có thể giảm thêm bao nhiêu?

Về mặt lý thuyết, thông lượng tính toán FP4 có thể gấp đôi FP8. NVIDIA Blackwell và AMD MI350 series đã hỗ trợ nguyên sinh (native) các phép toán FP4 ở cấp độ phần cứng, trong đó B200 của NVIDIA công bố hiệu năng FP4 có thể đạt 4500 TOPS (thưa thớt/sparse). Phần cứng đã sẵn sàng, nhưng phía phần mềm và thuật toán luôn bị kẹt ở một vấn đề:

Huấn luyện mô hình lớn từ đầu (pretrain) bằng FP4, quá trình huấn luyện rất không ổn định.

Trong hai năm qua, các công trình như LLM-FP4, NVFP4 pretraining lần lượt thử nghiệm con đường này, nhưng hiếm có giải pháp nào có thể chạy thông suốt toàn bộ quy trình tiền huấn luyện (pretraining) ở độ chính xác 4-bit một cách sạch sẽ, đồng thời duy trì chất lượng hội tụ gần với FP8.

Khó khăn hơn là nguyên nhân sụp đổ vẫn chưa rõ ràng. Phân tích trước đây cho rằng, nguyên nhân gây mất ổn định khi huấn luyện với FP4 rất có thể đến từ tính ngẫu nhiên không đủ.

Nhưng gần đây, AMD hợp tác với Đại học Bang Pennsylvania đã công bố một bài báo khoa học, lật ngược nhận thức truyền thống, đưa ra một chẩn đoán mới mẻ và rõ ràng cho việc huấn luyện nguyên sinh FP4.

  • Tiêu đề bài báo: Pretraining large language models with MXFP4 on Native FP4 Hardware
  • Liên kết bài báo: https://arxiv.org/abs/2605.09825

Bài báo này đã hoàn thành quy trình tiền huấn luyện (pretraining) đầy đủ cho Llama 3.1-8B sử dụng định dạng MXFP4 trên GPU AMD Instinct MI355X, tốc độ huấn luyện đầu cuối (end-to-end) nhanh hơn 9-10% so với đường cơ sở FP8, token hao phí chỉ nhiều hơn 8-9%. Đây là thí nghiệm hoàn chỉnh đầu tiên hiện nay hoàn thành tiền huấn luyện mô hình lớn trên phần cứng FP4 nguyên sinh (không phải mô phỏng phần mềm).

Quan trọng hơn, bài báo tiết lộ vấn đề cốt lõi: Nguồn gốc của sự bất ổn định khi huấn luyện FP4 không phải là do tính ngẫu nhiên không đủ, mà là do lỗi vi chia tỷ lệ (micro-scaling) cấu trúc tích lũy và khuếch đại dọc theo các đường dẫn gradient nhạy cảm.

MXFP4 là gì

Trước khi phân tích bài báo, cần hiểu định dạng dữ liệu MXFP4 này.

Lượng tử hóa nguyên (integer) truyền thống thường sử dụng một hệ số tỷ lệ (scaling factor) duy nhất cho toàn bộ tensor. Thiết kế cốt lõi của MXFP4 được gọi là "Vi chia tỷ lệ" (Micro-scaling): chia một tensor thành các khối nhỏ (ví dụ: mỗi nhóm 32 phần tử), cấp phát một số mũ chung (format E8M0) cho mỗi khối nhỏ, mỗi phần tử trong khối được biểu diễn bằng số dấu phẩy động 4-bit. Công thức tái tạo có thể được viết là:

Trong đó, E_shared là số mũ lớn nhất trong khối, Q_FP4 là giá trị được làm tròn gần nhất đến giá trị có thể biểu diễn được bằng số dấu phẩy động 4-bit.

Lợi ích của vi chia tỷ lệ nằm ở: mỗi khối nhỏ có phạm vi động (dynamic range) riêng, không bị "bắt cóc" bởi các giá trị ngoại lai toàn cục (global outliers). Điều này làm cho chất lượng biểu diễn của số dấu phẩy động 4-bit tốt hơn nhiều so với lượng tử hóa toàn cục đơn giản.

Nhưng ngay cả khi có vi chia tỷ lệ, việc huấn luyện FP4 vẫn không ổn định.

Thí nghiệm điều tra: Nguồn gốc của sự bất ổn định

Nhóm nghiên cứu trước tiên đã thiết kế một thí nghiệm kiểm soát từng bước.

Một phép tính lớp tuyến tính (linear layer) Transformer hoàn chỉnh liên quan đến ba thao tác nhân ma trận tổng quát (GEMM):

Fprop (Lan truyền xuôi/Forward propagation): Tính Y = XW^T, tạo ra giá trị kích hoạt (activations)

Dgrad (Gradient của kích hoạt): Tính ∇X = ∇Y · W, truyền gradient ngược về đầu vào

Wgrad (Gradient của trọng số): Tính ∇W = (∇Y)^T · X, tạo ra gradient dùng để cập nhật trọng số

Nhóm nghiên cứu giữ nguyên tất cả các yếu tố khác, lần lượt thay thế ba thao tác này từ FP8 sang MXFP4, quan sát ảnh hưởng của mỗi bước đến sự hội tụ. Tất cả thí nghiệm đều được thực thi trên AMD Instinct MI355X sử dụng tensor core FP4 nguyên sinh, không phụ thuộc vào mô phỏng phần mềm.

Nhiệm vụ huấn luyện là thiết lập tiêu chuẩn MLPerf, tiền huấn luyện Llama 3.1-8B trên tập dữ liệu C4, mục tiêu hội tụ là đạt độ bối rối (perplexity) trên tập kiểm định là 3.3.

Hai bước đầu chỉ dẫn đến hao phí token thêm nhẹ nhàng, nhưng ngay khi thay thế Wgrad bằng MXFP4, hao phí nhảy vọt lên 26-27%.

Wgrad là nút thắt (bottleneck) của việc huấn luyện FP4. Lan truyền xuôi và gradient của kích hoạt có khả năng chịu đựng tương đối với lượng tử hóa FP4, nhưng gradient của trọng số một khi bị lượng tử hóa xuống 4-bit, chất lượng hội tụ lập tức xuống cấp đáng kể.

Trực giác chủ đạo của ngành trước đây là: Lỗi lượng tử hóa FP4 về bản chất là vấn đề nhiễu (noise), do đó có thể "làm mịn" phân bố lỗi bằng cách bơm vào tính ngẫu nhiên. Hai chiến lược phổ biến là:

Làm tròn ngẫu nhiên (Stochastic Rounding): Đưa tính ngẫu nhiên vào khi lượng tử hóa, làm cho kỳ vọng của lỗi làm tròn bằng không.

Phép quay Hadamard ngẫu nhiên (Randomized Hadamard): Sử dụng biến đổi Hadamard với việc lật dấu ngẫu nhiên để làm phân tán phân bố dữ liệu trước khi lượng tử hóa.

Khi Wgrad bị lượng tử hóa, cả hai chiến lược ngẫu nhiên không những không ổn định được việc huấn luyện, mà còn trực tiếp dẫn đến không hội tụ. Tính ngẫu nhiên không những không giúp ích, mà còn đưa thêm nhiều lỗi lượng tử hóa hiệu quả vào đường dẫn gradient quan trọng.

Ngược lại, phép quay Hadamard tất định (deterministic) đã ép hao phí token toàn quy trình từ 26-27% trở lại chỉ còn 8-9%, quỹ đạo huấn luyện bám sát đường cơ sở FP8.

Đây là một kết quả rất có giá trị chẩn đoán. Cả phép quay Hadamard ngẫu nhiên và tất định đều là phép biến đổi trực giao, đều có thể làm phân tán năng lượng của các giá trị ngoại lai, về lý thuyết hiệu quả giảm nhẹ lỗi lượng tử hóa nên tương tự. Nhưng biểu hiện của chúng trong kịch bản Wgrad lại hoàn toàn trái ngược, điều này tiết lộ bản chất của vấn đề:

Sự bất ổn định của việc huấn luyện FP4, được thúc đẩy bởi lỗi cấu trúc do vi chia tỷ lệ MXFP4 tạo ra trên các đường dẫn gradient nhạy cảm. Các chiến lược ngẫu nhiên thất bại vì chúng đưa vào các mẫu lỗi (error pattern) khác nhau ở mỗi bước, và những mẫu lỗi biến đổi này tích lũy dọc theo đường dẫn gradient, ngược lại còn khuếch đại sự bất ổn định. Lý do phép quay tất định có hiệu quả, chính xác là vì nó áp dụng cùng một phép biến đổi ở mỗi bước, làm cho mẫu lỗi nhất quán, tránh được sự tích lũy lỗi.

Hiệu suất đầu cuối: Thông lượng bước huấn luyện +20%, tốc độ tổng hợp tăng 9-10%

Sau khi áp dụng phép quay Hadamard tất định kết hợp với MXFP4 toàn quy trình, dữ liệu hiệu suất như sau:

Thông lượng của mỗi bước huấn luyện tăng 20%, sau khi trừ đi hao phí token tăng thêm 8-9%, tốc độ tổng hợp đầu cuối vẫn tăng 9-10%.

Xét rằng đây là việc cắt trực tiếp độ chính xác từ 8-bit xuống 4-bit, cả chất lượng hội tụ và mức độ tăng tốc này đều khá ấn tượng.

Hình trái: Đường cong độ bối rối trên tập kiểm định (validation perplexity) của Llama 3.1–8B theo số token huấn luyện khi tiền huấn luyện MLPerf trên tập dữ liệu C4. Kết quả cho thấy, MXFP4 + Hadamard tất định có biểu hiện rất gần với FP8, trong khi MXFP4 toàn quy trình không xử lý ổn định hóa thì hội tụ chậm hơn và tính ổn định huấn luyện cũng kém hơn. Hình phải: Khung nhìn phóng to cục bộ ở giai đoạn cuối huấn luyện. Mục tiêu độ bối rối của MLPerf là 3.3. So với chạy MXFP4 không ổn định hóa, Hadamard tất định (H16) có thể duy trì sự nhất quán chặt chẽ hơn với đường cơ sở FP8.

Đáng chú ý, các tác giả trong bài báo đã nhấn mạnh rõ ràng một hạn chế quan trọng: Hiệu quả của phương án huấn luyện FP4 này (tập dữ liệu MLPerf C4 + Llama 3.1-8B) đã được xác minh, nhưng không thể trực tiếp giả định rằng nó có thể chuyển đổi liền mạch cho mọi mô hình, mọi tập dữ liệu và mọi phương pháp huấn luyện. Hành vi của việc huấn luyện FP4 có thể phụ thuộc cao vào thiết lập cụ thể, các chiến lược ổn định cụ thể cần được xác minh lại theo từng kịch bản.

Lời kết

Đặt bài báo này vào bối cảnh ngành công nghiệp lớn hơn, nó có ít nhất ba tầng ý nghĩa.

Tầng thứ nhất: Nó trả lời một câu hỏi cơ bản "Tại sao". Các công trình huấn luyện FP4 trước đây phần lớn tập trung vào "làm sao để nó không sụp", bài báo này lần đầu tiên đưa ra một chẩn đoán nhân quả rõ ràng: sự sụp đổ bắt nguồn từ lỗi vi chia tỷ lệ cấu trúc trên đường dẫn Wgrad, chứ không phải do tính ngẫu nhiên không đủ. Bản thân chẩn đoán này đã có giá trị về phương pháp luận, nó nói với các nhà nghiên cứu tiếp theo: khi gặp phải sự bất ổn định trong huấn luyện độ chính xác thấp, nên ưu tiên điều tra nguồn lỗi cấu trúc, thay vì mù quáng tăng tính ngẫu nhiên.

Tầng thứ hai: Nó đẩy FP4 từ "chuyên cho suy luận (inference)" sang "có thể dùng cho huấn luyện". Trước đây, sự đồng thuận của ngành là FP4 chỉ phù hợp cho lượng tử hóa suy luận, huấn luyện ít nhất phải dùng FP8. NVIDIA chủ trương đẩy mạnh FP4 cho suy luận chứ không phải huấn luyện trên Blackwell, cũng phản ánh nhận định này. Bài báo này đã chạy thông suốt quy trình tiền huấn luyện trên phần cứng FP4 nguyên sinh, có nghĩa là năng lực tính toán FP4 vốn được chuẩn bị cho suy luận trên MI355X và Blackwell, về lý thuyết cũng có thể dùng để huấn luyện. Nếu việc huấn luyện FP4 được xác minh là khả thi trên nhiều mô hình lớn hơn và nhiều kịch bản hơn, đồng nghĩa với việc năng lực tính toán có sẵn cho huấn luyện trên phần cứng hiện tại có thể tăng gấp đôi.

Tầng thứ ba: Nó sử dụng tiêu chuẩn mở OCP. MXFP4 là một phần của tiêu chuẩn định dạng OCP Microscaling, đằng sau có sự hỗ trợ chung của bảy công ty: AMD, NVIDIA, Intel, Meta, Microsoft, Arm, Qualcomm. Dựa trên tiêu chuẩn mở có nghĩa là phương pháp này có tính khả chuyển trên phần cứng của các nhà sản xuất khác nhau, không bị khóa chặt vào một hệ sinh thái duy nhất.

Từ FP16 đến FP8, DeepSeek-V3 đã chứng minh cắt đôi độ chính xác có thể giảm mạnh chi phí huấn luyện. Từ FP8 đến FP4, bài báo này đã thực hiện bước đầu tiên quan trọng. Mỗi lần cắt một nhát vào độ chính xác, toàn bộ tính kinh tế của việc huấn luyện mô hình lớn đều đang chuyển biến.

Bài viết này từ tài khoản công chúng WeChat "Machine Heart" (ID:almosthuman2014), biên tập: Leng Mao

Câu hỏi Liên quan

QNghiên cứu mới của AMD phát hiện nguyên nhân chính gây ra sự không ổn định khi huấn luyện mô hình lớn ở độ chính xác FP4 là gì?

ANguyên nhân chính không phải là do tính ngẫu nhiên không đủ, mà là do lỗi cấu trúc từ việc thu nhỏ vi mô (micro-scaling) tích lũy và khuếch đại dọc theo con đường gradient nhạy cảm, đặc biệt là ở Wgrad (gradient trọng số).

QMXFP4 là gì và nó khác với phương pháp lượng tử hóa truyền thống như thế nào?

AMXFP4 là một định dạng dữ liệu 4-bit sử dụng phương pháp 'vi tỷ lệ' (micro-scaling). Thay vì dùng một hệ số tỷ lệ chung cho cả tensor, nó chia tensor thành các khối nhỏ (ví dụ 32 phần tử) và gán một số mũ chia sẻ riêng cho mỗi khối. Điều này giúp mỗi khối có phạm vi động riêng, không bị ảnh hưởng bởi các giá trị ngoại lệ toàn cục, cải thiện chất lượng biểu diễn so với lượng tử hóa toàn cục thông thường.

QTrong ba phép tính của lớp Transformer, thao tác nào được xác định là điểm nghẽn gây ra sự không ổn định khi sử dụng MXFP4?

AThao tác Wgrad (tính gradient trọng số) được xác định là điểm nghẽn. Thử nghiệm cho thấy khi chỉ thay thế Fprop và Dgrad bằng MXFP4, tổn thất token tăng nhẹ, nhưng ngay khi thay thế Wgrad, tổn thất token tăng vọt lên 26-27%, dẫn đến suy giảm đáng kể chất lượng hội tụ.

QTại sao các chiến lược như làm tròn ngẫu nhiên (Stochastic Rounding) lại không hiệu quả trong việc ổn định huấn luyện FP4, thậm chí còn gây ra phân kỳ?

ACác chiến lược ngẫu nhiên như làm tròn ngẫu nhiên hay phép quay Hadamard ngẫu nhiên thất bại vì chúng tạo ra các mẫu lỗi (error pattern) khác nhau ở mỗi bước huấn luyện. Những mẫu lỗi thay đổi này tích lũy và khuếch đại dọc theo con đường gradient nhạy cảm, từ đó làm tăng thêm sự không ổn định thay vì làm dịu nó.

QPhương pháp quay Hadamard xác định (Deterministic Hadamard rotation) mang lại những lợi ích hiệu suất cụ thể nào trong huấn luyện end-to-end với MXFP4?

APhương pháp quay Hadamard xác định giúp ổn định quá trình huấn luyện, giảm tổn thất token từ 26-27% xuống chỉ còn 8-9%. Kết hợp với MXFP4, nó giúp tăng thông lượng mỗi bước huấn luyện lên 20% và mang lại tốc độ tổng thể end-to-end nhanh hơn 9-10% so với đường cơ sở FP8, trong khi vẫn duy trì chất lượng hội tụ gần tương đương.

Nội dung Liên quan

Nghiên cứu mới nhất của BIS: Stablecoin và Tương lai của Cục diện Tiền tệ Toàn cầu

BIS: Tương lai của Stablecoin và Cục diện Tiền tệ Toàn cầu Nghiên cứu mới nhất của Ngân hàng Thanh toán Quốc tế (BIS) phân tích sâu sắc tác động của stablecoin đối với hệ thống tiền tệ quốc tế. Thị trường stablecoin đã phát triển nhanh chóng, với tổng vốn hóa vượt 3000 tỷ USD vào năm 2026, bị chi phối bởi các stablecoin neo theo USD như USDT và USDC. Báo cáo nhận định stablecoin hoạt động như một hình thức trái quyền tư nhân phi tập trung của USD, mở rộng tính thanh khoản đồng đô la ra toàn cầu. Về ngắn hạn, chúng có khả năng củng cố vị thế thống trị của đồng USD. Đối với các nền kinh tế mới nổi và đang phát triển (EMDEs), stablecoin USD trở thành kênh "đô la hóa kỹ thuật số", cho phép người dân trữ giá trị và thực hiện thanh toán xuyên biên giới, từ đó có thể làm xói mòn chủ quyền tiền tệ, làm giảm hiệu quả chính sách tiền tệ và khiến các biện pháp kiểm soát vốn trở nên kém hiệu quả. Báo cáo đưa ra ba viễn cảnh tương lai: 1. **Áp dụng hạn chế (Kịch bản cơ sở):** Stablecoin chủ yếu tồn tại trong hệ sinh thái tiền mã hóa. 2. **Đô la hóa kỹ thuật số (Kịch bản rủi ro cao):** Stablecoin USD trở thành phương tiện thanh toán và dự trữ giá trị phổ biến tại các EMDEs, gây ra rủi ro nghiêm trọng cho ổn định tài chính. 3. **Tích hợp stablecoin nội tệ (Kịch bản lý tưởng):** Các EMDEs phát triển stablecoin neo theo đồng nội tệ được quản lý chặt chẽ, kết nối với hệ thống thanh toán trong nước và CBDC để tăng hiệu quả mà vẫn giữ được chủ quyền. Để quản lý những thách thức này, báo cáo nhấn mạnh sự cần thiết của việc **hài hòa tiêu chuẩn quản lý toàn cầu**, **tăng cường hợp tác xuyên biên giới**, **nâng cấp khả năng phòng thủ trong nước** (như phát triển CBDC và hệ thống thanh toán hiệu quả), và **kiểm soát các hoạt động bất hợp pháp**. Tương lai sẽ là sự cạnh tranh giữa tiền tệ pháp định, CBDC và stablecoin tư nhân, đòi hỏi sự phối hợp quốc tế để đón nhận lợi ích công nghệ trong khi vẫn bảo vệ được an toàn tài chính và chủ quyền tiền tệ.

链捕手8 phút trước

Nghiên cứu mới nhất của BIS: Stablecoin và Tương lai của Cục diện Tiền tệ Toàn cầu

链捕手8 phút trước

"Công ty một người" bùng nổ: Người kiếm trăm triệu mỗi năm, kẻ thu nhập co lại 90%

"Mô hình 'công ty một người' (One Person Company - OPC) đang trở thành xu hướng trong thời đại AI, cho phép cá nhân khởi nghiệp độc lập với chi phí thấp. Năm 2026 được coi là năm khởi đầu, với hơn 16 triệu OPC tại Trung Quốc. Tuy nhiên, thành công không phải là điều đảm bảo, với hơn 52% có thu nhập dưới 7.000 tệ/tháng. Bài viết chia sẻ câu chuyện của bốn nhà sáng lập: • **Anh Zhang (lĩnh vực game):** Phát triển 6 game tương tác bullet chat (đạn màn hình) trong một năm, doanh thu ~200 triệu tệ, thu nhập cá nhân 80-100 triệu tệ. AI đảm nhận ~70% công việc đồ họa và hỗ trợ viết code, giúp giảm chi phí sản xuất từ 2 triệu tệ xuống còn 1.000-1.500 tệ/game và rút ngắn chu kỳ phát triển từ 2-4 tháng xuống còn 15 ngày. • **Chị October (nghiên cứu vật liệu tại Nhật Bản):** Thu nhập gấp ~3 lần mức lương văn phòng trung bình, đạt ~150 triệu yên/năm. AI được sử dụng cho mọi công đoạn như dịch thuật, tư vấn pháp lý, xử lý đơn hàng. Thị trường Nhật ít cạnh tranh khốc liệt nhưng rào cản ngành và yêu cầu tín dụng rất cao. • **Anh Xiao Tao (công nghệ sinh học):** Thu nhập tăng gấp đôi so với đi làm thuê. Anh sử dụng AI Agent (như DeepSeek, Claude) để tự động hóa ~80% công việc phân tích dữ liệu và báo cáo lặp đi lặp lại, tập trung vào 20% công việc đòi hỏi phán đoán chuyên môn và giao tiếp với khách hàng. • **Anh A Yuan (thương mại điện tử xuyên biên giới):** Chuyển từ vị trí vận hành tại tập đoàn lớn (thu nhập ~6 triệu tệ/năm) sang khởi nghiệp OPC ở thị trường Mexico. AI thay thế ~60% công việc như chọn sản phẩm, tạo nội dung. Tuy nhiên, sau 2 tháng, doanh thu chỉ đạt hơn 10.000 tệ, lợi nhuận khoảng 1.000 tệ, thu nhập giảm ~90%. Anh khuyên không nên khởi nghiệp bồng bột và nhấn mạnh giá trị học hỏi thực tế từ việc tự kinh doanh. Các câu chuyện cho thấy AI là công cụ đắc lực giảm chi phí, rút ngắn thời gian và tự động hóa, nhưng không đảm bảo thành công. Yếu tố then chốt vẫn là kinh nghiệm ngành, khả năng sáng tạo, quản lý, nguồn khách hàng và hiểu biết về thị trường cụ thể. Mô hình OPC phù hợp nhất với những người có chuyên môn sẵn và nguồn lực khách hàng, chứ không phải cho người mới bắt đầu hoàn toàn."

marsbit15 phút trước

"Công ty một người" bùng nổ: Người kiếm trăm triệu mỗi năm, kẻ thu nhập co lại 90%

marsbit15 phút trước

Giải mã báo cáo của Goldman Sachs: Thiếu hụt bộ nhớ kéo dài đến năm 2028, tiếp tục mua vào

Bài báo từ Goldman Sachs nhấn mạnh rằng chu kỳ tăng trưởng bộ nhớ bán dẫn (DRAM, NAND, HBM) hiện tại sẽ kéo dài hơn dự kiến, với tình trạng thiếu hụt kéo dài đến năm 2028 do nhu cầu từ máy chủ AI, nguồn cung hạn chế và các hợp đồng dài hạn. Báo cáo nâng mục tiêu giá cổ phiếu cho Samsung Electronics, SK Hynix và nâng hạng mua cho Kioxia. Các công ty khác trong chuỗi cung ứng AI cũng được đề xuất mua, bao gồm MediaTek (chuyển đổi sang chip AI), Eoptolink (mô-đun quang), Biren (chip AI Trung Quốc), Huaqin (gia công AI), Lenovo (AI PC), cùng các công ty như GDS và VNET. Báo cáo cũng đề cập đến các lĩnh vực khác như bất động sản Trung Quốc (trong kịch bản lạc quan), BYD (xe thông minh), thiết bị bán dẫn Nhật Bản và Panasonic. Một chủ đề vĩ mô được nêu bật là sự va chạm giữa đầu tư AI bùng nổ và khủng hoảng năng lượng, có lợi cho các nước xuất khẩu công nghệ. Lưu ý quan trọng: Tất cả xếp hạng và dự báo là quan điểm của nhà phân tích Goldman Sachs, không phải lời khuyên đầu tư. Độc giả nên tập trung vào logic tổng thể và các giả định đằng sau báo cáo.

marsbit50 phút trước

Giải mã báo cáo của Goldman Sachs: Thiếu hụt bộ nhớ kéo dài đến năm 2028, tiếp tục mua vào

marsbit50 phút trước

Phân Tích Chi Tiết Chiến Thuật Đầu Tư Thần Thánh Của Mộc Đầu Tỷ Vào Circle

Bài viết phân tích chiến lược đầu tư xuất sắc của Cathie Wood (còn gọi là "chị gỗ") vào cổ phiếu Circle (CRCL), một công ty phát hành stablecoin USDC. Chiến lược bao gồm ba bước chính: (1) **Mua cổ phần với giá phát hành (IPO)** - ARK đã đăng ký mua trước, sở hữu 4.49 triệu cổ phiếu với giá 31 USD/CP trước khi niêm yết, hưởng lợi từ việc giá tăng vọt 168% trong ngày đầu giao dịch. (2) **Bán ra ở vùng giá cao** - Khi giá tăng lên khoảng 210 USD nhờ tin tức về dự luật stablecoin (GENIUS Act), ARK đã bán khoảng 1.7 triệu cổ phiếu để chốt lời, một phần do kỷ luật tái cân bằng danh mục. (3) **Mua lại ở vùng giá thấp** - Khi giá giảm mạnh (từ đỉnh 299 USD xuống dưới 90 USD) do áp lực từ việc cổ phiếu được giải tỏa và lo ngại về lãi suất, ARK đã mua lại dần, khôi phục vị thế về khoảng 4.5 triệu cổ phiếu. Bài học chính: Chiến lược thành công dựa trên **niềm tin vững chắc vào mô hình kinh doanh dài hạn** của Circle, **thực hiện giao dịch theo từng đợt** (không cố bắt đỉnh/đáy), và tuân thủ **kỷ luật quản lý danh mục** nghiêm ngặt (như quy tắc tái cân bằng khi một cổ phiếu vượt 10%). Đối với nhà đầu tư cá nhân, việc "đuổi theo" đợt tăng giá mạnh lúc IPO thường rất rủi ro.

marsbit52 phút trước

Phân Tích Chi Tiết Chiến Thuật Đầu Tư Thần Thánh Của Mộc Đầu Tỷ Vào Circle

marsbit52 phút trước

Báo Buổi Sáng | Michael Saylor Cập Nhật Thông Tin Bitcoin Tracker; Aave Công Bố Điều Tra Sự Kiện Tấn Công Cầu Kelp rsETH; Gravity Bridge Tạm Ngừng Dịch Vụ Sau Khi Bị Tấn Công

Dưới đây là tóm tắt những tin tức chính về tiền điện tử và blockchain trong 24 giờ qua: **Tin tức quan trọng:** * **Quy định & Chấp thuận:** Công ty tài sản số Laser Digital nhận được phê chuẩn có điều kiện từ OCC để thành lập một ngân hàng ủy thác liên bang. Việt Nam đang xem xét cho phép doanh nghiệp vừa và nhỏ dùng tài sản số, tài sản ảo làm tài sản thế chấp cho vay ngân hàng. * **Sự cố bảo mật:** Gravity Bridge thuộc hệ sinh thái Cosmos đã bị tấn công và tạm dừng dịch vụ. Aave đã công bố báo cáo điều tra sau sự cố tấn công vào cầu Kelp rsETH, nhấn mạnh lỗ hổng nằm ở cơ sở hạ tầng cầu của bên thứ ba. * **Thị trường & Cá nhân:** Chủ tịch Ủy ban Chứng khoán Hồng Kông cho biết khối lượng giao dịch trên 12 nền tảng tài sản ảo được cấp phép trong quý I/2026 tăng gần gấp ba lần. Michael Saylor tiếp tục đăng thông tin về Bitcoin Tracker, dự kiến công bố dữ liệu mua vào trong tuần tới. * **Quan điểm & Pháp lý:** Cố vấn Cục Dự trữ Liên bang Mỹ (Fed) Christopher Waller nhận định sự phổ biến của stablecoin có thể khuếch đại tầm ảnh hưởng chính sách của Fed. Một vụ án tại Trung Quốc xác định Bitcoin là tài sản có giá trị và kết án tù một đối tượng vì đánh cắp 107 BTC. SEC Mỹ đã khởi kiện người sáng lập Privvy về một vụ lừa đảo tiền điện tử trị giá 12,3 triệu USD. * **Phân tích thị trường:** Santiment chỉ ra tỷ lệ Long/Short Bitcoin đạt mức cao nhất trong năm, cảnh báo có thể điều chỉnh ngắn hạn. Tâm lý thị trường xung quanh Ethereum đã chuyển từ FOMO sang FUD. **Meme Token nổi bật (24h):** * **Ethereum:** HEX, SHIB, LINK, PEPE, UNI. * **Solana:** TROLL, WORLDCUP, neet, Buttcoin, PBTC. * **Base:** toby, ELSA, cbETH, CYPR, ALB. **Bài viết đáng chú ý:** Một bài viết nhìn lại các dự đoán về ChatGPT từ năm 2023 sau ba năm phát triển của AI.

链捕手1 giờ trước

Báo Buổi Sáng | Michael Saylor Cập Nhật Thông Tin Bitcoin Tracker; Aave Công Bố Điều Tra Sự Kiện Tấn Công Cầu Kelp rsETH; Gravity Bridge Tạm Ngừng Dịch Vụ Sau Khi Bị Tấn Công

链捕手1 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

AGENT S là gì

Agent S: Tương Lai của Tương Tác Tự Động trong Web3 Giới thiệu Trong bối cảnh không ngừng phát triển của Web3 và tiền điện tử, các đổi mới đang liên tục định nghĩa lại cách mà cá nhân tương tác với các nền tảng kỹ thuật số. Một dự án tiên phong như vậy, Agent S, hứa hẹn sẽ cách mạng hóa tương tác giữa con người và máy tính thông qua khung tác nhân mở của nó. Bằng cách mở đường cho các tương tác tự động, Agent S nhằm đơn giản hóa các nhiệm vụ phức tạp, cung cấp các ứng dụng chuyển đổi trong trí tuệ nhân tạo (AI). Cuộc khám phá chi tiết này sẽ đi sâu vào những phức tạp của dự án, các tính năng độc đáo của nó và những tác động đối với lĩnh vực tiền điện tử. Agent S là gì? Agent S đứng vững như một khung tác nhân mở đột phá, được thiết kế đặc biệt để giải quyết ba thách thức cơ bản trong việc tự động hóa các nhiệm vụ máy tính: Thu thập Kiến thức Cụ thể theo Miền: Khung này học một cách thông minh từ nhiều nguồn kiến thức bên ngoài và kinh nghiệm nội bộ. Cách tiếp cận kép này giúp nó xây dựng một kho lưu trữ phong phú về kiến thức cụ thể theo miền, nâng cao hiệu suất của nó trong việc thực hiện nhiệm vụ. Lập Kế Hoạch Qua Các Tầm Nhìn Nhiệm Vụ Dài Hạn: Agent S sử dụng lập kế hoạch phân cấp tăng cường kinh nghiệm, một cách tiếp cận chiến lược giúp phân chia và thực hiện các nhiệm vụ phức tạp một cách hiệu quả. Tính năng này nâng cao đáng kể khả năng quản lý nhiều nhiệm vụ con một cách hiệu quả và hiệu suất. Xử Lý Các Giao Diện Động, Không Đều: Dự án giới thiệu Giao Diện Tác Nhân-Máy Tính (ACI), một giải pháp đổi mới giúp nâng cao tương tác giữa các tác nhân và người dùng. Sử dụng các Mô Hình Ngôn Ngữ Lớn Đa Phương Thức (MLLMs), Agent S có thể điều hướng và thao tác các giao diện người dùng đồ họa đa dạng một cách liền mạch. Thông qua những tính năng tiên phong này, Agent S cung cấp một khung vững chắc giải quyết các phức tạp liên quan đến việc tự động hóa tương tác giữa con người với máy móc, mở ra nhiều ứng dụng trong AI và hơn thế nữa. Ai là Người Tạo ra Agent S? Mặc dù khái niệm về Agent S là hoàn toàn đổi mới, thông tin cụ thể về người sáng lập vẫn còn mơ hồ. Người sáng lập hiện vẫn chưa được biết đến, điều này làm nổi bật giai đoạn sơ khai của dự án hoặc sự lựa chọn chiến lược để giữ kín các thành viên sáng lập. Bất chấp sự ẩn danh, sự chú ý vẫn tập trung vào khả năng và tiềm năng của khung này. Ai là Các Nhà Đầu Tư của Agent S? Vì Agent S còn tương đối mới trong hệ sinh thái mã hóa, thông tin chi tiết về các nhà đầu tư và những người tài trợ tài chính của nó không được ghi chép rõ ràng. Sự thiếu vắng thông tin công khai về các nền tảng đầu tư hoặc tổ chức hỗ trợ dự án dấy lên câu hỏi về cấu trúc tài trợ và lộ trình phát triển của nó. Hiểu biết về sự hỗ trợ là rất quan trọng để đánh giá tính bền vững và tác động tiềm năng của dự án. Agent S Hoạt Động Như Thế Nào? Tại cốt lõi của Agent S là công nghệ tiên tiến cho phép nó hoạt động hiệu quả trong nhiều bối cảnh khác nhau. Mô hình hoạt động của nó được xây dựng xung quanh một số tính năng chính: Tương Tác Giống Như Con Người: Khung này cung cấp lập kế hoạch AI tiên tiến, cố gắng làm cho các tương tác với máy tính trở nên trực quan hơn. Bằng cách bắt chước hành vi của con người trong việc thực hiện nhiệm vụ, nó hứa hẹn nâng cao trải nghiệm người dùng. Ký Ức Tường Thuật: Được sử dụng để tận dụng các trải nghiệm cấp cao, Agent S sử dụng ký ức tường thuật để theo dõi lịch sử nhiệm vụ, từ đó nâng cao quy trình ra quyết định của nó. Ký Ức Tình Huống: Tính năng này cung cấp cho người dùng hướng dẫn từng bước, cho phép khung này cung cấp hỗ trợ theo ngữ cảnh khi các nhiệm vụ diễn ra. Hỗ Trợ OpenACI: Với khả năng chạy cục bộ, Agent S cho phép người dùng duy trì quyền kiểm soát đối với các tương tác và quy trình làm việc của họ, phù hợp với tinh thần phi tập trung của Web3. Tích Hợp Dễ Dàng với Các API Bên Ngoài: Tính linh hoạt và khả năng tương thích với nhiều nền tảng AI khác nhau đảm bảo rằng Agent S có thể hòa nhập liền mạch vào các hệ sinh thái công nghệ hiện có, làm cho nó trở thành lựa chọn hấp dẫn cho các nhà phát triển và tổ chức. Những chức năng này cùng nhau góp phần vào vị trí độc đáo của Agent S trong không gian tiền điện tử, khi nó tự động hóa các nhiệm vụ phức tạp, nhiều bước với sự can thiệp tối thiểu của con người. Khi dự án phát triển, các ứng dụng tiềm năng của nó trong Web3 có thể định nghĩa lại cách mà các tương tác kỹ thuật số diễn ra. Thời Gian Phát Triển của Agent S Sự phát triển và các cột mốc của Agent S có thể được tóm tắt trong một dòng thời gian nêu bật các sự kiện quan trọng của nó: 27 tháng 9, 2024: Khái niệm về Agent S được ra mắt trong một bài nghiên cứu toàn diện mang tên “Một Khung Tác Nhân Mở Sử Dụng Máy Tính Như Một Con Người,” trình bày nền tảng cho dự án. 10 tháng 10, 2024: Bài nghiên cứu được công bố công khai trên arXiv, cung cấp một cái nhìn sâu sắc về khung và đánh giá hiệu suất của nó dựa trên tiêu chuẩn OSWorld. 12 tháng 10, 2024: Một video trình bày được phát hành, cung cấp cái nhìn trực quan về khả năng và tính năng của Agent S, thu hút thêm sự quan tâm từ người dùng và nhà đầu tư tiềm năng. Những dấu mốc trong dòng thời gian không chỉ minh họa sự tiến bộ của Agent S mà còn chỉ ra cam kết của nó đối với sự minh bạch và sự tham gia của cộng đồng. Những Điểm Chính Về Agent S Khi khung Agent S tiếp tục phát triển, một số thuộc tính chính nổi bật, nhấn mạnh tính đổi mới và tiềm năng của nó: Khung Đổi Mới: Được thiết kế để cung cấp cách sử dụng máy tính trực quan giống như tương tác của con người, Agent S mang đến một cách tiếp cận mới cho việc tự động hóa nhiệm vụ. Tương Tác Tự Động: Khả năng tương tác tự động với máy tính thông qua GUI đánh dấu một bước tiến tới các giải pháp tính toán thông minh và hiệu quả hơn. Tự Động Hóa Nhiệm Vụ Phức Tạp: Với phương pháp mạnh mẽ của nó, nó có thể tự động hóa các nhiệm vụ phức tạp, nhiều bước, làm cho các quy trình nhanh hơn và ít sai sót hơn. Cải Tiến Liên Tục: Các cơ chế học tập cho phép Agent S cải thiện từ các trải nghiệm trước đó, liên tục nâng cao hiệu suất và hiệu quả của nó. Tính Linh Hoạt: Khả năng thích ứng của nó trên các môi trường hoạt động khác nhau như OSWorld và WindowsAgentArena đảm bảo rằng nó có thể phục vụ một loạt các ứng dụng rộng rãi. Khi Agent S định vị mình trong bối cảnh Web3 và tiền điện tử, tiềm năng của nó để nâng cao khả năng tương tác và tự động hóa quy trình đánh dấu một bước tiến quan trọng trong công nghệ AI. Thông qua khung đổi mới của mình, Agent S minh họa cho tương lai của các tương tác kỹ thuật số, hứa hẹn một trải nghiệm liền mạch và hiệu quả hơn cho người dùng trên nhiều ngành công nghiệp khác nhau. Kết luận Agent S đại diện cho một bước nhảy vọt táo bạo trong sự kết hợp giữa AI và Web3, với khả năng định nghĩa lại cách chúng ta tương tác với công nghệ. Mặc dù vẫn còn ở giai đoạn đầu, những khả năng cho ứng dụng của nó là rộng lớn và hấp dẫn. Thông qua khung toàn diện của mình giải quyết các thách thức quan trọng, Agent S nhằm đưa các tương tác tự động lên hàng đầu trong trải nghiệm kỹ thuật số. Khi chúng ta tiến sâu hơn vào các lĩnh vực tiền điện tử và phi tập trung, các dự án như Agent S chắc chắn sẽ đóng một vai trò quan trọng trong việc định hình tương lai của công nghệ và sự hợp tác giữa con người với máy tính.

Tổng lượt xem 841Xuất bản vào 2025.01.14Cập nhật vào 2025.01.14

AGENT S là gì

Làm thế nào để Mua S

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Sonic (S) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Sonic (S) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Sonic (S) của BạnSau khi mua Sonic (S), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Sonic (S)Giao dịch Sonic (S) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 1.5kXuất bản vào 2025.01.15Cập nhật vào 2025.03.21

Làm thế nào để Mua S

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của S (S) được trình bày dưới đây.

活动图片