DeepSeek Hạ Giá Vĩnh Viễn, Nhưng Lương Văn Phong Không Muốn Làm "Bồ Tát Công Nghệ"

marsbitXuất bản vào 2026-05-24Cập nhật gần nhất vào 2026-05-24

Tóm tắt

DeepSeek vừa công bố áp dụng mức giảm giá 75% vĩnh viễn cho API V4-Pro, với giá đầu vào cơ bản giảm từ 1,74 USD xuống 0,435 USD cho mỗi triệu token, trong khi toàn ngành AI đang có xu hướng tăng giá. Động thái này củng cố biệt danh “Pinduoduo của AI” của họ. Giữa lúc các gã khổng lồ như OpenAI, Anthropic và Google âm thầm tăng phí, DeepSeek đi ngược lại bằng chiến lược định giá thấp bền vững. Bài viết phân tích rằng đây không đơn thuần là hành động “từ thiện” của CEO Lương Văn Phong, mà là một lựa chọn chiến lược dựa trên lợi thế cạnh tranh hệ thống của Trung Quốc. Các lợi thế này bao gồm nguồn nhân lực AI với chi phí hợp lý hơn, đặc biệt là nền tảng năng lượng với giá điện công nghiệp thấp (chỉ bằng 1/5 đến 1/4 so với Mỹ và châu Âu), chiếm tới 60-70% chi phí vận hành mô hình AI. Việc DeepSeek lên kế hoạch xây dựng trung tâm dữ liệu ở khu vực phía Tây như Nội Mông càng tối ưu hóa lợi thế này. Trong khi các mô hình đóng (closed-source) thống trị về mặt hiệu năng đỉnh cao, DeepSeek nhắm đến thị trường đại chúng rộng lớn hơn với nhu cầu “đủ dùng, ổn định và cực rẻ”. Khi AI ngày càng đắt đỏ, thì mô hình “vừa phải nhưng cực kỳ tiết kiệm chi phí” của DeepSeek càng trở nên hấp dẫn, cho phép doanh nghiệp thử nghiệm và triển khai nhiều hơn với cùng một ngân sách. Chiến lược mã nguồn mở và giá cả thấp của họ không chỉ là một mô hình kinh doanh khả thi, mà còn đặt ra một cuộc cạnh tranh định giá token toàn cầu, đặc biệt trong bối cảnh cạnh tranh công nghệ giữa các quốc gia.

Văn | Kênh La Siêu

DeepSeek thông báo sẽ "vĩnh viễn hóa" mức giảm giá 75% cho API V4-Pro, có hiệu lực đồng bộ trên toàn cầu.

Hệ thống giá cuối cùng: Giá đầu vào cơ bản giảm từ 1,74 USD / triệu Token xuống 0,435 USD / triệu Token, giá đầu ra giảm từ 3,48 USD / triệu Token xuống 0,87 USD / triệu Token. Đối với việc đánh trúng bộ nhớ cache đầu vào cho toàn bộ sản phẩm API, DeepSeek áp dụng mức ưu đãi lớn hơn: 0,003625 USD / triệu Token, tất cả đều là mô hình định giá sàn kiểu Pinduoduo.

Các phương tiện truyền thông xã hội như X ngay lập tức xuất hiện một làn sóng tiếng gọi: Lương Văn Phong chính là Bồ Tát Công Nghệ trong giới AI, Thần Phong, Thánh Lương. Cảm xúc không chỉ đến từ việc rẻ mạt - DeepSeek vốn đã được gọi là Pinduoduo của AI, miễn phí cho người dùng C, giá rẻ cho doanh nghiệp B, cả thế giới đã quen với giá rẻ của nó, nhưng khó khăn của đợt giảm giá này nằm ở chỗ: AI trên toàn thế giới đang tăng giá.

Có báo cáo cho biết, trong vòng tài trợ Series A kỷ lục mà DeepSeek đang thúc đẩy, Lương Văn Phong cá nhân sẽ đầu tư tối đa 20 tỷ nhân dân tệ, chiếm 40% tổng số tiền tài trợ. Hầu hết các công ty khi gọi vốn việc đầu tiên là củng cố dòng tiền, làm cho hiệu suất kinh doanh trông đẹp hơn, nhưng Lương Văn Phong không có ý định dùng chiếc bánh thương mại hóa để thu hút nhà đầu tư, mà kiên trì mô hình nguồn mở, theo đuổi AGI, đợt giảm giá này thực sự là nói được làm được. Lần cuối cùng dũng cảm bày tỏ không muốn kiếm tiền như vậy là Pinduoduo, năm 24, đồng sáng lập của họ đã nói rõ trong cuộc gọi hội nghị với các nhà đầu tư: "Từ Q3, lợi nhuận của chúng tôi sẽ dần giảm xuống, trong ngắn hạn sẽ không phục hồi. Về lâu dài, sự sụt giảm khả năng sinh lời là không thể tránh khỏi." Giá cổ phiếu lao dốc.

Sam Altman miệng nói dân chủ hóa AI, nhưng công ty OpenAI đang lao nhanh về phía ngược lại với tên gọi của nó: CloseAI. Lương Văn Phong lại bằng hành động thực tế để mọi người, mọi doanh nghiệp đều có thể sử dụng AI một cách phổ cập và ưu đãi nhất có thể. Nhưng Lương Văn Phong có thực sự là Bồ Tát sống không? Không phải. Ông ấy là một doanh nhân, nguồn mở phổ cập chỉ là lựa chọn mô hình kinh doanh, điều này trong hiện tại là đáng quý, trong tương lai sẽ ngày càng khan hiếm.

Bởi vì: AI đang trở nên ngày càng đắt đỏ.

Tuần này, Microsoft đã hủy bỏ giấy phép Claude Code nội bộ, vì cách tính phí dựa trên token cao đến mức không chịu nổi. Microsoft từng hỗ trợ tài chính hậu hĩnh cho OpenAI, còn cung cấp dịch vụ đám mây Azure cho A, sở hữu tài nguyên điện toán đám mây khiến mọi doanh nghiệp phải thèm muốn, nhưng chi phí Token vẫn làm họ đau lòng. Không chỉ vậy, CTO của Uber vào tháng 4 năm nay đã báo cáo với ban lãnh đạo một tình huống khó xử: ngân sách AI mà công ty chuẩn bị cho cả năm 2026 đã bị tiêu hết trong vòng bốn tháng, trong đó 95% kỹ sư mỗi tháng đều sử dụng công cụ lập trình AI, 70% mã được gửi lên do AI tạo ra, nguyên văn là: "Tôi phải quay lại bàn vẽ vì ngân sách tôi nghĩ mình cần đã bay mất rồi.".

Ngân sách Token của các đại công ty đốt nhanh hơn nhiều so với dự kiến, đương nhiên có nguyên nhân nhân viên công ty "xem đậu phộng không phải lương thực" tha hồ đốt Token, nhưng AI đang trở nên đắt đỏ mới là nguồn gốc của sự căng thẳng ngân sách Token. Giá phần mềm AI tại Mỹ trong năm qua đã tăng từ 20% đến 37%. Bộ ba Anthropic, OpenAI và Google trong sáu tháng qua đều lặng lẽ tăng giá thực tế cho cùng một đầu ra AI.

(Nguồn ảnh: X)

Trước đây, quan điểm phổ biến là "AI càng được ứng dụng quy mô lớn, mức độ công nghiệp hóa càng cao, chi phí càng thấp, doanh nghiệp càng sướng", hóa ra ngây thơ.

Và xu hướng này sẽ không đảo ngược. Giá cả do quan hệ cung cầu chứ không phải chi phí quyết định, nhưng quan hệ cung cầu của AI năm 26 đã hoàn toàn đảo ngược. Trước đây các đại công ty năn nỉ mọi người dùng AI, cần giáo dục thị trường, quảng bá công nghệ, AI luôn được trợ giá, bạn đã uống bao nhiêu ly trà sữa của Văn Thiên Vấn rồi? Bây giờ thì sao? Mọi người ngày càng chủ động sử dụng, "hút điếu đầu tiên là không rời được", lập trình AI, tài liệu AI, AIGC thậm chí tìm kiếm AI, đều ngày càng phổ biến, thời đại trợ giá AI đã hoàn toàn kết thúc.

Càng nhiều người dùng, nhu cầu càng lớn, tài nguyên token càng căng thẳng, vì vậy sự thiếu hụt sức mạnh tính toán đã lan từ GPU sang CPU, lưu trữ thậm chí băng thông, Intel, Micron, SK Hynix, Samsung Electronics, SanDisk và các công ty Giang Ba Long, hai "Trường" trong nước ăn theo Nvidia. Doanh thu tăng gấp bội năm 26 của các ông lớn bán dẫn đến từ đâu? Căn bản không bao giờ là vòng đầu tư khép kín tam giác OpenAI-Oracle-Microsoft nhé? Sự đau lòng của các doanh nghiệp mới chỉ bắt đầu? Mà các sản phẩm AI như ChatGPT, Claude, Gemini, Đậu Bao nhấn mạnh sự "phân cấp nghiêm ngặt" giữa miễn phí và trả phí, cũng sẽ khiến người dùng cá nhân ngày càng phân vân.

Điều này giống như xe gọi: thời điên cuồng bạn có thể ngồi xe chuyên dụng đi làm miễn phí, vốn đầu tư trả tiền cho bạn. Sau khi thói quen người dùng được thiết lập, trợ giá kết thúc, giá cả trở về mức bình thường, ai đi tàu điện ngầm vẫn phải đi. AI cũng vậy. Vì vậy trong bối cảnh lớn của ngành Token đang tăng giá, DeepSeek kiên trì cắt giảm giá xuống, hành động này không còn chỉ là sự dũng cảm cá nhân của "Bồ Tát Công nghệ", mà thể hiện một loại quyền định giá ngược lại: Tôi có thể rẻ như vậy, vẫn vận hành bình thường, chất lượng vẫn không giảm.

Chỉ cần Lương Văn Phong muốn, DeepSeek hoàn toàn không cần phải rẻ đến mức này. Vì vậy mọi người bắt đầu lo lắng: Liệu DeepSeek có trở thành Linux của thời đại AI không? Ảnh hưởng to lớn, nhưng kiếm không ra tiền lớn. Linux đóng góp cho ngành công nghiệp IT lớn hơn nhiều so với Windows, hay Android (bản thân Android dựa trên nhân Linux), nhưng nó là mã nguồn mở, về mặt thương mại không sinh ra những gã khổng lồ như Microsoft, Google. DeepSeek hiện tại ảnh hưởng to lớn, khả năng thương mại kém xa bộ ba Silicon Valley, thậm chí không thể cạnh tranh với ba công ty Kimi, MiniMax, ZhiPu trong nước. Thứ tự doanh thu 4 tiểu long năm 25: ZhiPu (doanh thu 2025 7,24 tỷ nhân dân tệ) > MiniMax (doanh thu 2025 khoảng 5,6 tỷ nhân dân tệ) > Moonshot AI (khoảng 2 tỷ nhân dân tệ) > DeepSeek (không rõ nhưng thấp hơn).

Lương Văn Phong làm AI lượng tử hóa kiếm tiền, cá nhân có thể bỏ ra 20 tỷ đầu tư DeepSeek, nhưng câu chuyện "phát điện bằng tình yêu" không thể kéo dài.

Còn với mô hình nguồn mở, người khác cũng có thể chưng cất, triển khai, đào tạo lại lần hai, hào rào công nghệ của DeepSeek sẽ ngày càng mỏng đi. Vì vậy bạn luôn thấy những tin tức "đứng đầu bảng xếp hạng" như thế này: ZhiPu GLM-5.1 sau khi mở mã nguồn đã làm mới thành tích toàn cầu trong bài kiểm tra chuẩn SWE-bench Pro, MiMo-V2.5-Pro của Xiaomi đứng đầu bảng xếp hạng mô hình lớn nguồn mở toàn cầu... Báo cáo chung của Viện Công nghệ Massachusetts và Hugging Face cho thấy, trong năm qua, tỷ lệ tải xuống toàn cầu của các mô hình nguồn mở do Trung Quốc phát triển chiếm 17,1%, vượt Mỹ 15,8%, đứng đầu thế giới.

Không trách ngày càng nhiều tiếng nói ở Silicon Valley nói rằng: Nhất định phải có phiên bản DeepSeek của Mỹ, không thể đứng nhìn ngành công nghiệp AI lại diễn ra câu chuyện Shein, Temu hay TikTok. "Nếu Mỹ không có một nhà vô địch nguồn mở trỗi dậy, thế giới sẽ vận hành dưới bàn tay của bất kỳ quốc gia nào có thể sản xuất ra mô hình nguồn mở và phần mềm nguồn mở mạnh nhất, ổn định nhất, rẻ nhất, có thể tùy chỉnh, có thể mở rộng, phù hợp với nhu cầu cá nhân và thương mại." Các chủ đề liên quan đến cạnh tranh giữa các cường quốc thường có phần lớn lao, nhưng cuộc cạnh tranh đằng sau là có thật.

Sự trỗi dậy của DeepSeek, vốn đã có câu chuyện thay thế tự chủ. V4 hỗ trợ Ascend khiến mọi người phấn khởi, dưới sự thúc đẩy của sức mạnh tính toán nội địa, sức cạnh tranh giá cả mà DeepSeek hiện tại thể hiện mới chỉ là món khai vị. Trong báo cáo kỹ thuật, DeepSeek cho biết sau khi siêu nút Ascend 950 hàng loạt ra mắt vào nửa cuối năm, giá V4-Pro sẽ còn giảm mạnh, những ngày tốt đẹp vẫn còn ở phía trước.

Còn có lợi thế nhân tài AI cao cấp, nhân tài AI đều đắt đến mức "xa xỉ", nhưng của Trung Quốc tương đối rẻ, Lôi Quân với mức lương hàng chục triệu nhân dân tệ mời La Phúc Lợi từ DeepSeek đi đã trở thành tin tức, cùng kỳ Mark Zuckerberg lại phải bỏ ra 1 tỷ USD để mời người, bao gồm cả Acqui-hire. Nhưng khoảng cách giữa sản phẩm của người 1 tỷ USD và người lương hàng chục triệu nhân dân tệ tạo ra rõ ràng không lớn gấp 700 lần như vậy, chênh lệch giá nhân tài AI thực tế sẽ chuyển hóa thành chênh lệch hệ thống giá của hệ thống sản xuất Token.

Sức cạnh tranh lớn hơn còn có hệ thống năng lượng, đây là tầng đầu tiên trong chiếc bánh năm tầng AI của Hoàng Nhân Tốn.

Điểm cuối của AI là sức mạnh tính toán, điểm cuối của sức mạnh tính toán là điện lực. Tháng 4 năm 2026, DeepSeek tuyển dụng kỹ sư vận hành bảo trì cao cấp và quản lý giao hàng cao cấp cho trung tâm dữ liệu đặt tại Ulanqab, Nội Mông, điều này cho thấy nó sẽ đi về phía tây xây dựng nhà máy Token, đưa lợi thế chi phí từ tầng phần mềm đè xuống tầng vật lý. Lần trước tôi viết về Ulanqab trong bài báo là khi Kuaishou xây dựng trung tâm dữ liệu ở đây: gần nhà máy điện, khí hậu thích hợp dễ tản nhiệt. Và giá điện xanh phía tây Trung Quốc khoảng 0,2-0,3 nhân dân tệ/kWh, chỉ bằng 1/5 đến 1/4 của Âu Mỹ.

Không chỉ điện xanh phía tây có sức cạnh tranh. Số liệu Cơ quan Năng lượng Quốc tế năm 2025 cho thấy, tổng công suất lắp đặt phát điện của Trung Quốc đã vượt quá 2300 GW, chiếm khoảng 22% toàn cầu, đứng đầu thế giới; Mỹ khoảng 1300 GW. Quan trọng hơn, Trung Quốc sở hữu cấu trúc điện lực hoàn chỉnh nhất toàn cầu: nhiệt điện, thủy điện, phong điện, hạt nhân, quang điện đều đầy đủ. Số liệu cho thấy, giá điện công nghiệp Trung Quốc duy trì lâu dài ở mức 0,06 đến 0,08 USD/kWh, giá điện công nghiệp California Mỹ đã gần 0,18 USD/kWh, một số khu vực của Đức thậm chí vượt quá 0,25 USD/kWh, điều này có nghĩa là cùng huấn luyện một cụm máy tính vạn card, Trung Quốc tự nhiên rẻ hơn Âu Mỹ vài chục phần trăm.

Trong chi phí vận hành mô hình lớn AI, tỷ lệ chi phí điện lực trong tổng chi phí vận hành lên tới 60%-70%, không chỉ chạy mô hình cần điện, mà còn có khoản lớn tản nhiệt, tay xây dựng cơ sở hạ tầng cuồng nhiệt đều trực tiếp xây trung tâm dữ liệu dưới đáy biển rồi, một mặt điện gió ngoài khơi đầu vào gần, một mặt nước biển tuần hoàn tản nhiệt miễn phí. Còn có những dự án lớn như "Điện Tây đưa Đông", "Số Đông tính Tây", khả năng điều phối khu vực điện lực và sức mạnh tính toán đều cực mạnh, Quý Châu, Nội Mông, Ninh Hạ những nơi này vốn là nút cốt lõi của "Số Đông tính Tây", đường thông để trung tâm sức mạnh tính toán AI chuyển về phía tây đã chuẩn bị sẵn từ lâu.

Dùng AI của Trung Quốc, bản chất là dùng AI được huấn luyện bởi hệ thống năng lượng có sức cạnh tranh hơn - AI kinh tế hơn, phổ cập hơn. Đây là một trong những lý do tại sao doanh thu nước ngoài của kimi, minimax... sau Tết Nguyên đán tăng vọt, không chỉ thuật toán mạnh hơn, mà còn mở ngoại hỗ trợ giá điện.

Nvidia có thể định nghĩa giá sức mạnh tính toán cao cấp, nhưng DeepSeek lại đang nắm quyền định giá Token. Bạn có thể nói, AI rẻ không có hàng tốt. AI thực sự là một xu một hàng, DeepSeek V4 cũng chỉ thu hẹp khoảng cách giữa nguồn mở và đóng đến mức nhỏ nhất lịch sử, chính thức thừa nhận khoảng cách khách quan với các mô hình đỉnh cao như GPT, và còn không phải đa phương thức, có thể nhận diện hình ảnh, nhưng không thể tạo ra.

Nhưng điều này không ngăn cản cộng đồng đổ xô về DeepSeek. Nguyên nhân là: hầu hết các tình huống thương mại thực tế không cần mỗi lần đều gọi mô hình mạnh nhất thế giới. Tư vấn, dịch vụ khách hàng, tóm tắt, dịch thuật, bổ sung mã, kho kiến thức doanh nghiệp, quy trình tự động hóa, những thứ này cần không phải trí tuệ cao nhất, mà là "tạm dùng được + đủ rẻ + đủ ổn định". Khi chi phí suy luận của DeepSeek V4 chỉ bằng khoảng 1% (Flash) đến 11% (Pro) của GPT-5.5, một doanh nghiệp với cùng ngân sách có thể gọi nhiều hơn hàng chục lần token, thử nhiều chuỗi prompt hơn, lặp lại nhiều luồng công việc agent hơn, cuối cùng sản phẩm tạo ra ngược lại có cơ hội tốt hơn, xét cho cùng bản thân AI là một trò chơi "xác suất", chỉ cần đủ rẻ, dùng tạm được có thể đạt kết quả có gì không được?

Vì vậy, AI càng đắt, giá rẻ của DeepSeek càng có giá trị, công ty DeepSeek sẽ càng có giá trị, Lương Văn Phong và các nhà đầu tư của ông ấy nghĩ rõ hơn ai hết.

Câu hỏi Liên quan

QDeepSeek đã giảm giá vĩnh viễn API V4-Pro bao nhiêu phần trăm và mức giá mới là gì?

ADeepSeek đã giảm giá vĩnh viễn API V4-Pro 75%. Giá đầu vào cơ bản giảm từ 1,74 USD/triệu token xuống 0,435 USD/triệu token, giá đầu ra giảm từ 3,48 USD/triệu token xuống 0,87 USD/triệu token. Đối với bộ đệm đầu vào cho toàn bộ dòng sản phẩm API, giá còn thấp hơn đáng kể: 0,003625 USD/triệu token.

QTại sao bài báo cho rằng Liang Wenfeng (Lương Văn Phong) không phải là "Bồ Tát Ảo" mà là một doanh nhân?

ABài báo chỉ ra rằng Liang Wenfeng là một doanh nhân. Việc ông theo đuổi mã nguồn mở và định giá thấp cho DeepSeek là một lựa chọn mô hình kinh doanh chiến lược, nhằm tạo ra lợi thế cạnh tranh trong bối cảnh AI ngày càng đắt đỏ, chứ không đơn thuần là hành động từ thiện. Chiến lược này tạo ra giá trị lâu dài cho công ty và các nhà đầu tư.

QXu hướng giá cả của ngành AI toàn cầu hiện nay như thế nào và nguyên nhân chính là gì?

ANgành AI toàn cầu đang có xu hướng tăng giá. Giá phần mềm AI tại Mỹ đã tăng 20-37% trong năm qua. Các công ty lớn như Anthropic, OpenAI và Google đều đã âm thầm tăng giá trong sáu tháng qua. Nguyên nhân chính là sự đảo ngược quan hệ cung-cầu: nhu cầu sử dụng AI tăng mạnh trong khi nguồn cung tài nguyên tính toán (như token, GPU) trở nên khan hiếm, đánh dấu sự kết thúc của thời kỳ được trợ giá AI.

QBài báo đề cập những lợi thế cạnh tranh cốt lõi nào của DeepSeek và Trung Quốc trong cuộc đua AI?

ABài báo đề cập ba lợi thế cạnh tranh cốt lõi: 1. **Hệ thống năng lượng**: Trung Quốc có giá điện công nghiệp thấp (0.06-0.08 USD/kWh), đặc biệt là điện xanh ở phía Tây (0.2-0.3 NDT/độ), chỉ bằng 1/5 đến 1/4 so với Mỹ và châu Âu, giúp giảm đáng kể chi phí vận hành vốn chiếm 60-70% tổng chi phí AI. 2. **Nhân tài AI tương đối rẻ**: Chi phí thuê nhân tài AI cao cấp ở Trung Quốc thấp hơn nhiều so với Mỹ, tạo ra chênh lệch giá hệ thống trong sản xuất token. 3. **Hỗ trợ phần cứng nội địa**: DeepSeek V4 hỗ trợ kiến trúc Ascend (Thăng Đằng) của Huawei, tận dụng lợi thế sức mạnh tính toán trong nước và dự kiến sẽ giảm giá hơn nữa khi siêu nút Ascend 950 ra mắt.

QTại sao DeepSeek có giá rẻ lại trở nên có giá trị hơn khi AI nói chung ngày càng đắt, theo quan điểm của bài báo?

ATheo bài báo, khi AI nói chung càng đắt, thì mức giá thấp của DeepSeek càng trở nên có giá trị vì: 1. **Phù hợp với nhu cầu thực tế**: Nhiều tình huống kinh doanh (tư vấn, dịch vụ khách hàng, tóm tắt, dịch thuật, v.v.) không cần mô hình mạnh nhất, mà cần giải pháp 'đủ dùng + cực kỳ rẻ + ổn định'. 2. **Hiệu quả ngân sách**: Với chi phí suy luận chỉ bằng khoảng 1-11% so với GPT-5.5, cùng một ngân sách, doanh nghiệp có thể sử dụng nhiều token hơn hàng chục lần, thử nghiệm nhiều chuỗi prompt hơn và lặp lại nhiều quy trình công việc agent hơn, từ đó có khả năng tạo ra kết quả tốt hơn thông qua số lượng. 3. **Quyền định giá ngược**: Khả năng duy trì chất lượng với mức giá thấp thể hiện quyền định giá ngược và sức cạnh tranh cốt lõi của DeepSeek, làm tăng giá trị công ty trong dài hạn.

Nội dung Liên quan

Jensen Huang: Vera Rubin Đã Được Sản Xuất Hàng Loạt, AI Agent Là Hướng Đi Trọng Tâm, Thách Thức Intel Và Nhắm Đến Cổng Vào AI PC Thế Hệ Tiếp Theo

Ngày 1/6, CEO NVIDIA Jensen Huang đã có bài phát biểu quan trọng tại GTC Đài Bắc 2026, công bố hàng loạt sản phẩm và định hướng mới. Kiến trúc Vera Rubin đã chính thức được sản xuất hàng loạt, với khách hàng đầu tiên là OpenAI, Anthropic và SpaceX. NVIDIA tập trung mạnh vào phát triển AI Agent, đồng thời giới thiệu CPU Vera dành riêng cho các tác nhân AI. Một điểm nhấn lớn là tham vọng của NVIDIA trong thị trường AI PC thế hệ tiếp theo. Họ sẽ hợp tác với MediaTek phát triển chip RTX SPARK cho máy tính Windows, do TSMC sản xuất, dự kiến ra mắt vào mùa thu năm nay. Động thái này được xem như một thách thức trực tiếp đối với Intel và hướng tới việc cung cấp nền tảng tính toán hoàn chỉnh cho toàn bộ hệ sinh thái Windows. NVIDIA cũng công bố mô hình AI mới Nemotron 3 Ultra và nền tảng DSX - một "hướng dẫn hành động" hoàn chỉnh để xây dựng các nhà máy AI. Trong lĩnh vực ô tô tự hành, nền tảng DRIVE Hyperion đã được nhiều hãng xe Trung Quốc như BYD, Geely, Zeekr, Xiaomi và Pony.ai áp dụng. NVIDIA còn giới thiệu mô hình suy luận mở Alpamayo 2 cho taxi tự lái. Về robot hình người, NVIDIA hợp tác toàn cầu, bao gồm công ty Trung Quốc Unitree, và giới thiệu nền tảng tham chiếu Isaac GR00T cùng bộ công cụ phát triển mã nguồn mở, nhằm xây dựng hệ sinh thái cho kỷ nguyên robot.

marsbit10 phút trước

Jensen Huang: Vera Rubin Đã Được Sản Xuất Hàng Loạt, AI Agent Là Hướng Đi Trọng Tâm, Thách Thức Intel Và Nhắm Đến Cổng Vào AI PC Thế Hệ Tiếp Theo

marsbit10 phút trước

Cuộc Phỏng Vấn Với Bậc Thầy Vĩ Mô Raoul Pal: Điểm Kỳ Dị Kinh Tế Đang Đến Gần, Đừng Dễ Dàng Xuống Xe Trong 4 Năm Tới

Nhà đầu tư vĩ mô Raoul Pal chia sẻ quan điểm về tương lai kinh tế và cơ hội đầu tư trong bối cảnh AI phát triển bùng nổ. Ông nhận định cuộc đua AI giữa các quốc gia và doanh nghiệp là sự kiện vốn hóa lớn nhất lịch sử, dẫn dắt dòng tiền và có thể tiến tới "điểm kỳ dị kinh tế" - khi tốc độ công nghệ vượt quá khả năng vận hành của hệ thống kinh tế truyền thống. Về tiền mã hóa, Pal cho rằng đây vẫn là kênh đầu tư có tỷ suất sinh lời rủi ro tốt nhất về dài hạn. Ông nhấn mạnh tiềm năng vô hạn khi AI Agents (tác nhân AI) gia nhập và sử dụng mạng lưới blockchain, biến các Layer1 như ETH, Solana, Sui thành nền tảng hạ tầng then chốt. Ông xem đây là "cổ phần cơ bản" cho mọi người trong nền kinh tế số tương lai. Pal khuyên nhà đầu tư nên kiên nhẫn nắm giữ dài hạn thay vì cố gắng giao dịch thời điểm, vì lịch sử cho thấy chiến lược "mua và giữ" thường mang lại kết quả vượt trội. Ông lạc quan về triển vọng 2026-2027 với sự gia tăng thanh khoản toàn cầu, sự tham gia của ngân hàng, tiến bộ về mặt pháp lý và vị thế định giá hấp dẫn hiện tại của tài sản mã hóa so với các thị trường truyền thống.

链捕手11 phút trước

Cuộc Phỏng Vấn Với Bậc Thầy Vĩ Mô Raoul Pal: Điểm Kỳ Dị Kinh Tế Đang Đến Gần, Đừng Dễ Dàng Xuống Xe Trong 4 Năm Tới

链捕手11 phút trước

Chạy MoE trên điện thoại? Meta đề xuất MobileMoE, iPhone 16 Pro tăng tốc đến 3.8 lần

Trong những năm gần đây, Mô hình Chuyên gia Hỗn hợp (MoE) đã được sử dụng rộng rãi cho các mô hình lớn trên đám mây. Tuy nhiên, trên điện thoại, Kiến trúc Ngôn ngữ Lớn (LLM) vẫn chủ yếu sử dụng kiến trúc dày đặc. Meta đã đề xuất MobileMoE, lần đầu tiên triển khai suy luận MoE hiệu quả trên điện thoại thông minh thương mại. Kết quả cho thấy, trên 14 bài kiểm tra cơ bản, MobileMoE-S/M đạt độ chính xác trung bình tương đương hoặc cao hơn với chỉ 1/2 đến 1/4 lượng tính toán suy luận so với mô hình dày đặc cơ sở, trong khi sử dụng bộ nhớ tương tự. Trong thử nghiệm thực tế, MobileMoE-S trên iPhone 16 Pro (backend GPU/MLX) tăng tốc độ đáng kể, tăng tốc lên đến 3.8 lần trong giai đoạn đầu vào. MobileMoE là một loại mô hình ngôn ngữ MoE được thiết kế cho triển khai trên thiết bị đầu cuối, thay thế các lớp feed-forward dày đặc bằng các lớp MoE trong kiến trúc Transformer decoder-only. Quy trình đào tạo bao gồm bốn giai đoạn: tiền đào tạo, đào tạo trung gian, tinh chỉnh có giám sát và đào tạo nhận thức lượng tử hóa. Các thí nghiệm cho thấy cấu hình tối ưu sử dụng 8 chuyên gia (E=8), độ hạt chuyên gia 8 (g=8), với một chuyên gia được chia sẻ. MobileMoE thiết lập một biên giới Pareto mới cho LLM trên thiết bị đầu cuối, cân bằng tốt hơn giữa độ chính xác và chi phí suy luận. Sau khi lượng tử hóa INT4, mô hình vẫn duy trì tính cạnh tranh. Khi triển khai trên Samsung Galaxy S25 và iPhone 16 Pro, MobileMoE-S cho thấy tốc độ nhanh hơn đáng kể và mức sử dụng bộ nhớ thấp hơn so với các mô hình so sánh. Hướng phát triển trong tương lai bao gồm củng cố quá trình hậu đào tạo, mở rộng đa phương thức và tối ưu hóa việc triển khai trên NPU di động để tiếp tục cải thiện hiệu quả.

marsbit13 phút trước

Chạy MoE trên điện thoại? Meta đề xuất MobileMoE, iPhone 16 Pro tăng tốc đến 3.8 lần

marsbit13 phút trước

Đà Hồi Phục Yếu Ớt Của Bitcoin Khó Che Giấu Xu Hướng Điều Chỉnh, Tín Hiệu Đỉnh HYPE Cảnh Báo Rủi Ro Ngắn Hạn | Phân Tích Đặc Biệt

**Bitcoin Phục hồi yếu khó che giấu xu hướng điều chỉnh, tín hiệu đỉnh HYPE cảnh báo rủi ro ngắn hạn** **Phân tích cấu trúc Bitcoin (BTC):** - **Khung ngày:** BTC đã phá vỡ đường trung bình của kênh tăng (vàng) hình thành từ tháng 2/2026, cho thấy cấu trúc kỹ thuật suy yếu. Giá hiện trong kênh giảm ngắn hạn (xanh) và đang trong đợt phục hồi yếu hướng lên vùng kháng cự trên của kênh này (75.000-76.000 USD). - **Dự báo:** Đợt phục hồi này có thể chỉ là điều chỉnh kỹ thuật. Nếu không vượt qua được vùng 75.000-76.000 USD, giá có khả năng tiếp tục xu hướng giảm, thử thách vùng hỗ trợ mạnh 69.500-70.500 USD và thậm chí là đường xu hướng dưới của kênh tăng dài hạn. - **Chiến lược:** Ưu tiên chiến lược bán ra ở vùng kháng cự (Kế hoạch A) hoặc theo đà bán nếu giá phá vỡ hỗ trợ (Kế hoạch B), với khối lượng giao dịch dưới 30% và quản lý rủi ro chặt chẽ. **Phân tích cấu trúc HYPE:** - **Khung 4 giờ:** HYPE đã hoàn thành mô hình tăng 7 sóng từ đáy tháng 5. Điểm cuối cùng (47) cho thấy dấu hiệu phân kỳ động lượng tiềm ẩn và tín hiệu cảnh báo đỉnh mạnh từ mô hình giao dịch. - **Dự báo:** Nếu tín hiệu đỉnh tại điểm 47 được xác nhận cùng với phân kỳ, đây có thể là đỉnh ngắn hạn. Cần theo dõi phản ứng giá tại vùng hỗ trợ then chốt 62.5 - 64.75 USD. - **Chiến lược:** Chỉ xem xét mua vào nhẹ nếu giá hồi về vùng hỗ trợ 62.5-64.75 USD và có tín hiệu ổn định kết hợp. Nếu vùng này bị phá vỡ, điều chỉnh có thể mở rộng xuống 54-56.3 USD. **Lưu ý chung:** Thị trường biến động, cần điều chỉnh chiến lược linh hoạt. Mọi phân tích chỉ mang tính tham khảo, không phải lời khuyên đầu tư. Luôn sử dụng lệnh dừng lỗ và quản lý vốn nghiêm ngặt.

marsbit29 phút trước

Đà Hồi Phục Yếu Ớt Của Bitcoin Khó Che Giấu Xu Hướng Điều Chỉnh, Tín Hiệu Đỉnh HYPE Cảnh Báo Rủi Ro Ngắn Hạn | Phân Tích Đặc Biệt

marsbit29 phút trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片