Giá trị thực sự của DeepSeek V4 không nằm ở tham số

marsbitXuất bản vào 2026-04-25Cập nhật gần nhất vào 2026-04-25

Tóm tắt

DeepSeek V4 không chỉ gây ấn tượng bởi quy mô tham số hay độ dài ngữ cảnh lên đến 1 triệu token, mà còn ở khả năng tương thích hiệu quả với phần cứng AI nội địa Trung Quốc như Huawei Ascend 950 và Cambricon. Điều này đánh dấu bước đột phá chiến lược, giúp giảm sự phụ thuộc vào hệ sinh thái GPU và CUDA của NVIDIA. Bằng cách tối ưu kiến trúc MoE, cơ chế chú ý lai (CSA + HCA) và nén KV Cache, DeepSeek V4 giảm đáng kể tài nguyên tính toán và bộ nhớ cần thiết, giúp triển khai trên chip nội địa trở nên khả thi và ổn định. Về giá cả, DeepSeek V4 cung cấp mức giá cạnh tranh cho cả hai phiên bản Pro và Flash, giúp các doanh nghiệp có thể triển khai ứng dụng AI quy mô lớn với chi phí hợp lý, đặc biệt trong các tác vụ như xử lý tài liệu dài, phân tích mã nguồn và tự động hóa quy trình. Thành công của DeepSeek V4 chứng minh khả năng phát triển mô hình AI đẳng cấp thế giới dựa trên nền tảng phần cứng nội địa, mở ra hướng đi bền vững cho ngành trí tuệ nhân tạo Trung Quốc giữa bối cảnh hạn chế công nghệ toàn cầu.

Tác giả | Công xưởng Mô hình Thế giới

DeepSeek V4, một lần nữa làm cả Trung Quốc chấn động.

Quy mô tham số, độ dài ngữ cảnh, điểm số benchmark... những chỉ số kỹ thuật này đã được so sánh nhiều lần trong các báo cáo.

Nhưng nếu chỉ dừng lại ở những con số bề ngoài, bạn sẽ bỏ lõ mấu chốt chiến lược quan trọng nhất của lần ra mắt này.

Ba năm qua, các mô hình lớn của Trung Quốc luôn mắc kẹt trong một thực tế khó xử: huấn luyện dựa vào Nvidia, suy luận cũng dựa vào Nvidia, chip nội địa chỉ là phương án dự phòng.

Chỉ cần Nvidia ngừng cung cấp, toàn bộ giới mô hình Trung Quốc sẽ phải lo lắng.

Nhưng hôm nay, DeepSeek V4 đã chứng minh bằng thực lực:

Một mô hình lớn hàng đầu với tham số nghìn tỷ, cũng có thể chạy ổn định và hiệu quả trên nền tảng tính toán nội địa.

Ý nghĩa của việc này đã vượt xa bản thân các chỉ số kỹ thuật của mô hình.

Đột phá trong việc nội địa hóa

Để thực sự hiểu được khó khăn của việc thích ứng với nền tảng nội địa lần này, trước tiên phải hiểu đế chế chip của Nvidia.

Nvidia sở hữu không chỉ là chip, mà là một hệ sinh thái hoàn chỉnh, khép kín và cao cấp:

Về phần cứng, có họ chip GPU, cùng với NVLink, NVSwitch để thực hiện mạng tốc độ cao kết nối giữa các chip;

Về phần mềm, CUDA là hệ điều hành AI được Nvidia xây dựng cẩn thận trong hơn mười năm.

Nó giống như một nhà máy được tối ưu hóa cao, từ các toán tử cơ bản (đơn vị tính toán cơ bản của mô hình), đến tính toán song song, quản lý bộ nhớ, truyền thông phân tán, toàn bộ chuỗi đều được thiết kế riêng cho GPU của Nvidia.

Nói cách khác, Nvidia không chỉ bán động cơ, mà còn xây dựng cả con đường, trạm xăng, xưởng sửa chữa và hệ thống dẫn đường.

Hầu hết các mô hình lớn hàng đầu toàn cầu đều phát triển trên hệ sinh thái này.

Chuyển sang nền tảng tính toán nội địa, phải đối mặt với một tình huống hoàn toàn khác.

Kiến trúc phần cứng khác, cách thức kết nối khác, độ trưởng thành của ngăn xếp phần mềm khác, hệ sinh thái công cụ vẫn đang nhanh chóng đuổi theo.

Việc DeepSeek muốn thích ứng với chip nội địa, hoàn toàn không đơn giản là thay một động cơ, mà là chuyển một chiếc xe đang chạy tốc độ cao trên đường cao tốc, sang một con đường đồi núi vẫn đang được lát.

Chỉ cần sơ suất nhỏ, sẽ xuất hiện rung lắc, mất tốc độ, thậm chí cả chiếc xe không thể tiến lên.

Lần này, DeepSeek V4 không chọn tiếp tục tối ưu hóa chỉ theo con đường CUDA, mà bắt đầu đồng thời bước vào chuỗi thích ứng ngăn xếp phần mềm của nền tảng tính toán nội địa.

Từ thông tin công khai, V4 đã đạt được đột phá dựa trên chip suy luận nội địa, thích ứng sâu với chip Huawei Ascend 950, chip Cambricon cũng có thể chạy ổn định vào ngày công bố mô hình, thực sự đạt được thích ứng Day 0.

Điều này có nghĩa, các mô hình tiên tiến bắt đầu có khả năng triển khai trong hệ thống chip nội địa.

DeepSeek V4 đã làm được điều đó như thế nào?

Bước đầu tiên, xảy ra ở tầng kiến trúc mô hình.

V4 không chọn để chip nội địa gồng gánh ngữ cảnh 1M, mà trước tiên làm cho bản thân mô hình trở nên tiết kiệm hơn.

Thiết kế then chốt trong báo cáo kỹ thuật chính thức, là cơ chế chú ý hỗn hợp CSA + HCA, và tối ưu hóa ngữ cảnh dài như nén KV Cache.

Nói đơn giản, suy luận ngữ cảnh dài truyền thống, là để mô hình mỗi lần trả lời câu hỏi, đều trải ra cả một thư viện để lật, bộ nhớ, băng thông và năng lực tính toán sẽ nhanh chóng bị chiếm hết.

Cách làm của V4, là trước tiên lập chỉ mục lại, nén và lọc tài liệu trong thư viện, chỉ đưa thông tin quan trọng nhất vào chuỗi tính toán.

Bằng cách này, ngữ cảnh 1M không còn hoàn toàn phụ thuộc vào sức mạnh cứng của phần cứng, mà trước tiên thông qua thuật toán để giảm bớt chi phí tính toán và bộ nhớ.

Điều này rất quan trọng đối với chip nội địa.

Nếu mô hình vẫn phụ thuộc cao vào băng thông bộ nhớ và thư viện CUDA trưởng thành, chip nội địa dù có chạy được, cũng khó chạy rẻ, chạy ổn.

V4 trước tiên giảm tải suy luận, về bản chất là giảm áp cho nền tảng tính toán nội địa.

Bước thứ hai, xảy ra ở kiến trúc MoE và tầng tham số kích hoạt.

V4-Pro dù tổng tham số đạt 1.6 nghìn tỷ, nhưng mỗi lần suy luận chỉ kích hoạt khoảng 49 tỷ tham số; V4-Flash tổng tham số 284 tỷ, mỗi lần kích hoạt khoảng 13 tỷ tham số.

Điều này có nghĩa nó không phải mỗi lần gọi đều kéo toàn bộ tham số ra tính toán, mà giống như một đội ngũ chuyên gia lớn, nhiệm vụ đến chỉ gọi chuyên gia liên quan lên sân.

Đối với chip nội địa, điều này cũng quan trọng.

Nó giảm áp lực tính toán phải chịu mỗi lần suy luận, cũng làm cho các ngữ cảnh dài và kịch bản Agent dễ dàng được card suy luận đảm nhận hơn.

Bước thứ ba, là thích ứng ở tầng toán tử và Kernel.

Điểm mạnh của hệ sinh thái CUDA, là rất nhiều tính toán cơ bản đã được Nvidia mài dũa trưởng thành, nhiều tính toán hiệu suất cao có thể gọi trực tiếp.

Ý nghĩa của V4 nằm ở chỗ, nó rút một phần tính toán then chốt từ hộp đen của Nvidia ra, biến thành con đường tính toán tùy chỉnh có thể di chuyển, thích ứng hơn.

Nói thông tục một chút, V4 giống như tháo rời các bộ phận then chốt nhất trong động cơ, để các nhà sản xuất như Huawei Ascend, Cambricon có thể điều chỉnh lại theo cấu trúc chip của mình.

Bước thứ tư, là khung suy luận và tầng dịch vụ.

Nếu thích ứng chip nội địa chỉ dừng lại ở "chạy Demo", ý nghĩa công nghiệp không lớn. Điều đáng chú ý thực sự, là nó có thể bước vào hệ thống dịch vụ có thể gọi, có thể tính phí hay không.

Theo thử nghiệm nội bộ, trên Ascend 950PR, tốc độ suy luận của V4 so với phiên bản đầu đã đạt được cải thiện đáng kể, mức tiêu thụ năng lượng cũng giảm rõ rệt, hiệu suất đơn chip trong một số kịch bản độ chính xác thấp cụ thể đạt gấp hơn 2 lần so với H20 đặc chế của Nvidia.

DeepSeek chính thức đề cập, hiện tại V4-Pro bị hạn chế bởi năng lực tính toán cao cấp, thông lượng dịch vụ có hạn, dự kiến sau khi siêu nút Ascend 950 ra mắt hàng loạt vào nửa cuối năm, giá sẽ giảm mạnh.

Điều này cho thấy, cùng với việc phần cứng nội địa như Ascend sản xuất hàng loạt, thông lượng và tỷ lệ giá trị trên chi phí của V4 trong tương lai sẽ còn được tối ưu hóa hơn nữa.

Nhưng đáng chú ý, V4 không thay thế toàn diện GPU và CUDA của Nvidia. Huấn luyện mô hình có thể vẫn không thể tách rời Nvidia, nhưng suy luận đã có thể dần dần nội địa hóa.

Đây thực sự là con đường thương mại rất thực tế.

Huấn luyện là chi phí theo giai đoạn, huấn luyện một lần, điều chỉnh một lần, lặp lại một lần. Suy luận là chi phí liên tục, mỗi ngày triệu, tỷ người dùng gọi, mỗi lần đều tốn năng lực tính toán.

Khoản chi thực sự lớn của công ty mô hình, về lâu dài sẽ ngày càng nghiêng về suy luận. Ai có thể đáp ứng nhu cầu suy luận rẻ hơn, ổn định hơn, người đó sẽ có được lợi thế thực sự trong ứng dụng công nghiệp.

DeepSeek V4 lần đầu tiên khiến việc triển khai suy luận của mô hình tiên tiến Trung Quốc, xuất hiện một con đường không lấy CUDA của Nvidia làm tiền đề mặc định.

Bước này đã đủ có trọng lượng.

Tác động của V4 đối với ứng dụng công nghiệp

Nếu như thích ứng chip nội địa trả lời câu hỏi có chạy được hay không, thì giá cả trả lời một câu hỏi thực tế hơn:

Doanh nghiệp có dùng nổi không?

Điểm mạnh nhất của DeepSeek trong quá khứ, chính là nó có thể đè khả năng tiếp cận mô hình tiên tiến xuống mức giá cực thấp.

Thời V3, R1 là vậy, V4 vẫn vậy.

Khác biệt là, lần này nó không đánh chiến tranh giá cả trong cửa sổ ngữ cảnh thông thường, mà tiếp tục ép giá trong điều kiện tiên quyết là ngữ cảnh 1M + khả năng Agent.

Theo giá chính thức của DeepSeek:

Đầu vào trúng cache của V4-Flash là 0.2 nhân dân tệ / triệu tokens, đầu vào không trúng cache là 1 nhân dân tệ / triệu tokens, đầu ra là 2 nhân dân tệ / triệu tokens;

Đầu vào trúng cache của V4-Pro là 1 nhân dân tệ / triệu tokens, đầu vào không trúng cache là 12 nhân dân tệ / triệu tokens, đầu ra là 24 nhân dân tệ / triệu tokens.

Đặt nó vào các mô hình nội địa cùng loại để xem:

So với Alibaba Qwen3.6-Plus ở mức 256K-1M, giá đầu ra của V4-Pro khoảng bằng một nửa của nó, V4-Flash còn thấp hơn.

So với Xiaomi MiMo Pro Series ở mức 256K-1M, cả V4-Flash và V4-Pro đều rẻ hơn rõ rệt.

Ngữ cảnh của Kimi K2.6 là 256K, so với đó, ngữ cảnh của V4-Pro dài hơn, giá rẻ hơn; V4-Flash thì trực tiếp ép chi phí gọi tần suất cao xuống một cấp độ khác.

Điều này có ý nghĩa cực lớn đối với ứng dụng doanh nghiệp.

Bởi vì ngữ cảnh 1M, có nghĩa là mô hình có thể một lần đọc hết kho mã, gói hợp đồng dày, bản cáo bạch hàng trăm trang, biên bản họp dài hạn, hoặc trạng thái lịch sử tích lũy khi một Agent thực hiện nhiệm vụ liên tục.

Trước đây nhiều ứng dụng doanh nghiệp mắc kẹt ở đây, khả năng mô hình đủ, nhưng ngữ cảnh không đủ; ngữ cảnh đủ, giá lại quá đắt; giá có thể chấp nhận, khả năng mô hình lại không đủ ổn.

Ví dụ, một doanh nghiệp làm Agent nghiên cứu đầu tư, để mô hình đồng thời đọc báo cáo năm, báo cáo tài chính, cuộc gọi họp báo cáo tài chính, báo cáo ngành, tin tức đối thủ cạnh tranh và biên bản nội bộ.

Khi ngữ cảnh chỉ có 128K hoặc 256K, hệ thống thường phải liên tục cắt lát, truy xuất, tóm tắt, thông tin bị mất trong nhiều lần nén.

Ngữ cảnh 1M có thể để mô hình giữ lại nhiều tài liệu gốc hơn, giảm bỏ sót và đứt đoạn.

Lại ví dụ Agent mã.

Nó không phải viết vài dòng mã một lần, mà là đọc kho, hiểu phụ thuộc, sửa file, chạy test, sửa chữa lại theo báo lỗi. Quá trình này sẽ tiêu tốn tokens nhiều lần.

Nếu mỗi bước đều đắt, Agent chỉ có thể làm demo, nhưng nếu tokens đủ rẻ, nó mới có thể bước vào quy trình nghiên cứu phát triển thực tế.

Đây cũng là giá trị công nghiệp của V4.

Nó chưa chắc là mô hình mạnh nhất, nhưng có thể trở thành mô hình được sử dụng tần suất cao nhất của doanh nghiệp.

DeepSeek một lần nữa biến AI từ đồ chơi độc quyền của một số ít đại gia, thành công cụ sản xuất có thể triển khai quy mô hóa cho hàng ngàn ngành hàng.

Giá trị thực sự của V4

Khi ngữ cảnh 1M với giá cực thấp tiến vào tuyến đầu công nghiệp, giá trị thực sự của DeepSeek V4 mới lộ rõ.

Tất cả những điều này, được xây dựng trên nền tảng năng lực tính toán nội địa chưa trưởng thành.

Đối mặt với khoảng cách hệ thống của hệ sinh thái chip nội địa, đội ngũ DeepSeek không chọn đợi hệ sinh thái trưởng thành rồi mới lên sóng.

Họ liên tục trì hoãn cửa sổ ra mắt, đầu tư hàng tháng trời, triển khai điều chỉnh liên hợp sâu với các đối tác như Huawei, độ khó kỹ thuật như vậy, vượt xa tưởng tượng của bên ngoài.

Chính vì vậy, việc V4 đạt được năng lực suy luận và Agent gần với mô hình đóng hàng đầu trên nền tảng tính toán nội địa, càng trở nên khó khăn hơn.

V4 dùng chính mình chứng minh, dù đối mặt với khoảng cách giai đoạn của hệ sinh thái phần cứng, đội ngũ Trung Quốc vẫn có thể thông qua đầu tư kỹ thuật cực điểm và sáng tạo phối hợp phần cứng phần mềm, chạy ra hiệu suất cạnh tranh.

Tất nhiên, khoảng cách với việc hoàn toàn trưởng thành vẫn còn.

Độ hoàn thiện của chuỗi công cụ nền tảng Ascend, độ ổn định của cụm siêu quy mô lớn, và tối ưu hóa sâu cho nhiều kịch bản dọc hơn, đều cần các bên công nghiệp tiếp tục nỗ lực chung.

Nhưng thành công của V4, đã lát một con đường có thể tham khảo cho các mô hình tiếp theo.

Nó đã bơm một mũi tiêm tăng lực cho việc tự chủ tự kiểm soát của toàn bộ chuỗi cung ứng AI.

Trong bối cảnh môi trường bên ngoài đầy bất định, sự dẻo dai có thể đột phá trong hạn chế này, đáng được tôn trọng hơn các chỉ số tham số đơn thuần.

"Không bị dụ bởi danh tiếng, không sợ bị phỉ báng, đi theo đạo, ngay ngắn sửa mình".

Câu văn này từ phía chính thức DeepSeek, chính là chú thích tốt nhất cho nó.

Câu hỏi Liên quan

QGiá trị thực sự của DeepSeek V4 không nằm ở đâu?

AGiá trị thực sự của DeepSeek V4 không nằm ở quy mô tham số hay các chỉ số kỹ thuật, mà ở khả năng chạy ổn định và hiệu quả trên nền tảng điện toán nội địa Trung Quốc, chứng minh rằng mô hình tiên tiến hàng đầu có thể hoạt động mà không phụ thuộc hoàn toàn vào phần cứng của NVIDIA.

QDeepSeek V4 đã thích ứng với chip nội địa như thế nào?

ADeepSeek V4 đã thực hiện bốn bước chính: tối ưu hóa kiến trúc mô hình để giảm tải suy luận, sử dụng cơ chế MoE để giảm áp lực tính toán, điều chỉnh các toán tử và kernel để phù hợp với phần cứng nội địa, và tích hợp vào khung suy luận và dịch vụ có thể triển khai thực tế.

QDeepSeek V4 có ý nghĩa thế nào đối với ứng dụng doanh nghiệp?

ADeepSeek V4 mang lại khả năng xử lý ngữ cảnh dài 1M với mức giá cực thấp, cho phép doanh nghiệp triển khai các tác nhân AI (Agent) để xử lý tài liệu dài, mã nguồn phức tạp và dữ liệu nghiên cứu mà không tốn kém nhiều chi phí, biến AI thành công cụ sản xuất có thể mở rộng cho nhiều ngành.

QHiệu suất của DeepSeek V4 trên chip nội địa ra sao?

ATheo thử nghiệm nội bộ, DeepSeek V4 đạt tốc độ suy luận được cải thiện đáng kể và tiêu thụ năng lượng giảm trên chip Ascend 950 của Huawei, với hiệu suất đơn chip trong một số tình huống nhất định gấp hơn 2 lần so với NVIDIA H20.

QTại sao việc thích ứng DeepSeek V4 với phần cứng nội địa lại quan trọng?

AViệc thích ứng thành công DeepSeek V4 với phần cứng nội địa cho thấy Trung Quốc có thể giảm sự phụ thuộc vào NVIDIA, đảm bảo an ninh chuỗi cung ứng AI và mở đường cho việc triển khai các mô hình tiên tiến trong môi trường hạn chế về phần cứng, từ đó thúc đẩy khả năng tự chủ công nghệ.

Nội dung Liên quan

Đứng sau GPU và lưu trữ: MLCC đang trở thành cơn sốt nghìn tỷ tiếp theo trong điện toán AI

**MLCC: Yếu tố chi phí AI tiếp theo tỷ đô, sau GPU và bộ nhớ** Thị trường MLCC (tụ điện nhiều lớp) đang bước vào một chu kỳ tăng trưởng siêu cấp do sức kéo cấu trúc từ AI và xe điện. Giá cả, đặc biệt cho các mẫu cao cấp dùng cho máy chủ AI, đã tăng mạnh (từ 10% đến 275%) từ tháng 7 do cung không đáp ứng cầu. **Nhu cầu bùng nổ từ AI:** Lượng MLCC trong một máy chủ AI (ví dụ: GB300 NVL72) có thể lên tới 440.000 chiếc, cao hơn hàng trăm lần so với máy chủ thông thường (2.000 chiếc). Nguyên nhân là do GPU công suất cao cần ổn định điện áp cực nhanh, dẫn đến nhu cầu MLCC nhỏ gọn, dung lượng cao tăng theo cấp số nhân. Giá trị MLCC trên mỗi khung máy chủ cũng tăng mạnh, trở thành khoản chi phí lớn thứ ba sau GPU và bộ nhớ. **Nguồn cung hạn chế:** Việc mở rộng sản xuất MLCC cao cấp gặp nhiều rào cản: công nghệ, thiết bị và công thức vật liệu độc quyền (do các công ty Nhật Bản như Murata nắm giữ), chu kỳ chứng nhận khách hàng dài (12-18 tháng cho AI), đầu tư vốn lớn và ký ức về chu kỳ dư thừa trước đây. Tăng trưởng công suất toàn ngành chỉ khoảng 10%/năm, trong khi nhu cầu MLCC cho AI dự kiến tăng 34%/năm. **Ba công ty dẫn đầu thị trường:** 1. **Murata (Nhật Bản):** Gã khổng lồ tuyệt đối, thị phần ~40%, lợi nhuận ổn định, là lựa chọn an toàn. 2. **Samsung Electro-Mechanics (Hàn Quốc):** Có đòn bẩy tăng trưởng cao nhất với kế hoạch đầu tư mở rộng mạnh mẽ và lợi nhuận tăng nhanh. 3. **Taiyo Yuden (Nhật Bản):** Có "độ tinh khiết" MLCC cao nhất (70,9% doanh thu), là công cụ đầu cơ thuần túy nhất vào chủ đề này, với triển vọng phục hồi lợi nhuận rõ ràng. Chu kỳ siêu cấp này, được dự báo kéo dài đến năm 2030, được thúc đẩy bởi khoảng cách cung-cầu ngày càng lớn và đòn bẩy hoạt động mạnh mẽ (giá tăng nhỏ dẫn đến lợi nhuận tăng lớn). Tuy nhiên, rủi ro bao gồm: cắt giảm chi tiêu AI, định giá cao, khả năng mở rộng sản xuất từ Trung Quốc và biến động tỷ giá.

marsbit25 phút trước

Đứng sau GPU và lưu trữ: MLCC đang trở thành cơn sốt nghìn tỷ tiếp theo trong điện toán AI

marsbit25 phút trước

Vừa mới, Claude Mythos 5 ra mắt, xử lý 50 triệu dòng code trong 1 ngày

Anthropic đã chính thức công bố Claude Fable 5 và Claude Mythos 5, hai phiên bản mạnh mẽ nhất từ trước đến nay của họ. Fable 5 là phiên bản có "lưới bảo vệ", tự động chuyển sang Claude Opus 4.8 khi phát hiện câu hỏi rủi ro (như viết phần mềm độc hại), và được mở cho tất cả người dùng. Mythos 5 là phiên bản đầy đủ năng lực, tập trung vào an ninh mạng và nghiên cứu sinh học, nhưng chỉ dành cho một số ít người dùng được tin cậy. Về hiệu suất, Fable 5 thể hiện sự vượt trội trong nhiều lĩnh vực: * **Kỹ thuật phần mềm:** Đạt điểm cao trong các bài kiểm tra SWE-bench Pro và Frontier Code. Đáng chú ý, nó hoàn thành việc di chuyển kho code Ruby 50 triệu dòng chỉ trong 1 ngày. * **Thị giác máy tính:** Có thể tự chơi và hoàn thành game "Pokémon" chỉ dựa trên ảnh chụp màn hình mà không cần công cụ hỗ trợ. * **Bộ nhớ dài hạn & Ngữ cảnh dài:** Khả năng duy trì tập trung và sử dụng ghi chú trong các nhiệm vụ kéo dài được cải thiện, nâng cao hiệu quả hoạt động tự chủ (Agent). * **Tài chính & Phân tích:** Là mô hình đầu tiên đạt trên 90% trong một bài benchmark phân tích phức tạp, cho thấy khả năng suy luận ở cấp độ chuyên gia. * **Nghiên cứu khoa học:** Mythos 5 có thể tự động hóa toàn bộ quy trình nghiên cứu sinh học. 9 trong số 14 hợp chất do nó thiết kế đã được đưa vào quy trình phát triển thuốc thực tế. Một điểm đáng chú ý là cơ chế an toàn mới: thay vì từ chối trả lời, Fable 5 sẽ chuyển hướng câu hỏi nhạy cảm sang Opus 4.8. Tuy nhiên, cơ chế này đôi khi có thể "bắt nhầm" các yêu cầu hợp pháp. Anthropic cũng áp dụng chính sách lưu giữ dữ liệu 30 ngày cho lưu lượng truy cập của các mô hình cấp Mythos. Giá API cho cả hai mô hình là 10 USD/token đầu vào và 50 USD/token đầu ra (tính theo triệu). Giáo sư Ethan Mollick, người dùng thử nghiệm, nhận xét rằng với Fable 5, con người giống như "khách hàng" (patron) đưa ra yêu cầu tổng thể, trong khi AI tự động phân chia công việc và hoàn thành mà ít cần can thiệp, đánh dấu sự thay đổi lớn trong hình thức hợp tác giữa người và máy.

marsbit1 giờ trước

Vừa mới, Claude Mythos 5 ra mắt, xử lý 50 triệu dòng code trong 1 ngày

marsbit1 giờ trước

Người đầu tiên mang AI OS đến 1.4 tỷ người, hóa ra là WeChat?

WeChat AI đã chính thức hành động. Vào ngày diễn ra WWDC của Apple, WeChat đã công bố hướng dẫn cho nhà phát triển về việc kết nối với hệ sinh thái AI của mình, một bước đi có thể quan trọng hơn cả thông báo của Apple. Từ nay, nhà phát triển mini app có thể ủy quyền để WeChat AI đọc, thao tác và gọi các chức năng của mini app. WeChat cung cấp hai phương thức tích hợp: "Chế độ tự động" không yêu cầu viết code, nền tảng sẽ tự phân tích mã nguồn và trang để AI có thể vận hành trực tiếp; và "Chế độ phát triển" cho phép tùy chỉnh Skill. Điều này biến toàn bộ hệ sinh thái WeChat – hàng triệu mini app, WeChat Pay, thông báo dịch vụ – thành lớp thực thi cho AI. Thiết kế kỹ thuật dựa trên tiêu chuẩn MCP, ưu tiên thông tin phản hồi từ giao diện, cho thấy WeChat đã có kinh nghiệm thực tế sâu rộng. Lợi thế then chốt nằm ở kiến trúc tập trung: mọi mã code mini app đều chạy trong hệ thống của WeChat, cho phép nền tảng này có "góc nhìn toàn diện" để tự động hóa việc điều phối AI mà Apple hay Google khó có được. WeChat cũng đang hợp tác với các hãng điện thoại để trở thành bộ kết nối siêu cấp trong kỷ nguyên AI. Viễn cảnh người dùng ra lệnh bằng ngôn ngữ tự nhiên (ví dụ: "đặt vé tàu") và AI hoàn thành mọi tác vụ thông qua mini app ngay trong chat đang trở nên khả thi. Điều này biến WeChat thành một hệ điều hành (OS) thực thụ được vận hành bằng ngôn ngữ tự nhiên. Dù vẫn còn thách thức về độ tin cậy, đặc biệt trong các giao dịch, WeChat có lợi thế lớn nhờ kế thừa sẵn mạng lưới dịch vụ khổng lồ với 1,432 tỷ người dùng. Sự thay đổi có thể diễn ra âm thầm: người dùng chỉ cần đưa ra yêu cầu và mọi việc được hoàn tất mà không cần biết quy trình phía sau. WeChat có vẻ đang tiến gần hơn ai hết tới mốc này.

marsbit1 giờ trước

Người đầu tiên mang AI OS đến 1.4 tỷ người, hóa ra là WeChat?

marsbit1 giờ trước

Apple với vốn hóa 4 nghìn tỷ USD, tại sao không thể tạo ra một Siri thông minh?

Tác giả: Hồ Thế Hân, Biên tập: Diệp Cẩm Ngôn Vào ngày 9 tháng 6, Tim Cook chủ trì WWDC lần cuối cùng với tư cách là CEO của Apple. Bài phát biểu kéo dài 78 phút chủ yếu tập trung vào AI, với cốt lõi là giới thiệu Apple Intelligence và Siri được làm lại, có tên Siri AI. Apple Intelligence được xây dựng dựa trên hợp tác với Google, sử dụng công nghệ từ mô hình Gemini để tạo nền tảng mô hình cơ bản của riêng Apple. Mô hình này hoạt động kết hợp trên thiết bị và máy chủ đám mây riêng tư, nhấn mạnh vào tính năng bảo mật và riêng tư. Siri AI giờ đây là một ứng dụng độc lập, có thể hiểu nội dung màn hình, đồng bộ hóa lịch sử qua iCloud và quan trọng nhất là có khả năng gọi các hành động ứng dụng (App Actions) để thực hiện các tác vụ phức tạp xuyên suốt nhiều ứng dụng gốc như Safari, Ảnh, Mật khẩu. Tuy nhiên, các chức năng AI tiên tiến này hiện không khả dụng tại EU và Trung Quốc đại lục do các yêu cầu quy định. Phản ứng từ thị trường và giới phân tích khá thận trọng. Nhiều người nhận xét rằng những khả năng được trình diễn chủ yếu là bắt kịp xu hướng AI hiện có hơn là tạo ra đột phá. Cổ phiếu Apple đã giảm sau sự kiện. Bài viết điểm lại "món nợ AI" của Apple dưới thời Cook, bắt nguồn từ việc Siri bị tụt hậu sau nhiều năm, các dự án như ô tô "Titan" bị hủy bỏ và Vision Pro có mức độ phổ biến hạn chế. Áp lực từ ChatGPT đã buộc Apple phải tái cấu trúc đội ngũ AI và đẩy nhanh hợp tác với Google. Mục tiêu cốt lõi của Apple không nhất thiết là tạo ra mô hình mạnh nhất, mà là bảo vệ vị thế "cổng vào AI đầu tiên" trên iPhone. Bằng cách kiểm soát ngữ cảnh cá nhân và quyền truy cập hệ thống sâu thông qua Siri AI, Apple hy vọng ngăn người dùng chuyển sang các trợ lý AI của bên thứ ba như ChatGPT làm mặc định. Chiến lược này cũng có thể mở ra cơ hội kinh doanh mới thông qua các gói đăng ký dịch vụ. Dù vậy, vẫn còn những lo ngại về việc liệu AI có thực sự thúc đẩy làn sóng nâng cấp thiết bị mới và tăng trưởng doanh thu dịch vụ cho Apple hay không, đặc biệt khi một số dự án phần cứng hỗ trợ AI (như AirPods có camera) được cho là đang gặp trở ngại. Kết luận, thách thức lớn nhất của Apple là biến Siri - vốn đã có sẵn vị trí cổng vào - trở nên đủ thông minh để tận dụng cơ hội trong kỷ nguyên AI, một nhiệm vụ mà họ đã chậm chân trong nhiều năm.

marsbit1 giờ trước

Apple với vốn hóa 4 nghìn tỷ USD, tại sao không thể tạo ra một Siri thông minh?

marsbit1 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片