# Bài viết Liên quan Mã nguồn mở

Trung tâm Tin tức HTX cung cấp những bài viết mới nhất và phân tích chuyên sâu về "Mã nguồn mở", bao gồm xu hướng thị trường, cập nhật dự án, phát triển công nghệ và chính sách quản lý trong ngành tiền kỹ thuật số.

Người tạo ra Kling trở lại Alibaba và tạo ra một 'ngựa ô' mới

Người đứng sau mô hình AI video HappyHorse-1.0 của Alibaba, Zhang Di, từng làm việc tại Alibaba và Kuaishou, đã trở lại Alibaba vào tháng 11/2025 và chỉ sau 5 tháng đã cho ra mắt HappyHorse. Mô hình này đã đứng đầu bảng xếp hạng Artificial Analysis trong cả hai hạng mục text-to-video và image-to-video, vượt qua các đối thủ như ByteDance và Kuaishou. HappyHorse có 15 tỷ tham số, sử dụng kiến trúc Transformer đa phương thức, cho phép đồng bộ hóa khẩu hình với nhiều ngôn ngữ và giảm thời gian tạo video xuống còn 38 giây cho video 5 giây. Điều này giúp nó phù hợp cho các ứng dụng thương mại. Alibaba định hướng ứng dụng HappyHorse vào lĩnh vực thương mại điện tử, giúp các nhà bán hàng tạo video quảng cáo sản phẩm nhanh chóng, đa dạng hóa kịch bản và ngôn ngữ, đồng thời tăng hiệu quả chuyển đổi. Với lợi thế dữ liệu giao dịch và hành vi người dùng, Alibaba có thể tối ưu hóa video cho mục đích bán hàng. Tuy nhiên, vẫn có những thách thức về bản quyền và độ trung thực của nội dung AI. Nhưng với một kế hoạch ứng dụng rõ ràng, HappyHorse hứa hẹn mang lại lợi thế cạnh tranh cho Alibaba trong thị trường video AI.

marsbit04/13 05:14

Người tạo ra Kling trở lại Alibaba và tạo ra một 'ngựa ô' mới

marsbit04/13 05:14

54 tỷ đốt không cháy, Sora chết: Mô hình Trung Quốc ẩn danh dùng 38 giây đá cánh cửa tiếp theo

Vào cuối tháng 3/2026, OpenAI tuyên bố đóng cửa hoàn toàn Sora - công cụ tạo video bằng AI từng được kỳ vọng cao, do chi phí vận hành quá lớn (54 tỷ USD/năm) và tỷ lệ video khả dụng thấp (5-10%). Ngay sau đó, một mô hình ẩn danh có tên HappyHorse-1.0 của Trung Quốc đã đứng đầu bảng xếp hạng AI video uy tín Artificial Analysis với 1357 điểm ở hạng mục video thuần (không âm thanh), vượt qua các đối thủ lớn như Seedance 2.0 của ByteDance. HappyHorse-1.0 sử dụng kiến trúc Transformer thống nhất 15B tham số, tạo video 1080p chỉ trong 38,4 giây trên một card đồ họa H100. Dù bị chỉ trích là "mã nguồn mở ảo" ban đầu, nó nhanh chóng được xác nhận là mã nguồn mở thật. Nguồn gốc mô hình được cho là từ Alibaba hoặc dựa trên công nghệ của Sand.ai. Việc ẩn danh tham gia bảng xếp hạng giúp thu thập dữ liệu người dùng miễn phí và tránh rủi ro pháp lý về bản quyền. Sự kiện này cho thấy cuộc đua AI video đã chuyển từ "mô hình thông minh hơn" sang "chi phí tính toán rẻ hơn và khả năng tuân thủ tốt hơn". Các công ty lớn như ByteDance đang tập trung vào API giá rẻ (1 nhân dân tệ/giây video) và hợp đồng khung trị giá hàng triệu USD để kiểm soát rủi ro pháp lý. Ba lĩnh vực ứng dụng tiềm năng là: tự động hóa video thương mại điện tử (giảm chi phí từ 500-2000 xuống 10-50 nhân dân tệ), sản xuất phim ngắn công nghiệp (thay thế 30-40% cảnh quay) và địa phương hóa quảng cáo toàn cầu. Cạnh tranh trong lĩnh vực AI video giờ đây không còn là về mô hình mạnh nhất, mà là về quy trình làm việc hiệu quả nhất.

marsbit04/10 00:22

54 tỷ đốt không cháy, Sora chết: Mô hình Trung Quốc ẩn danh dùng 38 giây đá cánh cửa tiếp theo

marsbit04/10 00:22

Google sắp công bố mô hình lớn mã nguồn mở Gemma 4: Số lượng tham số tăng gấp 4 lần

Trong bối cảnh thị trường mô hình lớn mã nguồn mở toàn cầu lâu nay bị chi phối bởi các công ty công nghệ Trung Quốc, Google sắp công bố mô hình Gemma 4 thế hệ mới với nhiều nâng cấp đáng chú ý. Thông tin được Giám đốc điều hành DeepMind Demis Hassabis ám chỉ thông qua biểu tượng "bốn viên kim cương". Gemma 4 dự kiến có quy mô tham số tăng gấp 4 lần, bao gồm một mô hình lớn 120B thử thách giới hạn chạy cục bộ. Mô hình này áp dụng kiến trúc MoE (hỗn hợp chuyên gia), chỉ kích hoạt 15B tham số, cho phép khả năng chạy offline trên card đồ họa dân dụng. Khả năng xử lý ngữ cảnh dự kiến tăng 1-2 lần, cùng kỹ năng suy luận logic và xử lý tác vụ phức tạp được cải thiện sâu. Về mặt chiến lược, Google duy trì lợi thế thương mại từ mô hình đóng trong khi vẫn kiểm soát ảnh hưởng trong cộng đồng mã nguồn mở. Gemma 4 tập trung vào trải nghiệm cục bộ hóa, tối ưu hiệu suất mô hình nhẹ để cạnh tranh trực tiếp với các mô hình nguồn mở Trung Quốc. Sự xuất hiện của Gemma 4 đẩy cao ngưỡng cạnh tranh, biến cuộc đua sang thời kỳ kết hợp cả tham số và hiệu suất.

marsbit04/02 06:47

Google sắp công bố mô hình lớn mã nguồn mở Gemma 4: Số lượng tham số tăng gấp 4 lần

marsbit04/02 06:47

Đột phá mới trong Trí tuệ thể hiện: AutoNomy mở nguồn toàn bộ mô hình nền tảng robot đa năng ABot-M0

Lĩnh vực trí tuệ thể hiện (Embodied AI) đạt bước tiến đột phá: AutoNomy (Gaode) chính thức mở nguồn toàn bộ mô hình nền tảng robot đa năng ABot-M0 - mô hình kiến trúc thống nhất đầu tiên trên toàn cầu dành cho thao tác của robot. ABot-M0 hướng tới mục tiêu "một bộ não đa năng phù hợp với nhiều loại robot", phá vỡ rào cản giữa các phần cứng khác nhau, thúc đẩy ứng dụng trí tuệ thể hiện từ phòng thí nghiệm vào công nghiệp và gia đình. Về hiệu suất: ABot-M0 đạt tỷ lệ hoàn thành nhiệm vụ 80.5% trên benchmark Libero-Plus, vượt trội hơn 30% so với phương án tiêu chuẩn trước đó là Pi0, đồng thời thiết lập kỷ lục mới (SOTA) trên cả Libero và RoboCasa. AutoNomy mở nguồn toàn diện 3 khía cạnh: 1. **Dữ liệu:** Bộ dữ liệu UniACT với hơn 6 triệu đường dẫn thao tác thực tế. 2. **Thuật toán:** Công bố kiến trúc mô hình, framework huấn luyện, bao gồm thuật toán học đa tạp hành động (AML) sáng tạo và kiến trúc cảm nhận hai luồng. 3. **Mô hình:** Cung cấp mô hình đã tiền huấn luyện end-to-end và bộ công cụ đầy đủ, cho phép sử dụng ngay lập tức. Việc mở nguồn ABot-M0 nhằm giải quyết các vấn đề "ốc đảo dữ liệu" và "triển khai khó khăn", giảm đáng kể ngưỡng ứng dụng cho robot hợp tác công nghiệp và robot dịch vụ gia đình, xây dựng cầu nối giữa nghiên cứu học thuật và ứng dụng công nghiệp.

marsbit04/01 08:20

Đột phá mới trong Trí tuệ thể hiện: AutoNomy mở nguồn toàn bộ mô hình nền tảng robot đa năng ABot-M0

marsbit04/01 08:20

活动图片