# Bài viết Liên quan Mô hình

Trung tâm Tin tức HTX cung cấp những bài viết mới nhất và phân tích chuyên sâu về "Mô hình", bao gồm xu hướng thị trường, cập nhật dự án, phát triển công nghệ và chính sách quản lý trong ngành tiền kỹ thuật số.

Dự đoán của Đại học Thanh Hoa 2 năm trước đang trở thành đồng thuận toàn cầu, ba tổ chức AI lớn như Meta đã đưa ra cùng kết luận

Một nhóm nghiên cứu Trung Quốc từ Đại học Thanh Hoa và công ty Mianwall AI đã công bố "Định luật Mật độ" (Densing Law) vào cuối năm 2024, dự đoán rằng cứ mỗi 3,5 tháng, lượng tham số mô hình AI cần thiết để đạt được cùng một mức độ thông minh sẽ giảm một nửa. Đến tháng 4/2026, hai tổ chức hàng đầu thế giới là Meta và METR đã độc lập công bố các kết quả nghiên cứu xác nhận xu hướng này. Meta cho biết mô hình mới Muse Spark của họ đạt hiệu suất tương đương với mô hình tiền nhiệm chỉ với 1/10 năng lực tính toán, trong khi METR báo cáo rằng khả năng xử lý tác vụ của AI tăng gấp đôi sau mỗi 88,6 ngày. Cả ba nghiên cứu sử dụng phương pháp khác nhau nhưng đều cho ra một đường cong phát triển có độ dốc gần như trùng khớp, củng cố độ tin cậy của Định luật Mật độ. Phát hiện này dự báo chi phí suy luận AI sẽ giảm nhanh hơn, trí tuệ trên thiết bị cá nhân sẽ bùng nổ sớm, và buộc ngành công nghiệp chuyển trọng tâm từ mở rộng quy mô thuần túy sang nâng cao hiệu quả mật độ. Nhóm Mianwall AI, với dòng mô hình mã nguồn mở MiniCPM (Tiểu Công Pháo), đã áp dụng thành công định luật này từ 2 năm trước, cho thấy sự đi đầu của các nhà nghiên cứu Trung Quốc trong lĩnh vực này.

marsbit04/13 12:17

Dự đoán của Đại học Thanh Hoa 2 năm trước đang trở thành đồng thuận toàn cầu, ba tổ chức AI lớn như Meta đã đưa ra cùng kết luận

marsbit04/13 12:17

Gặp gỡ đỉnh cao của Generalist, hút 3 tỷ trong 30 ngày, Qiānxún Zhìnéng đã làm đúng điều gì?

Trong vòng 30 ngày, công ty khởi nghiệp Trung Quốc Qianxun AI (Thiên Tìm Thông Minh) đã huy động thành công 3 tỷ nhân dân tệ (khoảng 30.000 tỷ VND) qua hai vòng gọi vốn liên tiếp, với sự dẫn đầu từ các quỹ đầu tư lớn như Shunwei Capital (của Lôi Quân) và Yunfeng Fund (của Mã Vân). Công ty được đồng sáng lập bởi các chuyên gia hàng đầu về AI, robot và thương mại hóa. Qianxun AI tập trung phát triển mô hình AI "thể hiện" (embodied AI) Spirit v1.5, một mô hình thống nhất Vision-Language-Action (VLA) đầu-cuối. Mô hình này đã vượt qua các đối thủ để đứng đầu bảng xếp hạng RoboChallenge, thể hiện khả năng tổng quát hóa mạnh mẽ cho các tác vụ phức tạp mà không cần đào tạo bổ sung. Chiến lược cốt lõi của họ là áp dụng Định luật Scaling Law (Định luật Mở rộng Quy mô) tương tự như trong các mô hình ngôn ngữ lớn (LLM): tăng quy mô dữ liệu và mô hình để kích hoạt các khả năng mới. Động cơ dữ liệu đa dạng của họ kết hợp thu thập từ video Internet, vận hành từ xa và đặc biệt là thiết bị đeo tay chi phí thấp, giúp thu thập hơn 200.000 giờ dữ liệu tương tác. Để tạo ra một vòng lặp dữ liệu bền vững, Qianxun AI triển khai robot "Tiểu Mặc" vào các kịch bản thực tế như pha chế cà phê tại JD Mall và kiểm tra pin cho CATL. Những robot này không chỉ thực hiện nhiệm vụ mà còn thu thập dữ liệu chuyên gia từ môi trường thực, liên tục cải thiện mô hình. Cách tiếp cận "đẻ trứng dọc đường" này cho phép họ xác thực khả năng thương mại và thu thập dữ liệu cùng một lúc, định vị họ là một ứng cử viên mạnh mẽ trong cuộc đua AI thể hiện toàn cầu.

marsbit04/07 04:13

Gặp gỡ đỉnh cao của Generalist, hút 3 tỷ trong 30 ngày, Qiānxún Zhìnéng đã làm đúng điều gì?

marsbit04/07 04:13

Đội ngũ nghiên cứu Đại học Chiết Giang đề xuất hướng đi mới: Dạy cách thức não người hiểu thế giới cho AI

Nhóm nghiên cứu Đại học Chiết Giang công bố một phương pháp mới trên Nature Communications, chỉ ra rằng khi mô hình AI (như SimCLR, CLIP, DINOv2) mở rộng quy mô tham số, khả năng nhận diện vật thể cụ thể tăng (từ 74.94% lên 85.87%), nhưng hiểu khái niệm trừu tượng lại giảm (từ 54.37% xuống 52.82%). Khác với não người tự động phân loại theo cấp bậc (ví dụ: chim → động vật), mô hình AI dựa nhiều vào đặc trưng bề mặt và dữ liệu huấn luyện. Giải pháp của nhóm là sử dụng tín hiệu não người (ghi lại khi xem ảnh) để huấn luyện mô hình, giúp nó học cách tổ chức khái niệm như não người. Kết quả cho thấy khoảng cách giữa biểu diễn mô hình và não giảm rõ rệt, đồng thời khả năng học ít mẫu và xử lý tình huống mới tăng 20.5%, vượt cả mô hình lớn hơn. Nghiên cứu chuyển hướng từ "lớn hơn là tốt hơn" sang "cấu trúc tốt hơn là thông minh hơn", nhấn mạnh việc xây dựng cấu trúc nhận thức gần với con người để AI có khả năng tư duy trừu tượng và thích ứng linh hoạt. Hướng đi này cũng phù hợp với xu hướng phát triển AI agent có khả năng tự học và tiến hóa trong môi trường thực tế.

marsbit04/05 04:42

Đội ngũ nghiên cứu Đại học Chiết Giang đề xuất hướng đi mới: Dạy cách thức não người hiểu thế giới cho AI

marsbit04/05 04:42

"“Mượn gà đẻ trứng”? Apple được cấp quyền truy cập Google Gemini: Tạo ra AI cục bộ mạnh nhất thông qua “chưng cất” mô hình

Để nâng cấp Siri vượt trội, Apple đã chọn một con đường tắt công nghệ thông minh: hợp tác với Google. Theo báo cáo, Apple đã được cấp quyền truy cập đầy đủ vào mô hình Gemini của Google, không chỉ đơn thuần là tích hợp API mà còn cho phép Apple thực hiện "chưng cất mô hình" (model distillation). Kỹ thuật này hoạt động như một "giáo viên thiên tài" dạy cho "học sinh bình thường": Apple sử dụng Gemini để tạo dữ liệu đào tạo chi tiết, từ đó giúp mô hình AI nhỏ gọn hơn của họ học hỏi cách suy luận và đạt hiệu suất gần bằng mô hình lớn mà chỉ cần tài nguyên tính toán tối thiểu. Lợi ích lớn nhất là khả năng chạy cục bộ trên thiết bị như iPhone, không cần kết nối mạng, đảm bảo tốc độ phản hồi nhanh và bảo vệ tuyệt đối quyền riêng tư người dùng - thương hiệu đặc trưng của Apple. Dự kiến, Siri thế hệ mới ra mắt cùng iOS 27 sẽ có khả năng tương tác sâu: trả lời câu hỏi phức tạp, hỗ trợ cảm xúc, quét và hiểu tài liệu, tóm tắt thông tin, thậm chí đặt chuyến đi. Apple cũng có quyền chỉnh sửa Gemini để phù hợp với trải nghiệm người dùng của họ. Dù tận dụng công nghệ của Google, Apple vẫn không từ bỏ mục tiêu tự chủ. Đội ngũ Apple Foundation Models vẫn đang phát triển mô hình AI riêng, theo chiến lược "ngắn hạn dựa vào ngoại lực, dài hạn tự nghiên cứu". Bằng cách cân bằng giữa quyền riêng tư, hiệu suất và sức mạnh AI, Apple đang định hình lại cuộc đua AI trên thiết bị di động với một bộ não cục bộ đẳng cấp Gemini ngay trong iPhone của bạn.

marsbit03/26 01:09

"“Mượn gà đẻ trứng”? Apple được cấp quyền truy cập Google Gemini: Tạo ra AI cục bộ mạnh nhất thông qua “chưng cất” mô hình

marsbit03/26 01:09

Làm thế nào để kiếm 300.000 USD mỗi năm bằng cách đếm tweet của Musk?

Tóm tắt: Một người dùng có biệt danh "noovd" trên nền tảng Polymarket đã kiếm được khoảng 345.000 USD lợi nhuận ròng chỉ bằng cách dự đoán số lượng tweet hàng tuần của Elon Musk. Người này tham gia từ tháng 7/2024, thực hiện 1.281 lượt dự đoán và có mức thắng lớn nhất lên tới 136.000 USD. Chiến lược của noovd tập trung vào các khoảng dự đoán bị đánh giá thấp (thường có giá 2-24 cent) về số tweet của Musk, nơi xác suất thực tế cao hơn nhiều so với giá thị trường. Anh ta sử dụng một mô hình dữ liệu phức tạp, phân tích thói quen đăng tweet của Musk từ năm 2022, cập nhật hàng ngày và tính đến các yếu tố như ngày trong tuần, sự kiện quan trọng. Bằng cách mua vào các lựa chọn "Có" với giá rẻ khi xác suất thực tế chênh lệch lớn so với giá thị trường (ưu thế kỳ vọng lên tới 8-20 lần) và không đa dạng hóa, noovd đã đạt được lợi nhuận khổng lồ nhờ một vài lần thắng lớn bù cho nhiều lần thua nhỏ. Bài học chính là thay vì dựa vào cảm tính, việc tìm kiếm một tín hiệu hẹp, có thể lặp lại và phân tích sâu bằng dữ liệu (độ sâu hơn chiều rộng) mang lại hiệu quả vượt trội trên thị trường dự đoán.

比推02/21 14:58

Làm thế nào để kiếm 300.000 USD mỗi năm bằng cách đếm tweet của Musk?

比推02/21 14:58

活动图片