# Bài viết Liên quan Mã nguồn mở

Trung tâm Tin tức HTX cung cấp những bài viết mới nhất và phân tích chuyên sâu về "Mã nguồn mở", bao gồm xu hướng thị trường, cập nhật dự án, phát triển công nghệ và chính sách quản lý trong ngành tiền kỹ thuật số.

Trung Quốc xếp nhất, đuổi sát OpenAI, 'Tăng nhân quét đất' bí ẩn vọt lên top 7 toàn cầu

Một mô hình AI bí ẩn của Trung Quốc có tên MopMonk (tạm dịch: "Hòa thượng quét sân") đã đột ngột xuất hiện và xếp hạng 7 trên bảng xếp hạng toàn cầu CyberGym về đánh giá khả năng bảo mật của AI, với tỷ lệ thành công 73,1%, xếp ngay sau OpenAI và đạt điểm số cao nhất từ trước đến nay của một đội Trung Quốc. CyberGym, được phát triển bởi UC Berkeley, là tiêu chuẩn đánh giá uy tín với 1507 lỗ hổng thực tế, yêu cầu mô hình không chỉ nhận diện mà còn phải tạo được bằng chứng khai thác (PoC) để tái tạo lỗ hổng trong môi trường thực thi khép kín. Điều này biến nó thành "thánh địa" thử thách năng lực hành động thực tế (Agent) của các AI. MopMonk gây chú ý vì sự ẩn danh hoàn toàn, không có trang web hay thông tin nhóm phát triển. Manh mối chính cho thấy nó sử dụng mô hình nền tảng mã nguồn mở MiniMax M3 từ Thượng Hải - một mô hình mạnh về lập trình, ngữ cảnh dài và đa phương thức. Bí quyết thành công của MopMonk được cho là nằm ở bộ khung (Harness) Agent đa tác tử được thiết kế riêng cho khai thác lỗ hổng. Nó tập trung vào ba yếu tố chính: 1) Bộ nhớ cấu trúc hóa để lưu trữ thông tin lỗ hổng, ràng buộc và bằng chứng thất bại; 2) Quá trình khai thác dựa trên bộ nhớ này, giúp thu hẹp tìm kiếm và tránh thử sai lặp lại; 3) Nhiều Agent khám phá song song, chia sẻ bộ nhớ chung để tăng hiệu quả. Thành tích này cho thấy xu hướng cạnh tranh AI đang chuyển từ quy mô tham số sang hiệu quả thực thi của Agent. Giá trị lâu dài có thể nằm ở bộ khung Harness tinh vi - thứ có thể được tái sử dụng và cải tiến qua nhiều thế hệ mô hình nền tảng. Dù danh tính đội phát triển MopMonk vẫn là ẩn số, nhưng họ đã chứng minh một hướng đi hiệu quả: kết hợp mô hình nền tảng mạnh với kỹ thuật điều phối Agent chuyên sâu để giải quyết các nhiệm vụ phức tạp trong thế giới thực.

marsbit2 giờ trước

Trung Quốc xếp nhất, đuổi sát OpenAI, 'Tăng nhân quét đất' bí ẩn vọt lên top 7 toàn cầu

marsbit2 giờ trước

Biến đổi Cấu trúc Transformer, LLM Trở Nên Thông Minh Hơn

Năm 2026, khi ngành công nghiệp mô hình lớn tập trung vào việc nhồi nhét nhiều tham số hơn, một nghiên cứu mới từ Mila, Đại học Cornell và Đại học Montréal đặt ra câu hỏi ngược lại: Điều gì xảy ra nếu chỉ di chuyển các tham số hiện có mà không thêm bất kỳ tham số nào? Bài báo có tên "Tapered Language Models" (TLM) chỉ ra rằng các lớp trong kiến trúc Transformer truyền thống không quan trọng như nhau. Các nghiên cứu về thoát sớm, cắt tỉa lớp và khả năng giải thích đã cho thấy các lớp đầu nắm bắt thông tin cơ bản (như ngữ pháp), trong khi các lớp sau xử lý thông tin cấp cao hơn (như ngữ nghĩa) và thường chỉ "nhấn mạnh lại" các phán đoán hiện có. Thay vì phân bổ tham số đồng đều cho tất cả các lớp, nhóm nghiên cứu đề xuất một thiết kế "hình nón": giảm dần đều chiều rộng của mạng chuyển tiếp (FFN) - thành phần lưu trữ và xử lý thông tin chính của mỗi lớp - từ đầu đến cuối mô hình, trong khi vẫn giữ nguyên tổng số tham số và lượng tính toán. Thử nghiệm trên mô hình Transformer 440M tham số cho thấy, với đường cong giảm dần dạng cosine (chiều rộng đầu gấp 1.5 lần cơ sở, chiều rộng cuối là 0.5 lần), điểm perplexity cải thiện tới 1.84 điểm so với mô hình cơ sở phân bổ đồng đều. Kết quả tích cực này được khẳng định lại trên ba kiến trúc khác (mô hình chú ý có cổng, Hope-attention, Titans) ở quy mô 760M và 1.3B tham số, trên nhiều nhiệm vụ đánh giá như suy luận thường thức và dự đoán ngôn ngữ, mà không làm giảm khả năng xử lý ngữ cảnh dài. Nghiên cứu chứng minh việc phân bổ dung lượng "não bộ" của mô hình một cách có chủ đích - tập trung nhiều hơn vào các lớp đầu nơi xử lý thông tin đa dạng - là một đòn bẩy hiệu quả gần như miễn phí. Phương pháp này mở ra hướng đi mới không chỉ cho mô hình ngôn ngữ mà còn cho các mô hình Thị giác Transformer, khuếch tán và đa phương thức vốn kế thừa thiết kế phân bổ đồng đều truyền thống.

marsbit21 giờ trước

Biến đổi Cấu trúc Transformer, LLM Trở Nên Thông Minh Hơn

marsbit21 giờ trước

Bảng xếp hạng mô hình Hugging Face, hiện tại tôi chỉ phục yuxinlu1

Một nhà phát triển cá nhân, yuxinlu1 (Lộ Vũ Tân), đã gây bất ngờ khi hai mô hình AI của anh vươn lên Top Trending trên Hugging Face, cạnh tranh với những gã khổng lồ như GLM-5.2 hay Unlimited-OCR của Baidu. Hai mô hình này, dựa trên kiến trúc Gemma4-12B, đạt lượt tải xuống lần lượt 207K và 536K. Điểm nổi bật là chúng được tối ưu hóa ở định dạng GGUF, cho phép chạy cục bộ với chỉ khoảng 4.5GB VRAM/bộ nhớ thống nhất, mang lại trải nghiệm hỗ trợ lập trình và agent riêng tư, miễn phí. Phiên bản V1 tập trung vào lập trình và giải mã, được huấn luyện trên dữ liệu code "có thể xác minh". Phiên bản V2 bổ sung khả năng gọi công cụ đa bước (agentic), được báo cáo là hiệu suất gấp ~3.5 lần mô hình gốc trong một bài kiểm tra nhất định. Lộ Vũ Tân, một nghiên cứu sinh AI, đã tự tài trợ và dành khoảng 40 giờ làm việc cường độ cao cho dự án này. Anh nhấn mạnh yếu tố then chốt là chất lượng dữ liệu chứ không phải số lượng, và động lực là giải quyết nhu cầu thực tế của cộng đồng: một trợ lý AI mạnh mẽ, chạy được trên phần cứng phổ thông, bảo vệ quyền riêng tư và không có chi phí API. Câu chuyện của anh cho thấy sức mạnh của một nhà phát triển cá nhân tập trung giải quyết sâu một vấn đề cụ thể (coding/agent cục bộ) với sự chân thành và kiên trì, thay vì cố gắng tạo ra một mô hình toàn năng. Các mô hình của anh hiện có sẵn trên Hugging Face và được khuyến nghị chạy với llama.cpp.

marsbit2 ngày trước 01:54

Bảng xếp hạng mô hình Hugging Face, hiện tại tôi chỉ phục yuxinlu1

marsbit2 ngày trước 01:54

Mô hình lớn của Mỹ đi vào khép kín, nhân danh an ninh

Ngày 27/6, Anthropic thông báo mô hình bảo mật mạng mạnh nhất của họ, Mythos 5, đã được chính phủ Mỹ cho phép triển khai lại cho hơn 100 tổ chức Mỹ, trong khi phiên bản công khai Fable 5 vẫn chưa có thời gian phục hồi. Cùng ngày, OpenAI phát hành GPT-5.6 nhưng chỉ mở API cho các đối tác được chính phủ phê duyệt. Sự kiện này đánh dấu chu kỳ "dừng - đàm phán - cho phép có điều kiện" đầu tiên của chính phủ Mỹ đối với việc kiểm soát mô hình AI tiên tiến, sau lệnh hành pháp về AI của cựu Tổng thống Trump đầu tháng 6. Các công ty như OpenAI và Anthropic tuyên bố mô hình của họ không vượt quá ngưỡng rủi ro theo khung đánh giá an toàn tự ngành, nhưng chính phủ vẫn can thiệp. Động thái này làm dấy lên lo ngại về một kỷ nguyên kiểm duyệt mới, nơi việc phát hành mô hình AI phụ thuộc vào "đèn xanh" không rõ ràng từ chính phủ, với các tiêu chuẩn và quy trình không minh bạch. Chuyên gia cảnh báo điều này có thể làm suy yếu động lực đầu tư và cản trở sự phổ biến công nghệ quan trọng, tương tự "Cuộc chiến Mã hóa" những năm 1990 khi Mỹ cố gắng kiểm soát xuất khẩu công nghệ mã hóa mạnh. Trong khi đó, mô hình lớn Trung Quốc đang phát triển theo hướng mã nguồn mở. Các chuyên gia chỉ ra rằng nếu chỉ một số ít tổ chức được tiếp cận AI tiên tiến, rủi ro về bất bình đẳng quyền lực có thể tăng lên.

链捕手2 ngày trước 15:26

Mô hình lớn của Mỹ đi vào khép kín, nhân danh an ninh

链捕手2 ngày trước 15:26

Vừa qua, DeepSeek V4 cập nhật DSpark, tốc độ suy luận tăng 80%

Vừa qua, DeepSeek V4 đã được cập nhật với framework giải mã suy đoán mới là **DSpark**, giúp tăng tốc độ suy luận lên tới 80%. Cốt lõi của bản cập nhật này là framework **DSpark**, một kỹ thuật giải mã suy đoán được triển khai trên DeepSeek-V4-Pro hiện có để tăng tốc độ suy luận, chứ không phải là nâng cấp kiến trúc mô hình. DSpark giải quyết các điểm nghẽn về độ trễ và thông lượng trong môi trường sản xuất, đặc biệt ở các tình huống có tải cao. DSpark kết hợp hai cải tiến chính: 1. **Kiến trúc sinh bán tự hồi quy (Semi-Autoregressive Generation)**: Giữ lợi thế về thông lượng cao của mô hình phác thảo song song, đồng thời thêm mô-đun nối tiếp nhẹ để mô hình hóa mối quan hệ phụ thuộc giữa các token, giúp giảm thiểu tỷ lệ chấp nhận suy giảm. 2. **Xác minh theo lịch trình độ tin cậy, nhận biết phần cứng (Confidence-Scheduled Verification)**: Một "đầu độ tin cậy" (Confidence Head) được sử dụng để đánh giá xác suất tồn tại của mỗi token phác thảo. Hệ thống điều phối sẽ xác định độ dài xác minh tối ưu một cách linh hoạt dựa trên đặc điểm tải và phần cứng, chỉ phân bổ tài nguyên tính toán cho những token có khả năng được chấp nhận cao nhất. Trong các thử nghiệm trên nhiều lĩnh vực như suy luận toán học, tạo mã và hội thoại, DSpark vượt trội so với các phương pháp tiên tiến hiện tại như Eagle3 và DFlash. So với cơ sở sinh token đơn trước đó (MTP-1), DSpark đã **tăng tốc độ phản hồi cho người dùng từ 57% đến 85%** (tuỳ thuộc vào việc sử dụng mô hình Flash hay Pro) trong khi vẫn duy trì cùng tổng thông lượng. Cùng với DSpark, DeepSeek cũng công khai mã nguồn **DeepSpec**, một bộ công cụ toàn diện để đào tạo và đánh giá các mô hình phác thảo cho giải mã suy đoán. DeepSpec cung cấp một đường ống công việc tiêu chuẩn bao gồm chuẩn bị dữ liệu, đào tạo và đánh giá, hỗ trợ nhiều thuật toán (DSpark, DFlash, Eagle3) và mô hình mục tiêu (hiện tại là Qwen3 và Gemma).

marsbit06/27 08:54

Vừa qua, DeepSeek V4 cập nhật DSpark, tốc độ suy luận tăng 80%

marsbit06/27 08:54

Song Xiaodong, người tiên phong về an ninh máy tính, gia nhập Meta

Tuần này, Giáo sư Đại học UC Berkeley Dawn Song (Tống Hiểu Đông) đã thông báo gia nhập Phòng thí nghiệm Siêu trí tuệ (Superintelligence Labs) của Meta, giữ chức Phó Chủ tịch Nghiên cứu AI, báo cáo trực tiếp cho Giám đốc Nat Friedman. Bà là một học giả có ảnh hưởng lớn trong lĩnh vực an ninh máy tính và an ninh AI toàn cầu, hiện là Giáo sư tại UC Berkeley, và là người nhận học bổng MacArthur, ACM Fellow, IEEE Fellow. Nghiên cứu mang tính bước ngoặt của bà về "Phân tích vết bẩn động" (2005) là một tài liệu kinh điển trong ngành. Công trình của bà bao trùm an ninh phần mềm, mạng, và bà là người tiên phong trong lĩnh vực học máy đối kháng và an ninh tác nhân AI, đóng góp quan trọng vào việc thiết lập các điểm chuẩn an ninh cho AI thế hệ mới. Bà cũng là người sáng lập Oasis Labs và Virtue AI. Theo báo cáo, các nhà sáng lập khác của Virtue AI và các thành viên nhóm cũng cùng gia nhập Meta. Động thái này được cho là nhằm tăng cường các biện pháp an ninh cho các tác nhân AI của Meta, đặc biệt trong bối cảnh lo ngại về an ninh AI gia tăng sau sự cố với mô hình mythos của Anthropic. Meta đang tìm cách chứng minh khả năng chống lạm dụng độc hại của các mô hình AI khi triển khai chúng đến hàng tỷ người dùng. Thông tin liên quan khác đề cập đến việc Denny Zhou, nhà sáng lập Nhóm Lập luận Gemini của Google, được cho là đã gia nhập Meta vài tháng trước, củng cố thêm năng lực nghiên cứu AI của tập đoàn.

marsbit06/26 08:13

Song Xiaodong, người tiên phong về an ninh máy tính, gia nhập Meta

marsbit06/26 08:13

NVIDIA MoE Mới Đã Mã Nguồn Mở: Một Dòng Import, Tăng Tốc Fine-Tune 3.7 Lần

Chỉ cần thêm một dòng import, NeMo AutoModel của NVIDIA có thể tăng tốc độ fine-tuning mô hình MoE lên gấp 3.7 lần. Dựa trên nền tảng Hugging Face Transformers v5, công cụ này tương thích API và không yêu cầu sửa đổi code nhiều, cho phép fine-tuning các mô hình MoE với hiệu suất cao hơn và mức sử dụng bộ nhớ GPU thấp hơn. Bộ ba công nghệ cốt lõi gồm Expert Parallelism (EP) phân phối trọng số chuyên gia trên nhiều GPU để giảm 29-32% bộ nhớ, DeepEP kết hợp tính toán và giao tiếp để giảm độ trễ, và TransformerEngine tăng tốc các phép toán cơ bản. Thử nghiệm trên Qwen3-30B-A3B cho thấy tốc độ thông lượng huấn luyện (TPS/GPU) tăng từ 3075 lên 11340, tương đương 3.69 lần. Đối với Nemotron 3 Ultra 550B ở quy mô lớn (128 GPU), giải pháp này vẫn hoạt động ổn định trong khi Transformers v5 gặp lỗi tràn bộ nhớ. Mã nguồn và hướng dẫn sử dụng đã được NVIDIA công bố trên GitHub.

marsbit06/26 07:30

NVIDIA MoE Mới Đã Mã Nguồn Mở: Một Dòng Import, Tăng Tốc Fine-Tune 3.7 Lần

marsbit06/26 07:30

Sóng gió thị trường AI bạo lực điều chỉnh, phải chăng đã đến giờ GLM-5.2 của ZhiPu?

Thứ Ba, thị trường AI toàn cầu đối mặt đợt bán tháo mạnh nhất năm nay. Chỉ số KOSPI của Hàn Quốc giảm gần 10%, kích hoạt cơ chế ngừng giao dịch, với Samsung Electronics và SK Hynix lao dốc. Sự sụt giảm sau đó lan sang Mỹ, Nasdaq mất 2.2%, các cổ phiếu bán dẫn và AI dẫn đầu đà giảm. Nhiều ý kiến coi đây là "thời khắc DeepSeek của GLM", ám chỉ việc mô hình mã nguồn mở GLM-5.2 của Trí Tuệ Đại Thúc (Zhipu AI) Trung Quốc, được đánh giá vào top 3 toàn cầu, gây lo ngại về khả năng cạnh tranh của các mô hình Mỹ đắt đỏ. Các nhà đầu tư đặt câu hỏi về tính bền vững của hàng nghìn tỷ USD chi cho trung tâm dữ liệu nếu các mô hình rẻ hơn đủ tốt. Áp lực kép từ nghi ngờ về lợi tức đầu tư AI và kỳ vọng lãi suất cao hơn tại Mỹ khiến vốn rút khỏi chuỗi phần cứng hưởng lợi từ câu chuyện hạ tầng. Giao dịch hiện tại tập trung bán các "công ty chi tiêu nhiều nhất" như Alphabet, Meta. Sự kiện cụ thể ở Hàn Quốc như cảnh báo về ETF đòn bẩy và việc MSCI không nâng hạng nước này cũng góp phần gây sụt giảm. Thị trường chờ đợi báo cáo của Micron để kiểm chứng sức khỏe ngành. Một mối lo khác là việc tài trợ cho cơ sở hạ tầng AI ngày càng phụ thuộc vào nợ, như trường hợp SpaceX phát hành trái phiếu, làm dấy lên lo ngại về chi tiêu quá mức. Tuy nhiên, nhiều nhà đầu tư vẫn lạc quan, coi đây là đợt điều chỉnh cần thiết trong giai đoạn sớm của cuộc cách mạng AI, chứ không phải kết thúc xu hướng. Cốt lõi vấn đề chuyển từ "AI có tăng trưởng không" sang "giá phải trả cho tăng trưởng đó có quá cao không", tập trung vào khả năng chuyển đổi chi tiêu vốn thành dòng tiền và định giá hợp lý.

marsbit06/24 02:22

Sóng gió thị trường AI bạo lực điều chỉnh, phải chăng đã đến giờ GLM-5.2 của ZhiPu?

marsbit06/24 02:22

Tại sao "Cha đỡ đầu AGI" Ben Goertzel lại cho rằng tương lai của AI phải dựa vào Blockchain?

"Cha đỡ AGI" Ben Goertzel tin rằng tương lai của AI nằm ở blockchain vì AGI quá quan trọng để bị kiểm soát bởi các công ty đầu tư mạo hiểm hay một vài tập đoàn độc quyền. Ông nhấn mạnh rằng mã lõi của AGI phải là mã nguồn mở và miễn phí. Tuy nhiên, chỉ mã nguồn mở là chưa đủ; cần có một mạng lưới máy tính phi tập trung để mọi người có thể cùng triển khai và sử dụng nó, tránh tình trạng chỉ những quốc gia hay công ty lớn mới có khả năng tiếp cận. Goertzel chỉ trích các công ty như OpenAI và Anthropic đã nhanh chóng từ bỏ nguyên tắc mở ban đầu để theo đuổi mô hình độc quyền. Dự án SingularityNET và Liên minh Artificial Superintelligence Alliance của ông sử dụng nền tảng blockchain và mô hình kinh tế token để tài trợ cho việc phát triển một AGI phi tập trung. Ông hình dung một nền kinh tế Agent, nơi các AI Agent có thể hoạt động và giao dịch tự chủ thay mặt người dùng. Để phổ biến, dự án của ông dự kiến sẽ cung cấp các sản phẩm AI trả phí cho doanh nghiệp, chạy trên nền tảng phi tập trung nhưng dễ tiếp cận hơn với người dùng cuối. Goertzel dự đoán AGI ngang tầm con người có thể xuất hiện vào khoảng năm 2029 và lo ngại về khoảng cách hiểu biết giữa các nhóm người sẽ làm trầm trọng thêm bất bình đẳng. Ông tin rằng một mạng lưới mở và phi tập trung là giải pháp tốt nhất để đảm bảo AGI mang lại lợi ích cho nhiều người, thay vì củng cố quyền lực cho một số ít. Bài kiểm tra thực tế sắp tới là bản phát hành Agent Omega Claw trong vài tuần tới.

Foresight News06/22 12:12

Tại sao "Cha đỡ đầu AGI" Ben Goertzel lại cho rằng tương lai của AI phải dựa vào Blockchain?

Foresight News06/22 12:12

Hệ thống mở sẽ chiến thắng: Tại sao Ethereum là Linux tiếp theo?

Trong lịch sử công nghệ, các hệ thống mở thường chiến thắng các hệ thống đóng. Bài viết lập luận rằng Ethereum đang đi theo con đường của Linux và Internet, sử dụng mô hình phát triển "chợ mở" để vượt qua các giải pháp chuỗi khối riêng tư, tập trung (ví dụ: các liên minh ngân hàng). Yếu tố then chốt là tính trung lập đáng tin cậy của Ethereum: các quy tắc minh bạch, áp dụng công bằng, khó thay đổi và cho phép mọi người tham gia tự do. Điều này thu hút một hệ sinh thái nhà phát triển và ứng dụng khổng lồ, tạo ra một vòng lặp phát triển tự củng cố. Trong khi các mạng riêng có thể có ưu thế ban đầu, chúng không thể theo kịp tốc độ đổi mới không cần xin phép và luôn tiềm ẩn rủi ro từ bên kiểm soát. Ethereum, với tính phi tập trung cao, chủ quyền và cơ sở hạ tầng không thể bị chi phối bởi một thực thể duy nhất, đang trở thành nền tảng thanh toán toàn cầu ưu việt, được thể hiện qua việc các tổ chức lớn như BlackRock, JPMorgan, Coinbase và Robinhood xây dựng các ứng dụng và lớp 2 trên đó. Giống như HTTPS đã giải quyết lo ngại về bảo mật internet, các công nghệ như ERC-3643 và bằng chứng không tiết lộ thông tin (zero-knowledge proofs) trên Ethereum có thể giải quyết các yêu cầu về tuân thủ và riêng tư của tài chính truyền thống, xác nhận rằng hệ thống mở cuối cùng sẽ chiến thắng.

Foresight News06/22 10:30

Hệ thống mở sẽ chiến thắng: Tại sao Ethereum là Linux tiếp theo?

Foresight News06/22 10:30

# Bài viết Liên quan Mã nguồn mở

Trung Quốc xếp nhất, đuổi sát OpenAI, 'Tăng nhân quét đất' bí ẩn vọt lên top 7 toàn cầu

Biến đổi Cấu trúc Transformer, LLM Trở Nên Thông Minh Hơn

Bảng xếp hạng mô hình Hugging Face, hiện tại tôi chỉ phục yuxinlu1

Mô hình lớn của Mỹ đi vào khép kín, nhân danh an ninh

Vừa qua, DeepSeek V4 cập nhật DSpark, tốc độ suy luận tăng 80%

Song Xiaodong, người tiên phong về an ninh máy tính, gia nhập Meta

NVIDIA MoE Mới Đã Mã Nguồn Mở: Một Dòng Import, Tăng Tốc Fine-Tune 3.7 Lần

Sóng gió thị trường AI bạo lực điều chỉnh, phải chăng đã đến giờ GLM-5.2 của ZhiPu?

Tại sao "Cha đỡ đầu AGI" Ben Goertzel lại cho rằng tương lai của AI phải dựa vào Blockchain?

Hệ thống mở sẽ chiến thắng: Tại sao Ethereum là Linux tiếp theo?

Danh mục Phổ biến

Thẻ Nổi bật