Chiếc "ủng" đã rớt xuống. Blog chính thức của arXiv thông báo rằng nền tảng này đã chính thức tách khỏi Đại học Cornell vào ngày 1 tháng 7, mở ra một chương mới với tư cách là một tổ chức phi lợi nhuận độc lập.

Địa chỉ thông báo: https://blog.arxiv.org/2026/06/30/arxivs-next-chapter/
Tên chính thức của tổ chức mới là arXiv, Inc., đã được đăng ký theo luật Delaware với tư cách là một công ty phi lợi nhuận, không có cổ phiếu, và đã nhận được tư cách miễn thuế 501(c)(3) của IRS Hoa Kỳ.
Biểu tượng "Cornell University" in ở đầu trang, đồng hành cùng người dùng hơn hai mươi năm, giờ đây đã trở thành lịch sử.

Không chỉ vậy, màu đỏ quen thuộc của arXiv cũng đã chuyển sang màu đen.

Tất nhiên, chức năng không có gì thay đổi. Các bài báo vẫn còn, tìm kiếm vẫn hoạt động, và cổng gửi bài vẫn mở như thường lệ. Đội ngũ arXiv đặc biệt nêu rõ trong thông báo, "Trong vài tháng tới, các tác giả, độc giả và cộng đồng phụ thuộc vào chúng tôi sẽ hầu như không cảm nhận được bất kỳ thay đổi nào." Câu này là dành cho những người dùng lo lắng rằng nền tảng đột nhiên sẽ tính phí hoặc thay đổi lớn. Có thể tham khảo bài viết trước đây của chúng tôi để biết thêm về mối quan ngại này: "arXiv biến đổi: Sắp tách độc lập khỏi Đại học Cornell, tuyển CEO, cư dân mạng: Tương lai có còn được dùng miễn phí không?".

Cơ cấu tổ chức mới: Từ đơn vị trực thuộc đại học đến quản trị tự chủ
Trong khuôn khổ của Cornell, arXiv được quản lý trực tiếp bởi Greg Morrisett, Phó hiệu trưởng của Cornell Tech, còn về mặt điều hành thì do Giáo sư khoa học máy tính Ramin Zabih đảm nhiệm vai trò Giám đốc điều hành. Sau khi độc lập, cấu trúc này sẽ được thay thế bằng khuôn khổ quản trị công ty chính thức.
Theo tài liệu FAQ mà arXiv công bố, tổ chức mới sẽ được quản trị bởi một Hội đồng quản trị tối đa 12 người. Quỹ Simons và Đại học Cornell với tư cách là hai "thành viên sáng lập", cùng dẫn dắt công tác xây dựng thể chế giai đoạn đầu, bao gồm việc bổ nhiệm Hội đồng quản trị ban đầu, thiết lập tư cách miễn thuế, và ký kết một loạt các thỏa thuận pháp lý. Hai tổ chức này sẽ thực hiện trách nhiệm "thành viên" trong vòng năm năm, và đại diện của họ cũng có thể tiếp tục phục vụ trong Hội đồng quản trị sau thời gian đó.

Về vị trí CEO: Giáo sư khoa học máy tính Ramin Zabih của Cornell sẽ đảm nhiệm vai trò CEO tạm thời trong giai đoạn chuyển tiếp, và hỗ trợ CEO chính thức trong tương lai hoàn tất bàn giao.

Hiện tại, quy trình tuyển dụng đã gần kết thúc. Phương án lương khoảng 300 nghìn USD một năm đã từng gây tranh cãi rộng rãi trước đây vẫn có hiệu lực. Đáng chú ý là, địa chỉ trụ sở chính của arXiv tạm thời không đổi, nhân viên ở thành phố New York vẫn sẽ làm việc tại Trung tâm Đổi mới Tata thuộc Cornell Tech. Toàn bộ 26 nhân viên đã chuyển sang công ty mới cùng với tổ chức.
arXiv là gì? Tại sao nó xứng đáng được quan tâm nhiều như vậy?
Nếu bạn làm nghiên cứu về vật lý, toán học hoặc máy tính, arXiv hầu như là trang web bạn mở ra hàng ngày. Nếu bạn làm việc trong lĩnh vực AI, thì đây hầu như đã trở thành nền tảng bài báo mặc định.
Nói một cách đơn giản, arXiv là một máy chủ "bản in trước": các học giả có thể tải lên bản thảo của mình lên đây miễn phí trước khi bài báo chính thức trải qua quá trình bình duyệt và được xuất bản trên tạp chí, để đồng nghiệp trên toàn cầu có thể xem ngay lập tức.
Mô hình này đã thay đổi căn bản tốc độ phổ biến kiến thức học thuật. Các tạp chí học thuật truyền thống từ khi nộp bài đến khi xuất bản thường mất vài tháng đến vài năm, trong khi arXiv đã rút ngắn thời gian này xuống còn vài ngày hoặc thậm chí vài giờ.
arXiv ra đời năm 1991, người sáng lập là nhà vật lý Paul Ginsparg từ Phòng thí nghiệm Quốc gia Los Alamos.

Ban đầu, nó chỉ là một tập lệnh tự động hóa nhằm thay thế các danh sách email hỗn loạn, dự kiến nhận khoảng 100 bài báo mỗi năm. Nhưng ngay tháng đầu tiên, gần trăm bài báo đã đổ về, và sự tham gia sớm của bậc thầy lý thuyết dây Ed Witten đã giúp nó nhanh chóng được giới học thuật công nhận. Năm 2001, Ginsparg trở về giảng dạy tại alma mater của mình là Đại học Cornell, arXiv cũng theo chân định cư tại thư viện của trường này, mở ra kỷ nguyên Cornell kéo dài 25 năm.
Giá trị của nó đối với cộng đồng AI, đặc biệt là khó có thể thay thế.
Hầu như tất cả các bài báo quan trọng định hình bối cảnh AI đương đại, đều lần đầu tiên xuất hiện trên arXiv. Cơ chế chú ý (Attention), kiến trúc Transformer, BERT, loạt GPT, mô hình khuếch tán... Những cái tên này đại diện không chỉ là bài báo, mà còn là nền móng của toàn ngành. Những bài báo loạt DeepSeek làm chấn động giới AI toàn cầu, cũng được công bố lần đầu trên arXiv. So với chu kỳ bình duyệt kéo dài hàng tháng đến hàng năm của xuất bản học thuật truyền thống, cơ chế xử lý nhanh của arXiv đã giúp các lĩnh vực lặp lại nhanh chóng này tăng tốc đáng kể.
Quan trọng hơn, arXiv miễn phí cho tất cả mọi người, không cần đăng ký theo tổ chức, không cần vượt qua paywall. Những nhà khoa học nghiên cứu ở Đông Âu, Đông Nam Á, Châu Phi, ở một mức độ nhất định, đứng trên cùng một vạch xuất phát với các học giả ở MIT.
Tính đến tháng 6 năm 2026, arXiv đã tích lũy hơn 3.09 triệu bài báo, bao gồm 8 lĩnh vực chuyên ngành: Vật lý, Toán học, Khoa học Máy tính, Sinh học Định lượng, Tài chính Định lượng, Thống kê, Kỹ thuật Điện và Khoa học Hệ thống, và Kinh tế học. Nền tảng cho đến nay đã cung cấp hơn 3.7 tỷ lượt tải xuống. Đằng sau những con số này là một cơ sở hạ tầng phục vụ hơn mười triệu người dùng hoạt động hàng tháng trên toàn cầu.

Thống kê số lượng bài báo được gửi từ tháng 8/1991

Thống kê số lượt tải xuống bài báo
Tại sao lại độc lập bây giờ? Áp lực kép từ tài chính và AI
Quyết định độc lập không phải là bốc đồng. Trong nhiều năm, các cuộc thảo luận nội bộ của arXiv đã diễn ra, nhưng chỉ thực sự hình thành sức mạnh tổng hợp trong hai năm gần đây.

Trước hết là vấn đề tài chính.
arXiv trong năm tài chính 2025 có chi tiêu khoảng 6.7 triệu USD, thâm hụt 297 nghìn USD trong năm đó. Đại học Cornell, đối mặt với áp lực cắt giảm tài trợ liên bang và thắt chặt ngân sách, không thể tiếp tục bù lỗ cho khoản thâm hụt này.

Vận hành độc lập đồng nghĩa với kênh huy động vốn rộng hơn. Một số tổ chức ở châu Âu và châu Á vốn không sẵn lòng viết séc cho Đại học Cornell, nhưng nếu người nhận thanh toán là một tổ chức phi lợi nhuận độc lập trực tiếp phục vụ cộng đồng khoa học, thì thái độ sẽ hoàn toàn khác.
Thứ hai là tính linh hoạt về thể chế. Hệ thống nhân sự của trường đại học có nhịp độ cố hữu của nó (trần lương, chu kỳ tuyển dụng, quy trình mua sắm), những điều này đối với arXiv cần phản ứng nhanh với làn sóng công nghệ đôi khi là rào cản rõ ràng. Morrisett từng thẳng thắn nói: "Chúng tôi cần thuê người linh hoạt hơn mức trường đại học cho phép, và trả lương cạnh tranh hơn."
Sau đó là biến số mới từ AI.
Từ năm 2023 trở lại đây, nội dung do AI tạo ra tràn vào các nền tảng học thuật, và arXiv cũng không ngoại lệ, số lượng lớn bài báo chất lượng thấp hoặc hoàn toàn do AI viết được gửi lên tăng mạnh. Nền tảng dựa vào hàng trăm tình nguyện viên chuyên môn kiểm duyệt xử lý bài gửi, nhưng đối mặt với quy mô hàng chục nghìn bài mỗi tháng, hệ thống này đang chịu áp lực.
Tháng 2 năm 2026, arXiv đã đưa ra chính sách mới "chỉ chấp nhận bài báo có phiên bản tiếng Anh" để giảm bớt khó khăn kiểm duyệt đa ngôn ngữ. Trong mắt người sáng lập Ginsparg, vấn đề này còn căn bản hơn: "Nếu bài báo khoa học máy tính do LLM tạo ra, chất lượng đã vượt quá trình độ của một nghiên cứu sinh thông thường, thì thế giới ba tháng sau nên ứng phó thế nào?"

Có thể duy trì miễn phí không, CEO sẽ làm gì?
Đối với hầu hết người dùng, câu hỏi quan tâm duy nhất là: Tương lai có còn được dùng miễn phí không?
arXiv trả lời rất rõ ràng: "arXiv luôn cam kết mở cửa miễn phí cho độc giả và người gửi bài, chúng tôi cam kết cung cấp cơ hội tiếp cận công bằng các ý tưởng và khám phá mới cho các nhà khoa học toàn cầu." Nhưng về việc liệu trong tương lai có giới thiệu chức năng trả phí hay không, phía chính thức vẫn chưa đưa ra giải thích rõ ràng.
Cảm xúc phổ biến trong giới học thuật là "thận trọng lạc quan cộng với quan sát liên tục". Một nhà nghiên cứu trên mạng xã hội đã nhắc lại vài trường hợp nền tảng phi lợi nhuận ngày xưa dần dần đi theo hướng thương mại hóa, bày tỏ lo ngại. Cũng có người trong ngành phản bác rằng, cấu trúc thu nhập của arXiv (sự kết hợp từ các tổ chức thành viên, quỹ và cá nhân tài trợ) tương đối lành mạnh, và đã huy động đủ vốn để trang trải nhu cầu vận hành trong ba năm tới.
Còn vị CEO sắp nhậm chức đầu tiên, danh sách thách thức khá dài: Hoàn thành việc di chuyển mã nguồn hiện đại hóa từ Perl sang Python; Thiết lập một cơ chế kiểm duyệt có thể đối phó với làn sóng bài gửi từ AI; Mở rộng cơ sở nhà tài trợ, giảm sự phụ thuộc vào một số ít quỹ lớn; Đồng thời định vị lại hình ảnh thương hiệu của arXiv trước cộng đồng học thuật quốc tế. Giá của vị trí này, đặt trong giới quản lý tổ chức công nghệ phi lợi nhuận ở New York, thực ra không phải là quá đáng.
Sự độc lập của arXiv là một lần chuyển đổi nhận dạng từ "dự án phụ thuộc của một trường đại học" sang "cơ sở hạ tầng học thuật toàn cầu". Bản thân sự chuyển đổi này sẽ không thay đổi bất kỳ chức năng nào của nó, nhưng sẽ thay đổi vị trí của nó trong thế giới.
Link tham khảo
https://news.cornell.edu/stories/2026/06/digital-research-repository-arxiv-start-new-chapter-nonprofit
https://info.arxiv.org/about/spinout_faq.html
https://blog.arxiv.org/2026/01/13/non-english-paper-submission-guidelines/
https://physicstoday.aip.org/news/arxiv-sets-out-on-its-own
Bài viết này từ tài khoản công chúng WeChat "机器之心" (ID:almosthuman2014), tác giả: 看论文的





