Công việc hai năm, giờ đây hoàn thành chỉ trong vài tuần.
Gần đây, nhà khoa học thần kinh Jérôme Lecoq thuộc Viện Allen và nhóm của ông đã rút ngắn thời gian viết một bài tổng quan dài từ gần 2 năm xuống còn vài tuần.
Jérôme Lecoq hiện đang có khoảng 10 bài tổng quan tồn đọng, nhiều bài dài hơn 100 trang, mỗi trích dẫn đều được một tác nhân AI kiểm tra từng câu một.
Người giúp ông làm việc này, chính là ứng dụng mới vừa được Anthropic ra mắt: Claude Science.

Ngày 30 tháng 6 năm 2026, Anthropic ra mắt Claude Science, định vị là một bàn làm việc AI dành cho các nhà khoa học. (Nguồn ảnh: Blog chính thức Anthropic)
Theo giới thiệu của Anthropic, trước đây nhà khoa học này và nhóm của ông sẽ mất hai năm để làm xong công việc này.
Định vị mà Anthropic dành cho Claude Science, không phải là một mô hình nghiên cứu thông minh hơn, mà là một bàn làm việc AI dành cho các nhà khoa học.
Đột phá thực sự của nó nằm ở: lần đầu tiên chia nhỏ công việc nghiên cứu khoa học thành một quy trình có thể kiểm tra từng bước.
Hiện nay, Claude Science đã mở beta trên macOS và Linux, dành cho người dùng Pro, Max, Team, Enterprise.
Điều thực sự thay đổi, là toàn bộ chuỗi công cụ nghiên cứu
Người từng làm nghiên cứu đều hiểu sự rườm rà đó:
Một dự án phải nhảy qua lại giữa hàng chục cơ sở dữ liệu, mỗi cơ sở dữ liệu đều có lược đồ và ngôn ngữ truy vấn riêng;
Định dạng file đủ loại, mỗi loại đều phải tự xây dựng đường dẫn, tìm trình xem phù hợp;
Bên cạnh còn có hàng loạt công cụ, PubMed để tra tài liệu, Jupyter để chạy code, R để làm thống kê, cụm đầu cuối để nộp nhiệm vụ......
Liên tục chuyển đổi ngữ cảnh, thời gian thực sự dành cho suy nghĩ về vấn đề khoa học thường xuyên bị hao phí vào những công việc vận chuyển, ghép nối, gỡ lỗi này.
Việc mà Claude Science làm, chính là đóng gói và “thu gọn” tất cả các tình huống rời rạc này vào cùng một môi trường thực thi:
Phân tích tài liệu, tính toán nhiều bước, mài giũa biểu đồ, hoàn thành bản thảo bài báo, tất cả các giai đoạn đều hoàn thành trong cùng một môi trường, bạn không còn phải gián đoạn suy nghĩ chỉ để đổi công cụ.
Nó có thể chạy trên macOS hoặc Linux cục bộ của bạn, cũng có thể kết nối qua SSH đến máy từ xa, hoặc gắn vào node đăng nhập của cụm tính toán hiệu năng cao (HPC).
Giống như bạn thường dùng Jupyter vậy, dữ liệu ở đâu, nó sẽ đến đó.
Ngay cả việc điều phối năng lực tính toán, nó cũng đảm nhiệm.
Gập một protein, hoặc chạy một đường dẫn phân tích bộ gen trên dữ liệu khổng lồ, những công việc lớn như vậy trước đây đòi hỏi nhà nghiên cứu tự tay xử lý: dựng nhiệm vụ tính toán, xếp hàng chờ cụm, theo dõi thành công hay thất bại, rồi kéo kết quả về, đi về một lượt là nửa ngày đã hết.
Claude Science tiếp quản quy trình này: đầu tiên phác thảo kế hoạch, hỏi ý kiến bạn trước khi chạm vào tài nguyên mới, để bạn có thể kiểm tra hoặc hủy trước khi viết nhiệm vụ và nộp nhiệm vụ, mở rộng phân tích từ 1 GPU lên tới hàng trăm GPU.

Claude Science gửi một lần quét siêu tham số scVI 8 nhóm để chạy trên cụm A100 của phòng thí nghiệm, Notebook bên phải và tác nhân AI dùng chung một kernel thời gian thực, biến số và trạng thái đồng bộ theo thời gian thực. (Nguồn ảnh: Blog chính thức Anthropic)
Quan trọng hơn, dữ liệu nhạy cảm không rời khỏi hệ thống gốc, chỉ có ngữ cảnh thực sự cần thiết cho từng bước mới được gửi cho Claude.
Mỗi biểu đồ, đều đi kèm mã nguồn có thể truy nguyên
Nghề nghiên cứu vốn dĩ đã gắn liền với biểu đồ: cấu trúc ba chiều của protein, đường ray trình duyệt bộ gen, công thức cấu trúc hóa học, những thứ này vốn dĩ đã là đồ họa.
Claude Science theo hướng này, khi xuất biểu đồ và xuất bản thảo, đồng thời đưa ra mã nguồn tạo ra chúng, và có thể render chúng một cách nguyên bản.
Điều quan trọng hơn nằm ở khả năng tái tạo (reproducibility).
Mỗi khi Claude Science tạo ra một biểu đồ, nó sẽ đóng gói và “đính kèm” vào biểu đồ đó mã nguồn chính xác để tạo ra biểu đồ, môi trường chạy, giải thích bằng ngôn ngữ thuần túy và toàn bộ lịch sử hội thoại.

Bên trái là biểu đồ tế bào trải dài 138 loài, bên phải màn hình cùng hiển thị mã nguồn chính xác tạo ra nó, chỉ cần khoanh vùng và chú thích một câu là có thể yêu cầu tác nhân AI sửa biểu đồ. Mỗi kết quả đều có thể tái tạo, có thể truy nguyên về mã nguồn. (Nguồn ảnh: Blog chính thức Anthropic)
Một bài báo từ khi nộp đến khi đăng thường cách nhau nửa năm; vài tháng sau, khi người phản biện yêu cầu bạn chạy lại một biểu đồ nào đó, bạn có thể dễ dàng tái hiện lại toàn bộ chuỗi đầu vào, quy trình, kết quả ngay tại chỗ.
Muốn sửa biểu đồ? Chỉ cần nói là được - “bỏ đường lưới đi”, “trục tung đổi thành logarit”, tác nhân AI trực tiếp đi sửa mã nguồn mà nó đã viết.
Bạn còn có thể fork cuộc hội thoại tại bất kỳ thời điểm nào, thử đồng thời hai hướng suy nghĩ, luồng ban đầu không hề bị xáo trộn.
Nói ngắn gọn, lần đầu tiên nghiên cứu khoa học được tích hợp thành một luồng công việc có thể kiểm toán (auditable), code, môi trường, lịch sử đều được đưa vào một vòng khép kín.
Một tác nhân viết, một tác nhân khác chuyên bắt lỗi
Đằng sau Claude Science, không phải là một tác nhân AI đơn độc chiến đấu.
Bạn đang đối mặt với một tác nhân điều phối biết tổ chức, trong tay nắm giữ hơn 60 kỹ năng và bộ kết nối được cấu hình sẵn cho bộ gen, tế bào đơn, protein, sinh học cấu trúc, tin học hóa học.
Công việc nhiều lên, chính nó có thể tách ra thành nhiều tác nhân để phân công, cũng có thể gọi ngay tác nhân chuyên gia do chính bạn tạo ra.
Tuyệt vời nhất là tác nhân xem xét (reviewer agent).
Nó chuyên kiểm tra trích dẫn và tính toán, bắt ra những trích dẫn sai, những con số không truy xuất được nguồn, những biểu đồ không khớp với mã nguồn, phát hiện là đánh dấu và tự sửa.
Trong ví dụ của Viện Allen, nhóm đã sử dụng chính cặp actor-critic này, một tác nhân chịu trách nhiệm viết, một tác nhân khác chuyên đánh giá tính chính xác và độ thực của trích dẫn.
Cấu trúc này đã có chút hình dáng của “đánh giá ngang hàng nội bộ AI”.
Nhưng có một ranh giới phải nói rõ, toàn bộ quá trình đều có con người trong vòng lặp (human-in-the-loop).
Trước khi cần sử dụng tài nguyên mới, nó sẽ xin ủy quyền trước, mỗi quyết định bạn đều có thể xem xét lại, có thể hủy bỏ. Nó tự động hóa quy trình, chứ không phải tự động thay bạn khám phá khoa học.
Nó còn kết nối với NVIDIA BioNeMo Agent Toolkit, có thể kết nối nguyên bản với các mô hình khoa học sự sống như Evo 2, Boltz-2, OpenFold3.
Mô hình, dữ liệu, đường dẫn phân tích mà phòng thí nghiệm của bạn tự tin, cũng có thể lưu thành kỹ năng tái sử dụng rồi gắn vào, các cuộc hội thoại sau này tự động kế thừa.
Claude Science điểm đầu tiên là khoa học sự sống
Điểm rơi đầu tiên của Claude Science được chọn ở khoa học sự sống.
Bộ gen, tế bào đơn, protein, sinh học cấu trúc, tin học hóa học, dùng ngay.
Nó có thể đọc tài liệu, có thể truy vấn hơn 60 cơ sở dữ liệu khoa học, những cơ sở dữ liệu quy cách khác nhau như UniProt, PDB, Ensembl, ClinVar, ChEMBL, GEO, bạn không còn phải học sử dụng từng cái một.

Claude Science cấu hình sẵn môi trường cho bộ gen, tế bào đơn, protein, tin học hóa học, dựa vào hơn 60 cơ sở dữ liệu khoa học. (Nguồn ảnh: Blog chính thức Anthropic)
Manifold Bio làm về thuốc nhắm đích mô.
Họ dùng Claude Science để đề xuất đích nhắm cho thí nghiệm mới nhất, với mỗi mô và đích nhắm, đánh giá từng cái biểu hiện bề mặt, vận chuyển và tính an toàn, rồi sắp xếp ứng viên theo tiêu chuẩn mà công ty học được từ dữ liệu riêng.
Manifold nói, trợ lý lập trình thông thường không làm được điểm này, Claude Science có thể hoàn thành đầu cuối, lấy đúng dữ liệu, đưa ra quyết định đúng, và còn mang theo ngữ cảnh từ các dự án trước.
Còn có ví dụ cứng hơn nữa.
Một phó giáo sư dịch tễ học tại Trung tâm u não UCSF, dùng nó để nghiên cứu dịch tễ học phân tử u thần kinh đệm, phân tích hàng nghìn biến thể dòng mầm (germline) tác động nhỏ chồng chất như thế nào, định hình tính nhạy cảm cá thể.
Theo giới thiệu của Anthropic, bộ phân tích dòng mầm này, Claude Science đã chạy xong trong khoảng 1/10 thời gian so với trước đây, nhóm của ông còn độc lập kiểm tra lại kết quả, xác nhận vừa nhanh vừa ổn định.
Tuy nhiên, những tình huống tăng tốc 10 lần này, hiện chỉ giới hạn trong viết tổng quan, phân tích bộ gen, tự động hóa đường dẫn cụ thể, không tương đương với “tổng thể nghiên cứu khoa học tăng tốc 10 lần”.
Đồng thời, ngưỡng độ tin cậy của nghiên cứu cũng đang được định nghĩa lại.
Trước đây, đánh giá một nghiên cứu có đáng tin không, phải xem qua đánh giá ngang hàng, xem có thể được người khác tái tạo hay không.
Mà khả năng tái tạo, vốn là điểm đau lớn nhất trong nghiên cứu khoa học, mã nguồn mất, môi trường thay đổi, vài tháng sau tác giả cũng không thể chạy lại biểu đồ ban đầu.
Claude Science mỗi biểu đồ đều có mã nguồn có thể truy nguyên, mỗi kết quả đều liên kết với môi trường và lịch sử của nó. Rào cản tái tạo này, có thể nó là người đầu tiên vượt qua.
Cùng một đường đua, ba loại người chơi
Đường đua nghiên cứu sinh học, ba gã khổng lồ đều đang giành, chỉ là cách chơi khác nhau.
Google đặt cược vào mô hình độc quyền, OpenAI đặt cược vào trí thông minh nghiên cứu của mô hình, Anthropic thì đặt cược vào luồng công việc.
Google nắm giữ những mô hình riêng mà người khác không có như AlphaFold, AlphaGenome, trực tiếp xuống sân.
OpenAI đi một hướng khác.
Tháng 4 năm nay, họ ra mắt GPT-Rosalind, một mô hình tiên phong được xây dựng riêng cho suy luận sinh học và khám phá thuốc.
Giờ đây tiến thêm bước nữa, bắt đầu rèn luyện “khả năng đánh giá nghiên cứu” của mô hình.
Họ vừa mới ra mắt GeneBench-Pro, chuyên kiểm tra xem mô hình có thể đưa ra đánh giá như một nhà sinh học tính toán không: 129 câu hỏi, trải dài từ genomics, di truyền quần thể đến chẩn đoán lâm sàng, chuyên kiểm tra cảm giác “dữ liệu có đủ để hỗ trợ vấn đề này không”, “bước nào nên lật lại làm lại”.

GPT-5.6 Sol mạnh nhất đạt 28.7%, mở chế độ Pro đạt 31.5%; GPT-5 vài thế hệ trước còn chưa đến 5%.
OpenAI tự nói, với tốc độ này, cuối năm có thể bị làm mới hoàn toàn.
Nhưng dù mô hình mạnh đến đâu, cũng chỉ giải được chưa đến một phần ba. Mà phần không giải được đó, chính là vị trí của các nhà khoa học con người.
Điểm yếu của AI mà GeneBench-Pro phơi bày cũng rõ ràng:
Mô hình có thể mở đầu, nhưng không thể thu lại được vòng cuối cùng đó, ví dụ có nên loại bỏ một loạt dữ liệu bất thường không, giả thuyết bị bác bỏ thì sửa đường hướng như thế nào, những đánh giá như vậy vẫn phải do nhà khoa học tự quyết.
Claude Science cũng không né tránh điểm này, phương án giao cho người xem xét, mỗi quyết định để người hủy, nó tự động hóa quy trình, quyền đánh giá không giao cho mô hình, con người luôn ở trong vòng lặp.
Với các nhà khoa học như Lecoq, một bài tổng quan có thể tái tạo được không, vài tháng sau còn đứng vững không, vốn dĩ đã quan trọng hơn việc trên bảng xếp hạng cao hơn vài phần mười điểm phần trăm.
Claude Science đặt cược, chính là để AI nghiên cứu thực sự hòa vào sinh hoạt hàng ngày của phòng thí nghiệm.
Tài liệu tham khảo:
https://www.anthropic.com/news/claude-science-ai-workbench
https://openai.com/index/introducing-genebench-pro/
Bài viết này đến từ tài khoản công chúng WeChat “Tân Trí Nguyên”, tác giả: ASI Khải Thị Lục





