# Bài viết Liên quan Mã

Trung tâm Tin tức HTX cung cấp những bài viết mới nhất và phân tích chuyên sâu về "Mã", bao gồm xu hướng thị trường, cập nhật dự án, phát triển công nghệ và chính sách quản lý trong ngành tiền kỹ thuật số.

Đội ngũ NVIDIA để lập trình viên Agent tiếp quản thí nghiệm robot thực, tỷ lệ thành công đạt 99%

Nghiên cứu tự động hóa đã vượt ra khỏi môi trường mô phỏng để bước vào thế giới vật lý thực tế. NVIDIA GEAR Lab mới đây giới thiệu dự án ENPIRE - một hệ thống lần đầu tiên cho phép các Agent lập trình (Codex Agent) tự động tiến hành nghiên cứu trực tiếp trên phần cứng robot. Chỉ với mục tiêu chung là giải quyết nhiệm vụ nhanh chóng, giữ robot hoạt động an toàn và không lãng phí tài nguyên tính toán, 8 Agent được triển khai trong một đội robot và tự động vận hành toàn bộ vòng lặp khép kín: tự đặt lại môi trường, tìm kiếm tài liệu, lập ý tưởng và xây dựng cơ sở hạ tầng, đào tạo và triển khai chiến lược, tự xác minh, phân tích nhật ký và cải thiện mã code. Quá trình này lặp lại cho đến khi robot hoàn thành đáng tin cậy các nhiệm vụ khéo léo phức tạp trong thực tế như buộc dây rút, sắp xếp kim vào hộp hay lắp đặt GPU, với tỷ lệ thành công lên tới 99%. Hệ thống ENPIRE được xây dựng dựa trên bốn mô-đun cốt lõi tạo thành vòng phản hồi vật lý có thể lặp lại. Một phát hiện quan trọng là việc đặt lại môi trường thường dễ dàng hơn việc hoàn thành nhiệm vụ chính. Do đó, ENPIRE tập trung vào việc để Agent tự xây dựng quy trình đặt lại môi trường tự động trước. Nghiên cứu cũng chỉ ra "định luật mở rộng vật lý": tăng số lượng robot chạy song song (ví dụ lên 8 robot) giúp tăng tốc độ giải quyết nhiệm vụ đáng kể. Để đo lường hiệu quả, nhóm nghiên cứu đề xuất hai chỉ số mới: Tỷ lệ sử dụng robot trung bình (MRU) và Tỷ lệ sử dụng token trung bình (MTU). Mục tiêu tương lai là hệ thống có thể tự vận hành và lặp lại qua đêm mà không cần con người can thiệp. Dự án ENPIRE dự kiến sẽ được mã nguồn mở, cho phép các nhà phát triển tự xây dựng hệ thống nghiên cứu robot tự động tương tự.

marsbitHôm qua 00:36

Đội ngũ NVIDIA để lập trình viên Agent tiếp quản thí nghiệm robot thực, tỷ lệ thành công đạt 99%

marsbitHôm qua 00:36

Bất ngờ! Anthropic kêu gọi toàn ngành ngừng nghiên cứu AI

Bài viết thảo luận về lời kêu gọi tạm dừng nghiên cứu AI từ Anthropic, dựa trên quan sát về khả năng "tự tiến hóa" (recursive self-improvement - RSI) của AI, cụ thể là mô hình Claude. Dữ liệu nội bộ cho thấy Claude đang đẩy nhanh tiến trình phát triển AI: hơn 80% codebase của Anthropic hiện do Claude viết, so với chỉ số ít trước khi Claude Code ra mắt. Năng suất của kỹ sư tăng gấp 8 lần. Quan trọng hơn, chất lượng code của Claude được đánh giá ngang bằng con người và dự kiến vượt trội trong năm nay. Tỷ lệ thành công của Claude trong các nhiệm vụ lập trình phức tạp nhất đã tăng từ 26% lên 76% chỉ trong nửa năm. Anthropic giới thiệu chỉ số "thời gian nhiệm vụ AI có thể hoàn thành độc lập", cho thấy tốc độ tăng trưởng theo cấp số nhân, từ 4 phút (3/2024) lên 16 giờ (hiện tại), với chu kỳ tăng gấp đôi rút ngắn từ 7 tháng xuống 4 tháng. Claude không chỉ viết code mà còn tự động review code, ngăn chặn được khoảng 1/3 lỗi nghiêm trọng. Trong nghiên cứu, Claude đã tối ưu hóa code chạy nhanh hơn 52 lần và tự thiết kế/thực hiện thí nghiệm AI safety, đạt kết quả vượt xa nỗ lực của con người. Bài viết đặt câu hỏi về tương lai khi vai trò con người trong phát triển AI đang thu hẹp lại, chỉ còn lại ưu thế về "khiếu nghiên cứu". Anthropic nêu ba kịch bản có thể xảy ra: (1) Tiến bộ chững lại, (2) AI tiếp tục tăng tốc nhưng con người vẫn kiểm soát, (3) AI đạt đến RSI hoàn toàn, tự thiết kế thế hệ kế tiếp, mang lại lợi ích to lớn hoặc rủi ro mất kiểm soát nếu vấn đề "alignment" thất bại. Do những rủi ro tiềm ẩn này, Anthropic đề xuất một cơ chế có thể xác minh để các phòng lab AI cùng giảm tốc hoặc tạm dừng, nếu đảm bảo không có bên nào "lén lút" phát triển. Lời kêu gọi này trở nên đáng chú ý hơn khi OpenAI cũng gần đây chia sẻ quan sát tương tự về dấu hiệu tự tiến hóa sớm của AI.

marsbit06/05 00:29

Bất ngờ! Anthropic kêu gọi toàn ngành ngừng nghiên cứu AI

marsbit06/05 00:29

Nguồn tin nội bộ: DeepSeek đang thành lập nhóm Harness, đối đầu với Claude Code

Theo nguồn tin thân cận với DeepSeek, công ty này đang tổ chức một đội ngũ mới có tên "Harness" để phát triển sản phẩm trợ lý mã nguồn thông minh, trực tiếp đối đầu với Claude Code của Anthropic. Thông tin được xác nhận bởi nhà nghiên cứu kỳ cựu Trần Đức Lý thông qua mạng xã hội. DeepSeek đang tuyển dụng hai vị trí then chốt: Quản lý sản phẩm Harness và Kỹ sư phát triển Harness tại Bắc Kinh. Điều đáng chú ý là họ định nghĩa công thức cốt lõi: "Mô hình + Harness = Tác tử (Agent)". Điều này cho thấy DeepSeek không chỉ đơn thuần tạo một plugin trợ lý mã nguồn, mà đang bổ sung lớp trung gian kết nối mô hình với quy trình công việc thực tế, bao gồm quản lý ngữ cảnh, gọi công cụ, lập kế hoạch, đọc/ghi tệp và thực thi lệnh. Bài viết phân tích rằng cuộc cạnh tranh AI trong lập trình đang chuyển từ khả năng mô hình sang việc chiếm lĩnh luồng công việc của nhà phát triển. Mặc dù DeepSeek đã có nền tảng mô hình mã nguồn mạnh (DeepSeek-Coder), họ cần một sản phẩm chính thức tích hợp sâu vào quy trình làm việc. Sự nổi lên của dự án cộng đồng DeepSeek-TUI - một tác tử mã nguồn chạy trên terminal - chứng tỏ nhu cầu thị trường và sự thiếu vắng một giải pháp Harness chính thức. Harness chính thức từ DeepSeek sẽ có lợi thế mà dự án cộng đồng không có: khả năng cộng tác với đội ngũ mô hình, thiết kế giao diện, vòng lặp dữ liệu huấn luyện khép kín và tiếp cận các tình huống công việc thực tế. Động thái này đánh dấu việc DeepSeek chính thức tham gia vào "cuộc chiến Tác tử", trang bị cho mô hình của mình khả năng hành động trong môi trường thực.

链捕手05/22 02:18

Nguồn tin nội bộ: DeepSeek đang thành lập nhóm Harness, đối đầu với Claude Code

链捕手05/22 02:18

Lần đầu tiên sau ba năm, Người bảo trì cốt lõi thứ 6 của Bitcoin ra đời

Ngày 8/1, Bitcoin Core đã bổ nhiệm nhà phát triển TheCharlatan trở thành người bảo trì cốt lõi thứ sáu, nắm giữ khóa tin cậy (Trusted Keys) - lần đầu tiên sau 3 năm. Nhóm hiện có 6 người bảo trì cốt lõi, bao gồm Marco Falke, Gloria Zhao, Ryan Ofsky, Hennadii Stepanov, Ava Chow và TheCharlatan. Trong thập kỷ qua, chỉ 13 người được cấp quyền này. Bitcoin Core là nhóm phát triển chính của mạng Bitcoin, chịu trách nhiệm viết, bảo trì, kiểm thử và phát hành phần mềm nút đầy đủ. Nhóm có 41 thành viên, nhưng chỉ 6 người bảo trì cốt lõi có quyền hợp nhất mã vào kho lưu trữ chính thức và ký xác nhận các bản phát hành, đảm bảo tính an toàn và chính thức của phần mềm. Tuy nhiên, họ không có quyền thay đổi quy tắc trên chuỗi; mọi nâng cấp đều cần sự đồng thuận của người dùng và thợ đào. TheCharlatan, tốt nghiệp khoa học máy tính tại Đại học Zurich, có hơn 8 năm kinh nghiệm phát triển Bitcoin Core, tập trung vào khả năng tái sản xuất và logic xác thực. Anh được cộng đồng đánh giá cao và nhận được sự ủng hộ của ít nhất 20 thành viên khi được đề cử. Ngoài Bitcoin, TheCharlatan cũng từng đóng góp cho các dự án như Farcaster và quan tâm đến Monero.

Odaily星球日报01/14 10:10

Lần đầu tiên sau ba năm, Người bảo trì cốt lõi thứ 6 của Bitcoin ra đời

Odaily星球日报01/14 10:10

活动图片