# Bài viết Liên quan Mã

Trung tâm Tin tức HTX cung cấp những bài viết mới nhất và phân tích chuyên sâu về "Mã", bao gồm xu hướng thị trường, cập nhật dự án, phát triển công nghệ và chính sách quản lý trong ngành tiền kỹ thuật số.

Đội ngũ NVIDIA để lập trình viên Agent tiếp quản thí nghiệm robot thực, tỷ lệ thành công đạt 99%

Nghiên cứu tự động hóa đã vượt ra khỏi môi trường mô phỏng để bước vào thế giới vật lý thực tế. NVIDIA GEAR Lab mới đây giới thiệu dự án ENPIRE - một hệ thống lần đầu tiên cho phép các Agent lập trình (Codex Agent) tự động tiến hành nghiên cứu trực tiếp trên phần cứng robot. Chỉ với mục tiêu chung là giải quyết nhiệm vụ nhanh chóng, giữ robot hoạt động an toàn và không lãng phí tài nguyên tính toán, 8 Agent được triển khai trong một đội robot và tự động vận hành toàn bộ vòng lặp khép kín: tự đặt lại môi trường, tìm kiếm tài liệu, lập ý tưởng và xây dựng cơ sở hạ tầng, đào tạo và triển khai chiến lược, tự xác minh, phân tích nhật ký và cải thiện mã code. Quá trình này lặp lại cho đến khi robot hoàn thành đáng tin cậy các nhiệm vụ khéo léo phức tạp trong thực tế như buộc dây rút, sắp xếp kim vào hộp hay lắp đặt GPU, với tỷ lệ thành công lên tới 99%. Hệ thống ENPIRE được xây dựng dựa trên bốn mô-đun cốt lõi tạo thành vòng phản hồi vật lý có thể lặp lại. Một phát hiện quan trọng là việc đặt lại môi trường thường dễ dàng hơn việc hoàn thành nhiệm vụ chính. Do đó, ENPIRE tập trung vào việc để Agent tự xây dựng quy trình đặt lại môi trường tự động trước. Nghiên cứu cũng chỉ ra "định luật mở rộng vật lý": tăng số lượng robot chạy song song (ví dụ lên 8 robot) giúp tăng tốc độ giải quyết nhiệm vụ đáng kể. Để đo lường hiệu quả, nhóm nghiên cứu đề xuất hai chỉ số mới: Tỷ lệ sử dụng robot trung bình (MRU) và Tỷ lệ sử dụng token trung bình (MTU). Mục tiêu tương lai là hệ thống có thể tự vận hành và lặp lại qua đêm mà không cần con người can thiệp. Dự án ENPIRE dự kiến sẽ được mã nguồn mở, cho phép các nhà phát triển tự xây dựng hệ thống nghiên cứu robot tự động tương tự.

marsbitHôm qua 00:36

Đội ngũ NVIDIA để lập trình viên Agent tiếp quản thí nghiệm robot thực, tỷ lệ thành công đạt 99%

marsbitHôm qua 00:36

Bất ngờ! Anthropic kêu gọi toàn ngành ngừng nghiên cứu AI

Bài viết thảo luận về lời kêu gọi tạm dừng nghiên cứu AI từ Anthropic, dựa trên quan sát về khả năng "tự tiến hóa" (recursive self-improvement - RSI) của AI, cụ thể là mô hình Claude. Dữ liệu nội bộ cho thấy Claude đang đẩy nhanh tiến trình phát triển AI: hơn 80% codebase của Anthropic hiện do Claude viết, so với chỉ số ít trước khi Claude Code ra mắt. Năng suất của kỹ sư tăng gấp 8 lần. Quan trọng hơn, chất lượng code của Claude được đánh giá ngang bằng con người và dự kiến vượt trội trong năm nay. Tỷ lệ thành công của Claude trong các nhiệm vụ lập trình phức tạp nhất đã tăng từ 26% lên 76% chỉ trong nửa năm. Anthropic giới thiệu chỉ số "thời gian nhiệm vụ AI có thể hoàn thành độc lập", cho thấy tốc độ tăng trưởng theo cấp số nhân, từ 4 phút (3/2024) lên 16 giờ (hiện tại), với chu kỳ tăng gấp đôi rút ngắn từ 7 tháng xuống 4 tháng. Claude không chỉ viết code mà còn tự động review code, ngăn chặn được khoảng 1/3 lỗi nghiêm trọng. Trong nghiên cứu, Claude đã tối ưu hóa code chạy nhanh hơn 52 lần và tự thiết kế/thực hiện thí nghiệm AI safety, đạt kết quả vượt xa nỗ lực của con người. Bài viết đặt câu hỏi về tương lai khi vai trò con người trong phát triển AI đang thu hẹp lại, chỉ còn lại ưu thế về "khiếu nghiên cứu". Anthropic nêu ba kịch bản có thể xảy ra: (1) Tiến bộ chững lại, (2) AI tiếp tục tăng tốc nhưng con người vẫn kiểm soát, (3) AI đạt đến RSI hoàn toàn, tự thiết kế thế hệ kế tiếp, mang lại lợi ích to lớn hoặc rủi ro mất kiểm soát nếu vấn đề "alignment" thất bại. Do những rủi ro tiềm ẩn này, Anthropic đề xuất một cơ chế có thể xác minh để các phòng lab AI cùng giảm tốc hoặc tạm dừng, nếu đảm bảo không có bên nào "lén lút" phát triển. Lời kêu gọi này trở nên đáng chú ý hơn khi OpenAI cũng gần đây chia sẻ quan sát tương tự về dấu hiệu tự tiến hóa sớm của AI.

marsbit06/05 00:29

Bất ngờ! Anthropic kêu gọi toàn ngành ngừng nghiên cứu AI

marsbit06/05 00:29

Vừa rồi, Claude Opus 4.8 chính thức ra mắt, mở miệng đã tự nhận mình là DeepSeek, Qwen

Anthropic vừa công bố Claude Opus 4.8, nâng cấp mô hình flagship với cải thiện về lập trình, tác vủ agent, suy luận và công việc tri thức, đồng thời giữ nguyên giá. Mô hình này được cho là trung thực hơn, ít đưa ra kết luận thiếu căn cứ. Tuy nhiên, một số người dùng phát hiện nó đôi khi tự nhận là DeepSeek hay Qwen. Cùng lúc, Anthropic công bố hoàn thành vòng gọi vốn H trị giá 650 tỷ USD, định giá sau gần 10.000 tỷ USD. Khoản tiền này nhằm mở rộng năng lực hạ tầng điện toán thông qua thỏa thuận với Amazon, Google, Broadcom và SpaceX. Bên cạnh mô hình mới, Anthropic ra mắt tính năng "dynamic workflows" trong Claude Code, cho phép tạo và quản lý hàng trăm agent con song song để xử lý các nhiệm vụ kỹ thuật phức tạp như di chuyển codebase quy mô lớn, thể hiện qua ví dụ chuyển Bun từ Zig sang Rust. Các bản cập nhật này cho thấy Anthropic đang chuyển từ một công ty cung cấp mô hình thuần túy sang một nền tảng tích hợp AI vào quy trình làm việc và hệ thống doanh nghiệp.

marsbit05/28 23:59

Vừa rồi, Claude Opus 4.8 chính thức ra mắt, mở miệng đã tự nhận mình là DeepSeek, Qwen

marsbit05/28 23:59

Nguồn tin nội bộ: DeepSeek đang thành lập nhóm Harness, đối đầu với Claude Code

Theo nguồn tin thân cận với DeepSeek, công ty này đang tổ chức một đội ngũ mới có tên "Harness" để phát triển sản phẩm trợ lý mã nguồn thông minh, trực tiếp đối đầu với Claude Code của Anthropic. Thông tin được xác nhận bởi nhà nghiên cứu kỳ cựu Trần Đức Lý thông qua mạng xã hội. DeepSeek đang tuyển dụng hai vị trí then chốt: Quản lý sản phẩm Harness và Kỹ sư phát triển Harness tại Bắc Kinh. Điều đáng chú ý là họ định nghĩa công thức cốt lõi: "Mô hình + Harness = Tác tử (Agent)". Điều này cho thấy DeepSeek không chỉ đơn thuần tạo một plugin trợ lý mã nguồn, mà đang bổ sung lớp trung gian kết nối mô hình với quy trình công việc thực tế, bao gồm quản lý ngữ cảnh, gọi công cụ, lập kế hoạch, đọc/ghi tệp và thực thi lệnh. Bài viết phân tích rằng cuộc cạnh tranh AI trong lập trình đang chuyển từ khả năng mô hình sang việc chiếm lĩnh luồng công việc của nhà phát triển. Mặc dù DeepSeek đã có nền tảng mô hình mã nguồn mạnh (DeepSeek-Coder), họ cần một sản phẩm chính thức tích hợp sâu vào quy trình làm việc. Sự nổi lên của dự án cộng đồng DeepSeek-TUI - một tác tử mã nguồn chạy trên terminal - chứng tỏ nhu cầu thị trường và sự thiếu vắng một giải pháp Harness chính thức. Harness chính thức từ DeepSeek sẽ có lợi thế mà dự án cộng đồng không có: khả năng cộng tác với đội ngũ mô hình, thiết kế giao diện, vòng lặp dữ liệu huấn luyện khép kín và tiếp cận các tình huống công việc thực tế. Động thái này đánh dấu việc DeepSeek chính thức tham gia vào "cuộc chiến Tác tử", trang bị cho mô hình của mình khả năng hành động trong môi trường thực.

链捕手05/22 02:18

Nguồn tin nội bộ: DeepSeek đang thành lập nhóm Harness, đối đầu với Claude Code

链捕手05/22 02:18

Trải nghiệm thực tế Hunyuan Hy3 preview: Cuối cùng Tencent AI cũng đã có thể chiến đấu?

Bài viết đánh giá Tencent Hunyuan Hy3 Preview, mô hình ngôn ngữ mới nhất của Tencent với 295B tham số, hỗ trợ ngữ cảnh lên đến 256K. Mô hình được phát triển dưới sự dẫn dắt của Yao Shunyu, tập trung vào nâng cao khả năng suy luận, tuân thủ chỉ dẫn, học từ ngữ cảnh, tạo mã và hoạt động agent. Về suy luận, Hy3 Preview xử lý tốt logic phức tạp nhưng còn hạn chế với câu đố mẹo. Trong học ngữ cảnh và tuân thủ chỉ dẫn, mô hình thể hiện khả năng ổn định trong việc trích xuất thông tin và hiểu quy tắc mới. Về mã và agent, nó có thể gọi công cụ thành thạo nhưng đôi khi thiếu hoàn thiện trong giao nhiệm vụ. Trong hội thoại tự nhiên, Hy3 Preview giảm bớt "cảm giác AI", tạo văn bản trôi chảy, tự nhiên hơn. Tóm lại, Hy3 Preview là mô hình thực tế, ổn định trên nhiều mặt, đánh dấu bước tiến quan trọng của Tencent trong lĩnh vực AI, dù vẫn cần cải thiện thêm. Hiện mô hình đã được tích hợp vào các sản phẩm chính của Tencent như Tencent Cloud, Yuanbao và WorkBuddy.

marsbit04/26 07:20

Trải nghiệm thực tế Hunyuan Hy3 preview: Cuối cùng Tencent AI cũng đã có thể chiến đấu?

marsbit04/26 07:20

Anthropic thử nghiệm "Conway" hỗ trợ giao diện độc lập, kích hoạt qua Webhook và tiêu chuẩn mở rộng tùy chỉnh

Anthropic đang phát triển Conway, một giải pháp tác nhân thường trú (persistent agent) nhằm tạo ra môi trường thông minh luôn hoạt động và độc lập cho Claude. Conway sẽ có giao diện người dùng (UI) độc lập, vượt khỏi giới hạn giao diện trò chuyện truyền thống, cho phép thao tác trực tiếp trên trình duyệt, kết nối với các bên ngoài và tích hợp chức năng Claude Code để xử lý tác vụ sâu hơn. Giải pháp này hỗ trợ kích hoạt qua Webhook, giúp các dịch vụ hoặc sự kiện bên ngoài có thể kích hoạt công việc của tác nhân, nâng cao khả năng tự động hóa. Conway cũng sẽ đi kèm với hệ thống tiện ích mở rộng, sử dụng chuẩn CNW ZIP để nhà phát triển xây dựng công cụ tùy chỉnh, tab giao diện và bộ xử lý ngữ cảnh, tạo ra hệ sinh thái mở rộng linh hoạt. Conway được kỳ vọng sẽ biến Claude từ công cụ trò chuyện thụ động thành trợ lý thường trú, có khả năng tự thực hiện các tác vụ đa bước, đồng thời thúc đẩy xu hướng AI agent "luôn bật" (always-on) trong ngành.

marsbit04/02 06:32

Anthropic thử nghiệm "Conway" hỗ trợ giao diện độc lập, kích hoạt qua Webhook và tiêu chuẩn mở rộng tùy chỉnh

marsbit04/02 06:32

Sự cố rò rỉ Claude Code: Hé lộ kiến trúc 5 tầng và triết lý sinh tồn của AI Agent đỉnh cao

Sự cố rò rỉ mã nguồn Claude Code của Anthropic đã vô tình tiết lộ kiến trúc năm tầng phức tạp của một AI Agent đỉnh cao. Hệ thống bao gồm: Lớp đầu vào (Entrypoints), Lớp runtime (vòng lặp TAOR), Lớp động cơ (xử lý prompt), Lớp công cụ (40 tool với cách ly quyền hạn), và Lớp cơ sở hạ tầng. Các tính năng nổi bật bao gồm hệ thống bộ nhớ ba cấp (dài hạn, tình huống, công việc), cơ chế "Auto-Dream" để dọn dẹp và củng cố kiến thức, cùng các biện pháp kiểm soát thông tin chặt chẽ như chế độ Undercover và cơ chế ANTI_DISTILLATION chống đối thủ sao chép. Rò rỉ cũng tiết lộ tính năng tương lai KAIROS - một trợ lý chạy liên tục 24/7. Dù mã nguồn bị lộ, đây được xem như một case study quý giá về best practice trong lĩnh vực Agent, đồng thời đặt ra cho Anthropic thách thức cân bằng giữa minh bạch và bảo mật.

marsbit04/02 01:09

Sự cố rò rỉ Claude Code: Hé lộ kiến trúc 5 tầng và triết lý sinh tồn của AI Agent đỉnh cao

marsbit04/02 01:09

Curve Finance Tố Cáo PancakeSwap Sao Chép Mã StableSwap

Sàn giao dịch phi tập trung Curve Finance đã cáo buộc PancakeSwap sử dụng mã độc quyền của họ để vận hành tính năng StableSwap mà không được cấp phép. Thông báo được đăng trên X vào ngày 6/3, nhấn mạnh đây là hành vi vi phạm giấy phép StableSwap, đồng thời cảnh báo về rủi ro pháp lý và kỹ thuật khi sao chép phần mềm tài chính. Curve đề nghị PancakeSwap liên hệ để thảo luận về việc cấp phép và hợp tác. Sự việc xảy ra sau khi PancakeSwap công bố tích hợp StableSwap trên nền tảng Infinity của họ vào ngày 2/3. Hiện cả hai bên đã bắt đầu đàm phán kín, mở ra khả năng hợp tác chiến lược hoặc ký kết thỏa thuận cấp phép. Kết quả vụ việc được kỳ vọng sẽ tạo tiền lệ quan trọng về bảo vệ tài sản trí tuệ trong không gian mã nguồn mở.

TheNewsCrypto03/07 05:56

Curve Finance Tố Cáo PancakeSwap Sao Chép Mã StableSwap

TheNewsCrypto03/07 05:56

Một người đam mê Monero, làm thế nào để trở thành 'Người gác cổng' của Bitcoin?

Một người đam mê Monero trở thành "người gác cửa" của Bitcoin: TheCharlatan được bổ nhiệm là người bảo trì chính thứ 6 của Bitcoin Core. Với hơn 8 năm đóng góp cho dự án, anh tập trung vào khả năng tái sản xuất và logic xác thực, được cộng đồng đánh giá cao nhờ sự đáng tin cậy và hiểu biết sâu. Chỉ có 6 người nắm giữ "khóa tin cậy" toàn cầu này, có quyền ký và phát hành mã chính thức, đảm bảo tính bảo mật nhưng không kiểm soát các thay đổi quy tắc chuỗi. TheCharlatan từng nghiên cứu về Monero và thể hiện quan điểm nguyên tắc cứng rắn: "Tiền mặt trên internet. Không cập nhật tự động".

比推01/14 15:11

Một người đam mê Monero, làm thế nào để trở thành 'Người gác cổng' của Bitcoin?

比推01/14 15:11

Lần đầu tiên sau ba năm, Người bảo trì cốt lõi thứ 6 của Bitcoin ra đời

Ngày 8/1, Bitcoin Core đã bổ nhiệm nhà phát triển TheCharlatan trở thành người bảo trì cốt lõi thứ sáu, nắm giữ khóa tin cậy (Trusted Keys) - lần đầu tiên sau 3 năm. Nhóm hiện có 6 người bảo trì cốt lõi, bao gồm Marco Falke, Gloria Zhao, Ryan Ofsky, Hennadii Stepanov, Ava Chow và TheCharlatan. Trong thập kỷ qua, chỉ 13 người được cấp quyền này. Bitcoin Core là nhóm phát triển chính của mạng Bitcoin, chịu trách nhiệm viết, bảo trì, kiểm thử và phát hành phần mềm nút đầy đủ. Nhóm có 41 thành viên, nhưng chỉ 6 người bảo trì cốt lõi có quyền hợp nhất mã vào kho lưu trữ chính thức và ký xác nhận các bản phát hành, đảm bảo tính an toàn và chính thức của phần mềm. Tuy nhiên, họ không có quyền thay đổi quy tắc trên chuỗi; mọi nâng cấp đều cần sự đồng thuận của người dùng và thợ đào. TheCharlatan, tốt nghiệp khoa học máy tính tại Đại học Zurich, có hơn 8 năm kinh nghiệm phát triển Bitcoin Core, tập trung vào khả năng tái sản xuất và logic xác thực. Anh được cộng đồng đánh giá cao và nhận được sự ủng hộ của ít nhất 20 thành viên khi được đề cử. Ngoài Bitcoin, TheCharlatan cũng từng đóng góp cho các dự án như Farcaster và quan tâm đến Monero.

Odaily星球日报01/14 10:10

Lần đầu tiên sau ba năm, Người bảo trì cốt lõi thứ 6 của Bitcoin ra đời