Trong giới AI, một sự cố đóng gói nhỏ đang tạo ra hiệu ứng "cánh bướm" và biến thành một bài giảng công khai đỉnh cao trong làng công nghệ.
Theo truyền thông, do sơ suất cấu hình của công cụ xây dựng Bun, 1.900 tệp TypeScript với tổng cộng 512.000 dòng mã nguồn của trình trợ lý lập trình Claude Code thuộc Anthropic đã bị rò rỉ ngoài ý muốn. Sự cố này không chỉ cho thế giới bên ngoài cái nhìn sâu vào nền tảng công nghệ của Agent đỉnh cao, mà còn phơi bày logic sâu xa của Anthropic trong việc kiểm soát thông tin và phát triển sản phẩm.
Toàn cảnh kiến trúc 5 tầng: Đây không chỉ là một giao diện "vỏ bọc"
Mã bị rò rỉ cho thấy một hệ thống cấp sản xuất cực kỳ phức tạp, với kiến trúc được chia rõ ràng thành năm tầng:
Tầng đầu vào (Entrypoints): Định tuyến thống nhất CLI, máy tính để bàn và SDK, đạt được chuẩn hóa đầu vào đa nền tảng.
Tầng thực thi (Runtime): Cốt lõi là vòng lặp TAOR (Suy nghĩ - Hành động - Quan sát - Lặp lại), duy trì nhịp hành vi của Agent.
Tầng động cơ (Engine): Trái tim của hệ thống, chịu trách nhiệm lắp ráp các gợi ý động (dynamic prompt). Tùy theo chế độ, nó tiêm hàng trăm mảnh gợi ý, chỉ riêng các quy tắc an toàn đã lên tới 5.677 token.
Tầng công cụ và năng lực (Tools & Caps): Tích hợp sẵn khoảng 40 công cụ độc lập, mỗi công cụ đều có sự cách ly quyền hạn nghiêm ngặt.
Tầng cơ sở hạ tầng (Infrastructure): Quản lý bộ nhớ đệm gợi ý và điều khiển từ xa, thậm chí bao gồm cả một "công tắc giết" (kill switch) có thể vô hiệu hóa từ xa.
Thiết kế mô phỏng sinh học: Bộ nhớ phân tầng và cơ chế "giấc ngủ REM"
Hệ thống bộ nhớ của Claude Code phù hợp cao với khoa học nhận thức:
Ba tầng bộ nhớ: Chia thành bộ nhớ ngữ nghĩa dài hạn (truy xuất RAG), bộ nhớ tình huống (chuỗi hội thoại) và bộ nhớ làm việc (ngữ cảnh hiện tại), ý tưởng cốt lõi là "lấy theo nhu cầu, tuyệt đối không nhồi nhét".
Cơ chế Auto-Dream: Tầng cơ sở hạ tầng có một tiến trình nền tên là "mơ". Cứ sau 24 giờ hoặc 5 phiên làm việc, hệ thống sẽ khởi chạy một agent con để tích hợp bộ nhớ, dọn dẹp nhiễu, củng cố các diễn đạt mơ hồ thành kiến thức xác định.
Bộ ba kiểm soát thông tin: Chế độ Undercover và chống chưng cất
"Phòng tuyến" lộ ra trong mã nguồn thể hiện tư duy kiểm soát thông tin chặt chẽ của Anthropic:
Chế độ Undercover: Tự động kích hoạt khi thao tác trên kho lưu trữ không phải nội bộ, loại bỏ tất cả định danh AI, thực hiện "đóng góp trong bóng tối".
Cơ chế chống chưng cất (ANTI_DISTILLATION): Khi bật, nó sẽ tiêm các định nghĩa công cụ giả vào gợi ý, ngăn chặn đối thủ cạnh tranh huấn luyện mô hình của họ thông qua lưu lượng API.
Xác thực gốc (Native Authentication): Sử dụng xác thực cấp phần cứng ở tầng Bun/Zig, ngăn chặn bên thứ ba giả mạo hoặc làm giả ứng dụng khách chính thức.
Lộ trình tương lai: Chế độ KAIROS và trợ lý "không bao giờ ngủ"
Cờ tính năng (Feature Flag) bị rò rỉ dự báo chức năng thế hệ tiếp theo: chế độ KAIROS. Đây là một agent nền chạy liên tục, hỗ trợ đăng ký GitHub Webhook và làm mới định kỳ Cron. Điều này có nghĩa AI sẽ chuyển từ một công cụ "chỉ động khi được gọi" thành một cộng tác viên trực tuyến 24/24 giờ, có thể tự quan sát và chủ động hành động.
Kết luận: Mã bị rò rỉ, sự tích lũy không thể sao chép
Mặc dù Anthropic đã gấp rút gỡ xuống phiên bản liên quan và gửi thông báo DMCA, nhưng tư tưởng kiến trúc của Claude Code đã phát triển mạnh mẽ trong cộng đồng. Đối với ngành, đây có lẽ là "thực tiễn tốt nhất" đầu tiên trong lĩnh vực Agent được xác minh quy mô lớn trong sản xuất; còn đối với Anthropic, việc làm thế nào để tìm lại sự cân bằng giữa tính minh bạch cao và bảo mật sẽ là một chủ đề then chốt trên con đường IPO năm 2026 của họ.






