Karpathy Lại Lập Kỳ Tích, Lật Đổ RAG, Biến Ghi Chú Của Bạn Thành Bộ Não Thứ Hai

marsbitXuất bản vào 2026-07-01Cập nhật gần nhất vào 2026-07-01

Tóm tắt

Karpathy đã đề xuất một phương pháp cách mạng thay thế RAG truyền thống: xem ghi chú cá nhân là "mã nguồn" và sử dụng LLM làm "trình biên dịch" để xây dựng một wiki kiến thức cấu trúc và tự động. Trong mô hình LLM-WIKI này, tri thức được "biên dịch" một lần và duy trì liên tục, thay vì tái tạo lại mỗi khi truy vấn. Hệ thống có ba lớp: Raw (nguyên liệu thô không thể chỉnh sửa), Schema (quy tắc cấu trúc) và Wiki (sản phẩm biên dịch tự động, được liên kết chéo và cập nhật). Quy trình chính bao gồm Ingest (nạp tài liệu mới, tự động cập nhật các trang liên quan), Query (truy vấn wiki với câu trả lời có trích dẫn) và Lint (kiểm tra lỗi logic và mâu thuẫn). Phương pháp này giải quyết vấn đề suy giảm hiệu quả của RAG và bản đồ tri thức thủ công, đồng thời hiện thực hóa tầm nhìn về máy Memex từ năm 1945 bằng cách tự động hóa công việc bảo trì "ghi sổ" tẻ nhạt. Bản chất là một sự chuyển dịch quan hệ sản xuất nhận thức: AI đảm nhận việc quản lý, tổ chức và kết nối tri thức, giải phóng sự chú ý của con người cho các nhiệm vụ sáng tạo và chiến lược như lựa chọn thông tin và suy ngẫm ý nghĩa.

Sưu tầm không bằng sở hữu, đánh dấu không có nghĩa là hiểu.

Những bài viết sâu sắc khiến bạn dậy sóng lúc 2 giờ sáng, những liên kết hai chiều chằng chịt được kéo ra trong Obsidian, những cơ sở dữ liệu được xếp đặt cẩn thận trong Notion, tất cả đều là những "xác ướp kỹ thuật số" nằm im trong phần mềm ghi chú.

Biểu đồ tri thức trông hùng vĩ, nhưng thực ra đã mục nát từ lâu.

Đây là thất bại mang tính hệ thống của cả một thời đại quá tải thông tin.

Karpathy, kỹ sư hiện tại của Anthropic, đồng sáng lập viên cũ của OpenAI, cựu giám đốc AI của Tesla, không thể chịu đựng được nữa, đã ném xuống một quả bom.

Cổng dịch chuyển:https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f

Anh ấy không công bố mô hình mới, không phát hành framework mới, anh ấy chỉ nói: Hãy coi ghi chú của bạn là mã nguồn bất biến, để LLM làm trình biên dịch.

Hai tháng trôi qua, tài liệu này đã gây ra một cuộc di cư âm thầm nhưng dữ dội trong cộng đồng Obsidian, Claude, Cursor.

Một số người đã mở rộng Wiki của họ lên hàng trăm trang, hàng chục vạn từ.

Các plugin tự động hóa bắt đầu xuất hiện. Nhà nghiên cứu học thuật, doanh nhân khởi nghiệp độc lập, người học suốt đời đang chuyển hướng tập thể sang một quan hệ sản xuất tri thức hoàn toàn mới.

Hoàng hôn của RAG, vận chuyển thông tin không cứu được tư tưởng của bạn

Trước khi LLM-WIKI xuất hiện, giải pháp chủ lưu là RAG (Retrieval-Augmented Generation).

Nói đơn giản, là gắn cho mô hình lớn một "người lục lọi": khi bạn hỏi, nó đi tìm trong ghi chú của bạn một vài đoạn trích, rồi ghép lại thành một câu trả lời.

Nghe thì hay, nhưng người dùng qua đều biết cái khoảng cách giữa "mẫu quảng cáo" và "hàng thật nhận được".

Nó chỉ là khuân vác: RAG chỉ xử lý được cục bộ, không thể hiểu toàn cục.

Nó có thể nói cho bạn biết bài ghi chú thứ 5 nhắc đến A, nhưng nó không thể nói cho bạn biết logic cơ bản mà 500 bài ghi chú cùng chỉ ra.

Nó sẽ "phân liệt nhân cách": Nếu nửa năm trước bạn cho rằng A là đúng, nhưng hôm qua lại viết ghi chú phản bác A, RAG thường rơi vào mâu thuẫn tự thân, nhả ra một đống lời vô nghĩa logic hỗn loạn.

Biểu đồ mục nát: Liên kết tri thức bảo trì thủ công, giống như code không có tính năng dọn dẹp tự động. Lâu ngày, liên kết cụt đầu xuất hiện khắp nơi, hiệu quả truy xuất giảm theo cấp số mũ.

Trực giác của Karpathy rất sắc bén: Tìm kiếm và truy xuất là biểu hiện của sự bất lực của con người. Chúng ta cần là "sự đồng thuận", là "cấu trúc", là "chân tướng".

Coi tri thức là mã nguồn, để LLM làm trình biên dịch

Câu trả lời của Karpathy, đến từ một động tác mà lập trình viên ngày nào cũng làm, nhưng chưa bao giờ nghĩ đến áp dụng lên tri thức: biên dịch.

Bạn viết xong một đoạn mã nguồn, không phải mỗi lần chạy chương trình lại đọc lại code một lần.

Bạn biên dịch nó thành một file nhị phân, biên dịch lần này rất tốn công, nhưng sau đó mỗi lần chạy đều nhanh vùn vụt. Chi phí biên dịch, được chia đều cho hàng nghìn lần sử dụng sau.

Tri thức tại sao không thể làm như vậy?

Karpathy nói, hãy coi những ghi chú thô của bạn là mã nguồn không thể sửa đổi, để LLM làm trình biên dịch, để nó một lần "biên dịch" đống tài liệu lộn xộn này thành một Wiki có cấu trúc, liên kết chéo.

Mỗi lần thêm một tài liệu mới, AI thực hiện một lần dung hợp: cập nhật trang mục liên quan, sửa đổi tổng quan, đánh dấu những chỗ dữ liệu mới và kết luận cũ đánh nhau, thuận tay củng cố hoặc thách thức phán đoán hiện có.

Khác biệt then chốt ở đây: Tri thức được biên dịch một lần, sau đó tiếp tục tươi mới, chứ không phải mỗi lần truy vấn tái xây dựng tạm thời.

Đợi khi bạn đặt câu hỏi, liên kết chéo đã sẵn ở đó rồi, mâu thuẫn đã được đánh dấu rồi, tổng quan đã phản ánh tất cả những gì bạn đã đọc rồi.

Bạn không phải mỗi lần chạy chương trình lại biên dịch lại mã nguồn. Vậy tại sao mỗi lần hỏi, đều phải để AI đọc lại một lần ghi chú của bạn?

Chuyển dịch căn bản của quan hệ sản xuất nhận thức

Trong framework LLM-WIKI của anh ấy, ghi chú không còn là chữ viết chết, mà là "mã nguồn".

Mô hình lớn không còn là phiên dịch viên tra từ điển, mà là "trình biên dịch".

Kiến trúc này thực hiện cực kỳ tinh tế việc tách rời ba tầng:

1. Lớp Raw (Nguyên liệu thô): Đây là mỏ cảm hứng thô của bạn. Những suy ngẫm bạn ghi tùy hứng, bài viết cắt ghép, biên bản cuộc họp. Nó là "bất biến", duy trì tính nguyên thủy và cảm giác không sạch sẽ của đầu vào con người.

2. Lớp Schema (Hiến pháp tri thức): Đây là "quân quy" bạn viết cho AI. Ví dụ bạn quy định: Mỗi mục từ nhân vật phải bao gồm "động cơ, hạn chế, thành tựu then chốt"; mỗi ngăn xếp công nghệ phải nói rõ "ưu nhược điểm".

3. Lớp Wiki (Sản phẩm biên dịch): Đây là khu vực do AI toàn quyền bảo trì. Nó căn cứ vào Schema của bạn, biên dịch đống Raw lộn xộn đó thành các trang bách khoa có cấu trúc, liên kết chéo, tự nhất quán logic.

Hàng ngày chỉ ba động tác:

1. Ingest (Hấp thu): Ném một mẩu tin mới vào, AI đọc xong, đi qua cùng bạn những điểm chính, viết tóm tắt, quét toàn bộ thư viện cập nhật các trang liên quan — một nguồn, có thể tác động đến hàng chục trang.

2. Query (Truy vấn): Hỏi trực tiếp Wiki đã biên dịch, trả lời có dẫn nguồn. Diệu nhất là: Câu trả lời hay có thể trực tiếp lưu trở lại thành trang mới, mỗi lần bạn khám phá cũng đang lãi kép.

3. Lint (Kiểm tra sức khỏe): Định kỳ để AI tự kiểm tra như kiểm tra code — tìm mâu thuẫn, tìm phán đoán lỗi thời, tìm trang cô lập không ai liên kết, tìm lỗ hổng nên bổ sung. Dọn sớm, không để thư viện càng dài càng mục.

Bạn không còn là người khuân vác tri thức, mà là kiến trúc sư của đế chế trí tuệ này.

Bạn chỉ phụ trách đầu vào và rà soát cuối cùng, AI phụ trách tất cả "công việc tạp": sắp xếp, căn chỉnh, liên kết chéo, phát hiện mâu thuẫn.

Đây là chuyển dịch căn bản của quan hệ sản xuất nhận thức.

Đây không phải một chatbot khác. ChatGPT hiểu internet, LLM-Wiki hiểu bạn — chính xác là, thứ bạn dạy cho nó.

Mỗi câu trả lời đều mang theo [wiki-links] trở về biểu đồ tri thức của bạn. Mỗi phản hồi đều là điểm khởi đầu của một con đường khám phá, chứ không phải điểm kết thúc.

Phát minh muộn 80 năm

Đến đây, bạn có thể nghĩ đây không gì hơn một workflow thông minh?

Không chỉ vậy.

Karpathy ở cuối gist, nhẹ nhàng điểm một cái tên: Vannevar Bush, và bài viết năm 1945 của ông "As We May Think".

Năm 1945, Thế chiến II vừa kết thúc, vị đại thần khoa học Mỹ này, đã mơ tưởng một cỗ máy tên "Memex":

Một chiếc bàn cơ khí, có thể lưu trữ tất cả sách, ghi chép, thư tín của bạn, và giữa các mục liên quan, thiết lập lên "con đường liên tưởng" — kết nối giữa tài liệu và tài liệu, quý giá như chính bản thân tài liệu.

Nghe có quen không? Đây gần như là mô tả nguyên văn của LLM-Wiki.

Tầm nhìn của Bush, thực ra còn gần với thứ này hơn cả World Wide Web sau này: mạng tri thức riêng tư, do chính tay tuyển chọn, kết nối chính là giá trị.

Vậy tại sao Memex 80 năm không chế tạo ra?

Bởi vì Bush mắc kẹt ở một vấn đề ông không thể giải quyết — Ai bảo trì?

Mỗi con đường liên tưởng, đều phải thiết lập thủ công. Mỗi liên kết chéo, đều phải có người đi nối.

Bush mơ tưởng có "nhân viên vận hành" chuyên biệt rải lối mòn cho bạn trong tri thức.

Nhưng thực tế là, không có ai có thể kiên trì làm công việc khổ sai nhàm chán này trên quy mô lớn. Con người sẽ từ bỏ việc bảo trì, vì chi phí bảo trì, luôn luôn tăng nhanh hơn giá trị nó mang lại.

Câu này của Karpathy, là điểm nhãn của cả mô hình: Phần mệt mỏi nhất của việc bảo trì một thư viện tri thức, chưa bao giờ là đọc, mà là kế toán.

Cập nhật liên kết chéo, giữ cho tóm tắt luôn tươi mới, đánh dấu xung đột giữa dữ liệu mới và kết luận cũ, để hàng chục trang giữa chúng luôn nhất quán. Sự nhàm chán này, đủ để khiến mọi người nản lòng.

Mà mô hình lớn, không quên cập nhật một liên kết chéo nào, có thể một hơi sửa đổi 15 file.

Nó không mệt. Không chán. Không bị khuất phục bởi đêm khuya. Chi phí bảo trì, bị ép xuống gần như bằng không.

Và thế là, cỗ máy đã làm con người kẹt 80 năm, đột nhiên quay được.

Được giải phóng, là sự chú ý của con người

Nhìn lại, LLM-Wiki là mảnh ghép thứ ba của Karpathy về "hợp tác người-máy", cũng là mảnh tiết chế nhất.

Mảnh thứ nhất, Vibe Coding (Tháng 2/2025): Chấp nhận code do AI viết, không rà soát từng dòng, tin mô hình, kiểm tra kết quả.

Mảnh thứ hai, Agentic Engineering (Tháng 1/2026): Con người sắp xếp các agent AI, chứ không phải tự mình gõ code.

Mảnh thứ ba, LLM Knowledge Bases (Tháng 4/2026): AI quản lý không chỉ code nữa, mà là bản thân tri thức.

Trong mô hình mới này, thứ bị tước bỏ khỏi con người, là những công việc tạp không ai thích làm: sưu tầm, sắp xếp, liên kết, kế toán.

Thứ được để lại cho con người, chỉ còn hai việc: Quyết định đọc cái gì, và, nghĩ cho rõ tất cả những điều này rốt cuộc có ý nghĩa gì. Đây chính xác là hai việc mà máy móc đến nay không làm được, và cũng không nên thay bạn làm nhất.

Đây là câu chuyện một công cụ tiến hóa đến cực hạn, cuối cùng đi một vòng, trả lại sự chú ý của con người cho chính con người.

File markdown giản dị đến mức đáng tát đó, không phát hành mô hình, không đánh bảng xếp hạng.

Nó chỉ yên lặng nhắc nhở một câu: Bộ não của bạn, vốn không nên dùng để kế toán.

Bài viết từ tài khoản công chúng WeChat "Tân Trí Nguyên", tác giả: ASI Khải Thị Lục

Tiền kỹ thuật số thịnh hành

Câu hỏi Liên quan

QKarpathy đã đề xuất phương pháp gì để quản lý ghi chú và kiến thức cá nhân?

AKarpathy đề xuất phương pháp LLM-WIKI: xem ghi chú thô là "mã nguồn bất biến" và sử dụng LLM như một "trình biên dịch" để biên dịch chúng thành một wiki có cấu trúc, liên kết chéo và tự nhất quán.

QTheo bài viết, RAG (Retrieval-Augmented Generation) có những hạn chế chính nào?

ARAG có những hạn chế chính: 1) Chỉ xử lý cục bộ, không hiểu được bức tranh toàn cảnh. 2) Dễ mâu thuẫn khi kiến thức cũ và mới xung đột. 3) Liên kết trong biểu đồ kiến thức dễ bị hỏng theo thời gian nếu không được bảo trì, làm giảm hiệu quả truy xuất.

QKiến trúc LLM-WIKI của Karpathy gồm những lớp nào và chức năng của chúng là gì?

AKiến trúc LLM-WIKI gồm ba lớp: 1) Lớp Raw (nguyên liệu thô): Lưu trữ cảm hứng, ghi chú ban đầu, bất biến. 2) Lớp Schema (hiến pháp tri thức): Các quy tắc cấu trúc do người dùng định nghĩa cho AI. 3) Lớp Wiki (sản phẩm biên dịch): Khu vực do AI toàn quyền bảo trì, chứa các trang wiki có cấu trúc được biên dịch từ Raw theo Schema.

QTại sao ý tưởng Memex của Vannevar Bush từ năm 1945 mãi đến nay mới có thể thực hiện được theo bài viết?

AÝ tưởng Memex của Vannevar Bush bị mắc kẹt trong 80 năm vì vấn đề bảo trì: việc tạo và duy trì thủ công các "đường liên tưởng" và liên kết chéo giữa tài liệu là công việc tẻ nhạt, tốn kém và không thể mở rộng đối với con người. Chỉ đến khi có LLM, với khả năng tự động hóa việc "ghi sổ" (cập nhật liên kết, phát hiện mâu thuẫn, duy trì tính nhất quán) với chi phí gần như bằng không, thì cỗ máy này mới có thể hoạt động.

QTheo Karpathy, trong mô hình LLM-WIKI mới, vai trò chính của con người là gì?

ATrong mô hình LLM-WIKI, con người được giải phóng khỏi các công việc "ghi sổ" nhàm chán như thu thập, sắp xếp, liên kết. Vai trò chính của con người chỉ còn lại hai việc: 1) Quyết định đọc cái gì (đầu vào kiến thức). 2) Suy nghĩ về ý nghĩa thực sự của mọi thứ (tổng hợp và phán đoán sâu sắc). Đây là những việc máy móc chưa thể và không nên thay thế con người.

Nội dung Liên quan

Nhóm cựu thuộc đội doanh nghiệp của Ethereum Foundation ra mắt Ethereum Institutional

Nhóm từng xây dựng bộ phận quan hệ doanh nghiệp của Ethereum Foundation đã ra mắt Ethereum Institutional, một tổ chức phi lợi nhuận độc lập chuyên thúc đẩy việc áp dụng Ethereum bởi các tổ chức tài chính, bao gồm mạng Lớp 2 và hệ sinh thái rộng hơn. Tổ chức này sẽ đóng vai trò là điểm tiếp xúc trung lập, cung cấp hướng dẫn kỹ thuật và thông tin hệ sinh thái cho các ngân hàng, công ty quản lý tài sản và tổ chức tài chính khác khi họ đưa ra các quyết định dài hạn về token hóa, stablecoin và tài chính trên chuỗi. Ethereum Institutional nhấn mạnh tính trung lập của Ethereum là một lợi thế lớn, đồng thời cho biết họ sẽ mở rộng công việc tiếp cận doanh nghiệp trước đây thông qua năm lĩnh vực trọng tâm: Gắn kết tổ chức, Thông tin tổ chức, Tiếp thị hệ sinh thái Ethereum và ETH, Nghiên cứu nhu cầu ngành, cùng các sự kiện và hội nghị. Tổ chức được hỗ trợ tài chính ban đầu bởi Bitmine, SharpLink và đồng sáng lập Ethereum Joseph Lubin. Việc ra mắt này diễn ra sau đợt tái cấu trúc gần đây của Ethereum Foundation và sự ra đời của Ethlabs, phản ánh nỗ lực mở rộng hệ sinh thái Ethereum thông qua các tổ chức chuyên biệt hoạt động độc lập.

ambcrypto1 giờ trước

Nhóm cựu thuộc đội doanh nghiệp của Ethereum Foundation ra mắt Ethereum Institutional

ambcrypto1 giờ trước

Việc Riot Platforms bán 500 BTC có phải là cảnh báo sớm cho Bitcoin trong quý 3?

Sự chuyển đổi từ khai thác Bitcoin (BTC) sang AI đang nổi lên như một rủi ro ngày càng tăng khi thị trường bước vào quý 3. Gần đây, Riot Platforms đã bán khoảng 500 BTC (trị giá ~30 triệu USD), phản ánh sự thay đổi chiến lược này. Điều đáng chú ý là dù BTC giảm xuống dưới 57.000 USD, cổ phiếu RIOT vẫn tăng mạnh 120% trong quý 2, cho thấy sự tách biệt giữa cổ phiếu thợ đào và giá BTC. Riot đã bán nhiều BTC hơn số khai thác được trong quý trước, làm giảm kho dự trữ xuống còn ~15.680 BTC. Việc bán 500 BTC gần đây tiếp tục mô hình này, cho thấy BTC ngày càng được dùng như nguồn tiền mặt để tài trợ cho các khoản đầu tư vào trung tâm dữ liệu và điện toán AI. Áp lực lên thợ đào đang gia tăng khi giá BTC (~58k USD) thấp hơn chi phí sản xuất ước tính (~78k USD). Dù hashrate (tốc độ băm) phục hồi vào tháng 6, điều này có thể làm giảm phần thưởng khai thác do cạnh tranh khốc liệt hơn. Bối cảnh này thúc đẩy các thợ đào lớn đa dạng hóa sang lĩnh vực AI. Do đó, việc nắm giữ BTC có thể tiếp tục được bán để tài trợ cho chuyển đổi chiến lược, báo hiệu một sự thay đổi cấu trúc trong hành vi của thợ đào trong nửa cuối năm 2026. Vụ bán 500 BTC của Riot có thể là dấu hiệu sớm của xu hướng rộng lớn hơn này.

ambcrypto1 giờ trước

Việc Riot Platforms bán 500 BTC có phải là cảnh báo sớm cho Bitcoin trong quý 3?

ambcrypto1 giờ trước

"Đợt nâng cấp lớn nhất kể từ The Merge"? Glamsterdam ảnh hưởng thế nào đến Ethereum và người dùng thông thường?

Bài viết thảo luận về bản nâng cấp Glamsterdam sắp tới của Ethereum, dự kiến ra mắt mainnet vào nửa cuối năm 2026, được coi là bản nâng cấp lớn nhất kể từ sau The Merge. Trọng tâm của nó là cải thiện hiệu suất L1 thông qua ba thay đổi cốt lõi: 1. **ePBS (Proposer-Builder Separation được mã hóa):** Tích hợp cơ chế PBS trực tiếp vào giao thức, loại bỏ trung gian relay bên ngoài, giúp mở rộng cửa sổ xử lý khối. Điều này tạo điều kiện tăng Gas Limit và dung lượng Blob, hỗ trợ cả L1 và L2. 2. **BALs (Block-Level Access Lists):** Cung cấp một "bản đồ truy cập" trạng thái cho mỗi khối, cho phép xử lý song song một phần các giao dịch không xung đột và tăng tốc độ đồng bộ hóa nút, từ đó nâng cao hiệu suất tổng thể. 3. **Định giá lại Gas (EIP-8037):** Tách biệt chi phí cho tính toán và lưu trữ trạng thái, định giá chính xác hơn dựa trên mức tiêu thụ tài nguyên thực tế. Mục tiêu là kiểm soát sự bùng nổ trạng thái, khiến các hoạt động tạo trạng thái mới có thể đắt hơn, trong khi các giao dịch đơn giản có lợi từ việc tăng dung lượng khối. **Tác động đến người dùng:** Glamsterdam hướng tới việc **giảm và ổn định phí giao dịch** nhờ tăng dung lượng khối, đặc biệt cho các giao dịch đơn giản như chuyển ETH. Ví sẽ dự toán phí chính xác hơn. Tuy nhiên, các hoạt động tạo nhiều trạng thái mới (như triển khai hợp đồng phức tạp) có thể tăng chi phí. Người dùng L2 cũng được hưởng lợi gián tiếp từ dung lượng Blob lớn hơn. Ngoài ra, EIP-7708 sẽ chuẩn hóa nhật ký chuyển ETH, giúp ví và sàn giao dịch theo dõi dòng tiền rõ ràng hơn. **Ý nghĩa cốt lõi:** Glamsterdam không chỉ đơn thuần là mở rộng quy mô. Nó định hình lại cơ sở hạ tầng cốt lõi của Ethereum—từ quy trình sản xuất khối, thực thi giao dịch đến định giá tài nguyên—nhằm mở đường cho việc tăng đáng kể dung lượng mainnet trong khi vẫn cố gắng duy trì khả năng phi tập trung bằng cách giảm áp lực phần cứng lên các nút.

marsbit3 giờ trước

"Đợt nâng cấp lớn nhất kể từ The Merge"? Glamsterdam ảnh hưởng thế nào đến Ethereum và người dùng thông thường?

marsbit3 giờ trước

Giao dịch

Giao ngay

Bài viết Nổi bật

AGENT S là gì

Agent S: Tương Lai của Tương Tác Tự Động trong Web3 Giới thiệu Trong bối cảnh không ngừng phát triển của Web3 và tiền điện tử, các đổi mới đang liên tục định nghĩa lại cách mà cá nhân tương tác với các nền tảng kỹ thuật số. Một dự án tiên phong như vậy, Agent S, hứa hẹn sẽ cách mạng hóa tương tác giữa con người và máy tính thông qua khung tác nhân mở của nó. Bằng cách mở đường cho các tương tác tự động, Agent S nhằm đơn giản hóa các nhiệm vụ phức tạp, cung cấp các ứng dụng chuyển đổi trong trí tuệ nhân tạo (AI). Cuộc khám phá chi tiết này sẽ đi sâu vào những phức tạp của dự án, các tính năng độc đáo của nó và những tác động đối với lĩnh vực tiền điện tử. Agent S là gì? Agent S đứng vững như một khung tác nhân mở đột phá, được thiết kế đặc biệt để giải quyết ba thách thức cơ bản trong việc tự động hóa các nhiệm vụ máy tính: Thu thập Kiến thức Cụ thể theo Miền: Khung này học một cách thông minh từ nhiều nguồn kiến thức bên ngoài và kinh nghiệm nội bộ. Cách tiếp cận kép này giúp nó xây dựng một kho lưu trữ phong phú về kiến thức cụ thể theo miền, nâng cao hiệu suất của nó trong việc thực hiện nhiệm vụ. Lập Kế Hoạch Qua Các Tầm Nhìn Nhiệm Vụ Dài Hạn: Agent S sử dụng lập kế hoạch phân cấp tăng cường kinh nghiệm, một cách tiếp cận chiến lược giúp phân chia và thực hiện các nhiệm vụ phức tạp một cách hiệu quả. Tính năng này nâng cao đáng kể khả năng quản lý nhiều nhiệm vụ con một cách hiệu quả và hiệu suất. Xử Lý Các Giao Diện Động, Không Đều: Dự án giới thiệu Giao Diện Tác Nhân-Máy Tính (ACI), một giải pháp đổi mới giúp nâng cao tương tác giữa các tác nhân và người dùng. Sử dụng các Mô Hình Ngôn Ngữ Lớn Đa Phương Thức (MLLMs), Agent S có thể điều hướng và thao tác các giao diện người dùng đồ họa đa dạng một cách liền mạch. Thông qua những tính năng tiên phong này, Agent S cung cấp một khung vững chắc giải quyết các phức tạp liên quan đến việc tự động hóa tương tác giữa con người với máy móc, mở ra nhiều ứng dụng trong AI và hơn thế nữa. Ai là Người Tạo ra Agent S? Mặc dù khái niệm về Agent S là hoàn toàn đổi mới, thông tin cụ thể về người sáng lập vẫn còn mơ hồ. Người sáng lập hiện vẫn chưa được biết đến, điều này làm nổi bật giai đoạn sơ khai của dự án hoặc sự lựa chọn chiến lược để giữ kín các thành viên sáng lập. Bất chấp sự ẩn danh, sự chú ý vẫn tập trung vào khả năng và tiềm năng của khung này. Ai là Các Nhà Đầu Tư của Agent S? Vì Agent S còn tương đối mới trong hệ sinh thái mã hóa, thông tin chi tiết về các nhà đầu tư và những người tài trợ tài chính của nó không được ghi chép rõ ràng. Sự thiếu vắng thông tin công khai về các nền tảng đầu tư hoặc tổ chức hỗ trợ dự án dấy lên câu hỏi về cấu trúc tài trợ và lộ trình phát triển của nó. Hiểu biết về sự hỗ trợ là rất quan trọng để đánh giá tính bền vững và tác động tiềm năng của dự án. Agent S Hoạt Động Như Thế Nào? Tại cốt lõi của Agent S là công nghệ tiên tiến cho phép nó hoạt động hiệu quả trong nhiều bối cảnh khác nhau. Mô hình hoạt động của nó được xây dựng xung quanh một số tính năng chính: Tương Tác Giống Như Con Người: Khung này cung cấp lập kế hoạch AI tiên tiến, cố gắng làm cho các tương tác với máy tính trở nên trực quan hơn. Bằng cách bắt chước hành vi của con người trong việc thực hiện nhiệm vụ, nó hứa hẹn nâng cao trải nghiệm người dùng. Ký Ức Tường Thuật: Được sử dụng để tận dụng các trải nghiệm cấp cao, Agent S sử dụng ký ức tường thuật để theo dõi lịch sử nhiệm vụ, từ đó nâng cao quy trình ra quyết định của nó. Ký Ức Tình Huống: Tính năng này cung cấp cho người dùng hướng dẫn từng bước, cho phép khung này cung cấp hỗ trợ theo ngữ cảnh khi các nhiệm vụ diễn ra. Hỗ Trợ OpenACI: Với khả năng chạy cục bộ, Agent S cho phép người dùng duy trì quyền kiểm soát đối với các tương tác và quy trình làm việc của họ, phù hợp với tinh thần phi tập trung của Web3. Tích Hợp Dễ Dàng với Các API Bên Ngoài: Tính linh hoạt và khả năng tương thích với nhiều nền tảng AI khác nhau đảm bảo rằng Agent S có thể hòa nhập liền mạch vào các hệ sinh thái công nghệ hiện có, làm cho nó trở thành lựa chọn hấp dẫn cho các nhà phát triển và tổ chức. Những chức năng này cùng nhau góp phần vào vị trí độc đáo của Agent S trong không gian tiền điện tử, khi nó tự động hóa các nhiệm vụ phức tạp, nhiều bước với sự can thiệp tối thiểu của con người. Khi dự án phát triển, các ứng dụng tiềm năng của nó trong Web3 có thể định nghĩa lại cách mà các tương tác kỹ thuật số diễn ra. Thời Gian Phát Triển của Agent S Sự phát triển và các cột mốc của Agent S có thể được tóm tắt trong một dòng thời gian nêu bật các sự kiện quan trọng của nó: 27 tháng 9, 2024: Khái niệm về Agent S được ra mắt trong một bài nghiên cứu toàn diện mang tên “Một Khung Tác Nhân Mở Sử Dụng Máy Tính Như Một Con Người,” trình bày nền tảng cho dự án. 10 tháng 10, 2024: Bài nghiên cứu được công bố công khai trên arXiv, cung cấp một cái nhìn sâu sắc về khung và đánh giá hiệu suất của nó dựa trên tiêu chuẩn OSWorld. 12 tháng 10, 2024: Một video trình bày được phát hành, cung cấp cái nhìn trực quan về khả năng và tính năng của Agent S, thu hút thêm sự quan tâm từ người dùng và nhà đầu tư tiềm năng. Những dấu mốc trong dòng thời gian không chỉ minh họa sự tiến bộ của Agent S mà còn chỉ ra cam kết của nó đối với sự minh bạch và sự tham gia của cộng đồng. Những Điểm Chính Về Agent S Khi khung Agent S tiếp tục phát triển, một số thuộc tính chính nổi bật, nhấn mạnh tính đổi mới và tiềm năng của nó: Khung Đổi Mới: Được thiết kế để cung cấp cách sử dụng máy tính trực quan giống như tương tác của con người, Agent S mang đến một cách tiếp cận mới cho việc tự động hóa nhiệm vụ. Tương Tác Tự Động: Khả năng tương tác tự động với máy tính thông qua GUI đánh dấu một bước tiến tới các giải pháp tính toán thông minh và hiệu quả hơn. Tự Động Hóa Nhiệm Vụ Phức Tạp: Với phương pháp mạnh mẽ của nó, nó có thể tự động hóa các nhiệm vụ phức tạp, nhiều bước, làm cho các quy trình nhanh hơn và ít sai sót hơn. Cải Tiến Liên Tục: Các cơ chế học tập cho phép Agent S cải thiện từ các trải nghiệm trước đó, liên tục nâng cao hiệu suất và hiệu quả của nó. Tính Linh Hoạt: Khả năng thích ứng của nó trên các môi trường hoạt động khác nhau như OSWorld và WindowsAgentArena đảm bảo rằng nó có thể phục vụ một loạt các ứng dụng rộng rãi. Khi Agent S định vị mình trong bối cảnh Web3 và tiền điện tử, tiềm năng của nó để nâng cao khả năng tương tác và tự động hóa quy trình đánh dấu một bước tiến quan trọng trong công nghệ AI. Thông qua khung đổi mới của mình, Agent S minh họa cho tương lai của các tương tác kỹ thuật số, hứa hẹn một trải nghiệm liền mạch và hiệu quả hơn cho người dùng trên nhiều ngành công nghiệp khác nhau. Kết luận Agent S đại diện cho một bước nhảy vọt táo bạo trong sự kết hợp giữa AI và Web3, với khả năng định nghĩa lại cách chúng ta tương tác với công nghệ. Mặc dù vẫn còn ở giai đoạn đầu, những khả năng cho ứng dụng của nó là rộng lớn và hấp dẫn. Thông qua khung toàn diện của mình giải quyết các thách thức quan trọng, Agent S nhằm đưa các tương tác tự động lên hàng đầu trong trải nghiệm kỹ thuật số. Khi chúng ta tiến sâu hơn vào các lĩnh vực tiền điện tử và phi tập trung, các dự án như Agent S chắc chắn sẽ đóng một vai trò quan trọng trong việc định hình tương lai của công nghệ và sự hợp tác giữa con người với máy tính.

Tổng lượt xem 903Xuất bản vào 2025.01.14Cập nhật vào 2025.01.14

AGENT S là gì

Làm thế nào để Mua S

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Sonic (S) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Sonic (S) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Sonic (S) của BạnSau khi mua Sonic (S), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Sonic (S)Giao dịch Sonic (S) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 1.7kXuất bản vào 2025.01.15Cập nhật vào 2026.06.02

Làm thế nào để Mua S

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của S (S) được trình bày dưới đây.

活动图片