Biên tập viên lưu ý: Rào cản để tiếp cận AI Agent, có thể thấp hơn nhiều so với tưởng tượng của đa số mọi người.
Đây là một hướng dẫn nhập môn không cần code dành cho người dùng phổ thông. Bài viết bắt đầu từ việc giải thích sự khác biệt giữa Agent và chatbot, sau đó trình bày cách thiết kế "Bản thiết kế Agent", cách chạy tác vụ, cách gỡ lỗi tối ưu hóa, và thông qua việc lặp đi lặp lại, để một Agent từ "có thể dùng cơ bản" dần trở thành "thực sự dễ dùng".
Với người bình thường, học cách xây dựng Agent, về bản chất chính là học cách tự động hóa công việc lặp đi lặp lại của chính mình. Một cuối tuần, hai ngày, có lẽ đã đủ để bạn xây dựng AI Agent đầu tiên thuộc về chính mình.
Dưới đây là nội dung gốc:
Bạn không cần biết viết code, cũng có thể xây dựng một AI Agent. Đề nghị lưu lại và lưu trữ.
Tôi hy vọng bạn thực sự hiểu điểm này. Bởi vì đa số mọi người khi đọc câu này sẽ gật đầu, nhưng trong sâu thẳm vẫn nghĩ: Việc xây dựng Agent này, chỉ thuộc về các nhà phát triển.
Thực tế không phải vậy. Chỉ cần bạn có thể dùng tiếng Anh rõ ràng viết ra các chỉ dẫn rõ ràng, là bạn có thể xây dựng một AI Agent vào cuối tuần này. Không phải đồ chơi, không phải bản demo, mà là một Agent thực sự có thể sử dụng: nó có thể tiếp nhận một mục tiêu, chia nhỏ thành nhiều bước, gọi các công cụ hoàn thành từng bước, và cuối cùng giao kết quả thực tế.
Những người đang xây dựng Agent hiện nay, không phải tất cả đều là kỹ sư. Trong số họ có nhân viên tiếp thị, nhà sáng lập, cố vấn, nhà nghiên cứu và người sáng tạo nội dung. Họ chỉ nắm vững một điều: Làm thế nào để mô tả nhu cầu của mình đủ rõ ràng, để AI có thể thực thi.
Đây là khả năng duy nhất cần thiết.
Bài viết này sẽ dẫn bạn từ con số không, xây dựng AI Agent đầu tiên thực sự có thể sử dụng của bạn. Không cần code, không cần kinh nghiệm terminal, cũng không cần nền tảng khoa học máy tính. Bạn chỉ cần Claude, một mục tiêu rõ ràng, và một cuối tuần tập trung.
Đến tối Chủ nhật, bạn sẽ sở hữu một Agent thực sự có thể phát huy tác dụng cho cuộc sống hoặc công việc kinh doanh của bạn.
Thứ Bảy sáng: Trước tiên hiểu Agent thực sự là gì
Agent không phải là chatbot
Đa số mọi người cho rằng, Agent chỉ là một chatbot cao cấp hơn. Thực ra không phải.
Chatbot chờ bạn hỏi, sau đó đưa cho bạn một câu trả lời, chỉ vậy thôi. Một câu hỏi, một câu trả lời. Bước tiếp theo phải làm gì, vẫn do bạn hoàn thành. Bạn quay lại hỏi câu hỏi tiếp theo, lại tự mình hoàn thành bước tiếp theo. Bạn mới là động cơ của toàn bộ quy trình, chatbot chỉ là một cỗ máy phản hồi.
Agent thì hoàn toàn khác. Bạn đưa cho nó một mục tiêu, nó sẽ lập kế hoạch, và thực thi từng bước. Nó sẽ gọi công cụ, kiểm tra công việc của mình, xử lý các vấn đề phát sinh trong quá trình, và giao kết quả cuối cùng.
Điểm khác biệt cốt lõi giữa hai bên nằm ở tính tự chủ. Chatbot là công cụ hỗ trợ, Agent thì có khả năng thực thi nhiệm vụ.
Lấy một tình huống thực tế: Bạn muốn nghiên cứu năm đối thủ cạnh tranh chính, và tạo một tài liệu so sánh.
Nếu sử dụng chatbot, bạn cần hỏi đối thủ cạnh tranh đầu tiên, sao chép câu trả lời; rồi hỏi đối thủ thứ hai, sao chép câu trả lời; lặp lại như vậy ba lần. Sau đó bạn còn phải tự mình chỉnh sửa định dạng, tự mình viết phân tích. Điều này sẽ chiếm khoảng một giờ thời gian làm việc chủ động của bạn.
Nếu sử dụng Agent, bạn chỉ cần nói: "Vui lòng nghiên cứu năm đối thủ cạnh tranh chính trong ngành của tôi, so sánh từ các khía cạnh giá cả, chức năng, người dùng mục tiêu và định vị thị trường, và tạo một tài liệu so sánh có định dạng." Agent sẽ tìm kiếm thông tin của từng đối thủ cạnh tranh, thu thập dữ liệu, tổ chức nội dung, hoàn thành so sánh, và giao tài liệu cuối cùng. Bạn chỉ cần xem xét kết quả. Điều này có thể chỉ chiếm năm phút thời gian của bạn.
Kết quả giống nhau, nhưng quá trình hoàn toàn khác nhau.
Một Agent vận hành như thế nào
Mỗi Agent đều bao gồm bốn thành phần.
Thứ nhất, Mục tiêu.
Tức là Agent phải hoàn thành nhiệm vụ gì. Mục tiêu càng rõ ràng, biểu hiện của Agent càng tốt.
Thứ hai, Kế hoạch.
Tức là các bước Agent thực hiện để đạt được mục tiêu. Một số Agent sẽ tự tạo kế hoạch, một số sẽ thực hiện theo kế hoạch bạn thiết kế. Những Agent tốt nhất thường kết hợp cả hai: vừa tuân theo cấu trúc bạn cung cấp, vừa điều chỉnh dựa trên thông tin phát hiện trong quá trình thực thi.
Thứ ba, Công cụ.
Tức là các khả năng Agent có thể gọi, ví dụ tìm kiếm web, đọc file, ghi file, tính toán, truy cập API, v.v. Không có công cụ, Agent chỉ là một trình tạo văn bản biết "vừa nghĩ vừa nói"; có công cụ, nó mới thực sự có khả năng hoàn thành nhiệm vụ trong thế giới thực.
Thứ tư, Vòng lặp.
Agent sẽ thực thi một bước, kiểm tra kết quả, đánh giá bước tiếp theo nên làm gì, sau đó lặp lại quá trình này cho đến khi hoàn thành mục tiêu. Cơ chế vòng lặp này chính là chìa khóa cho tính tự chủ của Agent. Nó sẽ không dừng lại sau khi hoàn thành một bước, mà sẽ tiếp tục thúc đẩy cho đến khi nhiệm vụ kết thúc.
Bạn cần làm gì vào sáng thứ Bảy
Trước tiên hãy đọc phần này hai lần, cho đến khi bạn có thể giải thích cho người khác sự khác biệt giữa chatbot và Agent.
Sau đó, viết ra ba nhiệm vụ mà bạn hiện vẫn thực hiện thủ công trong công việc hoặc cuộc sống, nhưng về bản chất có quy trình nhiều bước. Đối với mỗi nhiệm vụ, liệt kê các bước bạn thường thực hiện, cũng như các công cụ bạn sẽ sử dụng.
Cuối cùng, chọn ra một nhiệm vụ đơn giản nhất, làm dự án Agent đầu tiên của bạn.
Thứ Bảy chiều: Sử dụng Claude để xây dựng Agent đầu tiên của bạn
Chọn nền tảng của bạn
Hiện tại, bạn có hai lựa chọn xây dựng Agent không cần code.
Claude Cowork trong ứng dụng Claude Desktop.
Đây là con đường đơn giản nhất. Cowork cho phép Claude truy cập file của bạn và tự chủ thực thi các nhiệm vụ nhiều bước. Nếu bạn đã đăng ký gói trả phí của Claude và cài đặt ứng dụng desktop, bạn có thể bắt đầu ngay lập tức.
Claude Projects trên claude.ai.
Nếu bạn không có ứng dụng desktop, bạn cũng có thể trực tiếp xây dựng Agent thông qua Projects trên web Claude. Bạn có thể tạo một dự án, tải tài liệu nền và chỉ dẫn, sau đó chạy quy trình làm việc Agent của bạn thông qua hội thoại.
Cả hai cách đều được. Cowork mạnh mẽ hơn vì nó có thể truy cập file cục bộ của bạn; Projects dễ tiếp cận hơn vì nó có thể chạy trên bất kỳ trình duyệt nào.
Chọn cách bạn có thể sử dụng, sau đó tiếp tục tiến hành.
Bản thiết kế Agent
Trước khi thực sự bắt đầu xây dựng, bạn cần viết một trang Bản thiết kế Agent trước. Tài liệu này sẽ biến một ý tưởng mơ hồ thành một hệ thống có thể thực thi.
Bản thiết kế này cần trả lời năm câu hỏi.
Thứ nhất, Mục tiêu là gì?
Diễn giải bằng một câu, cụ thể và có thể đo lường.
Ví dụ: "Nghiên cứu 10 AI newsletter hàng đầu và sắp xếp theo số lượng người đăng ký, tần suất phát hành và phạm vi chủ đề được bao phủ."
Thứ hai, Các bước là gì?
Đánh số theo thứ tự.
Ví dụ:
Bước 1: Tìm kiếm AI newsletter phổ biến nhất.
Bước 2: Đối với mỗi newsletter, tìm số lượng người đăng ký, nhịp độ phát hành và chủ đề chính.
Bước 3: Sắp xếp dữ liệu thành bảng so sánh.
Bước 4: Sắp xếp theo số lượng người đăng ký.
Bước 5: Viết một đoạn tóm tắt ba phần, tổng kết những phát hiện chính.
Thứ ba, Agent cần những công cụ nào?
Chỉ cần liệt kê.
Ví dụ: "Tìm kiếm web, sắp xếp dữ liệu, tạo file."
Thứ tư, Đầu ra cuối cùng nên như thế nào?
Hãy mô tả chính xác sản phẩm cuối cùng.
Ví dụ: "Một tài liệu Markdown, chứa một bảng so sánh 10 newsletter được sắp xếp theo số người đăng ký, kèm theo một đoạn tóm tắt, giải thích newsletter nào đang phát triển nhanh nhất."
Thứ năm, Nếu Agent bị kẹt, phải làm gì?
Cần xác định trước các quy tắc dự phòng.
Ví dụ: "Nếu số lượng người đăng ký không có dữ liệu công khai, hãy đánh dấu là 'Dữ liệu không có sẵn', không tự đoán."
Trước khi mở Claude, hãy viết bản thiết kế này. Bản thân bản thiết kế chính là Agent của bạn. Phần còn lại chỉ là thực thi.
Bắt đầu xây dựng Agent
Mở Claude Cowork, hoặc tạo một Claude Project. Dán bản thiết kế của bạn vào, như là chỉ dẫn. Nói với Claude hãy thực hiện kế hoạch theo từng bước và kiểm tra xem bước hiện tại đã hoàn thành chưa trước khi chuyển sang bước tiếp theo.
Sau đó quan sát cách nó chạy.
Claude sẽ bắt đầu từ bước một, tìm kiếm web, thu thập dữ liệu, sắp xếp thông tin, tạo nội dung so sánh, viết tóm tắt, và giao tài liệu cuối cùng.
Agent đầu tiên của bạn đã chạy như vậy. Nó sẽ không hoàn hảo. Một số dữ liệu có thể không chính xác, một số bước có thể không đầy đủ. Điều này là bình thường. Bạn sẽ sửa chữa nó trong giai đoạn tiếp theo.
Bạn cần làm gì vào chiều thứ Bảy
Theo năm câu hỏi trên, viết ra một trang Bản thiết kế Agent.
Mở Claude Cowork, hoặc tạo một Claude Project.
Dán bản thiết kế của bạn và chạy Agent. Lưu kết quả đầu ra, ghi lại phần nào hiệu quả, phần nào có vấn đề.
Đừng vội sửa chữa. Chỉ quan sát kết quả chạy lần đầu tiên.
Chủ nhật sáng: Gỡ lỗi, tối ưu hóa, làm cho Agent trở nên đáng tin cậy
Tại sao lần chạy đầu tiên không bao giờ là lần cuối cùng
Kết quả chạy Agent đầu tiên của bạn, rất có thể chỉ có 60% đến 70% là chính xác.
Đây là hiện tượng bình thường. Khoảng cách giữa "có thể dùng cơ bản" và "ổn định đáng tin cậy" chính là nơi đa số mọi người từ bỏ. Họ thấy kết quả không hoàn hảo, liền khẳng định Agent chưa sẵn sàng.
Họ sai rồi. Agent đã sẵn sàng. Điều thực sự cần tối ưu hóa là chỉ dẫn của bạn.
Mỗi đầu ra không hoàn hảo đều là một tín hiệu. Nó sẽ cho bạn biết: Trong bản thiết kế, chỗ nào quá mơ hồ, chỗ nào quá tham vọng, chỗ nào thiếu chi tiết then chốt.
Quy trình gỡ lỗi
Lấy kết quả đầu ra của lần chạy đầu tiên, so sánh với kết quả bạn thực sự mong muốn.
Đối với mỗi lỗi, hãy tự hỏi mình một câu: "Bản thiết kế của tôi đã nói với Agent nên xử lý vấn đề này như thế nào chưa?"
Chín trên mười, câu trả lời là không. Bạn nghĩ Agent nên biết một điều gì đó, nhưng thực ra bạn chưa bao giờ viết ra rõ ràng.
Lần chạy Agent đầu tiên, các vấn đề thường gặp nhất bao gồm:
· Mục tiêu quá mơ hồ, để lại cho Agent quá nhiều không gian giải thích;
· Thiếu bước, khiến Agent phải tự phát huy;
· Không có tiêu chuẩn chất lượng, do đó Agent không biết thế nào là "đủ tốt";
· Không có cơ chế xử lý lỗi, nên khi gặp vấn đề, Agent đã chọn đoán, thay vì đánh dấu vấn đề.
Phương pháp sửa chữa những vấn đề này, chính là làm cho bản thiết kế của bạn cụ thể hơn. Sau đó chạy lại Agent.
Vòng lặp tối ưu hóa
· Chạy Agent.
· Xem xét đầu ra.
· Tìm ra một lỗi.
· Cập nhật bản thiết kế, sửa chữa vấn đề này.
· Chạy lại Agent.
· Lặp lại quá trình này.
Đây là kỹ năng cốt lõi của việc xây dựng Agent. Trọng tâm không phải là viết ra bản thiết kế hoàn hảo ngay lần đầu, mà là thông qua việc lặp nhanh để liên tục tối ưu hóa.
Đa số mọi người chỉ cần ba đến bốn vòng lặp, là có thể nâng tỷ lệ chính xác của Agent từ 60% lên 90%. 10% còn lại cuối cùng, đến từ các trường hợp biên giới dần dần phát hiện trong quá trình sử dụng thực tế.
Bạn cần làm gì vào sáng Chủ nhật
Xem xét kết quả đầu ra từ lần chạy thứ Bảy, và liệt kê tất cả các vấn đề.
Đối với mỗi vấn đề, truy ngược lại khoảng trống của nó trong bản thiết kế.
Cập nhật bản thiết kế với chỉ dẫn cụ thể hơn, tiêu chuẩn chất lượng và quy tắc xử lý lỗi. Chạy Agent thêm ba lần nữa, và tiếp tục tối ưu hóa sau mỗi lần chạy. Khi đầu ra đã thực sự hữu ích, bạn có thể dừng lại.
Chủ nhật chiều: Mở rộng nó, và xây dựng Agent thứ hai của bạn
Một Agent rất thú vị, hai Agent mới bắt đầu hình thành hệ thống
Bây giờ bạn đã nắm vững quy trình, có thể xây dựng Agent thứ hai cho một nhiệm vụ hoàn toàn khác.
Agent đầu tiên dạy bạn cơ chế. Agent thứ hai sẽ dạy bạn tốc độ. Bạn sẽ ngạc nhiên khi thấy, Agent thứ hai xây dựng nhanh hơn nhiều. Bản thiết kế có thể chỉ mất 15 phút, thay vì một giờ. Lần chạy đầu tiên có thể đã hoàn thành 80%, thay vì 60%. Tối ưu hóa có thể chỉ cần hai vòng, thay vì bốn vòng.
Đây là hiệu ứng lãi kép của kinh nghiệm xây dựng Agent. Mỗi Agent bạn xây dựng, sẽ làm cho Agent tiếp theo nhanh hơn, tốt hơn.
Nếu bạn cần cảm hứng, có thể chọn từ một số hướng nhập môn đã chín muồi dưới đây.
Agent nghiên cứu.
Đưa cho nó một chủ đề, nó sẽ tạo ra một bản tin nghiên cứu có cấu trúc, chứa các phát hiện chính, nguồn thông tin và đề xuất bước tiếp theo.
Agent tái chế nội dung.
Đưa cho nó một bài viết dài, nó sẽ tạo ra năm tweet, ba bài đăng LinkedIn và một đoạn nội dung newsletter theo ngữ điệu của bạn.
Agent chuẩn bị cuộc họp.
Đưa cho nó tên và công ty của một người, nó sẽ sắp xếp một trang bản tin, bao gồm nền tảng của đối phương, động thái gần đây, người liên hệ chung và chủ đề thảo luận đề xuất.
Agent giám sát đối thủ cạnh tranh.
Đưa cho nó tên của ba đối thủ cạnh tranh, nó sẽ tạo ra bản cập nhật hàng tuần, theo dõi các thông báo mới nhất, thay đổi giá cả và lặp lại sản phẩm của các công ty này.
Agent soạn thảo email.
Đưa cho nó một loạt email cần trả lời, nó sẽ phân loại theo mức độ khẩn cấp, và tạo ra bản nháp trả lời dựa trên ngữ điệu và sở thích của bạn.
Bạn cần làm gì vào chiều Chủ nhật
· Chọn một hướng cho Agent thứ hai từ danh sách trên, hoặc cũng có thể chọn một nhiệm vụ từ công việc của riêng bạn.
Sử dụng 15 phút để viết bản thiết kế. Sử dụng một đến hai giờ để hoàn thành xây dựng và tối ưu hóa.
Đến đây, bạn đã xây dựng hai Agent có thể sử dụng mà không cần code trong một cuối tuần.
Tiếp theo sẽ xảy ra điều gì
Cuối tuần này, bạn đã xây dựng hai Agent. Chỉ riêng điều này, bạn đã dẫn trước 95% người vẫn chỉ trò chuyện với AI.
Con đường phía trước rất rõ ràng: Tiếp tục xây dựng thêm nhiều Agent, kết nối chúng với nhiều công cụ hơn, sau đó nối chúng lại với nhau, để đầu ra của một Agent trở thành đầu vào của Agent khác. Bạn có thể xây dựng Agent cho nhóm, cho khách hàng và cho công việc kinh doanh của chính mình.
Những người đang xây dựng Agent hiện nay, thực chất đang xây dựng cách làm việc trong tương lai. Không phải vì Agent đã hoàn hảo, mà vì chúng đã đủ tốt, có thể xử lý 80% công việc không cần đến sự phán đoán của con người.
Và việc "đủ tốt" này, mỗi tháng đều trở nên tốt hơn.
Bạn đã chứng minh với chính mình: Không cần viết code, cũng có thể xây dựng một Agent trong một cuối tuần.
Đa số mọi người sẽ đọc xong bài viết này, rồi nghĩ "có lẽ một ngày nào đó sẽ thử".
Nhưng những người thực sự sẽ xây dựng hai Agent vào cuối tuần này, sau đó khó có thể quay trở lại cách làm việc mà mọi việc đều dựa vào thao tác thủ công.
Hy vọng bài viết này hữu ích với bạn.
Khairallah ❤️






