Viết Prompt đã lỗi thời? Lập trình AI đang chuyển hướng sang Kỹ thuật Vòng lặp

marsbitXuất bản vào 2026-06-10Cập nhật gần nhất vào 2026-06-10

Tóm tắt

Tóm tắt: "Loop Engineering" (Kỹ thuật vòng lặp) đang thay đổi cách làm việc với AI trong lập trình, chuyển từ việc con người tự viết prompt thủ công sang thiết kế các hệ thống tự động hóa có thể lên kế hoạch, phân phối, thực thi và kiểm tra công việc một cách liên tục. Một vòng lặp điển hình bao gồm năm thành phần chính: Tự động hóa (Automations) để phát hiện và phân loại công việc, Cây công việc (Worktrees) để cách ly môi trường phát triển, Kỹ năng (Skills) để lưu trữ kiến thức dự án, Plugin/Kết nối (Plugins/Connectors) để tích hợp với các công cụ thực tế, và Các tác tử con (Sub-agents) để tách biệt vai trò thực thi và kiểm tra. Cùng với một lớp bộ nhớ ngoài (như file Markdown hoặc bảng Linear) để lưu trạng thái. Bài viết nhấn mạnh rằng ý nghĩa của Loop Engineering không chỉ là để AI chạy nhiều vòng hơn, mà là đưa khả năng phán đoán của kỹ sư vào trong thiết kế hệ thống. Nó có thể khuếch đại đáng kể hiệu quả công việc, nhưng không thay thế được nhu cầu xác minh, hiểu và đánh giá của con người. Rủi ro thực sự nằm ở việc sử dụng vòng lặp như một cái cớ để trốn tránh việc hiểu code và hệ thống. Năng lực cốt lõi trong tương lai khi hợp tác với AI có lẽ không còn là viết một prompt tốt, mà là thiết kế được các quy trình làm việc (workflow) của tác tử đáng tin cậy, có thể kiểm chứng và vận hành bền vững.

Lời biên tập: Cách sử dụng Agent mã hóa AI đang chuyển từ "con người viết Prompt thủ công, thúc đẩy nhiệm vụ từng vòng" sang "con người thiết kế vòng lặp, để hệ thống liên tục điều phối Agent". Loop Engineering (Kỹ thuật Vòng lặp) mà Addy Osmani đề cập, cốt lõi là xây dựng một quy trình công việc có thể tự động phát hiện nhiệm vụ, phân bổ nhiệm vụ, kiểm tra kết quả, ghi lại tiến độ và quyết định bước tiếp theo.

Vòng lặp này về cơ bản được tạo thành từ năm mô-đun: Automations (phát hiện và phân loại nhiệm vụ theo lịch trình), Worktrees (cô lập nhiều môi trường phát triển song song), Skills (lưu trữ kiến thức dự án và quy ước nhóm), Plugins/Connectors (kết nối với các công cụ thực tế như GitHub, Linear, Slack, cơ sở dữ liệu, v.v.), Sub-agents (tách biệt người thực thi và người kiểm tra), cộng thêm một lớp bộ nhớ bên ngoài, như tệp Markdown hoặc bảng Linear, để lưu trạng thái và tiến triển.

Bài viết nhắc nhở, ý nghĩa của Loop Engineering không chỉ là "để AI chạy nhiều vòng hơn", mà là đưa khả năng phán đoán của kỹ sư vào trước trong thiết kế hệ thống. Vòng lặp có thể khuếch đại đáng kể đòn bẩy công việc của nhà phát triển, nhưng sẽ không thay thế việc xác minh, hiểu và phán đoán. Rủi ro thực sự không nằm ở việc sử dụng vòng lặp, mà nằm ở việc sử dụng vòng lặp như một cái cớ để trốn tránh việc hiểu mã và hệ thống. Khả năng quan trọng để hợp tác với lập trình AI trong tương lai, có lẽ không còn chỉ là viết một Prompt tốt, mà là thiết kế quy trình công việc Agent đáng tin cậy, có thể xác minh và chạy bền vững.

Dưới đây là bài viết gốc:

Loop engineering (kỹ thuật vòng lặp) đang thay thế vai trò của bạn với tư cách là "người viết prompt cho trợ lý AI". Bạn sẽ thiết kế một hệ thống, để hệ thống này thay bạn prompt trợ lý AI. Ở đây, loop (vòng lặp) có thể hiểu là một mục tiêu đệ quy: bạn định nghĩa một mục đích, AI sẽ liên tục lặp lại cho đến khi nhiệm vụ hoàn thành. Nó về cơ bản được tạo thành từ năm thành phần, và cả Claude Code và Codex hiện đều đã có đủ năm thành phần này.

Tôi tin rằng, đây có thể là cách chúng ta hợp tác với các agent mã hóa trong tương lai. Tuy nhiên, tất cả vẫn đang ở giai đoạn đầu và tôi vẫn giữ thái độ hoài nghi. Bạn chắc chắn cần thận trọng với chi phí token, vì sự khác biệt chi phí giữa các chế độ sử dụng có thể rất lớn, đặc biệt tùy thuộc vào việc bạn "dư thừa token" hay "thiếu hụt token". Bạn cũng cần có cơ chế nào đó để đảm bảo chất lượng không bị giảm sút. Những lo ngại về "sản phẩm tào lao của AI" (slop) cũng hợp lý. Dù vậy, hãy cùng xem điều này thực sự là gì.

Gần đây, @steipete đã nói một câu: "Bạn không nên viết prompt cho agent mã hóa nữa. Bạn nên thiết kế một số vòng lặp, để những vòng lặp này prompt agent của bạn." Tương tự, @bcherny, người phụ trách Claude Code của Anthropic cũng nói: "Hiện tại tôi không còn prompt Claude nữa. Tôi có một loạt vòng lặp đang chạy, chúng sẽ prompt Claude và tự quyết định bước tiếp theo nên làm gì. Công việc của tôi là viết vòng lặp."

Vậy, điều này thực sự có nghĩa là gì?

Trong khoảng hai năm qua, cách cơ bản để bạn muốn agent mã hóa làm điều gì đó là viết một prompt tốt và cung cấp đủ ngữ cảnh. Bạn nhập một câu, đọc kết quả trả về, rồi nhập câu tiếp theo. Agent là một công cụ, và bạn luôn cầm công cụ này, thúc đẩy nó từng vòng một. Giai đoạn này ở một mức độ nào đó đã kết thúc, hoặc ít nhất một số người cho rằng nó sắp kết thúc.

Bây giờ, bạn xây dựng một hệ thống nhỏ: nó tự phát hiện công việc, phân bổ nhiệm vụ, kiểm tra kết quả, ghi lại tình trạng hoàn thành, rồi quyết định bước tiếp theo làm gì. Nghĩa là, bạn để hệ thống này điều khiển agent, thay vì bạn tự mình prompt nó từng chút một. Trước đây tôi đã viết về "họ hàng gần" của nó – agent harness engineering (kỹ thuật khung chạy agent), tức là xây dựng môi trường chạy cho một agent đơn lẻ; và factory model (mô hình nhà máy), tức là hệ thống xây dựng phần mềm. Loop engineering thì nằm ở một lớp trên harness. Nó giống harness, nhưng sẽ chạy theo bộ hẹn giờ, tạo ra trợ lý nhỏ và tự nuôi dưỡng chính mình.

Điều làm tôi ngạc nhiên là, bây giờ điều này không còn chỉ là vấn đề ở "cấp độ công cụ" nữa. Một năm trước, nếu bạn muốn một vòng lặp, bạn phải viết một đống script bash, rồi bảo trì đống script đó mãi mãi. Đó là thứ của riêng bạn, và chỉ thuộc về bạn. Bây giờ, các thành phần này đã được tích hợp trực tiếp vào sản phẩm. Các khả năng mà Steinberger liệt kê gần như có thể tương ứng từng cái một trong ứng dụng Codex, và cũng gần như tương tự có thể tương ứng trong Claude Code. Một khi bạn nhận ra hình dạng của chúng giống nhau, bạn sẽ không còn băn khoăn nên dùng công cụ nào nữa, mà sẽ đi thiết kế một vòng lặp: bất kể bạn đang ngồi trong công cụ nào, nó đều có thể tiếp tục vận hành.

Năm thành phần, và một số lưu ý

Một vòng lặp cần năm thứ, cộng thêm một nơi để ghi nhớ thông tin. Tôi sẽ liệt kê ra trước, rồi giải thích từng cái.

Thứ nhất, Automations (tự động hóa nhiệm vụ): Kích hoạt theo kế hoạch, tự động phát hiện và phân luồng.

Thứ hai, Worktrees (cây công việc): Để hai agent làm việc song song không can thiệp vào tệp của nhau.

Thứ ba, Skills (kỹ năng): Viết ra kiến thức dự án, tránh để agent mỗi lần phải đoán mò.

Thứ tư, Plugins and connectors (plugin và trình kết nối): Cho phép agent kết nối với các công cụ bạn đang sử dụng.

Thứ năm, Sub-agents (agent con): Một agent chịu trách nhiệm đề xuất giải pháp, một agent khác kiểm tra giải pháp.

Rồi đến thứ sáu: memory (bộ nhớ). Nó có thể là một tệp Markdown, hoặc một bảng Linear, hoặc bất kỳ thứ gì độc lập với một cuộc hội thoại đơn lẻ, có thể lưu "những việc đã hoàn thành" và "những việc tiếp theo". Nghe có vẻ đơn giản đến mức không giống một việc quan trọng, nhưng đây là cùng một kỹ thuật mà mọi agent chạy dài hạn đều dựa vào. Tôi cũng đã viết chi tiết trong long-running agents: mô hình sẽ quên giữa các lần chạy, vì vậy bộ nhớ phải được đặt trên đĩa, không phải trong ngữ cảnh. Agent sẽ quên, nhưng kho mã nguồn thì không.

Hiện tại, cả hai sản phẩm đều đã có đủ năm thành phần này.

Tên gọi của chúng ở một số chỗ khác nhau, nhưng bản chất khả năng là một. Dưới đây tôi giải thích từng cái, bởi thực sự, việc một vòng lặp cuối cùng chạy ổn định hay lén lút rò rỉ ở khắp nơi, chìa khóa đều nằm ở chi tiết.

Automations: Đây là nhịp tim của vòng lặp

Automations là thứ khiến vòng lặp thực sự trở thành vòng lặp, chứ không phải một nhiệm vụ một lần bạn đã từng chạy thủ công. Trong ứng dụng Codex, bạn có thể tạo một tác vụ tự động trong tab Automations, chọn dự án, prompt mà nó sẽ chạy, tần suất chạy, và việc nó chạy trong checkout cục bộ của bạn hay trong worktree nền. Những kết quả chạy phát hiện ra vấn đề sẽ đi vào Triage inbox (hộp thư phân loại), còn những kết quả không phát hiện vấn đề sẽ tự động lưu trữ, điểm này khá hay. OpenAI nội bộ cũng dùng nó để làm một số việc nhàm chán nhưng cần thiết, như phân loại issue hàng ngày, tóm tắt nguyên nhân thất bại CI, viết báo cáo commit, theo dõi lỗi do ai đó đưa vào tuần trước. Tác vụ tự động cũng có thể gọi skill, vì vậy bạn có thể giữ cho các nhiệm vụ lặp lại có thể bảo trì được: kích hoạt $skill-name, thay vì dán cả một bức tường văn bản hướng dẫn vào một tác vụ được lên lịch mà sau này không ai cập nhật.

Claude Code cũng đạt được hiệu quả tương tự, chỉ khác đường đi: nó thực hiện thông qua lập lịch và hooks. Bạn có thể dùng /loop để chạy một prompt hoặc lệnh theo khoảng thời gian cố định, cũng có thể lên lịch một cron job, và cũng có thể dùng hooks để kích hoạt lệnh shell tại một số điểm trong vòng đời của agent. Nếu bạn muốn nó tiếp tục chạy sau khi bạn đóng laptop, bạn cũng có thể đẩy toàn bộ thứ này lên GitHub Actions. Ý tưởng hoàn toàn giống nhau: bạn định nghĩa một nhiệm vụ tự chủ, cho nó một nhịp độ, để kết quả phát hiện đến với bạn, thay vì bạn phải đi kiểm tra khắp nơi.

Còn một cú pháp gốc trong phiên đáng để biết, nó gần hơn với cốt lõi thực sự được thảo luận trong bài viết này. /loop sẽ lặp lại chạy theo nhịp độ; /goal sẽ thực thi liên tục cho đến khi một điều kiện nào đó bạn viết ra thực sự đạt được. Sau mỗi vòng, sẽ có một mô hình nhỏ riêng biệt đánh giá xem nhiệm vụ đã hoàn thành chưa, vì vậy agent viết mã không phải là agent tự chấm điểm cho mình. Bạn có thể cho nó một điều kiện, chẳng hạn "tất cả bài kiểm tra trong test/auth đều pass, và lint sạch", rồi rời đi. Codex cũng có khả năng tương tự, cũng gọi là /goal. Nó sẽ làm việc xuyên suốt các vòng cho đến khi một điều kiện dừng có thể xác minh được đạt thành, và hỗ trợ tạm dừng, tiếp tục và xóa. Cùng một cú pháp gốc, cả hai công cụ đều có. Đây về cơ bản là mô hình lặp đi lặp lại trong bài viết này.

Vậy, Automations chịu trách nhiệm đưa công việc lên bề mặt. Phần còn lại của vòng lặp chịu trách nhiệm xử lý những công việc này.

Worktrees: Để song song không trở thành hỗn loạn

Một khi bạn chạy nhiều hơn một agent, xung đột tệp sẽ trở thành điểm thất bại. Hai agent đồng thời ghi vào cùng một tệp, về bản chất cũng phiền phức như hai kỹ sư sửa cùng một dòng mã mà không trao đổi. git worktree có thể giải quyết vấn đề này. Nó là một thư mục làm việc riêng biệt trên một nhánh độc lập, nhưng chia sẻ cùng một lịch sử kho mã nguồn, do đó sửa đổi của một agent về mặt vật lý không thể chạm vào checkout của agent kia.

Codex hỗ trợ worktree trực tiếp, vì vậy nhiều luồng có thể xử lý cùng một kho cùng lúc mà không va chạm nhau. Claude Code cũng có thể đạt được sự cô lập tương tự thông qua git worktree: bạn có thể dùng cờ --worktree để mở một phiên trong checkout độc lập, cũng có thể đặt isolation: worktree trên subagent, để mỗi trợ lý nhỏ nhận được một checkout hoàn toàn mới và được dọn dẹp tự động sau khi kết thúc. Tôi đã viết về khía cạnh con người của việc này trong the orchestration tax: worktrees có thể loại bỏ xung đột ở cấp độ cơ học, nhưng bạn vẫn là giới hạn trên. Thứ quyết định bạn có thể chạy bao nhiêu agent cùng lúc không phải là công cụ, mà là review bandwidth (băng thông xem xét) của bạn.

Skills: Để bạn không phải giải thích lại dự án mỗi lần

Skill là một cơ chế, để bạn không phải giải thích lại cùng một bộ ngữ cảnh dự án mỗi phiên như một con cá vàng. Cả hai công cụ sử dụng cùng định dạng: một thư mục, bên trong có một tệp SKILL.md, lưu hướng dẫn và siêu dữ liệu; ngoài ra có thể có tùy chọn script, tài liệu tham khảo và tệp tài nguyên. Codex sẽ chạy một skill khi bạn gọi nó bằng $ hoặc /skills, và cũng sẽ tự động chạy khi nhiệm vụ của bạn khớp với mô tả của skill đó. Đây cũng là lý do tại sao một mô tả ngắn gọn, đơn giản thường tốt hơn một mô tả thông minh, hoa mỹ. Cách làm của Claude Code cũng tương tự, tôi đã viết về mô hình này trong agent skills.

Skills cũng là nơi ý định không còn làm bạn hao tổn từng chút một. Tôi đã nói trong intent debt, agent khởi động lạnh mỗi khi bắt đầu phiên, chỉ cần ý định của bạn có khoảng trống, nó sẽ lấp đầy bằng những phỏng đoán đầy tự tin. Skill chính là viết ý định đó ra bên ngoài: quy ước dự án, các bước xây dựng, "chúng ta không làm điều đó vì lần đó đã xảy ra tai nạn", v.v., đều được viết một lần ở nơi mà agent sẽ đọc mỗi lần chạy. Không có skills, mỗi vòng lặp phải suy luận lại toàn bộ dự án của bạn từ đầu; có skills, nó giống như đang tăng trưởng lãi kép.

Cần phân biệt một điểm: skill là định dạng viết, plugin là cách phân phối. Khi bạn muốn chia sẻ một skill giữa nhiều kho mã nguồn, hoặc đóng gói một vài skill lại với nhau, bạn sẽ đóng gói chúng thành một plugin. Codex như vậy, Claude Code cũng vậy.

Plugins and connectors: Để vòng lặp tiếp xúc với công cụ thực của bạn

Một vòng lặp chỉ nhìn thấy hệ thống tệp là một vòng lặp rất nhỏ. Connectors được xây dựng dựa trên MCP, cho phép agent đọc trình theo dõi issue của bạn, truy vấn cơ sở dữ liệu, gọi API staging hoặc gửi tin nhắn trong Slack. Cả Codex và Claude Code đều hỗ trợ MCP, vì vậy connector bạn viết cho một bên thường cũng có thể sử dụng được ở bên kia. Plugins sẽ đóng gói connectors và skills lại với nhau, để đồng đội của bạn có thể cài đặt cấu hình đầy đủ một lần, thay vì xây dựng lại toàn bộ dựa trên trí nhớ.

Đây là sự khác biệt giữa "một agent nói với bạn 'đây là bản sửa lỗi'" và "một vòng lặp tự mở PR, liên kết ticket Linear và thông báo trên kênh khi CI pass". Connectors quan trọng vì chúng cho phép vòng lặp hành động trong môi trường thực của bạn, thay vì chỉ nói với bạn "nếu tôi có thể làm, tôi sẽ làm như vậy".

Sub-agents: Để người tạo ra xa khỏi người kiểm tra

Trong một vòng lặp, thiết kế cấu trúc hữu ích nhất, hơn xa việc tách biệt "người viết" và "người kiểm tra". Mô hình viết mã quá dễ dàng trở nên quá khoan dung khi tự chấm điểm bài tập của chính mình. Một agent khác mang theo hướng dẫn khác, đôi khi thậm chí sử dụng mô hình khác, có thể nắm bắt được những vấn đề mà agent đầu tiên đã tự thuyết phục bản thân bỏ qua.

Codex chỉ tạo subagents khi bạn yêu cầu, chúng sẽ chạy song song, sau đó hợp nhất kết quả thành một câu trả lời. Bạn có thể định nghĩa agents của riêng mình trong tệp TOML ở .codex/agents/: mỗi agent có tên, mô tả, hướng dẫn và tùy chọn mô hình và cường độ suy luận. Do đó, người kiểm tra an ninh của bạn có thể là một mô hình mạnh với cường độ suy luận cao, trong khi người thám hiểm của bạn có thể là một mô hình nhẹ, nhanh, chỉ đọc. Claude Code cũng thực hiện khả năng tương tự thông qua subagents và agent teams trong .claude/agents/, cho phép nhiều agent chuyển công việc giữa nhau. Sự phân công phổ biến nhất ở cả hai bên là: một agent thám hiểm, một agent triển khai, một agent xác minh theo quy chuẩn.

Tôi đã trình bày quan điểm này hai lần: một lần trong code agent orchestra, lần khác trong adversarial code review. Nó đặc biệt quan trọng trong vòng lặp, bởi vì vòng lặp chạy khi bạn không để mắt tới, vì vậy một verifier (người xác minh) mà bạn thực sự tin tưởng, là lý do duy nhất để bạn dám rời đi. Subagents thực sự tiêu thụ nhiều token hơn, vì mỗi agent phải thực hiện cuộc gọi mô hình và công cụ riêng, vì vậy bạn nên sử dụng chúng ở những nơi "đáng trả tiền cho ý kiến thứ hai". Điều này về cơ bản cũng là những gì /goal của Claude Code làm ở lớp dưới: một mô hình mới quyết định vòng lặp đã hoàn thành chưa, thay vì để mô hình đã hoàn thành công việc quyết định. Nghĩa là, nó áp dụng sự tách biệt "người tạo ra" và "người kiểm tra" vào chính điều kiện dừng.

Một vòng lặp trông như thế nào

Ghép những thứ này lại với nhau, một luồng đơn lẻ sẽ trở thành một bảng điều khiển nhỏ. Dưới đây là một cấu trúc tôi thường sử dụng.

Mỗi sáng, một automation chạy trên kho mã nguồn. Prompt của nó sẽ gọi một skill triage, đọc các lần thất bại CI ngày hôm trước, các issues đang mở, các commits gần đây và ghi phát hiện vào một tệp Markdown hoặc bảng Linear. Đối với mỗi vấn đề đáng xử lý, luồng sẽ mở một worktree cô lập, cử một sub-agent soạn thảo phương án sửa lỗi, rồi cử sub-agent thứ hai xem xét phương án này dựa trên project skills và các bài kiểm tra hiện có.

Connectors cho phép vòng lặp này tự mở PR và cập nhật ticket. Bất cứ thứ gì vòng lặp không xử lý được sẽ đi vào triage inbox, giao cho tôi xử lý. Tệp trạng thái là xương sống của toàn bộ hệ thống: nó ghi nhớ những gì đã thử, những gì đã pass, những gì vẫn chưa hoàn thành. Do đó, lần chạy vào sáng hôm sau sẽ tiếp tục từ nơi hôm nay dừng lại.

Hãy chú ý bạn thực sự đã làm gì. Bạn chỉ thiết kế một lần. Những bước đó không phải do bạn tự mình prompt từng cái một. Đây là phiên bản hiện thực của câu nói đó của Steinberger. Và cùng một vòng lặp có thể chạy trên Codex, cũng có thể chạy trên Claude Code, vì các thành phần bản thân chúng là cùng một bộ.

Vòng lặp vẫn sẽ không thay bạn làm gì

Vòng lặp thay đổi cách làm việc, nhưng không xóa bạn khỏi công việc. Trên thực tế, khi vòng lặp trở nên mạnh hơn, ba vấn đề sẽ trở nên gay gắt hơn, chứ không dễ dàng hơn.

Xác minh vẫn phụ thuộc vào bạn. Một vòng lặp chạy không giám sát cũng có thể đang mắc lỗi không giám sát. Lý do bạn tách verifier sub-agent và maker ra là để câu nói "đã hoàn thành" của vòng lặp có ý nghĩa phần nào. Dù vậy, "hoàn thành" vẫn là một tuyên bố, không phải là bằng chứng. Tôi vẫn lặp lại cùng một câu trong code review in the age of AI: trách nhiệm của bạn là giao mã mà bạn xác nhận có hiệu lực.

Nếu bạn bỏ mặc, sự hiểu biết của chính bạn vẫn sẽ mục nát. Vòng lặp càng nhanh chóng giao mã mà bạn không tự viết, khoảng cách giữa những gì bạn thực sự hiểu và những gì thực sự tồn tại trong hệ thống càng lớn. Đây là comprehension debt (nợ hiểu biết). Nếu bạn không đọc những gì vòng lặp tạo ra, một vòng lặp trơn tru chỉ khiến món nợ này tăng trưởng nhanh hơn.

Và, đúng vậy, tư thế thoải mái nhất rất có thể cũng là tư thế nguy hiểm nhất. Khi vòng lặp có thể tự chạy, bạn rất dễ dừng việc hình thành phán đoán của riêng mình, chỉ chấp nhận bất cứ thứ gì nó trả về. Tôi gọi đây là cognitive surrender (đầu hàng nhận thức). Nếu bạn thiết kế vòng lặp với sự phán đoán, nó là liều thuốc giải; nếu bạn thiết kế vòng lặp chỉ để trốn tránh suy nghĩ, nó là chất xúc tác tăng tốc. Cùng một hành động, dẫn đến kết quả hoàn toàn trái ngược.

Xây dựng vòng lặp, nhưng vẫn làm kỹ sư

Tôi cho rằng, điều này báo trước sự tiến hóa trong công việc tương lai của chúng ta. Dù vậy, nếu tôi không tự mình xem xét mã, hoặc hoàn toàn phụ thuộc vào vòng lặp tự động để sửa mã, chất lượng sản phẩm của tôi sẽ bị tổn hại. Tôi rất có thể rơi vào một vòng xoáy đi xuống: liên tục tự đào sâu vào hố.

Vì vậy, bạn tất nhiên có thể xây dựng vòng lặp của riêng mình, nhưng đừng quên, việc trực tiếp prompt agent của bạn vẫn hiệu quả. Điểm mấu chốt là tìm ra sự cân bằng phù hợp.

Kết quả của vòng lặp cũng sẽ khác nhau tùy người. Hai người có thể xây dựng cùng một vòng lặp hoàn toàn giống nhau, nhưng lại nhận được kết quả hoàn toàn trái ngược. Một người dùng nó để tăng tốc trên công việc mình hiểu sâu sắc; người kia dùng nó để trốn tránh việc hiểu chính công việc đó. Vòng lặp không biết sự khác biệt giữa hai điều này. Bạn biết.

Đây là lý do tại sao loop design (thiết kế vòng lặp) khó hơn prompt engineering (kỹ thuật prompt), chứ không dễ hơn. Ý của Cherny không phải là công việc trở nên dễ dàng hơn, mà là điểm đòn bẩy đã dịch chuyển.

Hãy xây dựng vòng lặp. Nhưng hãy xây dựng nó như một người vẫn có ý định làm kỹ sư, chứ không phải như một người chỉ chịu trách nhiệm nhấn nút "bắt đầu".

Câu hỏi Liên quan

QTác giả định nghĩa 'Loop Engineering' (Kỹ thuật vòng lặp) trong lập trình AI là gì?

ALoop Engineering (Kỹ thuật vòng lặp) là phương pháp trong đó con người thiết kế một hệ thống hoặc quy trình tự động (một vòng lặp) để liên tục phát hiện nhiệm vụ, phân bổ chúng, kiểm tra kết quả, ghi lại tiến độ và quyết định bước tiếp theo. Hệ thống này thay thế việc con người phải viết prompt thủ công cho từng bước, cho phép các Agent AI hoạt động một cách tự chủ và liên tục để hoàn thành mục tiêu.

QBài viết đề cập một vòng lặp (loop) tiêu chuẩn bao gồm những thành phần chính nào?

AMột vòng lặp tiêu chuẩn bao gồm năm thành phần chính: 1) Automations (Tự động hóa): phát hiện và phân loại nhiệm vụ theo lịch trình. 2) Worktrees (Cây công việc): tạo môi trường phát triển độc lập để tránh xung đột. 3) Skills (Kỹ năng): lưu trữ kiến thức và quy ước dự án. 4) Plugins/Connectors (Plugin và bộ kết nối): tích hợp với các công cụ thực tế như GitHub, Linear. 5) Sub-agents (Agent con): tách biệt vai trò thực thi và kiểm tra. Ngoài ra còn có một lớp bộ nhớ bên ngoài (memory) để lưu trạng thái và tiến độ.

QTại sao việc tách biệt 'sub-agent' (Agent thực thi) và 'verifier' (Agent kiểm tra) lại quan trọng trong Loop Engineering?

AViệc tách biệt 'sub-agent' (Agent thực thi) và 'verifier' (Agent kiểm tra) là rất quan trọng vì một Agent khi tự đánh giá công việc của mình có thể quá khoan dung và bỏ sót lỗi. Một Agent độc lập với nhiệm vụ và hướng dẫn khác (đôi khi sử dụng mô hình khác) sẽ đưa ra ý kiến đánh giá khách quan hơn, phát hiện được những vấn đề mà Agent thực thi có thể đã bỏ qua. Điều này đặc biệt quan trọng khi vòng lặp chạy không có sự giám sát trực tiếp của con người.

QBài viết cảnh báo những rủi ro hoặc thách thức tiềm ẩn nào khi áp dụng Loop Engineering?

ABài viết cảnh báo ba rủi ro/thách thức chính: 1) Vẫn cần con người xác minh: Một vòng lặp chạy không giám sát vẫn có thể mắc lỗi một cách tự động. Trách nhiệm cuối cùng về chất lượng code thuộc về kỹ sư. 2) Nợ hiểu biết (Comprehension Debt): Nếu không đọc và hiểu code do AI tạo ra, khoảng cách giữa hiểu biết của kỹ sư và hệ thống thực tế sẽ ngày càng lớn. 3) Đầu hàng nhận thức (Cognitive Surrender): Nguy cơ kỹ sư ngừng đưa ra phán đoán của riêng mình và chỉ thụ động chấp nhận đầu ra từ AI, dẫn đến chất lượng suy giảm.

QTheo tác giả, kỹ năng then chốt để cộng tác với AI trong lập trình trong tương lai là gì?

ATheo tác giả, kỹ năng then chốt trong tương lai không còn chỉ là viết một prompt tốt (Prompt Engineering), mà là khả năng thiết kế các luồng công việc (workflow) cho Agent AI một cách đáng tin cậy, có thể kiểm chứng và vận hành bền vững - tức là Loop Design (Thiết kế vòng lặp). Điều này đòi hỏi kỹ sư phải áp dụng tư duy và khả năng phán đoán của mình vào việc xây dựng hệ thống, thay vì chỉ thao tác từng bước với AI.

Nội dung Liên quan

Báo cáo tài chính mạnh nhất lịch sử của Oracle, nhưng vì sao giá cổ phiếu lại giảm?

Oracle đã công bố báo cáo tài chính mạnh nhất từ trước đến nay với doanh thu quý IV đạt 19,2 tỷ USD (tăng 21%) và doanh thu cả năm 2026 đạt kỷ lục 67,4 tỷ USD (tăng 17%). Tăng trưởng chủ yếu đến từ mảng điện toán đám mây, đặc biệt là cơ sở hạ tầng AI (IaaS) với mức tăng 93% trong quý. Tuy nhiên, cổ phiếu của hãng đã giảm sau báo cáo. Nguyên nhân chính đến từ những áp lực tài chính đi kèm. Đơn hàng tồn đọng (RPO) của Oracle tăng vọt lên 638 tỷ USD, hơn một nửa trong số đó đến từ hợp đồng AI với OpenAI. Để đáp ứng nhu cầu này, công ty đã tăng mạnh chi tiêu vốn (CAPEX) lên 55,7 tỷ USD trong năm, dẫn đến dòng tiền tự do âm 23,7 tỷ USD. Oracle cũng đã huy động 48 tỷ USD thông qua phát hành nợ và vốn cổ phần, và dự kiến huy động thêm 40 tỷ USD trong năm tài chính 2027, khiến các nhà đầu tư lo ngại về rủi ro nợ cao và tính bền vững của nhu cầu AI. Bất chấp những lo ngại, Oracle đưa ra dự báo lạc quan cho năm tài chính 2027, với mục tiêu doanh thu 90 tỷ USD. Công ty cũng đang đẩy mạnh ứng dụng AI vào lĩnh vực chăm sóc sức khỏe thông qua bộ giải pháp Oracle Health, nhằm tạo ra các nguồn doanh thu mới trong tương lai.

链捕手33 phút trước

Báo cáo tài chính mạnh nhất lịch sử của Oracle, nhưng vì sao giá cổ phiếu lại giảm?

链捕手33 phút trước

Muốn đuổi theo SpaceX? Dữ liệu cho thấy 30 IPO Mỹ "ngôi sao", năm đầu tiên đa số đều bị "chém đôi"

**Tóm tắt:** SpaceX dự kiến phát hành cổ phiếu lần đầu ra công chúng (IPO) vào ngày 12/6 với mã SPCX trên Nasdaq, định giá khoảng 1,75 nghìn tỷ USD - đợt IPO lớn nhất lịch sử. Tuy nhiên, dữ liệu lịch sử từ 30 công ty công nghệ nổi bật khác cho thấy triển vọng đầu tư ngắn hạn không mấy sáng sủa. Phân tích của Motley Fool chỉ ra rằng lợi nhuận trung vị của các công ty này sau 6 tháng và 12 tháng niêm yết đều là -9%. Đặc biệt, mức sụt giảm tối đa (drawdown) trung vị trong năm đầu tiên lên tới 54%, không có công ty nào tránh khỏi. Ngay cả những cổ phiếu thành công sau này như Meta hay Palantir cũng từng trải qua đợt sụt giảm tương tự. Về định giá SpaceX, Morningstar đánh giá công ty bị định giá quá cao, với mức định giá hợp lý chỉ khoảng 7800 tỷ USD, chưa bằng một nửa so với định giá IPO. Năm 2025, SpaceX ghi nhận doanh thu 18,7 tỷ USD nhưng lỗ ròng 4,9 tỷ USD. Theo dữ liệu S-1, riêng quý I/2026 lỗ lên tới 4,28 tỷ USD, chủ yếu do mảng AI (xAI) "đốt" khoảng 2,5 tỷ USD mỗi quý. Mặc dù SpaceX nắm giữ thị phần phóng tên lửa áp đảo tại Mỹ và Starlink đã có lãi, nhưng với tỷ lệ Giá/Doanh thu (P/S) trên 90 lần cùng bài học từ lịch sử, các nhà đầu tư mua vào ngay sau IPO cần chuẩn bị tinh thần cho khả năng biến động mạnh và thua lỗ đáng kể trong năm đầu tiên.

marsbit41 phút trước

Muốn đuổi theo SpaceX? Dữ liệu cho thấy 30 IPO Mỹ "ngôi sao", năm đầu tiên đa số đều bị "chém đôi"

marsbit41 phút trước

Xu Hướng Thị Trường Chứng Khoán Mỹ: Chỉ Số Dow Jones Phá Vỡ Ngưỡng 50,000 Điểm, Báo Cáo Tài Chính Xuất Sắc Nhất Cũng Không Cứu Nổi Oracle

Chứng khoán Mỹ giảm mạnh vào ngày 10/6 (giờ địa phương), với Dow Jones mất 953.33 điểm (-1.87%) xuống dưới mốc 50,000. S&P 500 và Nasdaq cũng giảm lần lượt 1.62% và 1.98%. Nguyên nhân đến từ hai mặt trận: dữ liệu CPI tháng 5 cao hơn và leo thang căng thẳng địa chính trị giữa Mỹ và Iran, đẩy chỉ số VIX tăng vọt. Trong bối cảnh vĩ mô u ám, câu chuyện AI đang chuyển hướng. Siêu máy tính (SMCI) sụt giảm thảm hại 28% sau thông báo gây vốn 70 tỷ USD. Oracle, dù có báo cáo quý mạnh với doanh thu và đơn đặt hàng tồn đọng (RPO) kỷ lục, đã giảm giá trong giao dịch ngoài giờ do dòng tiền tự do âm và kế hoạch vay thêm 400 tỷ USD để xây dựng trung tâm dữ liệu. Các giao dịch gây vốn lớn gần đây của Alphabet và SMCI cho thấy thị trường đang đánh giá lại chi phí và chu kỳ hoàn vốn cho cuộc chạy đua vũ trang AI. Dòng tiền tìm đến các tài sản trú ẩn an toàn, đẩy cổ phiếu như Coca-Cola và TJX lên mức cao kỷ lục. Chỉ số Russell 2000 (vốn ít liên quan đến AI) cũng giảm ít nhất. Bài học chính: Đợt bán tháo này là sự kết hợp giữa chu kỳ lạm phát/địa chính trị và chu kỳ tín dụng AI. Khi các gã khổng lồ công nghệ chuyển từ dùng lợi nhuận sang dùng vốn vay và pha loãng cổ phần để tài trợ cho AI, định giá cổ phiếu có thể thay đổi căn bản. Mọi sự chú ý giờ đang đổ dồn vào dữ liệu PPI sắp tới và định hướng từ ban lãnh đạo Oracle.

marsbit49 phút trước

Xu Hướng Thị Trường Chứng Khoán Mỹ: Chỉ Số Dow Jones Phá Vỡ Ngưỡng 50,000 Điểm, Báo Cáo Tài Chính Xuất Sắc Nhất Cũng Không Cứu Nổi Oracle

marsbit49 phút trước

Cảnh báo tối đa: Ngân hàng Nhật Bản sắp tăng lãi suất 25bp, thị trường Mỹ và crypto tái hiện đợt sụt giảm nhanh năm 2024?

Theo Nikkei, Ngân hàng Trung ương Nhật Bản (BOJ) dự kiến tăng lãi suất chính sách ngắn hạn thêm 25 điểm cơ bản lên 1.0% trong cuộc họp tháng 6, mức cao nhất kể từ năm 1995. Xác suất thị trường định giá cho việc tăng lãi suất đã lên tới 98%. Động thái này chủ yếu do áp lực lạm phát đầu vào từ giá năng lượng biến động và đồng yên yếu kéo dài, buộc BOJ phải thắt chặt chính sách để kiềm chế kỳ vọng lạm phát. Việc tăng lãi suất sẽ đẩy cao chi phí vốn bằng yên, có nguy cơ kích hoạt làn sóng thanh lý các giao dịch carry trade sử dụng đồng yên. Theo ước tính của Morgan Stanley, vẫn còn khoảng 500 tỷ USD vị thế tài trợ bằng yên chưa đóng trên thị trường. Việc thanh lý bắt buộc có thể dẫn đến bán tháo tài sản rủi ro toàn cầu, lặp lại kịch bản sụt giảm nhanh vào tháng 8/2024, khi thị trường chứng khoán và tiền mã hóa (ví dụ Bitcoin giảm 15% trong một ngày) chịu tác động mạnh. Đối với thị trường Mỹ, sự thắt chặt thanh khoản sẽ tác động trực tiếp đến các cổ phiếu tăng trưởng định giá cao, đặc biệt là nhóm AI và công nghệ vốn phụ thuộc vào vốn vay rẻ. Chi phí năng lượng leo thang cũng làm giảm lợi nhuận của các doanh nghiệp AI. Tiền mã hóa, với đặc tính rủi ro cao (beta cao), sẽ dễ bị tổn thương hơn. Chi phí đòn bẩy toàn cầu tăng lên và việc cạnh tranh thanh khoản với lĩnh vực AI có thể gây áp lực bán mạnh lên Bitcoin và các tài sản tiền mã hóa khác. Tóm lại, việc BOJ tăng lãi suất là tín hiệu thắt chặt thanh khoản toàn cầu, đặt ra rủi ro điều chỉnh ngắn hạn đáng kể cho các tài sản rủi ro như cổ phiếu công nghệ AI và tiền mã hóa, trong bối cảnh chồng chất các yếu tố từ xung đột địa chính trị và chính sách tiền tệ. Nhà đầu tư cần thận trọng và quản lý rủi ro đòn bẩy.

marsbit53 phút trước

Cảnh báo tối đa: Ngân hàng Nhật Bản sắp tăng lãi suất 25bp, thị trường Mỹ và crypto tái hiện đợt sụt giảm nhanh năm 2024?

marsbit53 phút trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片