Gần đây, từ nào đang "sốt" nhất ở Thung lũng Silicon?
Loop.
Vừa mở X ra, toàn mạng tràn ngập đều nói về Loop Engineering.
Hàng loạt đại gia Thung lũng Silicon đang lần lượt từ bỏ gợi ý từ (prompt), chuyển hướng sang vòng lặp tự chủ (autonomous loop)!
Hoàng Nhân Huân đã chỉ ra trọng tâm mới cho giai đoạn tiếp theo (cũng là cách mới để đốt token):
Nobody writes prompts anymore. The new job is to write and handle loops.
(Không ai còn viết prompt nữa, công việc mới là viết Loop, xử lý Loop.)

Gần đây, kỹ sư Anthropic tiết lộ:
Hơn 80% kỹ sư nội bộ Anthropic đang sử dụng các vòng lặp tự cải thiện (self-improving loops), trong vòng 3-6 tháng sẽ đạt 100%.

Ngô Ân Đạt khẳng định: Sau 3 đến 6 tháng nữa, prompt sẽ diệt vong! Loop thay thế prompt đã là định cục.

Trước đó, khi giảng giải về dự án AutoResearch của mình, Karpathy đã thảo luận về vòng khép kín của AI agents (sinh ra → thực thi → đánh giá → cải thiện), kêu gọi loại bỏ con người khỏi một phần vòng lặp.

Trong một cuộc phỏng vấn vào tháng 3, Karpathy đã nói sâu về AutoResearch / Karpathy Loop
Cha đẻ của OpenClaw, Peter Steinberger thẳng thừng nói: Nhắc nhở hàng tháng, đừng viết prompt bằng tay nữa, thiết kế loop mới là vương đạo.

Cha đẻ của Claude Code, Boris Cherny trực tiếp tuyên bố: Loop chính là tương lai!
Hai năm trước, chúng ta còn viết code thủ công. Sau đó bắt đầu chuyển sang để agent viết code.
Mà hiện nay, chúng ta đang tiến đến giai đoạn: Agent này nhắc nhở agent khác, rồi agent sau đó sinh ra code.
Bước từ source code sang agent tuy lớn, nhưng ý nghĩa và ảnh hưởng của việc đưa cơ chế vòng lặp vào, cũng không hề kém bước trước đó.

Không ngờ, prompt engineering nổi lên được hai năm, các kỹ sư AI đỉnh cao đã không chơi nữa.
Tại sao các đại gia Thung lũng Silicon đều lạc quan về Loop?
Bản chất của prompting truyền thống là: Con người chính là vòng lặp.
Bạn viết prompt → Agent xuất kết quả → Bạn review → Bạn viết prompt tiếp theo → Lặp đi lặp lại.
Mỗi bước đều phụ thuộc vào sự chú ý, trí nhớ ngữ cảnh và băng thông quyết định của con người. Một người một ngày có thể lái hiệu quả một lượng token và độ phức tạp nhiệm vụ là có hạn.
Bản chất của Loop Engineering là: Hệ thống tự trở thành vòng lặp.
Do đó, kỹ thuật vòng lặp quan trọng hơn kỹ thuật gợi ý từ.

Con người chỉ làm một lần thiết kế giá trị cao:
1. Định nghĩa mục tiêu và điều kiện dừng
2. Xây dựng cơ chế xác minh (quan trọng nhất)
3. Thiết lập bộ nhớ bền vững (markdown / trạng thái bên ngoài)
4. Cấu hình phát hiện và điều phối
Sau đó, hệ thống vòng lặp AI có thể tự chủ phát hiện nhiệm vụ → thực thi → xác minh → lưu trữ bền vững → phát hiện lại, chạy 24/7, con người chỉ can thiệp khi cần thiết.

Đó chính là lý do các đại gia Thung lũng Silicon đều lạc quan về Loop.
Họ dựa trên đánh giá này: Một khi loop trưởng thành, tính hiệu quả chi phí của prompt thủ công sẽ trực tiếp sụp đổ!
Sách trắng Loop Engineering 11 trang, lan truyền điên cuồng toàn mạng
Vậy, quá trình vòng lặp rốt cuộc là gì?
Mấy ngày gần đây, trên X bắt đầu lan truyền điên cuồng một bản sách trắng về Loop Engineering.

https://drive.google.com/file/d/1qzKI4DKnyHRpXK1J3ATPqwaqLc0iNu-M/view
Bản PDF 11 trang này, về bản chất là một bản tổng kết phổ biến/hướng dẫn thực địa, tập hợp các thảo luận công khai và kinh nghiệm thực tiễn liên quan.

Ý tưởng cốt lõi trong đó bắt nguồn từ các tuyên bố công khai của Peter Steinberger, Boris Cherny và Addy Osmani.
Kỹ thuật vòng lặp là gì?
Loop Engineering (Kỹ thuật Vòng lặp), được đặt tên bởi kỹ sư Google Chrome Addy Osmani vào tháng 6 năm 2026.

Nó là tầng thứ tư trên nền tảng của kỹ thuật gợi ý từ, kỹ thuật ngữ cảnh, kỹ thuật công cụ chuỗi: Ba tầng trước đều giả định bạn ngồi trước bàn phím chỉ huy AI từng dòng; Loop Engineering sẽ đưa bạn ra khỏi vị trí đó, giải phóng bạn hoàn toàn khỏi vị trí làm việc.
Từ đây, bạn không còn là động cơ lái AI, mà là kiến trúc sư thiết kế động cơ này.
Hệ thống sẽ tự động thức dậy vào thời gian đã thiết lập, tạo ra các agent con để làm việc, và đưa kết quả đầu ra phản hồi cho chính nó như đầu vào của vòng tiếp theo.
Bài viết chia một Loop hoàn chỉnh thành năm động tác then chốt:
Phát hiện: AI sử dụng thư viện kỹ năng cố định tự đi tìm công việc có giá trị, ví dụ đọc bản ghi thất bại CI mới nhất hoặc Issue chưa giải quyết.
Bàn giao: Mở sandbox độc lập cho mỗi nhiệm vụ, để nhiều agent chạy song song và không can thiệp lẫn nhau.
Xác minh: Đây là bước cốt lõi nhất. Để AI viết code tự chấm điểm cho mình, nó sẽ chỉ mù quáng tự khen. Do đó, phải đưa vào một agent "người đánh giá" hoàn toàn độc lập, mặc định mang thái độ nghi ngờ để tìm lỗi.
Lưu trữ bền vững: Trí nhớ của AI không thể chỉ nằm trong cửa sổ ngữ cảnh dễ bị xóa sạch, phải cố định trạng thái và tiến độ của nó vào đĩa, để ngày mai có thể tiếp tục làm.
Điều phối: Thông qua kịch bản tự động hóa để hệ thống tự chủ vận hành theo chu kỳ, khép kín toàn bộ vòng lặp.

Trong đó, khó nhất, cũng dễ bị lười bỏ qua nhất là xác minh.
Để AI tự chấm điểm cho mình, nó hầu như luôn khen mình, vì trong đầu nó chứa chuỗi thuyết phục bản thân. Cách giải quyết, chính là đưa vào một Agent đánh giá độc lập, mặc định giả định code là hỏng.

Tuy nhiên, hệ thống chạy hoàn toàn tự động không có nghĩa là bạn có thể an tâm nằm cao gối đầu. Tác giả cảnh báo: Khi vòng lặp chạy cuồng loạn vào đêm khuya, có thể âm thầm tích lũy bốn chi phí tiềm ẩn.
Nợ xác minh: Lỗi nhỏ chưa được xác minh bị âm thầm hợp nhất vào kho.
Suy thoái hiểu biết: AI viết code quá nhanh, dẫn đến hiểu biết của con người về kho code nghiêm trọng tuột dốc.
Đầu hàng nhận thức: Con người lười xem xét lại, chấp nhận toàn bộ kết quả của AI.
Mất kiểm soát Token: AI trong vòng lặp chết thử lại suốt đêm, đốt sạch ngân sách.

Cùng một Loop, hai người xây dựng, có thể cho ra kết quả hoàn toàn trái ngược. Mang óc phán đoán vào, thì phóng đại óc phán đoán; mang sự lười biếng vào, thì phóng đại sự lười biếng.
Tóm lại, báo cáo này tiết lộ một thay đổi sâu sắc của ngành: Kỹ thuật vòng lặp khiến việc sinh code gần như miễn phí, còn khả năng phán đoán của con người, lại trở thành tài nguyên khan hiếm duy nhất!
Ngoài ra, đồng thời lan truyền điên cuồng toàn mạng còn có một sổ tay thực hành 14 bước của Codez, hiện đã có hàng triệu lượt chia sẻ.

Đại ý bài viết như sau: Prompt đã lỗi thời rồi, điểm đòn bẩy đã dịch chuyển lên một tầng – từ "viết lời để AI đọc", trở thành "thiết kế một hệ thống tự động cung cấp cho AI".
Sự chuyển dịch này có thể chia thành 14 bước, 3 giai đoạn –
Trước tiên đánh giá xem bạn có thực sự cần một vòng lặp không (nhiệm vụ có lặp lại không? Xác minh có thể tự động hóa không? Ngân sách có chịu được không?), sau đó học năm thành phần (điều phối, thư mục làm việc cách ly, file kỹ năng, bộ kết nối bên ngoài, agent con đánh giá độc lập), cuối cùng dựng lên vòng lặp tối thiểu có thể dùng được.
Trong đó điểm then chốt nhất là: Để agent viết code và agent duyệt code tách biệt. Cùng một mô hình vừa làm vận động viên vừa làm trọng tài, kết quả luôn là tự chấm điểm tuyệt đối cho mình.
Vòng lặp không có cổng xác minh khách quan chỉ là "hai người lạc quan gật đầu với nhau", vòng lặp chạy càng tốt, càng dễ khiến kỹ sư ngừng thực sự hiểu code.


Dòng thời gian ra đời của Loop Engineering
Nếu phải vạch ra một dòng thời gian cho kỹ thuật vòng lặp, đại thể như sau.
Giai đoạn nền tảng trước đó
2022: Diêu Thuận Vũ và những người khác đề xuất khung ReAct, đặt nền tảng lý thuyết.
2025: Geoffrey Huntley đề xuất "Ralph".
Đầu 2025–2026: Andrej Karpathy phát hành dự án AutoResearch, hình thành vòng lặp thí nghiệm tự chủ kinh điển, đây là một cột mốc lớn.
Giai đoạn bùng nổ khái niệm và đặt tên
Đầu tháng 6/2026, Peter Steinberger lên tiếng: Bạn không nên nhắc nhận thủ công agent mã hóa nữa, mà nên thiết kế vòng lặp nhắc nhở chúng.
Boris Cherny nói: Tôi không còn trực tiếp nhắc nhở Claude nữa, công việc của tôi là viết các vòng lặp chạy Claude.
Ngày 7 tháng 6 năm 2026: Addy Osmani xuất bản blog "Loop Engineering", chính thức đặt tên, cung cấp khung 4 tầng: Prompt → Context → Harness → Loop Engineering).
Sau đó, trong suốt tháng 6, Loop Engineering bắt đầu lan truyền như virus trên toàn mạng.

Claude "vòng lặp vô hạn", Agent tự động hóa tiếp quản tất cả
Trong podcast nội bộ, kỹ sư của Anthropic tiết lộ một chi tiết rùng rợn:
Khi bạn click chạy, để Claude thực thi 8 giờ, bạn thực chất đang thực hiện một ván cược sức mạnh tính toán 500 đô la.
Nếu bạn còn đang băn khoăn viết prompt thế nào, bạn đã thua rồi.

Trong logic của Anthropic, kỹ sư đang tiến hóa thành "chuyên gia phân bổ sức mạnh tính toán".
Công việc cốt lõi của bạn không còn là viết logic, mà là quyết định mỗi xu sức mạnh tính toán được đầu tư vào đâu.
Như nhà nghiên cứu OpenAI Noam Brown đã chỉ ra vào đầu tháng này, các mô hình đương đại chỉ cần bạn sẵn sàng ném đủ sức mạnh tính toán vào, gần như có thể giải quyết mọi vấn đề.

Kỹ thuật vòng lặp là một phần của xu hướng lớn "tính toán thời điểm kiểm thử (test-time computation)".
Thú vị là, ý tưởng để agent làm việc theo vòng lặp thực ra đã có hình hài từ trước.

Ít nhất là vào mùa hè năm ngoái, chú chăn cừu người Úc Geoffrey Huntley đã nhắc đến cách làm tương tự trong blog, ông gọi đó là "vòng lặp Ralph".

Một năm trước, nếu bạn muốn thực hiện một vòng lặp, bạn phải viết một đống script bash, rồi bảo trì mãi đống code đó, nó chỉ thuộc về một mình bạn.
Mà hiện nay, các thành phần này đã được tích hợp trực tiếp trong sản phẩm.
Bạn sẽ không còn tranh cãi nên dùng Codex hay Claude Code nữa, mà là trực tiếp thiết kế các vòng lặp có thể chạy bình thường cho dù bạn đang ở công cụ nào.
Nguyên Giám đốc phụ trách quan hệ kỹ sư và nhà phát triển của Google, Addy Osmani chỉ ra, các phần cần thiết cho kỹ thuật vòng lặp, các công cụ AI này đều đã có.

Ông còn khẳng định, kỹ thuật vòng lặp có thể dẫn đến việc kỹ sư "đầu hàng nhận thức":
Khi vòng lặp tự vận hành, bạn rất dễ ngừng suy nghĩ, chỉ thụ động chấp nhận mọi thứ nó phản hồi.
Đây cũng chính là điều mà kỹ sư phần mềm Armin Ronacher lo lắng.

Đây cũng chính là điều được nói trong Cuốn sách Cam, Addy Osmani khuyến khích mọi người mang theo óc phán đoán để thiết kế vòng lặp:
Thiết kế vòng lặp, nếu mang óc phán đoán làm sẽ là giải pháp, nếu để trốn tránh suy nghĩ làm thì là chất xúc tác – cùng một động tác, kết quả hoàn toàn trái ngược.
Vòng lặp không dừng, kỹ thuật không chết
Tại hội nghị kỹ sư AI tháng Tư, kỹ sư của Anthropic nói, họ để Claude phát triển ứng dụng game nhỏ retro, dùng hai cách: Một là chỉ dùng prompt cực giản, một là dùng vòng lặp agent.
Kết quả đối chiếu rất rõ ràng: Phiên bản chỉ dùng prompt cực giản tốn 20 phút, tiêu hao 9 đô la là xong; còn cách vòng lặp tốn 6 giờ, tiêu hao 200 đô la.
Nhưng chất lượng ứng dụng do cách sau làm ra cao hơn hẳn.
Phiên bản trước game không chạy được, App rất thô sơ; còn phiên bản vòng lặp thì phong phú hơn nhiều, chứa nhiều chức năng mà nhà thiết kế game muốn.
Vòng lặp sẽ không thương xót người từ bỏ suy nghĩ. Nó chỉ dùng tốc độ nhanh hơn, biến sự thiếu hiểu biết của bạn thành món nợ trong code.

Mà những người sẵn sàng tiếp tục duy trì sự hiểu biết vụng về, liên tục định nghĩa quy tắc, và chịu trách nhiệm cho kết quả cuối cùng, sẽ trong lần chuyển dịch mô hình này, có được đòn bẩy lớn hơn trước.
Build the loop. Stay the engineer.
Prompt đã chết, Loop đang chạy.
Và bạn, vẫn là người quyết định ý nghĩa của nó.
Tài liệu tham khảo:
https://x.com/DataScienceDojo/status/2069873216152092975
https://x.com/0xCodez/status/2064374643729773029
https://x.com/akshay_pachaar/status/2069769689560187027
Bài viết đến từ tài khoản WeChat công chúng "Tân Trí Nguyên", tác giả: ASI Khải Thị Lục






