Cách thực hiện nghiên cứu sâu với Dynamic Workflows của Claude

marsbitXuất bản vào 2026-06-09Cập nhật gần nhất vào 2026-06-09

Tóm tắt

Công việc nghiên cứu kỹ thuật chứa đầy cạm bẫy, dễ bị chìm trong biển thông tin và mất tập trung vào mục tiêu ban đầu. Claude mới giới thiệu tính năng **Dynamic Workflows** (Quy trình làm việc động), một bước tiến vượt bậc so với các phương pháp AI truyền thống bằng cách tự động thiết kế và điều phối quy trình tối ưu cho từng nhiệm vụ cụ thể, đặc biệt hiệu quả cho nghiên cứu sâu (**deep-research**). Dynamic Workflows hoạt động dựa trên sáu mẫu điều phối lõi, giải quyết hai vấn đề cốt lõi: **cách chia nhỏ nhiệm vụ** và **cách hợp nhất kết quả**: 1. **Định tuyến (Classify-And-Act)**: Phân loại nhiệm vụ và định tuyến đến chuyên gia phù hợp nhất. 2. **Chia tách & Hợp nhất (Fan-out & Merge)**: Chia thành các nhiệm vụ con chạy song song, sau đó tổng hợp kết quả. 3. **Xác minh đối kháng (Adversarial Verification)**: Sử dụng nhiều agent độc lập để thách thức và biểu quyết cho một kết luận, chống lại thiên kiến xác nhận. 4. **Tạo & Lọc (Generate & Filter)**: Tạo ra nhiều phương án, sau đó lọc để giữ lại những phương án tốt nhất. 5. **Giải đấu (Tournament)**: Các agent cạnh tranh từng cặp qua nhiều vòng để chọn ra giải pháp tối ưu. 6. **Vòng lặp (Loop)**: Lặp lại nhiệm vụ một cách thích ứng cho đến khi đạt tiêu chí hoàn thành. So sánh với hệ thống deep-research tự xây dựng trước đây, Dynamic Workflows của Claude bổ sung các cơ chế then chốt giúp nghiên cứu **định hướng mục tiêu** và **chắc chắn** hơn: * **Phân tách vấn đề**: Phân tích câu hỏi ban đầu thành các khía cạnh phụ t...

Thực hiện nghiên cứu công nghệ thực sự là một việc đầy cạm bẫy (dù cho là người hay AI), bởi từ lúc bắt đầu nghiên cứu, bạn sẽ tiếp nhận lượng thông tin khổng lồ, quan điểm thông tin ngày càng nhiều, kết luận ngày càng mơ hồ. Vì vậy, luôn phải biết quay về với mục tiêu ban đầu.

Đây cũng là điểm mà AI từ trước đến nay chưa đủ xuất sắc, bởi từ góc độ tập trung và liên tưởng, AI sẽ dễ bị mắc kẹt trong lượng thông tin hiện tại hơn con người, và khả năng liên tưởng xuyên ngành thực sự có giá trị rất yếu.

Tất nhiên, điểm đủ xuất sắc của AI chính là khả năng thực thi, sẽ dưới hình thức agent từng tầng một đi tìm kiếm, tổng hợp, kết luận, hoàn toàn có thể tránh được hao tổn chi tiết.

Mặc dù nửa năm nay tôi không mấy đăng bài công khai trên WeChat, nhưng hầu như tất cả các mặt trận chính trong ngành tôi đều có quan tâm và nghiên cứu toàn diện, và thứ hỗ trợ đầu vào đầu ra này, chính là một hệ thống deep-research của riêng tôi.

Và trước việc tuần trước Claude Code ra mắt tính năng Dynamic Workflows này, tôi muốn đối đầu thử xem, xem năng lực mặc định của nó, liệu có thể hoàn toàn vượt qua tôi hay không.

II. Dynamic Workflows là gì

Dynamic Workflows (Luồng công việc động) ý tưởng cốt lõi của nó là: Trước khi thực hiện nhiệm vụ, để AI tự động thiết kế nhiệm vụ này nên dùng luồng công việc nào để hoàn thành, sau đó mới khởi động thực thi.

Điều này khác biệt cơ bản với "Chế độ kế hoạch" và "skill" mà chúng ta từng dùng trước đây. Chế độ kế hoạch là chia nhỏ nhiệm vụ hơn, nhưng chưa chắc đã phù hợp với một luồng công việc hợp lý nào đó, theo sự sắp xếp của prompt của bạn, mới có thể thêm tiêu chí nghiệm thu (điều này rất quan trọng với Research), tương tự bạn chỉ khi có prompt, nó mới có thể thiết lập trước một số quy tắc harness tốt hơn.

Nhưng luồng công việc động sẽ tự động đưa logic nghiệm thu, hội tụ kết quả, xác minh đối kháng... những thứ này vào.

Cách kích hoạt rất đơn giản, trực tiếp trong cc sử dụng /deep-research sau đó cung cấp một số mẫu nghiên cứu và tài liệu đầu vào là được, nếu muốn dùng riêng năng lực luồng công việc động thì dùng prompt hoặc nói trực tiếp ultracode, lưu ý trước khi dùng, lượng token tiêu hao gấp khoảng vài chục lần bình thường.

III. Sáu chế độ luồng công việc tích hợp sẵn

Dưới đáy của luồng công việc động, là sáu chế độ điều phối cốt lõi do chính thức tổng kết, đây là lý do tại sao nó mạnh hơn đối thoại/agent/skill thông thường.

Thực ra đằng sau sáu chế độ này chỉ có hai vấn đề cốt lõi: Nhiệm vụ chia thế nào? Kết quả hợp thế nào? Chia thành sáu loại bản chất là sự kết hợp của hai cái này.

3.1 Chế độ định tuyến (Classify-And-Act)

Đầu tiên một agent phân loại nhiệm vụ, sau đó phân phối nhiệm vụ cho agent chuyên môn phù hợp nhất để làm. Logic cốt lõi là logic lựa chọn định tuyến, chứ không phải song song hay lặp lại. Một nhiệm vụ chỉ đi một đường, các đường khác hoàn toàn không thực thi.

Ví dụ tôi có thể có ba vai trò subagent thiết lập trước: một agent phân tích nghiêm ngặt xác minh dữ liệu, một agent đầu ra giỏi viết, một agent thách thức chuyên tìm lỗ hổng. Để tầng định tuyến đánh giá nhiệm vụ con hiện tại phù hợp giao cho ai, chứ không để một agent ôm hết.

Giá trị của chế độ này nằm ở: Chính xác và tiết kiệm, prompt của mỗi agent có thể hoàn toàn độc lập, không bị nhiễu bởi mục tiêu khác, hình thành khám phá có chiều sâu chuyên môn. Lượng token tiêu hao thấp nhất, tốc độ phản hồi nhanh nhất. Ranh giới trách nhiệm rất rõ ràng.

Nhược điểm cũng rõ rệt, khả năng xử lý nhiệm vụ ranh giới mơ hồ (ví dụ "vừa là vấn đề kỹ thuật vừa là vấn đề tài khoản") yếu.

3.2 Chia nhỏ và hợp nhất (Fan-out & Merge)

Cũng là chế độ tôi hay dùng nhất, logic cốt lõi là song song + hợp nhất. Nhiệm vụ chia thành N nhiệm vụ con độc lập chạy đồng thời, đợi tất cả hoàn thành rồi hợp nhất thống nhất.

Ưu thế nằm ở tốc độ và cô lập. Tổng thời gian tiêu hao xấp xỉ bằng nhiệm vụ con chậm nhất, chứ không phải tổng của tất cả nhiệm vụ con. Mỗi nhiệm vụ con có context độc lập, không ảnh hưởng lẫn nhau, cũng không vì nhiễu của một nhiệm vụ con nào đó làm ô nhiễm nhiệm vụ con khác.

Điểm yếu là chi phí token gấp N lần so với tuần tự, bản thân tầng hợp nhất (Synthesize) cũng có độ khó - đầu ra cấu trúc không nhất quán của N đường hợp nhất thế nào là một thách thức thiết kế. Chia nhiệm vụ con không tốt sẽ dẫn đến bỏ sót hoặc phủ sóp trùng lặp.

3.3 Xác minh đối kháng (Adversarial Verification)

Logic cốt lõi là kiểm tra, đối với cùng một kết luận, để nhiều agent từ góc độ "bác bỏ" đi thách thức, số phiếu quá nửa mới tính là thông qua.

Ưu thế nằm ở, do Verifier không biết ý tưởng của Worker, chỉ xem kết quả, về cấu trúc đã loại bỏ độ lệch tự đánh giá khi "để mô hình kiểm tra code mình viết".

Chế độ này, giải quyết một vấn đề lâu nay làm tôi băn khoăn: Chúng ta thường dùng cách nói thông thường trò chuyện với AI, nhưng AI có xu hướng trả lời thuận theo kỳ vọng của bạn, dễ sản sinh "thiên kiến xác nhận". Thông qua xác minh đối kháng buộc AI đi tìm phản ví dụ, dựa trên dữ liệu và thực nghiệm để xác minh, chứ không phải chiều theo ý nghĩ của bạn.

Nhưng, việc xác minh này, nếu nó đưa ra phán đoán sai, sẽ dẫn Worker đi lệch, chiều theo Verifier. Vì vậy ưu tiên phải dựa trên sự thật có thể tái hiện, chứ không phải mượn quan điểm.

Nói đùa một chút, nếu bạn để AI tìm vấn đề, nó có thể tìm ra vô tận vấn đề, vì vậy bạn phải giới hạn biên giới tìm vấn đề của nó.

3.4 Tạo ra và lọc (Generate & Filter)

Logic cốt lõi là phát tán rồi hội tụ. Đầu tiên cố ý sản sinh ứng viên dư thừa, dùng rubric đào thải đến tinh hoa, chỉ giữ lại kết quả có độ tin cậy cao để xuất ra.

Thay vì để một agent xuất ra một đáp án "tạm được", không bằng để nó tạo ra mười cái, rồi dùng tầng xác minh sàng lọc. Vì vậy ưu thế nằm ở sự đa dạng. Nhiều Generator có thể dùng chiến lược khác nhau, prompt khác nhau, sản xuất cách giải mà con người khó lường trước, bước lọc khiến chất lượng đầu ra cuối cùng tập trung cao độ.

Điểm yếu là, chất lượng rubric của Filter quyết định trực tiếp hiệu quả cuối cùng, rubric thiết kế sai bằng với toàn bộ quy trình hỏng.

Kịch bản phù hợp là tình huống không biết trước đáp án chính xác, cần chọn ưu từ nhiều khả năng, có nhu cầu rõ ràng về đa dạng hóa.

Chỉ giống bề ngoài với Fanout-And-Synthesize: Cả hai đều là "đa tuyến song song → đầu ra đơn nhất", dễ nhầm lẫn nhất.

Khác biệt then chốt nằm ở ý đồ: Mỗi tuyến của Fanout xử lý phần khác nhau của nhiệm vụ, kết quả bổ sung cho nhau, khi hợp nhất tất cả tuyến đều có đóng góp; Mỗi tuyến của Generate-And-Filter xử lý cùng một nhiệm vụ, kết quả cạnh tranh với nhau, khi hợp nhất phần lớn bị loại bỏ. Cái trước là "ghép hình", cái sau là "chọn hoa hậu".

3.5 Chế độ giải đấu (Tournament)

Logic cốt lõi là đào thải cạnh tranh. N agent mỗi cái độc lập làm cùng một việc, thông qua so sánh pairwise loại dần từng vòng, cuối cùng chọn ra giải pháp tối ưu nhất.

Cái này trước đây tôi từng làm thủ công - cùng một thay đổi code chạy hai ba phiên bản, rồi để AI so sánh cái nào tốt hơn. Bây giờ có thể trực tiếp sắp xếp vào trong luồng công việc.

Ưu thế nằm ở tính ổn định của phán đoán. So sánh cặp đôi ("A và B cái nào tốt hơn?") ổn định hơn nhiều so với chấm điểm tuyệt đối ("cho A chấm điểm"), bởi loại bỏ vấn đề trôi tiêu chuẩn chấm điểm. Kết quả trải qua cạnh tranh nhiều vòng, độ tin cậy của người chiến thắng cuối cùng cao.

Cũng chỉ giống bề ngoài với Generate-And-Filter: Cả hai đều là chọn ưu từ nhiều ứng viên. Khác biệt then chốt nằm ở cơ chế chọn ưu: Tournament dùng pairwise judge so sánh cặp đôi, là "để ứng viên cạnh tranh lẫn nhau". Khi rubric khó lượng hóa, phán đoán bản chất là tương đối, sẽ đáng tin cậy hơn.

3.6 Chế độ vòng lặp (Loop)

Logic cốt lõi là lặp lại thích ứng, liên tục thử, gặp trở lực thì thu thập thông tin lỗi, bổ sung ngữ cảnh, thử lại, cho đến khi thỏa điều kiện nghiệm thu thì thôi.

Bản chất là đang chống lại tính ngẫu nhiên của AI: thử nhiều lần, rồi sẽ gặp kết quả tốt hơn. Nhưng cách làm trưởng thành hơn là kết hợp xác minh đối kháng, để mỗi lần lặp đều mang thêm thông tin thực thi, chứ không phải chỉ dựa vào ngẫu nhiên.

Ưu thế nằm ở khả năng xử lý nhiệm vụ không biết trước khối lượng công việc. Năm chế độ còn lại đều giả định biên giới nhiệm vụ là xác định, Loop Until Done là chế độ duy nhất có thể xử lý "không biết phải làm bao nhiêu vòng".

Điểm yếu là nguy cơ mất kiểm soát tiềm ẩn - điều kiện dừng thiết kế không tốt sẽ lặp vô hạn. Agent mỗi vòng là context mới hoàn toàn, không thể tích lũy trạng thái xuyên vòng (trừ khi ghi rõ vào file).

IV. Skill của tôi và luồng công việc chính thức đối đầu

Trước khi luồng công việc động ra đời, tôi đã thiết kế riêng một bộ deep-research của mình. Logic của skill đó của tôi đại khái như thế này:

Chỉ cung cấp một thông tin đơn giản (ví dụ một dự án mới lên chức năng nào đó)
Để AI đi tìm kiếm tất cả tư liệu liên quan: tài liệu chính thức, mã nguồn, dư luận thị trường
Nén thông tin thành bản tóm tắt có ý nghĩa
Nhiều vai trò agent làm phân tích đối kháng, tạo báo cáo
Tự động khử trùng lặp, bởi nội dung đa agent tỷ lệ trùng lặp cao

Dùng một thời gian, tôi thấy khá hay. Nhưng nó có một khuyết điểm căn bản: Thiếu sự hội tụ định hướng mục tiêu.

Và nhiều lúc dù có bước thứ năm khử trùng lặp, nhưng lúc này, nó thường xuyên xóa mất thông tin có giá trị, nếu không khử trùng lặp, lại đặc biệt dễ skill sẽ cho bạn một bài văn dài vạn chữ, thông tin rất đầy đủ, nhưng không trực tiếp nói cho bạn "việc này liên quan gì đến bạn, bạn nên làm thế nào".

Tuy nhiên, nghiên cứu là để phục vụ cho "quyết định", đây là lý do tại sao nhiều skill chỉ dừng lại ở bản thân nghiên cứu, có 80 điểm, nhưng thiếu 20 điểm then chốt nhất.

Đến nỗi AI sau khi hoàn thành sơ bộ nghiên cứu, còn cần tiếp tục suy nghĩ và đối thoại mười lần, mới đạt được kết luận chu toàn thỏa mãn.

Luồng công việc động chính thức làm thêm được gì

Thông qua thực nghiệm mấy lần nhiệm vụ nghiên cứu phức tạp tuần này, tôi phát hiện, luồng công việc deep research tích hợp sẵn trong Claude Code (lưu ý không chỉ là skill, mà là mô-đun biên dịch nhúng vào cc), so với trên cơ sở skill của tôi, có thêm mấy mắt xích then chốt:

Tầng phân giải vấn đề: Nó sẽ không trực tiếp bắt đầu tìm kiếm, mà đầu tiên bắt đầu hỏi vấn đề, phân giải vấn đề của tôi thành nhiều vấn đề con: bạn thực sự muốn làm rõ cái gì? Việc này liên quan gì đến bạn? Những chiều nào đáng nghiên cứu sâu? Bước này trước đây tôi bỏ qua.
Đánh giá độ tin cậy: Đánh giá khả năng bác bỏ đối với mỗi thông tin, tương tự điểm quyền uy trong SEO truyền thống - nguồn có đáng tin không? Số lần trích dẫn thế nào? Đây là mắt xích trước đây tôi chưa nghĩ đến phải thêm.
Xóa chéo thay vì hợp nhất trung bình: Cách làm trước đây của tôi là chọn trung bình tất cả kết luận, vì vậy tài liệu rất lớn. Luồng công việc động sẽ đối với mỗi kết luận làm bỏ phiếu đa agent, số phiếu không đủ thì xóa, không phải hợp nhất đơn giản.
Đầu ra định hướng mục tiêu: Báo cáo cuối cùng không phải chất đống thông tin, mà là xoay quanh mục tiêu ban đầu của bạn đưa ra phán đoán và phương án đề xuất. Mà then chốt thực hiện điểm này nằm ở năng lực thiết lập trước điều phối đa subagent của nó, lý do trước đây skill của tôi dễ thiếu định hướng mục tiêu cuối cùng, chính là vì sau lượng thông tin khổng lồ, suy giảm trọng số lệnh.

Những cơ chế này giải quyết vấn đề gì?

Nhắm vào chính mấy vấn đề điển hình của AI khi làm nhiệm vụ dài:

Trôi mục tiêu: Lúc bắt đầu nhiệm vụ trạng thái tốt, đến giữa thì không biết đang làm gì, lúc kết thúc lại tìm lại nhịp điệu - tương tự con người lơ đãng trong giờ học. Nhiệm vụ càng dài càng rõ.

Dừng sớm: Chạy chạy gặp khó khăn, AI tự cho là "hoàn thành" rồi dừng, thực ra tiêu chuẩn nghiệm thu căn bản chưa qua.

Ô nhiễm ngữ cảnh: Một agent đơn lẻ làm nhiệm vụ phức tạp, lượng prompt tiền trạp lớn sẽ nén không gian thực thi hậu kỳ. Cách tốt hơn là khống chế prompt tiền trạp trong vài k, dùng đa agent để phân bổ ngữ cảnh.

Thiên lệch đầu ra: AI có xu hướng trả lời thuận theo kỳ vọng của bạn, hỏi theo kiểu nói thông thường dễ kích hoạt vấn đề này hơn.

Mà luồng công việc động dùng cách thức cấu trúc hóa giải quyết bốn vấn đề này: Tự động thêm tiêu chí nghiệm thu ngăn ngừa dừng sớm; Song song cô lập ngữ cảnh; Xác minh đối kháng triệt tiêu thiên lệch đầu ra; Phân giải vấn đề tầng tầng ràng buộc AI hiểu mục tiêu trước rồi hành động.

V. Tổng kết

Cuối cùng, tác giả là người nghiên cứu lâu năm, thán phục cơ chế mới này của CC, sáu chế độ tích hợp sẵn của nó - lựa chọn định tuyến, chia nhỏ hợp nhất, xác minh đối kháng, tạo ra lọc, thi đấu giải đấu, vòng lặp Loop - bao phủ nhu cầu điều phối tuyệt đại đa số nhiệm vụ nghiên cứu phức tạp.

Khiến tôi không còn cần thiết kế thủ công điều phối agent, cũng không cần tự làm khử trùng lặp và xác minh chéo, những cái này đều được biên vào bản thân luồng công việc rồi.

Và nó đặc biệt phù hợp trong việc thiếu thông tin, tìm tòi vấn đề mở để suy nghĩ, bởi điều phối đa agent tự nhiên + phân chia mục tiêu nhiệm vụ, khiến nó nâng cao tính phổ dụng một lần nữa, thực ra từ 3 năm trước AI, đối với một ràng buộc tầng tầng, chỉ để nó giải quyết vấn đề nhỏ cực kỳ rõ ràng, đã làm rất tốt rồi, nhưng biến đổi chất lượng thực sự của AI vẫn là ở tính phổ dụng, điểm này đối thủ cạnh tranh của nó, từ code đơn giản trở thành Agent thực sự, từ giải quyết một vấn đề trạng thái rắn, đến thích ứng bất kỳ vấn đề nào.

Vì vậy Dynamic Workflows luồng công việc động không phải là "đối thoại một lần thông minh hơn", mà là bản thân quy trình nghiên cứu được cấu trúc hóa.

Vốn dĩ tôi cần phát động mười mấy lần đối thoại độc lập nghiên cứu, bây giờ nén xuống 3-4 lần. Mặc dù lượng Token tiêu hao tương ứng tăng trưởng vài chục lần rồi.

Vậy tại sao vẫn cần 3-4 lần? Tôi nghĩ căn nguyên nằm ở sự khác biệt của những nhu cầu này.

Thứ nhất là mức độ nghiêm khắc của cơ chế xác minh, tôi chủ yếu nghiên cứu công nghệ mới trên blockchain, nhiều việc, tài liệu chính thức đều chậm trễ, có dữ liệu mã nguồn mở đáng tham khảo hơn, giao dịch trên chain vân vân, mà hiện tại AI mặc định vẫn lấy tài liệu chính thức làm chuẩn, chứ không phải lấy xác minh tính sự thật làm chuẩn.

Thứ hai là suy nghĩ sâu hoàn toàn xuyên ngành, điểm này mặc dù thông qua thiết lập trước luồng công việc có thể giải quyết một phần (định nghĩa trước các subAgent chiều khác nhau) để suy nghĩ về cùng một vấn đề. Nhưng AI giỏi vẫn là mô hình suy nghĩ chủ lưu, đối với cái rất mới, rất sâu, thiếu căn cứ dữ liệu, thì hơi không đủ.

Thứ ba là thiết kế và xác minh giải pháp, ý nghĩa của giải pháp không nằm ở đề xuất mà nằm ở xác minh, hỗ trợ, nó dựa vào cân nhắc cơ chế hiện có, đầu tư và chi phí, nếu điều khiển AI tốt đương nhiên có thể làm tốt hơn, nhưng như vậy lại trái với tính phổ dụng rồi.

Cuối cùng là cô đặc thông tin cực hạn, đây lại cần quay về mức độ hiểu biết đối tượng tiếp nhận thông tin, có người hoàn toàn không có nền tảng, cần bạn biểu đạt theo kiểu hình tượng nhân hóa, mà có thính giả, cần bạn một câu đánh động anh ta~.

Câu hỏi Liên quan

QDynamic Workflows (Luồng công việc động) của Claude là gì và nó hoạt động như thế nào?

ADynamic Workflows (Luồng công việc động) là một tính năng của Claude Code, với ý tưởng cốt lõi là: trước khi thực thi nhiệm vụ, AI sẽ tự động thiết kế luồng công việc phù hợp để hoàn thành nhiệm vụ đó, sau đó mới khởi chạy thực thi. Điều này khác biệt cơ bản so với chế độ 'lập kế hoạch' thông thường, vì nó tự động đưa vào các logic kiểm tra, hội tụ kết quả và xác minh đối kháng. Có thể kích hoạt bằng lệnh /deep-research trong Claude Code hoặc thông qua prompt 'ultracode'.

QBài viết đề cập đến sáu chế độ điều phối lõi của Dynamic Workflows. Hãy nêu tên và mô tả ngắn gọn ba trong số đó.

ABa trong số sáu chế độ điều phối lõi được đề cập là: 1. **Chế độ Định tuyến (Classify-And-Act)**: Một agent chính phân loại nhiệm vụ và phân phối cho agent chuyên biệt phù hợp nhất xử lý, đảm bảo chính xác và tiết kiệm tài nguyên. 2. **Chế độ Chia tách & Hợp nhất (Fan-out & Merge)**: Chia nhiệm vụ thành các nhiệm vụ con độc lập chạy song song, sau đó hợp nhất kết quả, giúp tăng tốc độ và cách ly ngữ cảnh. 3. **Chế độ Xác minh Đối kháng (Adversarial Verification)**: Nhiều agent độc lập thách thức hoặc phản bác một kết luận từ các góc độ khác nhau, kết luận chỉ được chấp nhận khi đạt đa số phiếu, nhằm giảm thiểu sai lệch xác nhận.

QTheo tác giả, hệ thống deep-research tự thiết kế trước đây của họ có điểm yếu cốt lõi nào so với Dynamic Workflows tích hợp sẵn?

AHệ thống deep-research tự thiết kế trước đây của tác giả thiếu khả năng **hội tụ có định hướng mục tiêu**. Nó thu thập và tóm tắt thông tin tốt nhưng thường tạo ra báo cáo dài với đầy đủ thông tin mà không trực tiếp trả lời câu hỏi 'điều này liên quan thế nào đến bạn' hoặc 'bạn nên làm gì'. Nói cách khác, nó dừng lại ở việc nghiên cứu mà thiếu phần đưa ra kết luận và đề xuất phục vụ cho quyết định.

QDynamic Workflows giải quyết những vấn đề điển hình nào khi AI thực hiện nhiệm vụ dài?

ADynamic Workflows giải quyết bốn vấn đề chính khi AI thực hiện nhiệm vụ dài: 1. **Trôi dạt mục tiêu**: AI mất tập trung vào mục tiêu ban đầu trong quá trình thực thi dài. 2. **Dừng sớm**: AI tự cho là đã hoàn thành khi gặp khó khăn trong khi tiêu chí nghiệm thu chưa đạt. 3. **Ô nhiễm ngữ cảnh**: Một agent duy nhất xử lý nhiệm vụ phức tạp khiến prompt ban đầu chiếm nhiều dung lượng, làm giảm không gian cho các bước sau. 4. **Thiên vị đầu ra**: AI có xu hướng trả lời theo kỳ vọng của người dùng, đặc biệt với câu hỏi đàm thoại thông thường.

QTác giả chỉ ra lý do Dynamic Workflows vẫn cần 3-4 lần tương tác cho một nghiên cứu sâu là gì?

ATác giả cho rằng vẫn cần 3-4 lần tương tác (thay vì một lần) vì những khác biệt trong nhu cầu nghiên cứu sâu: 1. **Độ nghiêm ngặt của cơ chế xác minh**: AI mặc định thường ưu tiên tài liệu chính thức, trong khi nghiên cứu các lĩnh vực như blockchain đòi hỏi xác minh dựa trên dữ liệu thực tế như mã nguồn mở, giao dịch trên chuỗi. 2. **Tư duy sâu liên ngành hoàn toàn**: AI vẫn giỏi các mô hình tư duy chính thống hơn là các ý tưởng rất mới hoặc sâu sắc nhưng thiếu dữ liệu nền tảng. 3. **Thiết kế và xác minh giải pháp**: Việc đề xuất và đặc biệt là xác minh tính khả thi của giải pháp phụ thuộc vào hiểu biết về cơ chế hiện có, chi phí, cần điều chỉnh AI sâu hơn. 4. **Cô đặc thông tin cực độ**: Cần điều chỉnh đầu ra cho phù hợp với kiến thức nền và nhu cầu cụ thể của từng đối tượng người đọc.

Nội dung Liên quan

Virtuals Ra Mắt Hyperboost: Gia Hạn 14 Ngày Thưởng Cho Mỗi Token Tốt Nghiệp, Đối Phó Lời Nguyền 'Đỉnh Đầu Ngày'

Virtuals Protocol đã ra mắt cơ chế Hyperboost từ ngày 27/7, nhằm chống lại hiện tượng "đỉnh đầu ngày" khi 75% token sau khi tốt nghiệp từ bonding curve thường đạt khối lượng giao dịch cao nhất trong vòng 24 giờ rồi suy giảm nhanh. Cơ chế này tái phân bổ một phần nguồn cung token tạm thời nhàn rỗi, biến chúng thành phần thưởng được phân phát hàng ngày trong 14 ngày sau khi token tốt nghiệp. Phần thưởng chia làm hai loại: thưởng giao dịch (theo tỷ lệ khối lượng giao dịch) và thưởng nội dung (cho người sáng tạo trên X). Cơ chế tự động áp dụng cho tất cả token tốt nghiệp sau thời điểm trên. Sau khoảng hai ngày triển khai, các dự án token mới tốt nghiệp đầu tiên như AMARA, MAGE vẫn cho thấy biểu đồ giá sụt giảm điển hình sau khi ra mắt. Hiệu quả thực tế của Hyperboost cần thêm thời gian để đánh giá, đặc biệt là liệu phần thưởng giao dịch có vô tình thu hút "wash trading" hay không, và tiêu chí đánh giá nội dung còn thiếu minh bạch. Hyperboost là một nỗ lực đáng chú ý của Virtuals (nền tảng với hơn 18,000 AI Agent token) nhằm kéo dài thời gian phát hiện giá và duy trì thanh khoản cho token sau khi tốt nghiệp, trong bối cảnh thị trường chung vẫn còn nhiều biến động.

marsbit7 phút trước

Virtuals Ra Mắt Hyperboost: Gia Hạn 14 Ngày Thưởng Cho Mỗi Token Tốt Nghiệp, Đối Phó Lời Nguyền 'Đỉnh Đầu Ngày'

marsbit7 phút trước

Làn sóng khởi nghiệp giả: Mỹ đăng ký 5,8 triệu công ty mới mỗi năm, 70% sẽ không bao giờ thuê người

Tác giả Ed Elson, qua phân tích dữ liệu của Cục Điều tra Dân số Hoa Kỳ, chỉ ra một nghịch lý: số lượng đơn đăng ký doanh nghiệp mới tại Mỹ đạt kỷ lục gần 6 triệu vào năm ngoái, nhưng khoảng 70% trong số đó được phân loại là "doanh nghiệp không có khả năng thuê lao động". Điều này phản ánh một làn sóng khởi nghiệp "ảo" - nơi mọi người dễ dàng thành lập công ty trách nhiệm hữu hạn (LLC) chỉ với 130 USD trong 15 phút, chủ yếu cho các dự án phụ, sở thích cá nhân hoặc để xây dựng hình ảnh "người sáng lập" trên mạng xã hội. Bài viết lập luận rằng xu hướng này bắt nguồn từ "sự sùng bái người sáng lập" trong văn hóa đại chúng, nơi danh hiệu "nhà sáng lập" mang lại vốn xã hội và sự thú vị. Tuy nhiên, nó tạo ra ảo tưởng nguy hiểm rằng khởi nghiệp là dễ dàng, trong khi thực tế phần lớn doanh nghiệp thất bại trong những năm đầu và rất ít nhận được đầu tư mạo hiểm. Tác giả cảnh báo rằng những "doanh nghiệp ảo" này, thường không có doanh thu đáng kể, đang làm loãng đi tinh thần khởi nghiệp thực sự vốn đòi hỏi sự hy sinh và cam kết toàn diện. Thay vì sống trong trạng thái lưỡng lự, bài viết kêu gọi giới trẻ nên đưa ra lựa chọn rõ ràng: hoặc theo đuổi khởi nghiệp thực sự, hoặc tìm kiếm ý nghĩa và thành công thông qua các con đường khác, thay vì tự lừa dối bản thân bằng một danh hiệu rỗng tuếch.

marsbit7 phút trước

Làn sóng khởi nghiệp giả: Mỹ đăng ký 5,8 triệu công ty mới mỗi năm, 70% sẽ không bao giờ thuê người

marsbit7 phút trước

Opus 5 Prompt Đang Làm Mưa Làm Gió, Nhái Tác Phẩm 3A Chỉ Trong 24 Giờ

Chỉ trong 24 giờ, một prompt (lệnh) có tên "Thử thách vòng lặp" dành cho mô hình AI Opus 5 đã gây bão trên mạng X, cho phép người dùng tạo nguyên mẫu game có chất lượng gần với tiêu chuẩn AAA. Prompt này hoạt động theo cơ chế đa tác tử (multi-agent): một **Tác tử chính** phân tích nhiệm vụ và phân công cho các **Tác tử chuyên biệt** thực hiện từng phần (như lập trình, đồ họa). Điểm then chốt là một **Tác tử Giám khảo** độc lập, có nhiệm vụ so sánh kết quả với các game AAA thực tế (như *Call of Duty*, *Starfield*). Nếu chất lượng chưa đạt, công việc sẽ bị trả về để cải thiện cho đến khi thỏa mãn tiêu chuẩn. Bằng cách này, người dùng Anshu đã tạo ra *The Long Silence*, một game khám phá không gian lấy cảm hứng từ *Outer Wilds*, trong vòng một ngày. Quy trình bao gồm: đặt mục tiêu cơ bản, yêu cầu Opus 5 tự lên kế hoạch và sử dụng công cụ (như Three.js, Blender), sau đó áp dụng "Thử thách vòng lặp" trong 24 giờ để tối ưu hóa đồ họa thông qua so sánh và lặp lại liên tục. Phương pháp này nhanh chóng được cộng đồng áp dụng, tạo ra nhiều thể loại game khác như đua xe hay phiên bản *Claudepunk 2077*, và cũng cho kết quả khả quan trên các mô hình AI khác như GPT-5.6 Sol. Sự kiện này minh họa cho khả năng lập kế hoạch dài hạn, phối hợp đa tác tử và tự sửa lỗi mạnh mẽ của Opus 5, đồng thời cho thấy tiềm năng của việc sử dụng AI kết hợp với cơ chế đánh giá nghiêm ngặt để đẩy nhanh quá trình phát triển nguyên mẫu sản phẩm số.

marsbit11 phút trước

Opus 5 Prompt Đang Làm Mưa Làm Gió, Nhái Tác Phẩm 3A Chỉ Trong 24 Giờ

marsbit11 phút trước

Quyết định của Kevin Walsh về Fed sắp được công bố: Đây là lý do TD Securities cho rằng đồng USD vẫn có thể giảm giá

Theo dữ liệu từ CME FedWatch, có 95-98% khả năng Fed sẽ giữ nguyên lãi suất trong cuộc họp ngày 31/7, đánh dấu lần thứ 5 liên tiếp họ không thay đổi chính sách kể từ khi Chủ tịch Kevin Warsh nhậm chức. Bitcoin đã phản ứng trước với sự sụt giảm và thanh lý các vị thế mua. Dù thị trường kỳ vọng mạnh mẽ vào việc giữ nguyên lãi suất, TD Securities cảnh báo rằng các nhà giao dịch có thể đang đánh giá thấp rủi ro về một quyết định ngược lại. Ngân hàng này lập luận rằng đồng USD hiện đang định giá quá cao khả năng tăng lãi suất - một kịch bản mà họ cho là ít xảy ra. Do đó, một khi Fed xác nhận giữ nguyên lãi suất, đồng USD có khả năng giảm giá. TD Securities dự báo đồng bạc xanh có thể tiếp tục suy yếu khoảng 2% vào nửa cuối năm 2026. Đối với Bitcoin, kết quả cuộc họp Fed sẽ có tác động trực tiếp. Việc giữ lãi suất kết hợp với tín hiệu "dove" (thiên hướng nới lỏng), cùng dữ liệu PCE và GDP tích cực, có thể thúc đẩy Bitcoin thử thách vùng $68,000-$70,000 trong tháng 8. Ngược lại, một tông điệu bất ngờ mang tính "hawk" (thắt chặt) có thể kéo giá về vùng $58,000-$60,000. Sự suy yếu của đồng USD, như dự báo của TD Securities, cũng thường là yếu tố hỗ trợ cho các tài sản rủi ro như Bitcoin.

cryptonews.ru12 phút trước

Quyết định của Kevin Walsh về Fed sắp được công bố: Đây là lý do TD Securities cho rằng đồng USD vẫn có thể giảm giá

cryptonews.ru12 phút trước

Chuyện gì xảy ra khi hai thợ đào tìm thấy khối trong cùng một giây? Cuộc đua "khối mồ côi" diễn ra như thế nào

Khai thác Bitcoin là một cuộc đua không có trọng tài theo dõi vạch đích theo thời gian thực. Một khối mới phải được lan truyền vật lý qua mạng toàn cầu trước khi tất cả các nút đồng ý về đỉnh chuỗi hiện tại. Nếu hai thợ đào tìm thấy các khối hợp lệ gần như cùng lúc, hai phiên bản cạnh tranh của chuỗi khối sẽ tồn tại trong thời gian ngắn. Cả hai đều hợp lệ theo quy tắc giao thức; sự khác biệt chỉ là thời gian và nút nào biết về khối nào trước. Bitcoin giải quyết tình huống này không phải bằng bỏ phiếu hay dựa trên ai tìm thấy trước, mà bằng nguyên tắc chuỗi nào tích lũy nhiều bằng chứng công việc (proof-of-work) hơn sẽ được tất cả các nút chấp nhận. Khối bị thua cuộc trở thành "khối mồ côi" (orphan block), bị loại khỏi chuỗi được công nhận. Phần thưởng và phí giao dịch của nó bị mất, nhưng các giao dịch bên trong thường được trả lại để đưa vào một khối trong tương lai. Thông thường, cuộc đua được giải quyết ngay sau một khối tiếp theo. Tuy nhiên, sự kiện hiếm hoi vào ngày 24 tháng 3 năm 2026 đã chứng kiến một cuộc phân tách hai khối giữa AntPool/ViaBTC và Foundry USA, khi Foundry cuối cùng tạo ra một chuỗi dài hơn và giành chiến thắng. Sự kiện này nhấn mạnh xu hướng tập trung sức mạnh băm, nơi các nhóm khai thác lớn có nguồn lực tốt hơn có lợi thế trong việc kết thúc các cuộc đua như vậy so với các thợ đào nhỏ. Mặc dù các cuộc đua cho một khối là tương đối phổ biến (khoảng 9,2% khoảng cách giữa các khối trong một mẫu phân tích là dưới 60 giây), nhưng chúng thường được giải quyết nhanh chóng và âm thầm. Các mạng chuyển tiếp độ trễ thấp như FIBRE đã giảm đáng kể độ trễ lan truyền, khiến các cuộc phân tách kéo dài hai khối trở nên cực kỳ hiếm. Sự nhàm chán của quy trình bình thường này thực ra lại chính là điểm then chốt cho tính ổn định của mạng lưới.

cryptonews.ru23 phút trước

Chuyện gì xảy ra khi hai thợ đào tìm thấy khối trong cùng một giây? Cuộc đua "khối mồ côi" diễn ra như thế nào

cryptonews.ru23 phút trước

Giao dịch

Giao ngay

Cách thực hiện nghiên cứu sâu với Dynamic Workflows của Claude

Tóm tắt

II. Dynamic Workflows là gì

III. Sáu chế độ luồng công việc tích hợp sẵn

3.1 Chế độ định tuyến (Classify-And-Act)

3.2 Chia nhỏ và hợp nhất (Fan-out & Merge)

3.3 Xác minh đối kháng (Adversarial Verification)

3.4 Tạo ra và lọc (Generate & Filter)

3.5 Chế độ giải đấu (Tournament)

3.6 Chế độ vòng lặp (Loop)

IV. Skill của tôi và luồng công việc chính thức đối đầu

Luồng công việc động chính thức làm thêm được gì

Những cơ chế này giải quyết vấn đề gì?

V. Tổng kết

Câu hỏi Liên quan

Nội dung Liên quan

Virtuals Ra Mắt Hyperboost: Gia Hạn 14 Ngày Thưởng Cho Mỗi Token Tốt Nghiệp, Đối Phó Lời Nguyền 'Đỉnh Đầu Ngày'

Làn sóng khởi nghiệp giả: Mỹ đăng ký 5,8 triệu công ty mới mỗi năm, 70% sẽ không bao giờ thuê người

Opus 5 Prompt Đang Làm Mưa Làm Gió, Nhái Tác Phẩm 3A Chỉ Trong 24 Giờ

Quyết định của Kevin Walsh về Fed sắp được công bố: Đây là lý do TD Securities cho rằng đồng USD vẫn có thể giảm giá

Chuyện gì xảy ra khi hai thợ đào tìm thấy khối trong cùng một giây? Cuộc đua "khối mồ côi" diễn ra như thế nào

Giao dịch

Danh mục Phổ biến

Thẻ Nổi bật