Bộ Dữ Liệu Đào Tạo Doc2Repo Dài Hạn Đầu Tiên, Code Agent Không Chỉ Sửa Lỗi, Bắt Đầu Tạo Kho Lưu Trữ

marsbitXuất bản vào 2026-06-25Cập nhật gần nhất vào 2026-06-25

Tóm tắt

Khả năng của Code Agent đang dần vượt ra ngoài việc sửa lỗi đơn lẻ, tiến tới các nhiệm vụ dài hạn cấp repository. Nghiên cứu mới từ Đại học Nhân dân Trung Quốc giới thiệu DeNovoSWE - tập dữ liệu đào tạo đầu tiên dành riêng cho việc tạo mã cấp kho lưu trữ từ đầu. Tập dữ liệu này chứa 4.818 nhiệm vụ chất lượng cao, được xây dựng thông qua cơ chế "Chia để trị" (Divide & Conquer) và "Phê bình & Sửa chữa" (Critic & Repair), nhằm giải quyết thách thức trong việc tạo toàn bộ kho mã chức năng từ một tài liệu mô tả. Phương pháp này phân tích kho mã mục tiêu thành các "năng lực" (capabilities), sau đó sử dụng một quy trình đa tác nhân để tự động tạo tài liệu nhiệm vụ rõ ràng, có cấu trúc, vừa đủ chi tiết để đánh giá nhưng không làm lộ chi tiết triển khai. Một kỹ thuật lọc theo độ khó được áp dụng để cân bằng giữa chất lượng và tính đa dạng của dữ liệu. Kết quả thử nghiệm cho thấy hiệu quả rõ rệt: Mô hình Qwen3-30B-A3B-Instruct được huấn luyện trên DeNovoSWE đã cải thiện hiệu suất trên benchmark BeyondSWE-Doc2Repo từ 5.8% lên 47.2% và trên NL2RepoBench từ 4.3% lên 23.0%. Điều này khẳng định nhu cầu về dữ liệu được thiết kế đặc biệt cho các tác vụ dài hạn, thay vì chỉ dựa vào dữ liệu sửa lỗi thông thường. DeNovoSWE đánh dấu một bước tiến quan trọng, cung cấp môi trường đào tạo có hệ thống để phát triển các Code Agent thực sự có khả năng hiểu yêu cầu, lập kế hoạch kiến trúc và tạo ra toàn bộ kho phần mềm có thể thực thi.

Với khả năng của LLM Code Agent ngày càng được nâng cao, ngày càng nhiều nhà nghiên cứu nhận ra đã đến lúc bước sang giai đoạn tiếp theo - những nhiệm vụ dài hạn gần với nhu cầu thực tế hơn. Do đó, một số benchmark đánh giá nhiệm vụ dài hạn đã xuất hiện như NL2RepoBench và BeyondSWE. Kỳ vọng về vai trò của Code Agent dần chuyển từ người bảo trì kho lưu trữ thành kiến trúc sư, có thể lập kế hoạch và hoàn thành các nhiệm vụ dài hạn liên quan toàn bộ mã nguồn trong kho.

Gần đây, Trường Cao học Trí tuệ Nhân tạo Gaoling, Đại học Nhân dân Trung Quốc đã hoàn thành nghiên cứu liên quan và công bố bộ dữ liệu DeNovoSWE, tập trung vào các nhiệm vụ kỹ thuật phần mềm dài hạn, đặc biệt là nhiệm vụ tạo mã cấp kho lưu trữ từ đầu.

Link bài báo: https://arxiv.org/pdf/2606.10728

Link kho lưu trữ: https://github.com/AweAI-Team/DeNovoSWE

Link dữ liệu: https://huggingface.co/collections/AweAI-Team/denovoswe

Bằng cơ chế Divide & ConquerCritic & Repair để xây dựng bộ dữ liệu chất lượng cao, đồng thời thành công trong việc mở rộng quy mô cho nhiệm vụ SWE dài hạn, xây dựng bộ dữ liệu nhiệm vụ SWE dài hạn chất lượng cao mã nguồn mở chứa 4,818 dữ liệu thực tế - thành quả này cung cấp dữ liệu quy mô lớn cho việc đào tạo khả năng dài hạn của Code Agent, nâng cao đáng kể năng lực thực hiện nhiệm vụ dài hạn của Code Agent.

Bài báo cũng cung cấp phương pháp lọc dựa trên điểm độ khó của đề bài, giúp giảm thiểu hiệu quả vấn đề đánh đổi giữa tỷ lệ bài toán khó và chất lượng quỹ đạo.

Thí nghiệm cho thấy, Qwen3-30B-A3B-Instruct được huấn luyện dựa trên DeNovoSWE đã cải thiện từ 5.8% lên 47.2% trên BeyondSWE-Doc2Repo, và từ 4.3% lên 23.0% trên NL2RepoBench, thể hiện sự cải thiện đáng kể về khả năng tạo mã cấp kho lưu trữ nhờ dữ liệu dài hạn.

Từ Một Tài Liệu Bắt Đầu Tái Tạo Toàn Bộ Kho Lưu Trữ

Một năm qua, với việc mở rộng quy mô dữ liệu SWE lớn như Scale-SWE, các tác nhân mã thông minh đã tiến bộ nhanh chóng trên các nhiệm vụ kỹ thuật phần mềm thực tế như SWE-bench. Nhưng khi mô hình ngày càng giỏi "sửa một issue" hay "sửa vài dòng lỗi", một vấn đề then chốt hơn bắt đầu nổi lên: Liệu tác nhân thông minh có thực sự sở hữu năng lực kỹ thuật phần mềm dài hạn? Nhìn vào hiệu quả của các mô hình tiên phong trên BeyondSWE-Doc2Repo và NL2RepoBench, kết quả không lý tưởng.

Phát triển phần mềm trong thế giới thực thường không phải là sửa một hàm, bổ sung một điều kiện, mà là hiểu yêu cầu, lập kế hoạch kiến trúc, tạo tệp, thiết kế API, xử lý phụ thuộc, kết nối các module, và cuối cùng là đảm bảo toàn bộ kho chạy thông qua kiểm thử.

Nói cách khác, khó khăn nằm ở việc tạo cấp kho lưu trữ tầm nhìn dài hạn: từ một tài liệu nhiệm vụ, tạo ra một kho phần mềm hoàn chỉnh, có thể thực thi, có thể kiểm chứng. Đây chính là vấn đề DeNovoSWE muốn giải quyết.

Tài Liệu Nhiệm Vụ Chất Lượng Cao Cho Việc "Tạo Kho Từ Đầu"

Trong việc tạo kho lưu trữ từ tài liệu, tài liệu không chỉ là README, cũng không phải là danh sách API đơn giản. Về bản chất, nó là điểm vào nhiệm vụ duy nhất để tác nhân thông minh tái tạo toàn bộ kho.

Một tài liệu nhiệm vụ chất lượng cao ít nhất cần đáp ứng hai tiêu chuẩn cốt lõi.

Thứ nhất, nó phải được tổ chức tốt.

Nhiệm vụ cấp kho vốn dĩ phức tạp, chứa nhiều module, giao diện, cấu hình, cấu trúc dữ liệu và quy trình tương tác. Nếu tài liệu chỉ xếp chồng các mô tả hàm lên nhau, tác nhân thông minh dễ bị lạc trong thông tin mảnh vỡ. Do đó, tài liệu nên đưa ra cái nhìn tổng quan rõ ràng về kho trước, sau đó phân chia chương theo khả năng hoặc luồng công việc, để mỗi phần tương ứng với ranh giới chức năng rõ ràng.

Thứ hai, nó phải xuất phát từ góc độ đánh giá (evaluation) đáng tin cậy.

Tài liệu không thể quá ít, nếu không nhiệm vụ trở thành vấn đề không được định nghĩa đầy đủ, khiến mô hình có thể cần đoán mò mới vượt qua được evaluation; cũng không thể quá nhiều, nếu không sẽ tiết lộ chi tiết triển khai, làm mất đi tính thách thức của nhiệm vụ.

Tài liệu thực sự chất lượng cao nên mô tả các hành vi then chốt mà evaluation phụ thuộc vào: bao gồm đường dẫn import, API công khai, đầu vào/đầu ra, tham số mặc định, hành vi ngoại lệ, mục cấu hình, chuỗi mẫu, trường trả về, v.v., đồng thời cũng mô tả chức năng cần hoàn thành đại khái. Nói cách khác, tài liệu phải đủ để tác nhân thông minh tái hiện hành vi có thể kiểm thử, nhưng không được biến thành bản sao của mã triển khai.

Đây cũng là tư tưởng cốt lõi của DeNovoSWE: làm cho tài liệu vừa dễ đọc, có thể thực hiện, vừa có thể kiểm chứng.

Phương Pháp DeNovoSWE

DeNovoSWE xây dựng "tạo kho hoàn chỉnh từ tài liệu" thành một nhiệm vụ kỹ thuật phần mềm dài hạn, quy mô lớn, có thể kiểm chứng. Nó không phải là viết tài liệu thủ công, mà là tự động xây dựng các ví dụ chất lượng cao thông qua một quy trình làm việc đa tác nhân trong môi trường sandbox. Toàn bộ phương pháp có thể tóm tắt thành hai bước: Chia để trị.

Trong giai đoạn Chia, hệ thống trước hết phân tích kho mục tiêu, tách nó thành nhiều khả năng của kho.

Mỗi khả năng tương ứng với một khả năng cốt lõi hoặc luồng công việc trong kho, ví dụ như xác thực và kết nối, đọc/ghi dữ liệu, xử lý hàng loạt, quy trình xuất, v.v. Như vậy, vấn đề tạo kho lớn ban đầu được chia thành nhiều chương tài liệu có cấu trúc rõ ràng.

Đồng thời, DeNovoSWE sẽ chạy kiểm thử đơn vị gốc và thu thập dấu vết thực thi, xác định hàm, lớp và giao diện nào thực sự ảnh hưởng đến evaluation, từ đó phân biệt thêm các thành phần trực tiếp, thành phần gián tiếp cốt lõi và thành phần gián tiếp không cốt lõi: các giao diện được gọi trực tiếp bởi kiểm thử phải được ghi lại chi tiết; các thành phần gián tiếp cốt lõi ảnh hưởng đến hành vi quan sát được cũng cần được bao phủ; còn các triển khai nội bộ không cốt lõi có thể để tác nhân thông minh tự do phát huy.

Trong giai đoạn Trị, DeNovoSWE sử dụng cơ chế Phác thảo-Phê bình-Sửa chữa để tạo tài liệu theo từng khả năng. Tác nhân Phác thảo viết bản nháp đầu tiên; Tác nhân Phê bình kiểm tra xem tài liệu có bỏ sót API then chốt, hợp đồng hành vi hoặc thông tin cấu trúc không; Tác nhân Sửa chữa sau đó sửa tài liệu dựa trên phản hồi. Vòng lặp này lặp lại liên tục cho đến khi mỗi chương về khả năng đủ rõ ràng, hoàn chỉnh và phù hợp với evaluation.

Cuối cùng, tài liệu của các khả năng khác nhau sẽ được hợp nhất thành một tài liệu nhiệm vụ hoàn chỉnh, làm cơ sở duy nhất để tác nhân thông minh tạo kho từ đầu.

Độ Khó: Tại Sao Đây Là Nhiệm Vụ Dài Hạn?

Độ khó của nhiệm vụ DeNovoSWE đến từ một thay đổi căn bản: nó không còn là sửa lỗi cấp issue, mà là tạo toàn bộ kho.

Trong các nhiệm vụ SWE truyền thống, tác nhân thông minh thường đối mặt với một kho đã tồn tại, chỉ cần định vị lỗi, sửa mã cục bộ và vượt qua kiểm thử.

Trong DeNovoSWE, tác nhân thông minh đối mặt với một môi trường đã được làm sạch: mã nguồn và kiểm thử gốc bị loại bỏ, lịch sử git được đặt lại, bộ nhớ đệm, tàn dư site-packages, pip wheel, sản phẩm biên dịch tạm thời và các kênh rò rỉ tiềm ẩn khác cũng sẽ bị xóa. Điều này có nghĩa là tác nhân thông minh phải thực sự dựa vào tài liệu để hoàn thành việc tái tạo toàn bộ kho. Nó cần lập kế hoạch cấu trúc dự án, tạo tệp module, định nghĩa giao diện công khai, triển khai tương tác xuyên tệp, xử lý phụ thuộc và cấu hình, đồng thời liên tục sửa lỗi trong nhiều vòng chỉnh sửa và phản hồi kiểm thử.

Bất kỳ sai lệch nào về chữ ký API, trường trả về, kiểu ngoại lệ hoặc hành vi mặc định đều có thể dẫn đến thất bại kiểm thử. Lỗi còn tích lũy trong quá trình dài hạn: một module được thiết kế không hợp lý từ sớm có thể ảnh hưởng đến nhiều tệp và chuỗi gọi sau này.

Để xử lý thêm sự khác biệt về độ khó giữa các kho, DeNovoSWE còn đề xuất lọc quỹ đạo nhận biết độ khó. Nói đơn giản, nhiệm vụ dễ nên yêu cầu tỷ lệ vượt qua cao hơn, còn nhiệm vụ khó không thể bị loại bỏ hoàn toàn chỉ vì không đạt điểm số hoàn hảo. DeNovoSWE dựa trên độ phức tạp cấu trúc và đánh giá độ khó của LLM để đặt ngưỡng lọc khác nhau cho các khoảng độ khó khác nhau, từ đó đạt được sự cân bằng giữa chất lượng và tính đa dạng.

Điều này đặc biệt quan trọng với nhiệm vụ dài hạn: kho càng phức tạp, càng khó vượt qua tất cả kiểm thử ngay lập tức, nhưng những quỹ đạo của kho khó, điểm thấp, thành công một phần trong đó vẫn chứa đựng khả năng lập kế hoạch và triển khai dài hạn quý giá.

Kết Quả Thực Nghiệm

DeNovoSWE cuối cùng đã xây dựng được 4818 ví dụ nhiệm vụ chuyển tài liệu thành kho chất lượng cao. Đây là môi trường kỹ thuật phần mềm dài hạn có thể thực thi, có thể đánh giá, có thể huấn luyện.

Kết quả thí nghiệm cho thấy, DeNovoSWE mang lại sự cải thiện đáng kể cho khả năng tạo kho dài hạn của mô hình. Trên Qwen3-30B-A3B-Instruct, mô hình gốc chỉ đạt 5.8% trên BeyondSWE-Doc2Repo và 4.3% trên NL2RepoBench. Scale-SWE-Agent được huấn luyện bằng dữ liệu SWE cấp issue thông thường có thể nâng lên 29.2% và 18.3%, cho thấy dữ liệu SWE thông thường thực sự có hiệu ứng chuyển giao. Nhưng khi mô hình được huấn luyện bằng DeNovoSWE, hiệu suất lại được nâng cao thêm lên 47.2% và 23.0%.

Điều này cho thấy, dữ liệu hướng đến "sửa lỗi" không thể hoàn toàn thay thế dữ liệu dài hạn hướng đến "tạo kho hoàn chỉnh". Muốn tác nhân thông minh thực sự học được kỹ thuật cấp kho, cần xây dựng môi trường huấn luyện chuyên biệt cho nhiệm vụ dài hạn.

Trên backbone mạnh hơn Qwen3.5-35B-A3B, DeNovoSWE cũng mang lại lợi ích ổn định: BeyondSWE-Doc2Repo tăng từ 43.8% lên 50.0%, NL2RepoBench tăng từ 23.5% lên 27.1%. Điều này củng cố thêm rằng lợi ích của DeNovoSWE không phải ngẫu nhiên thích ứng với một mô hình cụ thể, mà đến từ chính chất lượng cao của dữ liệu dài hạn.

Kết Luận

Giai đoạn tiếp theo của tác nhân mã thông minh không chỉ là sửa từng issue nhanh hơn, mà còn là có thể hiểu tài liệu, lập kế hoạch kiến trúc, tổ chức module, triển khai giao diện, và cuối cùng tạo ra một kho phần mềm hoàn chỉnh, có thể chạy được.

DeNovoSWE đã xây dựng có hệ thống mục tiêu này thành một tập dữ liệu có thể huấn luyện, có thể kiểm chứng, có thể mở rộng. Nó trả lời một câu hỏi then chốt: Loại dữ liệu nào mới thực sự có thể huấn luyện ra tác nhân thông minh sở hữu năng lực kỹ thuật phần mềm dài hạn?

Câu trả lời không phải là nhiều mã mảnh vỡ hơn, cũng không phải là bài toán đơn giản hơn, mà là nhiệm vụ tạo toàn bộ kho chất lượng cao, có cấu trúc, phù hợp với evaluation, chống rò rỉ.

Từ một tài liệu bắt đầu, tái tạo toàn bộ kho. Đây là ngưỡng cửa mà tác nhân mã thông minh dài hạn cần vượt qua.

Tài liệu tham khảo: https://arxiv.org/pdf/2606.10728

Bài viết này đến từ tài khoản WeChat công chúng "Tân Trí Nguyên", biên tập: LRST

Tiền kỹ thuật số thịnh hành

Câu hỏi Liên quan

QDeNovoSWE là gì và mục tiêu chính của nó trong lĩnh vực Phát triển Phần mềm Trí tuệ Nhân tạo là gì?

ADeNovoSWE là một tập dữ liệu chuyên dụng về tác vụ kỹ thuật phần mềm tầm xa, đặc biệt tập trung vào nhiệm vụ tạo mã cấp kho lưu trữ từ đầu. Mục tiêu chính của nó là cung cấp một bộ dữ liệu chất lượng cao, có thể huấn luyện để phát triển các tác nhân mã (Code Agent) có khả năng hiểu tài liệu, lập kế hoạch kiến trúc và tạo ra toàn bộ kho lưu trữ phần mềm có thể thực thi từ một tài liệu mô tả nhiệm vụ.

QPhương pháp 'Divide & Conquer' và 'Critic & Repair' trong nghiên cứu DeNovoSWE hoạt động như thế nào?

ATrong giai đoạn 'Divide', hệ thống phân tích kho lưu trữ mục tiêu và chia nó thành nhiều 'repository capabilities' (khả năng kho lưu trữ), mỗi phần tương ứng với một chức năng cốt lõi. Trong giai đoạn 'Conquer', phương pháp 'Draft-Critic-Repair' được sử dụng: Tác nhân Draft viết bản nháp tài liệu, tác nhân Critic kiểm tra và phê bình các thiếu sót, sau đó tác nhân Repair sửa chữa tài liệu dựa trên phản hồi. Quá trình này lặp lại cho đến khi tài liệu đầy đủ và rõ ràng.

QDeNovoSWE đã giải quyết vấn đề gì trong việc tạo dữ liệu huấn luyện cho các tác vụ phần mềm tầm xa?

ADeNovoSWE giải quyết vấn đề thiếu dữ liệu huấn luyện chất lượng cao cho các tác vụ phần mềm tầm xa (long-horizon), nơi tác nhân cần tạo toàn bộ kho lưu trữ từ đầu. Nó tạo ra các tài liệu nhiệm vụ được tổ chức tốt, căn chỉnh với đánh giá (evaluation-aligned) và chống rò rỉ thông tin (anti-leakage), đồng thời giới thiệu kỹ thuật lọc dựa trên độ khó (difficulty-aware filtering) để cân bằng giữa chất lượng và sự đa dạng của dữ liệu.

QKết quả thí nghiệm cho thấy hiệu quả của việc huấn luyện với DeNovoSWE trên các mô hình như thế nào?

AKết quả thí nghiệm cho thấy việc huấn luyện với DeNovoSWE cải thiện đáng kể khả năng tạo mã cấp kho lưu trữ. Ví dụ, mô hình Qwen3-30B-A3B-Instruct được huấn luyện trên DeNovoSWE đã tăng hiệu suất từ 5.8% lên 47.2% trên benchmark BeyondSWE-Doc2Repo và từ 4.3% lên 23.0% trên NL2RepoBench. Điều này chứng tỏ dữ liệu tầm xa chuyên biệt hiệu quả hơn dữ liệu sửa lỗi thông thường.

QThách thức chính của nhiệm vụ 'tạo kho lưu trữ từ tài liệu' trong DeNovoSWE là gì?

AThách thức chính là nhiệm vụ không còn là sửa lỗi cấp độ vấn đề (issue-level fixing) mà là tạo toàn bộ kho lưu trữ (whole-repository generation). Tác nhân phải làm việc trong môi trường đã được làm sạch, không có mã nguồn gốc, và chỉ dựa vào tài liệu để lập kế hoạch cấu trúc, tạo tệp, định nghĩa giao diện, xử lý phụ thuộc và sửa lỗi tích lũy qua nhiều bước. Bất kỳ sai lệch nào trong API, hành vi hoặc kiểu trả về đều có thể dẫn đến thất bại.

Nội dung Liên quan

Tides Investment: Chúng tôi vẫn lạc quan về chuỗi ngành AI, nhưng lý do đã thay đổi

**Tóm tắt: Đầu tư Thủy Triều - Chúng tôi vẫn lạc quan về chuỗi cung ứng AI, nhưng lý do đã thay đổi** Thị trường đang trải qua giai đoạn hỗn loạn với nhiều gã khổng lồ công nghệ như SpaceX, OpenAI, và các công ty đám mây lớn (Alphabet, Amazon, Meta, Microsoft, Oracle) tích cực huy động vốn quy mô lớn. Điều này khiến nhiều người lo ngại rằng AI đã đạt đỉnh. Tuy nhiên, quan điểm của chúng tôi là đây không phải dấu hiệu kết thúc, mà là sự chuyển mình sang một giai đoạn mới. Trước đây, sự lạc quan dựa trên trí tưởng tượng về nhu cầu và tiềm năng ngành. Đến năm 2026, câu hỏi chính là: **Liệu cường độ đầu tư khổng lồ này có thể duy trì bao lâu?** Dữ liệu cho thấy dòng vốn vẫn đang chảy mạnh và ngày càng lớn. Chi tiêu vốn (Capex) của 5 công ty đám mây lớn dự kiến tăng mạnh trong năm 2026, với mức tăng từ hàng trăm tỷ USD. Điều này cho thấy họ vẫn quyết tâm xây dựng cơ sở hạ tầng AI. **Lý do khiến chu kỳ đầu tư này khó dừng lại:** 1. **Phạm vi đầu tư rộng:** Capex không chỉ dành cho chip (GPU) mà còn trải dài trên nhiều lớp vật lý như điện lực, làm mát, mạng lưới, biến áp, hệ thống phân phối điện (như đơn hàng từ Eaton tăng 240%). Các dự án kỹ thuật hạ tầng một khi bắt đầu thì khó dừng giữa chừng. 2. **Các nút thắt cổ chai chuyển xuống hạ tầng:** Nếu thiếu chip có thể giải quyết bằng mở rộng sản xuất, thì các vấn đề như **cung cấp điện, lắp đặt lưới điện, biến áp tùy chỉnh** lại có thời gian dẫn đầu kéo dài (hàng năm), không thể giải quyết nhanh. 3. **Khác biệt với bong bóng dotcom 2000:** Bong bóng dotcom sụp đổ chủ yếu do cung vượt xa cầu (cáp quang được lắp đặt quá mức). Lần này, cung (đặc biệt là năng lượng và hạ tầng điện) lại là yếu tố hạn chế, không thể "đào đường một lần cho 10 năm dùng" như cáp quang, do đó khó xảy ra tình trạng dư thừa công suất nghiêm trọng và đột ngột. **Những lo ngại chính của thị trường & Phản biện:** * **Lo ngại 1: Capex tăng nhanh hơn doanh thu, ROI khó đảm bảo.** Điều này đúng là rủi ro, nhưng lịch sử ngành điện toán đám mây cho thấy giai đoạn đầu Capex cao hơn doanh thu là bình thường, lợi nhuận sẽ đến từ quy mô hóa sau này. Quan điểm chỉ nên thay đổi nếu có dấu hiệu như: các công ty giảm hướng dẫn Capex, hủy đơn hàng, hoặc doanh thu từ AI sụt giảm. Đến giữa 2026, chưa có dấu hiệu nào trong số này xảy ra. * **Lo ngại 2: Đây có phải là dotcom 2000 lần 2?** Như đã phân tích, động lực cung-cầu khác biệt cơ bản. Sự khan hiếm hạ tầng vật lý (điện) thay vì dư thừa (cáp quang) khiến kịch bản sụp đổ tương tự khó lặp lại. **Kết luận:** Đợt huy động vốn lớn hiện tại cho thấy cuộc đua AI vẫn tiếp tục và đang bước vào giai đoạn xây dựng hạ tầng vật lý phức tạp, đầy thách thức. Các nút thắt về năng lượng và hạ tầng có thể kéo dài chu kỳ đầu tư. Thay vì kết thúc, vở kịch AI mới chỉ thay đổi kịch bản, chuyển từ giai đoạn "tưởng tượng" sang giai đoạn "thi công" đầy cam go.

marsbit1 giờ trước

Tides Investment: Chúng tôi vẫn lạc quan về chuỗi ngành AI, nhưng lý do đã thay đổi

marsbit1 giờ trước

Đầu tư Thủy Triều: Chúng tôi vẫn lạc quan về chuỗi cung ứng AI, nhưng lý do đã thay đổi

**Tóm tắt: Đầu tư Thủy triều vẫn lạc quan về chuỗi công nghiệp AI, nhưng lý do đã thay đổi** Thị trường hiện tại vừa phấn khích vừa lo lắng khi các gã khổng lồ công nghệ như Alphabet và Meta đang huy động vốn lớn, cùng với các thông tin IPO của SpaceX, OpenAI. Tuy nhiên, việc diễn giải điều này như dấu hiệu đỉnh của AI là quá đơn giản. Đây thực chất là sự chuyển sang chương mới. Chúng tôi vẫn lạc quan về chuỗi cung ứng AI, nhưng sự lạc quan ngày nay không còn dựa trên trí tưởng tượng thuần túy như hai năm trước. Bằng chứng rõ ràng là vốn đầu tư (Capex) từ năm nhà cung cấp đám mây lớn (Alphabet, Amazon, Meta, Microsoft, Oracle) không ngừng tăng mạnh trong năm 2025 và 2026, thậm chí khiến các công ty có dòng tiền mạnh nhất cũng phải điều chỉnh cơ cấu vốn. Lý do khiến chu kỳ đầu tư này khó dừng lại nằm ở quy mô và tính chất của nó. Đầu tư không chỉ cho chip (GPU) mà còn trải rộng sang các khâu vật lý như điện lực, máy biến áp, làm mát, mạng lưới và tích hợp tủ rack. Các điểm nghẽn đang dịch chuyển xuống các hạ tầng này, nơi việc mở rộng sản xuất chậm và phức tạp (ví dụ: kết nối lưới điện có thể mất nhiều năm). Các đơn đặt hàng tăng vọt từ các nhà cung cấp như Eaton cho thấy tiến độ xây dựng thực tế đang diễn ra. Thị trường có hai lo ngại chính: 1. **Tốc độ tăng Capex vượt doanh thu, ROI khó đảm bảo:** Điều này là thật, nhưng lịch sử phát triển đám mây cho thấy giai đoạn đầu tư vượt trội là cần thiết để đạt quy mô. Rủi ro ROI sẽ chỉ trở thành hiện thực nếu có dấu hiệu cắt giảm Capex, hủy đơn hàng hoặc doanh thu AI không đạt. 2. **Lặp lại bong bóng năm 2000:** Khác với cơn sốt viễn thông năm 2000 nơi cung (cáp quang) có thể dư thừa nhanh chóng, hạ tầng cho AI (điện, máy biến áp) có rào cản sản xuất và phê duyệt cao, khó tạo ra tình trạng cung vượt cầu đột ngột. Tóm lại, làn sóng huy động vốn lớn hiện tại phản ánh nhu cầu tiếp tục đầu tư để vượt qua những thách thức hạ tầng ngày càng lớn trong giai đoạn phát triển tiếp theo của AI. Kịch bản đã thay đổi từ giai đoạn chứng minh khái niệm sang giai đoạn triển khai hạ tầng quy mô, và vở kịch vẫn chưa kết thúc.

链捕手1 giờ trước

Đầu tư Thủy Triều: Chúng tôi vẫn lạc quan về chuỗi cung ứng AI, nhưng lý do đã thay đổi

链捕手1 giờ trước

Grayscale: 15 giao thức kiếm tiền trong crypto này đang bị định giá thấp một cách nghiêm trọng

Tác giả: Zach Pandl (Trưởng bộ phận Nghiên cứu Grayscale) Biên dịch: Deep Tide TechFlow Báo cáo mới nhất từ Grayscale Research liệt kê 15 giao thức có doanh thu on-chain hàng đầu và so sánh hệ số định giá của chúng. Phát hiện chính: Nhiều giao thức có doanh thu hàng năm hàng trăm triệu USD đang được giao dịch ở mức hệ số doanh thu rất thấp, chỉ từ 1 đến dưới 10 lần. Đáng chú ý, Pump.fun, PancakeSwap và Meteora có vốn hóa thị trường gần bằng doanh thu một năm của họ. Grayscale cho rằng Đạo luật CLARITY (có khả năng được thông qua trong tháng tới) có thể là chất xúc tác quan trọng, mở đường cho dòng vốn tổ chức đổ vào các giao thức DeFi này bằng cách đưa ra khuôn khổ pháp lý rõ ràng. 12 trong số 15 giao thức được đề cập thuộc lĩnh vực tài chính hoặc cơ sở hạ tầng liên quan, và sẽ hưởng lợi từ hoạt động giao dịch on-chain dự kiến tăng sau đó. Báo cáo cũng đề cập đến phân tích định giá DCF của Grayscale cho Aave, với mức giá mục tiêu khoảng 175 USD trong kịch bản cơ sở, phản ánh tiềm năng tăng trưởng. Cần lưu ý: Grayscale là một công ty quản lý tài sản tiền mã hóa, có lợi ích thương mại gắn với việc thu hút đầu tư vào các tài sản này. Nhà đầu tư nên đánh giá độc lập luận điểm "định giá thấp" cùng với rủi ro (bao gồm sự không chắc chắn về pháp lý và tính biến động của doanh thu phụ thuộc vào xu hướng thị trường).

marsbit1 giờ trước

Grayscale: 15 giao thức kiếm tiền trong crypto này đang bị định giá thấp một cách nghiêm trọng

marsbit1 giờ trước

Bí quyết tạo dựng tài sản cá nhân của Sam Altman: Đầu tư 400 công ty, hơn 10 công ty gắn kết sâu với OpenAI

Theo điều tra của WSJ, Sam Altman, CEO của OpenAI, đã xây dựng một mạng lưới tài sản cá nhân phức tạp thông qua việc đầu tư vào khoảng 400 công ty khởi nghiệp công nghệ, tập trung vào các lĩnh vực như AI, phần mềm, công nghệ sinh học và năng lượng. Đáng chú ý, ít nhất 10 trong số các công ty này đã thiết lập quan hệ đối tác kinh doanh hoặc có tiếp xúc tiềm năng với OpenAI, dấy lên lo ngại về xung đột lợi ích. Altman không trực tiếp nắm giữ cổ phần tại OpenAI, nhưng các khoản đầu tư cá nhân của ông đã thu lợi nhuận khổng lồ nhờ mối liên hệ với công ty. Ví dụ điển hình là Helion Energy, một công ty nhiệt hạch mà ông đã đầu tư và từng làm Chủ tịch HĐQT. Sau khi OpenAI ký thỏa thuận mua điện với Helion và công ty này huy động vốn thành công, giá trị cổ phần của Altman ở Helion được ước tính tăng gấp đôi, lên ít nhất 4,1 tỷ USD. Một ví dụ khác là Retro Biosciences, với cổ phần của Altman trị giá 258 triệu USD, và Cerebras Systems, một nhà sản xuất chip mà giá trị đầu tư của ông tăng hơn 6 lần sau thỏa thuận với OpenAI và IPO. Các giao dịch này, cùng với những hợp đồng trị giá nghìn tỷ USD của OpenAI với các đối tác như Nvidia, đã khiến Ủy ban Giám sát Hạ viện Mỹ và một số tổng chưởng lý bang điều tra về khả năng xung đột lợi ích. Dù Chủ tịch HĐQT OpenAI Bret Taylor khẳng định Altman minh bạch và các xung đột được quản lý cẩn thận, câu chuyện vẫn phác họa một "bậc thầy luyện vàng" tài sản AI, với khối tài sản ròng ước tính 3,4 tỷ USD, giúp thứ hạng của ông trên bảng xếp hạng Forbes tăng hơn 1400 bậc chỉ trong 2 năm.

Odaily星球日报2 giờ trước

Bí quyết tạo dựng tài sản cá nhân của Sam Altman: Đầu tư 400 công ty, hơn 10 công ty gắn kết sâu với OpenAI

Odaily星球日报2 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

Làm thế nào để Mua RE

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Re (RE) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Re (RE) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Re (RE) của BạnSau khi mua Re (RE), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Re (RE)Giao dịch Re (RE) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 38Xuất bản vào 2026.06.18Cập nhật vào 2026.06.18

Làm thế nào để Mua RE

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của RE (RE) được trình bày dưới đây.

活动图片