Bộ Dữ Liệu Đào Tạo Doc2Repo Dài Hạn Đầu Tiên, Code Agent Không Chỉ Sửa Lỗi, Bắt Đầu Tạo Kho Lưu Trữ

marsbitXuất bản vào 2026-06-25Cập nhật gần nhất vào 2026-06-25

Tóm tắt

Khả năng của Code Agent đang dần vượt ra ngoài việc sửa lỗi đơn lẻ, tiến tới các nhiệm vụ dài hạn cấp repository. Nghiên cứu mới từ Đại học Nhân dân Trung Quốc giới thiệu DeNovoSWE - tập dữ liệu đào tạo đầu tiên dành riêng cho việc tạo mã cấp kho lưu trữ từ đầu. Tập dữ liệu này chứa 4.818 nhiệm vụ chất lượng cao, được xây dựng thông qua cơ chế "Chia để trị" (Divide & Conquer) và "Phê bình & Sửa chữa" (Critic & Repair), nhằm giải quyết thách thức trong việc tạo toàn bộ kho mã chức năng từ một tài liệu mô tả. Phương pháp này phân tích kho mã mục tiêu thành các "năng lực" (capabilities), sau đó sử dụng một quy trình đa tác nhân để tự động tạo tài liệu nhiệm vụ rõ ràng, có cấu trúc, vừa đủ chi tiết để đánh giá nhưng không làm lộ chi tiết triển khai. Một kỹ thuật lọc theo độ khó được áp dụng để cân bằng giữa chất lượng và tính đa dạng của dữ liệu. Kết quả thử nghiệm cho thấy hiệu quả rõ rệt: Mô hình Qwen3-30B-A3B-Instruct được huấn luyện trên DeNovoSWE đã cải thiện hiệu suất trên benchmark BeyondSWE-Doc2Repo từ 5.8% lên 47.2% và trên NL2RepoBench từ 4.3% lên 23.0%. Điều này khẳng định nhu cầu về dữ liệu được thiết kế đặc biệt cho các tác vụ dài hạn, thay vì chỉ dựa vào dữ liệu sửa lỗi thông thường. DeNovoSWE đánh dấu một bước tiến quan trọng, cung cấp môi trường đào tạo có hệ thống để phát triển các Code Agent thực sự có khả năng hiểu yêu cầu, lập kế hoạch kiến trúc và tạo ra toàn bộ kho phần mềm có thể thực thi.

Với khả năng của LLM Code Agent ngày càng được nâng cao, ngày càng nhiều nhà nghiên cứu nhận ra đã đến lúc bước sang giai đoạn tiếp theo - những nhiệm vụ dài hạn gần với nhu cầu thực tế hơn. Do đó, một số benchmark đánh giá nhiệm vụ dài hạn đã xuất hiện như NL2RepoBench và BeyondSWE. Kỳ vọng về vai trò của Code Agent dần chuyển từ người bảo trì kho lưu trữ thành kiến trúc sư, có thể lập kế hoạch và hoàn thành các nhiệm vụ dài hạn liên quan toàn bộ mã nguồn trong kho.

Gần đây, Trường Cao học Trí tuệ Nhân tạo Gaoling, Đại học Nhân dân Trung Quốc đã hoàn thành nghiên cứu liên quan và công bố bộ dữ liệu DeNovoSWE, tập trung vào các nhiệm vụ kỹ thuật phần mềm dài hạn, đặc biệt là nhiệm vụ tạo mã cấp kho lưu trữ từ đầu.

Link bài báo: https://arxiv.org/pdf/2606.10728

Link kho lưu trữ: https://github.com/AweAI-Team/DeNovoSWE

Link dữ liệu: https://huggingface.co/collections/AweAI-Team/denovoswe

Bằng cơ chế Divide & Conquer và Critic & Repair để xây dựng bộ dữ liệu chất lượng cao, đồng thời thành công trong việc mở rộng quy mô cho nhiệm vụ SWE dài hạn, xây dựng bộ dữ liệu nhiệm vụ SWE dài hạn chất lượng cao mã nguồn mở chứa 4,818 dữ liệu thực tế - thành quả này cung cấp dữ liệu quy mô lớn cho việc đào tạo khả năng dài hạn của Code Agent, nâng cao đáng kể năng lực thực hiện nhiệm vụ dài hạn của Code Agent.

Bài báo cũng cung cấp phương pháp lọc dựa trên điểm độ khó của đề bài, giúp giảm thiểu hiệu quả vấn đề đánh đổi giữa tỷ lệ bài toán khó và chất lượng quỹ đạo.

Thí nghiệm cho thấy, Qwen3-30B-A3B-Instruct được huấn luyện dựa trên DeNovoSWE đã cải thiện từ 5.8% lên 47.2% trên BeyondSWE-Doc2Repo, và từ 4.3% lên 23.0% trên NL2RepoBench, thể hiện sự cải thiện đáng kể về khả năng tạo mã cấp kho lưu trữ nhờ dữ liệu dài hạn.

Từ Một Tài Liệu Bắt Đầu Tái Tạo Toàn Bộ Kho Lưu Trữ

Một năm qua, với việc mở rộng quy mô dữ liệu SWE lớn như Scale-SWE, các tác nhân mã thông minh đã tiến bộ nhanh chóng trên các nhiệm vụ kỹ thuật phần mềm thực tế như SWE-bench. Nhưng khi mô hình ngày càng giỏi "sửa một issue" hay "sửa vài dòng lỗi", một vấn đề then chốt hơn bắt đầu nổi lên: Liệu tác nhân thông minh có thực sự sở hữu năng lực kỹ thuật phần mềm dài hạn? Nhìn vào hiệu quả của các mô hình tiên phong trên BeyondSWE-Doc2Repo và NL2RepoBench, kết quả không lý tưởng.

Phát triển phần mềm trong thế giới thực thường không phải là sửa một hàm, bổ sung một điều kiện, mà là hiểu yêu cầu, lập kế hoạch kiến trúc, tạo tệp, thiết kế API, xử lý phụ thuộc, kết nối các module, và cuối cùng là đảm bảo toàn bộ kho chạy thông qua kiểm thử.

Nói cách khác, khó khăn nằm ở việc tạo cấp kho lưu trữ tầm nhìn dài hạn: từ một tài liệu nhiệm vụ, tạo ra một kho phần mềm hoàn chỉnh, có thể thực thi, có thể kiểm chứng. Đây chính là vấn đề DeNovoSWE muốn giải quyết.

Tài Liệu Nhiệm Vụ Chất Lượng Cao Cho Việc "Tạo Kho Từ Đầu"

Trong việc tạo kho lưu trữ từ tài liệu, tài liệu không chỉ là README, cũng không phải là danh sách API đơn giản. Về bản chất, nó là điểm vào nhiệm vụ duy nhất để tác nhân thông minh tái tạo toàn bộ kho.

Một tài liệu nhiệm vụ chất lượng cao ít nhất cần đáp ứng hai tiêu chuẩn cốt lõi.

Thứ nhất, nó phải được tổ chức tốt.

Nhiệm vụ cấp kho vốn dĩ phức tạp, chứa nhiều module, giao diện, cấu hình, cấu trúc dữ liệu và quy trình tương tác. Nếu tài liệu chỉ xếp chồng các mô tả hàm lên nhau, tác nhân thông minh dễ bị lạc trong thông tin mảnh vỡ. Do đó, tài liệu nên đưa ra cái nhìn tổng quan rõ ràng về kho trước, sau đó phân chia chương theo khả năng hoặc luồng công việc, để mỗi phần tương ứng với ranh giới chức năng rõ ràng.

Thứ hai, nó phải xuất phát từ góc độ đánh giá (evaluation) đáng tin cậy.

Tài liệu không thể quá ít, nếu không nhiệm vụ trở thành vấn đề không được định nghĩa đầy đủ, khiến mô hình có thể cần đoán mò mới vượt qua được evaluation; cũng không thể quá nhiều, nếu không sẽ tiết lộ chi tiết triển khai, làm mất đi tính thách thức của nhiệm vụ.

Tài liệu thực sự chất lượng cao nên mô tả các hành vi then chốt mà evaluation phụ thuộc vào: bao gồm đường dẫn import, API công khai, đầu vào/đầu ra, tham số mặc định, hành vi ngoại lệ, mục cấu hình, chuỗi mẫu, trường trả về, v.v., đồng thời cũng mô tả chức năng cần hoàn thành đại khái. Nói cách khác, tài liệu phải đủ để tác nhân thông minh tái hiện hành vi có thể kiểm thử, nhưng không được biến thành bản sao của mã triển khai.

Đây cũng là tư tưởng cốt lõi của DeNovoSWE: làm cho tài liệu vừa dễ đọc, có thể thực hiện, vừa có thể kiểm chứng.

Phương Pháp DeNovoSWE

DeNovoSWE xây dựng "tạo kho hoàn chỉnh từ tài liệu" thành một nhiệm vụ kỹ thuật phần mềm dài hạn, quy mô lớn, có thể kiểm chứng. Nó không phải là viết tài liệu thủ công, mà là tự động xây dựng các ví dụ chất lượng cao thông qua một quy trình làm việc đa tác nhân trong môi trường sandbox. Toàn bộ phương pháp có thể tóm tắt thành hai bước: Chia để trị.

Trong giai đoạn Chia, hệ thống trước hết phân tích kho mục tiêu, tách nó thành nhiều khả năng của kho.

Mỗi khả năng tương ứng với một khả năng cốt lõi hoặc luồng công việc trong kho, ví dụ như xác thực và kết nối, đọc/ghi dữ liệu, xử lý hàng loạt, quy trình xuất, v.v. Như vậy, vấn đề tạo kho lớn ban đầu được chia thành nhiều chương tài liệu có cấu trúc rõ ràng.

Đồng thời, DeNovoSWE sẽ chạy kiểm thử đơn vị gốc và thu thập dấu vết thực thi, xác định hàm, lớp và giao diện nào thực sự ảnh hưởng đến evaluation, từ đó phân biệt thêm các thành phần trực tiếp, thành phần gián tiếp cốt lõi và thành phần gián tiếp không cốt lõi: các giao diện được gọi trực tiếp bởi kiểm thử phải được ghi lại chi tiết; các thành phần gián tiếp cốt lõi ảnh hưởng đến hành vi quan sát được cũng cần được bao phủ; còn các triển khai nội bộ không cốt lõi có thể để tác nhân thông minh tự do phát huy.

Trong giai đoạn Trị, DeNovoSWE sử dụng cơ chế Phác thảo-Phê bình-Sửa chữa để tạo tài liệu theo từng khả năng. Tác nhân Phác thảo viết bản nháp đầu tiên; Tác nhân Phê bình kiểm tra xem tài liệu có bỏ sót API then chốt, hợp đồng hành vi hoặc thông tin cấu trúc không; Tác nhân Sửa chữa sau đó sửa tài liệu dựa trên phản hồi. Vòng lặp này lặp lại liên tục cho đến khi mỗi chương về khả năng đủ rõ ràng, hoàn chỉnh và phù hợp với evaluation.

Cuối cùng, tài liệu của các khả năng khác nhau sẽ được hợp nhất thành một tài liệu nhiệm vụ hoàn chỉnh, làm cơ sở duy nhất để tác nhân thông minh tạo kho từ đầu.

Độ Khó: Tại Sao Đây Là Nhiệm Vụ Dài Hạn?

Độ khó của nhiệm vụ DeNovoSWE đến từ một thay đổi căn bản: nó không còn là sửa lỗi cấp issue, mà là tạo toàn bộ kho.

Trong các nhiệm vụ SWE truyền thống, tác nhân thông minh thường đối mặt với một kho đã tồn tại, chỉ cần định vị lỗi, sửa mã cục bộ và vượt qua kiểm thử.

Trong DeNovoSWE, tác nhân thông minh đối mặt với một môi trường đã được làm sạch: mã nguồn và kiểm thử gốc bị loại bỏ, lịch sử git được đặt lại, bộ nhớ đệm, tàn dư site-packages, pip wheel, sản phẩm biên dịch tạm thời và các kênh rò rỉ tiềm ẩn khác cũng sẽ bị xóa. Điều này có nghĩa là tác nhân thông minh phải thực sự dựa vào tài liệu để hoàn thành việc tái tạo toàn bộ kho. Nó cần lập kế hoạch cấu trúc dự án, tạo tệp module, định nghĩa giao diện công khai, triển khai tương tác xuyên tệp, xử lý phụ thuộc và cấu hình, đồng thời liên tục sửa lỗi trong nhiều vòng chỉnh sửa và phản hồi kiểm thử.

Bất kỳ sai lệch nào về chữ ký API, trường trả về, kiểu ngoại lệ hoặc hành vi mặc định đều có thể dẫn đến thất bại kiểm thử. Lỗi còn tích lũy trong quá trình dài hạn: một module được thiết kế không hợp lý từ sớm có thể ảnh hưởng đến nhiều tệp và chuỗi gọi sau này.

Để xử lý thêm sự khác biệt về độ khó giữa các kho, DeNovoSWE còn đề xuất lọc quỹ đạo nhận biết độ khó. Nói đơn giản, nhiệm vụ dễ nên yêu cầu tỷ lệ vượt qua cao hơn, còn nhiệm vụ khó không thể bị loại bỏ hoàn toàn chỉ vì không đạt điểm số hoàn hảo. DeNovoSWE dựa trên độ phức tạp cấu trúc và đánh giá độ khó của LLM để đặt ngưỡng lọc khác nhau cho các khoảng độ khó khác nhau, từ đó đạt được sự cân bằng giữa chất lượng và tính đa dạng.

Điều này đặc biệt quan trọng với nhiệm vụ dài hạn: kho càng phức tạp, càng khó vượt qua tất cả kiểm thử ngay lập tức, nhưng những quỹ đạo của kho khó, điểm thấp, thành công một phần trong đó vẫn chứa đựng khả năng lập kế hoạch và triển khai dài hạn quý giá.

Kết Quả Thực Nghiệm

DeNovoSWE cuối cùng đã xây dựng được 4818 ví dụ nhiệm vụ chuyển tài liệu thành kho chất lượng cao. Đây là môi trường kỹ thuật phần mềm dài hạn có thể thực thi, có thể đánh giá, có thể huấn luyện.

Kết quả thí nghiệm cho thấy, DeNovoSWE mang lại sự cải thiện đáng kể cho khả năng tạo kho dài hạn của mô hình. Trên Qwen3-30B-A3B-Instruct, mô hình gốc chỉ đạt 5.8% trên BeyondSWE-Doc2Repo và 4.3% trên NL2RepoBench. Scale-SWE-Agent được huấn luyện bằng dữ liệu SWE cấp issue thông thường có thể nâng lên 29.2% và 18.3%, cho thấy dữ liệu SWE thông thường thực sự có hiệu ứng chuyển giao. Nhưng khi mô hình được huấn luyện bằng DeNovoSWE, hiệu suất lại được nâng cao thêm lên 47.2% và 23.0%.

Điều này cho thấy, dữ liệu hướng đến "sửa lỗi" không thể hoàn toàn thay thế dữ liệu dài hạn hướng đến "tạo kho hoàn chỉnh". Muốn tác nhân thông minh thực sự học được kỹ thuật cấp kho, cần xây dựng môi trường huấn luyện chuyên biệt cho nhiệm vụ dài hạn.

Trên backbone mạnh hơn Qwen3.5-35B-A3B, DeNovoSWE cũng mang lại lợi ích ổn định: BeyondSWE-Doc2Repo tăng từ 43.8% lên 50.0%, NL2RepoBench tăng từ 23.5% lên 27.1%. Điều này củng cố thêm rằng lợi ích của DeNovoSWE không phải ngẫu nhiên thích ứng với một mô hình cụ thể, mà đến từ chính chất lượng cao của dữ liệu dài hạn.

Kết Luận

Giai đoạn tiếp theo của tác nhân mã thông minh không chỉ là sửa từng issue nhanh hơn, mà còn là có thể hiểu tài liệu, lập kế hoạch kiến trúc, tổ chức module, triển khai giao diện, và cuối cùng tạo ra một kho phần mềm hoàn chỉnh, có thể chạy được.

DeNovoSWE đã xây dựng có hệ thống mục tiêu này thành một tập dữ liệu có thể huấn luyện, có thể kiểm chứng, có thể mở rộng. Nó trả lời một câu hỏi then chốt: Loại dữ liệu nào mới thực sự có thể huấn luyện ra tác nhân thông minh sở hữu năng lực kỹ thuật phần mềm dài hạn?

Câu trả lời không phải là nhiều mã mảnh vỡ hơn, cũng không phải là bài toán đơn giản hơn, mà là nhiệm vụ tạo toàn bộ kho chất lượng cao, có cấu trúc, phù hợp với evaluation, chống rò rỉ.

Từ một tài liệu bắt đầu, tái tạo toàn bộ kho. Đây là ngưỡng cửa mà tác nhân mã thông minh dài hạn cần vượt qua.

Tài liệu tham khảo: https://arxiv.org/pdf/2606.10728

Bài viết này đến từ tài khoản WeChat công chúng "Tân Trí Nguyên", biên tập: LRST

Tiền kỹ thuật số thịnh hành

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

BrevisBREV

ZRX（0X）ZRX

Câu hỏi Liên quan

QDeNovoSWE là gì và mục tiêu chính của nó trong lĩnh vực Phát triển Phần mềm Trí tuệ Nhân tạo là gì?

ADeNovoSWE là một tập dữ liệu chuyên dụng về tác vụ kỹ thuật phần mềm tầm xa, đặc biệt tập trung vào nhiệm vụ tạo mã cấp kho lưu trữ từ đầu. Mục tiêu chính của nó là cung cấp một bộ dữ liệu chất lượng cao, có thể huấn luyện để phát triển các tác nhân mã (Code Agent) có khả năng hiểu tài liệu, lập kế hoạch kiến trúc và tạo ra toàn bộ kho lưu trữ phần mềm có thể thực thi từ một tài liệu mô tả nhiệm vụ.

QPhương pháp 'Divide & Conquer' và 'Critic & Repair' trong nghiên cứu DeNovoSWE hoạt động như thế nào?

ATrong giai đoạn 'Divide', hệ thống phân tích kho lưu trữ mục tiêu và chia nó thành nhiều 'repository capabilities' (khả năng kho lưu trữ), mỗi phần tương ứng với một chức năng cốt lõi. Trong giai đoạn 'Conquer', phương pháp 'Draft-Critic-Repair' được sử dụng: Tác nhân Draft viết bản nháp tài liệu, tác nhân Critic kiểm tra và phê bình các thiếu sót, sau đó tác nhân Repair sửa chữa tài liệu dựa trên phản hồi. Quá trình này lặp lại cho đến khi tài liệu đầy đủ và rõ ràng.

QDeNovoSWE đã giải quyết vấn đề gì trong việc tạo dữ liệu huấn luyện cho các tác vụ phần mềm tầm xa?

ADeNovoSWE giải quyết vấn đề thiếu dữ liệu huấn luyện chất lượng cao cho các tác vụ phần mềm tầm xa (long-horizon), nơi tác nhân cần tạo toàn bộ kho lưu trữ từ đầu. Nó tạo ra các tài liệu nhiệm vụ được tổ chức tốt, căn chỉnh với đánh giá (evaluation-aligned) và chống rò rỉ thông tin (anti-leakage), đồng thời giới thiệu kỹ thuật lọc dựa trên độ khó (difficulty-aware filtering) để cân bằng giữa chất lượng và sự đa dạng của dữ liệu.

QKết quả thí nghiệm cho thấy hiệu quả của việc huấn luyện với DeNovoSWE trên các mô hình như thế nào?

AKết quả thí nghiệm cho thấy việc huấn luyện với DeNovoSWE cải thiện đáng kể khả năng tạo mã cấp kho lưu trữ. Ví dụ, mô hình Qwen3-30B-A3B-Instruct được huấn luyện trên DeNovoSWE đã tăng hiệu suất từ 5.8% lên 47.2% trên benchmark BeyondSWE-Doc2Repo và từ 4.3% lên 23.0% trên NL2RepoBench. Điều này chứng tỏ dữ liệu tầm xa chuyên biệt hiệu quả hơn dữ liệu sửa lỗi thông thường.

QThách thức chính của nhiệm vụ 'tạo kho lưu trữ từ tài liệu' trong DeNovoSWE là gì?

AThách thức chính là nhiệm vụ không còn là sửa lỗi cấp độ vấn đề (issue-level fixing) mà là tạo toàn bộ kho lưu trữ (whole-repository generation). Tác nhân phải làm việc trong môi trường đã được làm sạch, không có mã nguồn gốc, và chỉ dựa vào tài liệu để lập kế hoạch cấu trúc, tạo tệp, định nghĩa giao diện, xử lý phụ thuộc và sửa lỗi tích lũy qua nhiều bước. Bất kỳ sai lệch nào trong API, hành vi hoặc kiểu trả về đều có thể dẫn đến thất bại.

Nội dung Liên quan

Grayscale: 15 giao thức kiếm tiền trong crypto này đang bị định giá thấp một cách nghiêm trọng

Tác giả: Zach Pandl (Trưởng bộ phận Nghiên cứu Grayscale) Biên dịch: Deep Tide TechFlow Báo cáo mới nhất từ Grayscale Research liệt kê 15 giao thức có doanh thu on-chain hàng đầu và so sánh hệ số định giá của chúng. Phát hiện chính: Nhiều giao thức có doanh thu hàng năm hàng trăm triệu USD đang được giao dịch ở mức hệ số doanh thu rất thấp, chỉ từ 1 đến dưới 10 lần. Đáng chú ý, Pump.fun, PancakeSwap và Meteora có vốn hóa thị trường gần bằng doanh thu một năm của họ. Grayscale cho rằng Đạo luật CLARITY (có khả năng được thông qua trong tháng tới) có thể là chất xúc tác quan trọng, mở đường cho dòng vốn tổ chức đổ vào các giao thức DeFi này bằng cách đưa ra khuôn khổ pháp lý rõ ràng. 12 trong số 15 giao thức được đề cập thuộc lĩnh vực tài chính hoặc cơ sở hạ tầng liên quan, và sẽ hưởng lợi từ hoạt động giao dịch on-chain dự kiến tăng sau đó. Báo cáo cũng đề cập đến phân tích định giá DCF của Grayscale cho Aave, với mức giá mục tiêu khoảng 175 USD trong kịch bản cơ sở, phản ánh tiềm năng tăng trưởng. Cần lưu ý: Grayscale là một công ty quản lý tài sản tiền mã hóa, có lợi ích thương mại gắn với việc thu hút đầu tư vào các tài sản này. Nhà đầu tư nên đánh giá độc lập luận điểm "định giá thấp" cùng với rủi ro (bao gồm sự không chắc chắn về pháp lý và tính biến động của doanh thu phụ thuộc vào xu hướng thị trường).

marsbit15 phút trước

Grayscale: 15 giao thức kiếm tiền trong crypto này đang bị định giá thấp một cách nghiêm trọng

marsbit15 phút trước

Ripple Ra Mắt RLUSD Tại Nhật Bản Khi Làn Sóng Mở Rộng Stablecoin Được Quy Định Ngày Càng Mạnh Mẽ

Ripple đã chính thức ra mắt stablecoin RLUSD tại thị trường Nhật Bản sau khi được Cơ quan Dịch vụ Tài chính Nhật Bản phê duyệt theo khung Công cụ Thanh toán Điện tử Loại 4. RLUSD, được hỗ trợ bởi tiền gửi USD, trái phiếu Kho bạc và các tài sản tương đương tiền mặt, sẽ có sẵn cho các nhà đầu tư tổ chức và bán lẻ trên nền tảng VCTRADE của SBI VC Trade. Sự kiện này đánh dấu một bước tiến quan trọng trong việc mở rộng mạng lưới thị trường được quản lý toàn cầu của Ripple. Công ty và đối tác chiến lược SBI Group (hợp tác từ năm 2016) nhắm đến việc thúc đẩy các trường hợp sử dụng như thanh toán xuyên biên giới, mã hóa tài sản và quản lý tài sản thế chấp. Ra mắt cuối năm 2024, RLUSD đã nhanh chóng đạt vốn hóa thị trường khoảng 1,7 tỷ USD và trở thành stablecoin USD thứ hai trên SBI VC Trade sau USD Coin. Việc phát hành tại Nhật Bản, một thị trường có khung pháp lý rõ ràng cho tài sản số, nhấn mạnh cam kết của Ripple trong việc phát triển cơ sở hạ tầng thanh toán toàn cầu dựa trên stablecoin được quản lý.

TheNewsCrypto22 phút trước

Ripple Ra Mắt RLUSD Tại Nhật Bản Khi Làn Sóng Mở Rộng Stablecoin Được Quy Định Ngày Càng Mạnh Mẽ

TheNewsCrypto22 phút trước

Bí quyết tạo dựng tài sản cá nhân của Sam Altman: Đầu tư 400 công ty, hơn 10 công ty gắn kết sâu với OpenAI

Theo điều tra của WSJ, Sam Altman, CEO của OpenAI, đã xây dựng một mạng lưới tài sản cá nhân phức tạp thông qua việc đầu tư vào khoảng 400 công ty khởi nghiệp công nghệ, tập trung vào các lĩnh vực như AI, phần mềm, công nghệ sinh học và năng lượng. Đáng chú ý, ít nhất 10 trong số các công ty này đã thiết lập quan hệ đối tác kinh doanh hoặc có tiếp xúc tiềm năng với OpenAI, dấy lên lo ngại về xung đột lợi ích. Altman không trực tiếp nắm giữ cổ phần tại OpenAI, nhưng các khoản đầu tư cá nhân của ông đã thu lợi nhuận khổng lồ nhờ mối liên hệ với công ty. Ví dụ điển hình là Helion Energy, một công ty nhiệt hạch mà ông đã đầu tư và từng làm Chủ tịch HĐQT. Sau khi OpenAI ký thỏa thuận mua điện với Helion và công ty này huy động vốn thành công, giá trị cổ phần của Altman ở Helion được ước tính tăng gấp đôi, lên ít nhất 4,1 tỷ USD. Một ví dụ khác là Retro Biosciences, với cổ phần của Altman trị giá 258 triệu USD, và Cerebras Systems, một nhà sản xuất chip mà giá trị đầu tư của ông tăng hơn 6 lần sau thỏa thuận với OpenAI và IPO. Các giao dịch này, cùng với những hợp đồng trị giá nghìn tỷ USD của OpenAI với các đối tác như Nvidia, đã khiến Ủy ban Giám sát Hạ viện Mỹ và một số tổng chưởng lý bang điều tra về khả năng xung đột lợi ích. Dù Chủ tịch HĐQT OpenAI Bret Taylor khẳng định Altman minh bạch và các xung đột được quản lý cẩn thận, câu chuyện vẫn phác họa một "bậc thầy luyện vàng" tài sản AI, với khối tài sản ròng ước tính 3,4 tỷ USD, giúp thứ hạng của ông trên bảng xếp hạng Forbes tăng hơn 1400 bậc chỉ trong 2 năm.

Odaily星球日报36 phút trước

Bí quyết tạo dựng tài sản cá nhân của Sam Altman: Đầu tư 400 công ty, hơn 10 công ty gắn kết sâu với OpenAI

Odaily星球日报36 phút trước

Kỹ sư từ SpaceX tái cấu trúc hệ thống thực thi tài chính từ nguyên lý đầu tiên

Dự án cơ sở hạ tầng tài chính Plan Execution Lab vừa công bố hoàn thành vòng gọi vốn thiên thần do một văn phòng gia đình nổi tiếng ở Singapore dẫn đầu, định giá sau đầu tư đạt 50 triệu USD. Người sáng lập Lex Li, cựu kỹ sư SpaceX, áp dụng tư duy nguyên lý đầu tiên (First Principles Thinking) để phân tích lại thị trường tài chính. Ông cho rằng chức năng cốt lõi của thị trường là phân bổ vốn, và quá trình then chốt biến quyết định thành hành động là "thực thi". Tuy nhiên, tầng thực thi hiện nay vẫn phụ thuộc nhiều vào quy trình làm việc thủ công của con người. Trong kỷ nguyên AI và Agent, tốc độ suy giảm chiến lược ngày càng nhanh. Thách thức lớn không còn là tiếp cận thông tin, mà là thực thi liên tục và hiệu quả. Plan Execution Lab tin rằng đơn vị cạnh tranh trong tương lai không phải là chiến lược đơn lẻ, mà là mạng lưới thực thi (Execution Network) được tạo thành từ các năng lực cơ bản như quản lý rủi ro, phân bổ vốn, phối hợp thanh khoản. Công ty đang phát triển hai sản phẩm chính: 1. **PlanX**: Một giao thức thực thi tài chính (Financial Execution Protocol), nhằm mục tiêu trở thành cơ sở hạ tầng cho làn sóng di chuyển hoạt động giao dịch từ các sàn tập trung (CEX) lên chuỗi (on-chain). 2. **Xgent**: Một thời gian chạy tài chính tự chủ (Autonomous Financial Runtime), cho phép người dùng chỉ cần xác định mục tiêu và ràng buộc, hệ thống sẽ tự động xây dựng đồ thị thực thi, xác minh và thực thi chiến lược. Tầm nhìn dài hạn của nhóm là xây dựng môi trường vận hành cho kỷ nguyên tài chính tự chủ (Autonomous Finance), tương tự như vai trò của Bloomberg Terminal trong thế giới tài chính truyền thống. Cơ sở hạ tầng tương lai sẽ được xây dựng chung bởi một mạng lưới các nút thực thi, nhà cung cấp thanh khoản và đại lý tài chính tự chủ. Sức cạnh tranh cốt lõi trong tương lai sẽ nằm ở mạng lưới thực thi mạnh mẽ và linh hoạt nhất.

链捕手1 giờ trước

Kỹ sư từ SpaceX tái cấu trúc hệ thống thực thi tài chính từ nguyên lý đầu tiên

链捕手1 giờ trước

Cựu kỹ sư SpaceX tái cấu trúc hệ thống thực thi tài chính bằng Nguyên lý Đầu tiên

Dự án cơ sở hạ tầng tài chính Plan Execution Lab vừa hoàn thành vòng gọi vốn thiên thần do một văn phòng gia đình nổi tiếng Singapore dẫn đầu, định giá sau đầu tư đạt 50 triệu USD. Người sáng lập Lex Li, cựu kỹ sư SpaceX, áp dụng tư duy nguyên lý đầu tiên để định hình lại hệ thống thực thi tài chính. Ông cho rằng chức năng cốt lõi của thị trường là phân bổ vốn, và thực thi là quá trình biến quyết định thành hành động. Trong khi tài sản, thanh khoản và thanh toán đã chuyển lên blockchain, thì tầng thực thi vẫn phụ thuộc nhiều vào quy trình làm việc thủ công của con người. Kỷ nguyên AI Agent đang đẩy nhanh tốc độ suy giảm hiệu quả của các chiến lược. Plan Execution Lab không xây dựng sàn giao dịch hay bot giao dịch thông minh hơn, mà tập trung vào hai sản phẩm chính: 1. **PlanX:** Một giao thức thực thi tài chính, nhằm trở thành cơ sở hạ tầng hỗ trợ dòng giao dịch di chuyển từ các sàn tập trung (CEX) lên chuỗi, cung cấp khả năng thực thi, kết nối thanh khoản và quản lý rủi ro. 2. **Xgent:** Một thời gian chạy tài chính tự chủ, cho phép người dùng chỉ cần xác định mục tiêu và ràng buộc, hệ thống sẽ tự động xây dựng đồ thị thực thi, xác minh và thực thi. Tầm nhìn dài hạn là tạo ra một mạng lưới thực thi mở, nơi các nút thực thi, nhà cung cấp thanh khoản và đại lý tài chính tự chủ cùng đóng góp và hợp tác. Lex Li ví tổ hợp PlanX + Xgent như "Bloomberg Terminal cho kỷ nguyên tài chính tự chủ". Cạnh tranh trong tương lai không nằm ở chiến lược đơn lẻ, mà ở mạng lưới thực thi mạnh mẽ và có khả năng thích ứng.

marsbit1 giờ trước

Cựu kỹ sư SpaceX tái cấu trúc hệ thống thực thi tài chính bằng Nguyên lý Đầu tiên

marsbit1 giờ trước

Giao dịch

Giao ngay

Hợp đồng Tương lai

Bài viết Nổi bật

Làm thế nào để Mua RE

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Re (RE) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Re (RE) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Re (RE) của BạnSau khi mua Re (RE), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Re (RE)Giao dịch Re (RE) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 37Xuất bản vào 2026.06.18Cập nhật vào 2026.06.18

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến của người dùng về giá của RE (RE) được trình bày dưới đây.