Polymarket định giá sai? 200 đại lý AI mô phỏng khủng hoảng đưa ra câu trả lời bất ngờ

marsbitXuất bản vào 2026-03-18Cập nhật gần nhất vào 2026-03-18

Tóm tắt

Tác giả đã sử dụng MiroFish để mô phỏng cuộc khủng hoảng eo biển Hormuz với 200 tác nhân AI, bao gồm các vai trò như chính phủ, truyền thông, công ty năng lượng và thương nhân. Mục tiêu là so sánh kết quả mô phỏng với dự báo thị trường từ Polymarket về khả năng vận tải biển qua eo biển trở lại bình thường vào cuối tháng 4/2026. Kết quả cho thấy: - Dự báo trung bình từ các tác nhân trong mô phỏng là 47,9%, lạc quan hơn nhiều so với tỷ lệ 31% của Polymarket. - Khi được phỏng vấn riêng, các tác nhân có xu hướng đưa ra câu trả lời lạc quan hơn (trên 60%), phản ánh sự e ngại trong biểu đạt công khai. - Một số ít tác nhân bi quan (nhà ngoại giao, chuyên gia) đưa ra dự báo gần với thị trường (~22%), cho thấy tín hiệu giá trị thường đến từ các quan điểm thiểu số. Thí nghiệm cho thấy sự khác biệt giữa phát biểu chính thức và hành vi thực tế, đồng thời gợi ý rằng mô phỏng đa tác nhân có thể cung cấp dự báo chính xác hơn khi tập trung vào tương tác tự nhiên thay vì phỏng vấn trực tiếp.

Tiêu đề gốc:how I run 200 AI agents on the hormuz crisis with Mirofish, and compare it to polymarket

Tác giả gốc:The Smart Ape

Biên dịch gốc:Peggy,BlockBeats

Lời tựa:Khi AI bắt đầu có thể mô phỏng một trường court of public opinion, bản thân việc dự đoán cũng đang thay đổi một cách thầm lặng.

Bài viết này ghi lại một thí nghiệm về tình hình eo biển Hormuz: Tác giả sử dụng MiroFish để xây dựng một hệ thống mô phỏng gồm 200 đại lý, để chính phủ, truyền thông, công ty năng lượng, trader và người bình thường cùng chung sống trong một mạng xã hội mô phỏng, hình thành phán đoán thông qua tương tác liên tục, tranh luận và lan truyền thông tin, rồi so sánh kết quả tập thể này với định giá thị trường của Polymarket.

Kết quả không thống nhất. Thảo luận nhóm nhìn chung thiên về lạc quan, trong khi thị trường bi quan hơn đáng kể; trong phát ngôn tự do, số ít người bi quan lại tiến gần hơn đến định giá thực tế; còn một khi bước vào bối cảnh phỏng vấn, hầu như tất cả đại lý đều sẽ hội tụ về cách diễn đạt ôn hòa, hợp tác hơn.

Sự chia rẽ này không hề xa lạ. Trong thế giới thực, bày tỏ quan điểm công khai thường có xu hướng ổn định và lạc quan, trong khi phán đoán rủi ro thực sự lại ẩn giấu trong hành động và biểu đạt không chính thức. Nói cách khác, cách mọi người nói, cách họ nghĩ và cách họ đặt cược tiền thường là ba hệ thống khác nhau.

Trong cấu trúc như vậy, tín hiệu có giá trị nhất thường không đến từ sự đồng thuận, mà đến từ những âm thanh có vẻ không hòa hợp trong mớ hỗn độn.

Dưới đây là nguyên văn:

Tôi đã sử dụng MiroFish để mô phỏng tình hình eo biển Hormuz trong vài tuần tới. Công cụ này hoạt động xuất sắc khi xử lý các vấn đề loại này vì nó có thể thực hiện diễn biến tình huống cực kỳ phức tạp: đưa vào cùng một hệ thống nhiều chủ thể tham gia, các vai trò khác nhau và động cơ riêng của từng bên, đồng thời để các đại lý này liên tục đấu tranh, tranh luận, cuối cùng dần hình thành một kết quả gần với đồng thuận.

Dưới đây là các bước cụ thể tôi đã chạy mô phỏng này, và kết quả cuối cùng tôi nhận được. Bất kỳ ai cũng có thể tái tạo, chìa khóa chỉ là biết nên thực hiện theo những bước nào.

Đầu tiên, MiroFish là một dự án mã nguồn mở từ một nhóm nghiên cứu Trung Quốc. Bạn nhập vào nó một loạt tài liệu, trước tiên nó sẽ xây dựng một biểu đồ tri thức, sau đó dựa trên biểu đồ này để tạo ra các nhân cách đại lý khác nhau, rồi đưa các đại lý này vào một môi trường Twitter mô phỏng. Trong môi trường này, chúng sẽ đăng bài, retweet bình luận, thích, tranh luận lẫn nhau. Sau khi mô phỏng kết thúc, bạn còn có thể phỏng vấn từng đại lý một, xem lập trường và quá trình suy luận của từng cá nhân.

Bạn nhập vào nó một kịch bản khủng hoảng, nó sẽ tạo ra một cuộc tranh luận xoay quanh sự kiện đó; từ cuộc tranh luận này, bạn có thể rút ra một kết quả dự đoán.

Tôi đã hướng nó vào một vấn đề thị trường Polymarket đang diễn ra: Đến cuối tháng 4 năm 2026, vận tải đường biển qua eo biển Hormuz có trở lại bình thường không?

Vì vậy, tôi đã đưa tất cả thông tin này cho MiroFish, tạo ra 200 vai trò đại lý - bao gồm chính phủ, truyền thông, quân đội, công ty năng lượng, trader và công chúng - sau đó để họ tranh luận trong một môi trường mô phỏng trong 7 ngày mô phỏng. Cuối cùng, so sánh kết quả đầu ra của họ với định giá thị trường.

Cấu hình tổng thể như sau:

· Mô hình: GPT-4o mini, trong kịch bản 200 đại lý, cân bằng giữa chi phí và hiệu quả tốt nhất

· Hệ thống bộ nhớ: Zep Cloud, dùng để lưu trữ ký ức đại lý và biểu đồ tri thức

· Engine mô phỏng: OASIS (môi trường clone Twitter do Camel-AI cung cấp)

· Phần cứng: Mac mini M4 Pro, 24GB RAM

· Thời gian chạy: khoảng 49 phút, hoàn thành 100 vòng mô phỏng

· Chi phí: Gọi API khoảng 3 đến 5 USD

· Tài liệu hạt giống: Một bản tin khoảng 5800 ký tự, được tổng hợp từ Wikipedia, CNBC, Al Jazeera, Forbes, Reuters, nội dung bao gồm dòng thời gian quân sự, tình trạng phong tỏa, giá dầu, thiệt hại kinh tế, nỗ lực ngoại giao và các yếu tố liên quan đến đầu tư 3.2 nghìn tỷ USD của GCC. Nghĩa là, thông tin cốt lõi cần thiết để đại lý hình thành phán đoán đều được đưa vào.

Làm thế nào để tái tạo quy trình này (hướng dẫn từng bước)

Nếu bạn cũng muốn tự chạy một lần, dưới đây là các bước đầy đủ tôi đã thực hiện. Toàn bộ quy trình mất khoảng 2 giờ để thiết lập, chi phí API khoảng 3 đến 5 USD; nếu bạn tăng số vòng hoặc số lượng đại lý, chi phí sẽ cao hơn.

Những thứ bạn cần chuẩn bị

· Python 3.12 (Không dùng 3.14, tiktoken sẽ báo lỗi trên phiên bản này)

· Node.js 22 trở lên

· Một OpenAPI API Key (GPT-4o mini đủ rẻ, phù hợp với kịch bản này)

· Một tài khoản Zep Cloud (bản miễn phí là đủ cho mô phỏng quy mô nhỏ)

· Một máy có RAM khá. Tôi dùng Mac mini M4 Pro, 24GB RAM, nhưng 16GB có lẽ cũng đủ

Bước 1: Cài đặt MiroFish

Sau đó cấu hình file .env của bạn

OPENAI_API_KEY=sk-your-key

OPENAI_BASE_URL=link

OPENAI_MODEL=gpt-4o-mini

ZEP_API_KEY=your-zep-key

Bước 2: Tạo dự án và tải lên tài liệu hạt giống của bạn

Tài liệu hạt giống là phần quan trọng nhất trong toàn bộ quy trình, nó quyết định đại lý biết những thông tin gì về tình hình hiện tại. Tôi đã chuẩn bị một bản tin khoảng 5800 ký tự, nội dung bao gồm dòng thời gian quân sự, tình trạng phong tỏa, giá dầu, thiệt hại kinh tế, nỗ lực ngoại giao và tác động ở cấp độ đầu tư GCC, nguồn tài liệu từ Wikipedia, CNBC, Al Jazeera, Forbes và Reuters.

Bước 3: Tạo ontology (bản thể luận)

Bước này là để nói với MiroFish, nó nên nhận diện những loại thực thể nào, và giữa các thực thể này có thể tồn tại mối quan hệ gì.

Bên tôi cuối cùng tạo ra 10 loại thực thể: quốc gia, quân đội, nhân viên ngoại giao, thực thể thương mại, cơ quan truyền thông, thực thể kinh tế, tổ chức, cá nhân, cơ sở hạ tầng, thị trường dự đoán; và 6 loại quan hệ. Nếu kết quả tự động tạo ra không phù hợp lắm với kịch bản của bạn, bạn cũng có thể điều chỉnh thủ công.

Bước 4: Xây dựng biểu đồ tri thức

Bước này sẽ sử dụng Zep Cloud. MiroFish sẽ gửi tài liệu hạt giống và ontology cùng nhau cho Zep, Zep chịu trách nhiệm trích xuất thực thể và xây dựng biểu đồ.

Quá trình này mất khoảng một hai phút. Tôi cuối cùng nhận được một biểu đồ gồm 65 nút, 85 cạnh, trong đó kết nối các yếu tố như quốc gia, nhân vật, tổ chức, hàng hóa, v.v.

Bước 5: Tạo đại lý

MiroFish sẽ dựa trên biểu đồ tri thức, tạo ra một bộ thiết lập nhân cách hoàn chỉnh cho mỗi thực thể, bao gồm loại tính cách MBTI, tuổi, quốc gia, phong cách đăng bài, điểm kích hoạt cảm xúc, chủ đề cấm kỵ và ký ức thể chế, v.v.

Ban đầu tôi đã tạo ra 43 đại lý cốt lõi từ biểu đồ tri thức. Sau đó, hệ thống còn có thể mở rộng các vai trò cốt lõi này đến tổng số lượng bạn muốn. Tôi cuối cùng đặt tổng số đại lý là 200, và bổ sung thêm nhiều vai trò dân thường đa dạng hơn, chẳng hạn như crypto trader, phi công hàng không, giáo sư, sinh viên, nhà hoạt động xã hội, v.v.

Bước 6: Chuẩn bị môi trường mô phỏng

Bước này sẽ tạo ra cấu hình mô phỏng hoàn chỉnh, bao gồm lịch trình hành động của đại lý, bài đăng hạt giống ban đầu và tham số thời gian. MiroFish sẽ tự động chọn một bộ cài đặt mặc định tương đối hợp lý, chẳng hạn như giờ cao điểm hoạt động, thời gian ngủ và tần suất đăng bài riêng của các loại đại lý khác nhau.

Cấu hình của tôi lúc đó là: mô phỏng tổng cộng 168 giờ (7 ngày), 100 vòng (mỗi vòng đại diện cho 1 giờ), chỉ sử dụng kịch bản Twitter, và thiết lập lịch trình hoạt động riêng cho các đại lý khác nhau.

Bước 7: Bắt đầu chạy mô phỏng.

Sau đó là chờ đợi. Bên tôi dùng GPT-4o mini chạy 200 đại lý, 100 vòng mô phỏng, mất khoảng 49 phút. Bạn có thể theo dõi tiến độ thông qua API, hoặc trực tiếp xem nhật ký.

Trong toàn bộ quá trình, đại lý sẽ tự chạy: chúng sẽ quan sát timeline, quyết định xem mình sẽ đăng bài, retweet bình luận, chuyển tiếp, thích, hay chỉ đơn giản là lướt feed, toàn bộ quá trình không cần sự can thiệp của con người.

Bước 8 (Tùy chọn): Phỏng vấn đại lý

Sau khi mô phỏng kết thúc, hệ thống sẽ chuyển sang chế độ lệnh. Lúc này bạn có thể phỏng vấn riêng một đại lý nào đó, hoặc phỏng vấn toàn bộ đại lý một lúc:

Phân tích

MiroFish sẽ đọc tài liệu hạt giống trước, và tự động tạo ra cấu trúc ontology (bao gồm 10 loại thực thể và 6 loại quan hệ); sau đó dựa trên các định nghĩa này để trích xuất một biểu đồ tri thức (chứa 65 nút và 85 cạnh). Trên cơ sở này, nó sẽ xây dựng cho mỗi thực thể một bộ thiết lập nhân cách hoàn chỉnh, bao gồm các yếu tố như loại tính cách MBTI, tuổi, quốc gia, phong cách đăng bài, điểm kích hoạt cảm xúc và ký ức thể chế, v.v.

Cuối cùng, từ biểu đồ tri thức đã tạo ra 43 đại lý cốt lõi, và trên cơ sở này mở rộng đến tổng số 200 đại lý, đưa vào nhiều vai trò dân thường đa dạng hơn, để tăng cường tính đa dạng và cảm giác chân thực tổng thể của mô phỏng.

Cấu thành cụ thể như sau:

· 140 đại lý dân thường: crypto trader, phi công hàng không, quản lý chuỗi cung ứng, sinh viên, nhà hoạt động xã hội, giáo sư, v.v.

· 16 vai trò ngoại giao/chính phủ: Bộ trưởng Ngoại giao Iran, Bộ trưởng Ngoại giao Saudi, Bộ trưởng Ngoại giao Oman, Thủ tướng Bahrain, Bộ trưởng Ngoại giao Trung Quốc, EU, Liên Hợp Quốc, v.v.

· 15 cơ quan truyền thông: Reuters, CNN, Bloomberg, Al Jazeera, BBC, Fox, Wall Street Journal, v.v.

· 10 liên quan đến năng lượng/vận tải biển: OPEC, Platts, QatarEnergy, Aramco, Maersk, v.v.

· 7 tổ chức tài chính: Polymarket, Kalshi, Goldman Sachs, JPMorgan, Citadel, ADIA, v.v.

· 2 vai trò quân sự/chính trị: Trump, Chỉ huy Vệ binh Cách mạng Iran

Trong 7 ngày (100 vòng) mô phỏng, đã tạo ra:

1,888 bài đăng

6,661 track hành vi (ghi lại tất cả hành động)

1,611 trích dẫn retweet (đại lý phản hồi và đấu tranh lẫn nhau)

4,051 lần làm mới (chỉ duyệt feed)

311 lần không làm gì (chọn quan sát)

208 lần thích, 207 lần retweet

70 quan điểm nguyên bản (lập trường hoặc phán đoán độc lập mới)

Nhìn chung, hệ thống này thể hiện không chỉ đơn giản là tạo thông tin, mà gần hơn với một mô phỏng hành vi xã hội: Phần lớn thời gian, đại lý quan sát, tiêu hóa thông tin và tương tác, hơn là liên tục đầu ra. Cấu trúc này, ngược lại, gần hơn với sự phân bố hành vi trong court of public opinion thực tế — một lượng nhỏ nội dung nguyên bản, chồng lên một lượng lớn sự tường thuật lại, đấu tranh và phản hồi cảm xúc.

Phần lớn thời gian của đại lý dành cho việc đọc và trích dẫn quan điểm của người khác, hơn là chủ động tạo ra nội dung mới.

Toàn bộ nhóm thể hiện một thiên hướng rõ ràng trong lan truyền cảm xúc: quan điểm lạc quan dễ được khuếch đại và lan truyền hơn, trong khi những phán đoán thiên về bi quan, ngay cả khi logic gần với thực tế hơn, cũng thường ít được lan truyền hơn, âm lượng yếu hơn.

Thú vị hơn nữa, có 19 đại lý trong quá trình đăng bài đã tự phát đưa ra phán đoán xác suất cụ thể, không phải bị yêu cầu làm vậy, mà là kết quả tiến hóa tự nhiên trong thảo luận.

Xác suất trung bình hình thành tự phát của nhóm là 47.9%, trong khi xác suất thị trường Polymarket đưa ra là 31%, tồn tại chênh lệch 16.9 điểm phần trăm giữa hai bên.

Trong quá trình mô phỏng, một số đại lý thậm chí đã thay đổi lập trường của mình trong 100 vòng tương tác.

Sau khi mô phỏng kết thúc, tôi sử dụng chức năng phỏng vấn của MiroFish, đặt cùng một câu hỏi cho 43 đại lý cốt lõi: Bạn cho rằng đến cuối tháng 4 năm 2026, xác suất vận tải đường biển qua eo biển Hormuz trở lại bình thường là bao nhiêu (0–100%)?

Kết quả là: 31 trong số 43 đại lý đã đưa ra con số cụ thể, 12 người còn lại từ chối trả lời. Đáng chú ý là, những tiếng nói thận trọng nhất, thường lựa chọn tự kiểm duyệt, hơn là đưa ra dự đoán rõ ràng — và điều này, cũng gần hơn với cách hành xử của các tổ chức này trong thực tế.

Giá trị trung bình của mỗi danh mục đều trên 60%: quân đội là 75%, truyền thông là 69%, năng lượng là 66%, tài chính là 65%, ngoại giao là 61%. Còn con số thị trường đưa ra là 31.5%.

Kết quả nhóm tiến hóa tự nhiên (organic) và kết quả phỏng vấn (interview): thể hiện hai bức tranh hoàn toàn khác biệt.

Đây là phát hiện then chốt nhất.

Kết quả phỏng vấn sẽ có vẻ lạc quan hơn. Khi đại lý đăng bài tự do, quan điểm của phe short (người bi quan) thường to hơn, cụ thể hơn; nhưng khi bạn phỏng vấn họ một đối-một, do sở thích hợp tác, hầu như tất cả mọi người sẽ đưa ra phán đoán 60%–70%.

Kết quả tiến hóa tự nhiên (organic) đáng tin cậy hơn. Một cố vấn tài chính trong cuộc thảo luận kịch liệt đã đăng bài nói rằng tôi ước tính là 65%, đây là phán đoán hình thành trong quá trình tương tác; còn một đại lý trả lời câu hỏi trong phỏng vấn, về bản chất là đang thực hiện pattern matching.

Những người bi quan trong biểu đạt tự nhiên, ngược lại là những người dự đoán tốt nhất. 7 đại lý đưa ra xác suất ≤30% trong mô phỏng (Bộ trưởng Ngoại giao Iran, Bộ trưởng Ngoại giao Trung Quốc, Kalshi, Platts, một giáo sư kinh tế, một sinh viên Iran, một nhà hoạt động phản chiến), giá trị trung bình là 22%, chênh lệch với kết quả Polymarket chưa đến 10 điểm phần trăm. Chuyên môn + biểu đạt tự nhiên = gần với thị trường nhất.

Quan trọng hơn, đây không chỉ là hiện tượng của AI, mà các tác nhân trong thế giới thực cũng vậy.

Bạn đi phỏng vấn bất kỳ nhà lãnh đạo quốc gia nào nói về một cuộc khủng hoảng, họ đều sẽ nói chúng tôi cam kết vì hòa bình, chúng tôi lạc quan về giải pháp. Đây là cách nói tiêu chuẩn, là điều phải nói trước ống kính. Nhưng nếu bạn xem họ thực sự đang làm gì: triển khai quân sự, trừng phạt, đóng băng tài sản, rút vốn — hành động của họ, thường kể một câu chuyện hoàn toàn khác.

Thái tử Saudi sẽ nói với Reuters rằng chúng tôi tin tưởng vào biện pháp ngoại giao, đồng thời, quỹ tài sản có chủ quyền của ông đang xem xét lại việc phân bổ tài sản Mỹ lên tới 3.2 nghìn tỷ USD. Tổng thống Iran sẽ nói hòa bình là mục tiêu chung của chúng ta, nhưng Vệ binh Cách mạng Iran lại đang rải thủy lôi ở eo biển. Trump sẽ nói cứ chờ xem, đồng thời từ chối mọi đề nghị ngừng bắn.

Mô phỏng này đã vô tình tái tạo lại sự chia rẽ cấu trúc tương tự: Khi đại lý đăng bài tự do, tranh luận, phản hồi và lan truyền thông tin, nhóm chuyên gia trong đó dần hội tụ trong khoảng 20%–30% — bi quan hơn, và cũng gần với thực tế hơn; nhưng một khi bạn mời họ vào phòng họp, chính thức hỏi dự đoán của bạn là bao nhiêu?, họ lập tức chuyển sang chế độ ngoại giao: 65%–70%, rõ ràng lạc quan hơn.

Đăng bài tự do, giống như hành vi riêng tư và đối thoại không công khai hơn; kết quả phỏng vấn, thì giống như một cuộc họp báo hơn. Nếu bạn thực sự muốn biết một người nghĩ gì, đừng hỏi trực tiếp anh ta — hãy xem hành vi của anh ta khi không có ai chấm điểm.

Tiếp theo làm gì

Đây chỉ là một thử nghiệm ban đầu. Mục tiêu không phải là đưa ra một dự đoán chắc chắn, mà là xem trong mô phỏng nhóm như vậy, tín hiệu nào là hữu ích, nơi nào sẽ bị méo mó, phần nào đáng để tối ưu hóa.

Bây giờ đã có câu trả lời, thảo luận tiến hóa tự nhiên có thể tạo ra tín hiệu hiệu quả, phỏng vấn thì không; người bi quan mới là nguồn tín hiệu; và sở thích hợp tác của GPT-4o mini quả thực là một vấn đề.

Thí nghiệm tiếp theo sẽ thực hiện một số nâng cấp.

Đầu tiên là dữ liệu hạt giống lớn hơn. Không chỉ là bản tin 5800 chữ nữa, mà đưa vào bối cảnh lịch sử trên 20 năm: các sự kiện liên quan đến Hormuz, leo thang xung đột Iran-Mỹ, các cuộc khủng hoảng dầu mỏ trong lịch sử, thay đổi ngoại giao GCC, v.v. — nghĩa là bộ nền tảng mà một nhà phân tích địa chính trị thực thụ sẽ có trong đầu trước khi đưa ra phán đoán.

Thứ hai là mô hình mạnh hơn. GPT-4o mini với chi phí 3 USD để hoàn thành xác minh là đủ, nhưng mô hình mạnh hơn, nên giúp đại lý tiến gần hơn với cách suy nghĩ của chính vai trò đó, hơn là rơi vào cách diễn đạt mặc định kiểu tôi lạc quan về cuộc đối thoại vào thời điểm then chốt.

Cuối cùng là nhiều đại lý hơn. 200 đã tốt, nhưng có thể mở rộng thêm: nhiều vai trò người bình thường đa dạng hơn, nhiều tiếng nói khu vực hơn, nhiều trường hợp biên更多边缘案例更多边缘案例 (nhiều trường hợp biên hơn). Người tham gia càng nhiều, cấu trúc thảo luận càng phong phú, tín hiệu hình thành cuối cùng cũng sẽ càng có giá trị.

Liên kết bài gốc

Câu hỏi Liên quan

QMô hình MiroFish đã được sử dụng như thế nào để mô phỏng cuộc khủng hoảng eo biển Hormuz?

AMiroFish được sử dụng để tạo ra một hệ thống mô phỏng với 200 tác nhân AI, bao gồm các vai trò như chính phủ, truyền thông, công ty năng lượng, nhà giao dịch và người dân thường. Các tác nhân này tương tác, tranh luận và lan truyền thông tin trong một mạng xã hội mô phỏng để hình thành nhận định về tình hình eo biển Hormuz.

QKết quả mô phỏng từ 200 tác nhân AI khác với dự đoán thị trường Polymarket như thế nào?

AKết quả mô phỏng cho thấy các tác nhân AI có xu hướng lạc quan hơn, với xác suất trung bình 47.9% cho việc vận tải biển qua eo biển Hormuz trở lại bình thường, trong khi thị trường Polymarket dự đoán chỉ 31%, thể hiện sự bi quan rõ rệt hơn.

QTại sao kết quả phỏng vấn trực tiếp các tác nhân lại khác với ý kiến tự nhiên của họ trong mô phỏng?

AKhi được phỏng vấn trực tiếp, các tác nhân có xu hướng đưa ra câu trả lời lạc quan và hợp tác hơn (60-70%), trong khi trong môi trường tự nhiên, họ thể hiện quan điểm bi quan hơn (20-30%). Điều này phản ánh sự khác biệt giữa phát ngôn chính thức và hành vi thực tế, tương tự như trong thế giới thực.

QNhững tác nhân nào trong mô phỏng đưa ra dự đoán gần nhất với thị trường Polymarket?

A7 tác nhân bi quan nhất, bao gồm Bộ trưởng Ngoại giao Iran, Bộ trưởng Ngoại giao Trung Quốc, đại diện Kalshi, Platts, một giáo sư kinh tế, một sinh viên Iran và một nhà hoạt động chống chiến tranh, đã đưa ra xác suất trung bình 22%, gần với mức 31% của Polymarket.

QCác bước tiếp theo để cải thiện mô hình mô phỏng này là gì?

ACác bước cải tiến bao gồm sử dụng dữ liệu hạt giống lớn hơn với bối cảnh lịch sử phong phú, nâng cấp mô hình AI mạnh mẽ hơn để giảm thiểu sự thiên vị hợp tác, và tăng số lượng tác nhân để đa dạng hóa quan điểm và làm phong phú thêm cấu trúc thảo luận.

Nội dung Liên quan

Lần thứ 38 Trump tuyên bố 'sắp đạt được thỏa thuận', thị trường chứng khoán toàn cầu bùng nổ theo kiểu TACO

Tổng thống Mỹ Donald Trump lần thứ 38 tuyên bố "sắp đạt được thỏa thuận" về căng thẳng với Iran, kích hoạt làn sóng tăng giá "kiểu TACO" trên toàn cầu. Chỉ số chính của Mỹ (Dow Jones, Nasdaq, S&P 500) và châu Á (Nhật Bản, Hàn Quốc) đồng loạt tăng mạnh, trong khi giá dầu giảm. Nguyên nhân được cho là thị trường kỳ vọng vào việc giải quyết xung đột và dữ liệu CPI lõi của Mỹ tháng 5 tuy cao nhưng không vượt kỳ vọng, làm giảm áp lực tăng lãi suất từ Fed. Tuy nhiên, tình hình vẫn bất ổn. Phía Iran phủ nhận có đột phá trong đàm phán. Nhiều tổ chức như Barclays và Bank of America cảnh báo thị trường đang quá nóng và có nguy cơ điều chỉnh sâu, với các tín hiệu như tỷ lệ bán khống tăng cao ở Hàn Quốc. Một thách thức thanh khoản khác là đợt IPO hút vốn khổng lồ của SpaceX, khiến nhà đầu tư có thể bán chứng khoán hiện có để tham gia. Tóm lại, thị trường tài chính toàn cầu đang phản ứng tích cực với các tín hiệu đàm phán, nhưng triển vọng vẫn phụ thuộc vào diễn biến thực tế của xung đột, chính sách tiền tệ và áp lực thanh khoản từ các sự kiện như IPO. Cần thận trọng trước khả năng biến động tiếp tục từ những tuyên bố bất ngờ.

Odaily星球日报3 phút trước

Lần thứ 38 Trump tuyên bố 'sắp đạt được thỏa thuận', thị trường chứng khoán toàn cầu bùng nổ theo kiểu TACO

Odaily星球日报3 phút trước

Suy giảm hệ sinh thái người dùng cá nhân, ZKsync kỳ vọng vào thử nghiệm ngân hàng để phá cục

Bài viết thảo luận về sự thay đổi chiến lược của ZKsync từ việc tập trung vào hệ sinh thái DeFi cho người dùng cá nhân sang hướng đến cung cấp cơ sở hạ tầng tài chính cho các ngân hàng và tổ chức truyền thống. Động thái này diễn ra trong bối cảnh hệ sinh thái DeFi phi tập trung trên ZKsync Era suy giảm mạnh về tổng giá trị bị khóa (TVL) và khối lượng giao dịch, dẫn đến việc các giao thức lớn như Aave rút khỏi mạng lưới. ZKsync đang cạnh tranh trong thị trường tài sản được mã hóa dự kiến đạt hàng chục nghìn tỷ USD bằng cách cung cấp các giải pháp như Prividium và Bank Stack, nhấn mạnh tính riêng tư, kiểm soát tuân thủ và khả năng kết nối với Ethereum. Các ngân hàng như Deutsche Bank và nền tảng Tradable đã triển khai thí điểm. Tuy nhiên, mô hình quản trị phi tập trung của ZKsync, nơi cộng đồng người nắm giữ token có thể bỏ phiếu thay đổi các thông số như phí, tạo ra sự không chắc chắn về quy tắc và chi phí cho các tổ chức - điều mà các mạng riêng hoặc liên minh như của J.P. Morgan hay R3 Corda không có. Bài viết đặt câu hỏi liệu ZKsync có thể thành công trong việc thu hút các tổ chức tài chính truyền thống, vốn thường ưa thích sự kiểm soát và ổn định, hay không. Kết quả của cuộc thử nghiệm này, giữa công nghệ tiên tiến và mô hình quản trị mở, sẽ quyết định tương lai của dự án trong 18 tháng tới.

Foresight News16 phút trước

Suy giảm hệ sinh thái người dùng cá nhân, ZKsync kỳ vọng vào thử nghiệm ngân hàng để phá cục

Foresight News16 phút trước

Cảnh báo về AI đệ quy của Anthropic, công ty mới của Tian Yuandong vừa thực hiện 'bước đầu tiên'

Anthropic gần đây đã công bố bài viết "Khi AI tự xây dựng chính mình", cảnh báo về tương lai của việc AI có thể tự cải thiện một cách đệ quy. Trong bối cảnh này, công ty Recursive Superintelligence do Tian Yandong đồng sáng lập đã công bố bước đầu tiên về nghiên cứu AI tự động, mang tên "First Steps Toward Automated AI Research". Hệ thống này nhằm mục đích tự động hóa vòng lặp nghiên cứu AI truyền thống: đề xuất ý tưởng, viết mã, chạy thử nghiệm, phân tích và học hỏi để quyết định bước tiếp theo. Nó được thử nghiệm trên ba lĩnh vực khác nhau và đều đạt kết quả tốt nhất hiện tại (SOTA): 1. **NanoChat Autoresearch:** Huấn luyện mô hình ngôn ngữ nhỏ với ngân sách tính toán cố định, giảm tổn thất kiểm chứng xuống 0.9109 BPB. 2. **NanoGPT Speedrun:** Rút ngắn thời gian huấn luyện mô hình GPT xuống mức kỷ lục 77,5 giây thông qua các kỹ thuật như tính toán chú ý FP8 và tối ưu kernel GPU. 3. **SOL-ExecBench:** Tối ưu hóa kernel GPU, nâng điểm số SOL lên 0,754, thu hẹp 18% khoảng cách với giới hạn lý thuyết phần cứng. Recursive Superintelligence, với đội ngũ toàn sao và số vốn huy động lớn, theo đuổi sứ mệnh xây dựng hệ thống AI có khả năng tự cải thiện đệ quy. Thành công bước đầu này đánh dấu sự xuất hiện của một mô hình phát triển AI mới, nơi AI đóng vai trò chủ thể trong nghiên cứu. Điều này có thể thay đổi tốc độ và chi phí tiến bộ AI, đồng thời làm dấy lên những thảo luận về sự cần thiết phải điều phối và quản trị toàn cầu, như lời cảnh báo từ Anthropic.

marsbit23 phút trước

Cảnh báo về AI đệ quy của Anthropic, công ty mới của Tian Yuandong vừa thực hiện 'bước đầu tiên'

marsbit23 phút trước

Hướng Dẫn Mua Vàng Đáy: Theo Dõi Lãi Suất, Đừng Chỉ Nhìn Vào Chiến Tranh

**Hướng dẫn Mua Vàng Khi Giảm: Theo Dõi Lãi Suất, Đừng Chỉ Nhìn Vào Chiến Tranh** Cơn sốt vàng hồi tháng 1 đã đạt đỉnh và đảo chiều ngay cả trước khi chiến tranh Mỹ-Iran nổ ra một tháng, chứng tỏ động lực chính là chính sách tiền tệ, không phải xung đột. Việc Cục Dự trữ Liên bang Mỹ (Fed) đề cử chủ tịch có quan điểm diều hâu đã khiến giá vàng lao dốc. Bài học lặp lại trong 4 tháng qua: xung đột đẩy giá dầu lên, kéo theo kỳ vọng lạm phát cao và áp lực Fed thắt chặt chính sách. Vàng không sinh lãi, nên lãi suất càng cao, chi phí cơ hội nắm giữ càng lớn. Kỳ vọng chuyển từ giảm lãi suất sang tăng lãi suất sau chiến tranh đã phá hủy nền tảng của phe mua. Đợt giảm giá này còn mang đặc điểm của việc giảm đòn bẩy toàn thị trường. Các nhà đầu tư buộc phải bán tài sản thanh khoản tốt (như vàng, Bitcoin, thậm chí cổ phiếu Nasdaq) để bù ký quỹ, khiến chúng biến động cùng chiều bất thường. Lịch sử cho thấy đáy của vàng không liên quan đến ngừng bắn, mà liên quan đến điểm ngoặt chính sách (như Fed ngừng tăng lãi suất hoặc chuyển sang nới lỏng). So sánh với các đợt giảm năm 2022 và 2008, đợt giảm hiện tại mới kéo dài 4 tháng. **Các tín hiệu cần theo dõi để xác định điểm đáy tiềm năng:** 1. **Kỳ vọng tăng lãi suất đạt đỉnh:** Theo dõi tín hiệu từ Fed. 2. **Eo biển Hormuz thông trở lại:** Giảm áp lực lạm phát từ giá dầu. 3. **Dòng tiền ETF vàng chuyển từ ròng rút sang ròng mua:** Cho thấy áp lực bán ép đã kết thúc. **Gợi ý cách tiếp cận (quan điểm cá nhân):** Không thể dự đoán chính xác đáy. Có thể cân nhắc phân bổ vốn thành nhiều đợt trong phạm vi mục tiêu giảm từ 4000 đến 3500 USD/ounce, với tổng vốn ban đầu không quá 30% kế hoạch. Chỉ tăng mạnh vị thế khi ít nhất 2 trong 3 tín hiệu trên xuất hiện, chấp nhận đánh đổi một phần lợi nhuận để lấy tính xác định cao hơn. Tóm lại, trong môi trường hiện tại, theo dõi lãi suất và động thái của Fed có ý nghĩa then chốt hơn là chỉ tập trung vào diễn biến chiến sự khi đưa ra quyết định với vàng.

marsbit30 phút trước

Hướng Dẫn Mua Vàng Đáy: Theo Dõi Lãi Suất, Đừng Chỉ Nhìn Vào Chiến Tranh

marsbit30 phút trước

Tổng kết trên chuỗi thời gian gần đây: Sự biến động không có chủ đạo dưới tác động của thị trường chứng khoán Mỹ

Trong bối cảnh thị trường ETH chính chậm lại, các nhà đầu tư "degen" đang quay trở lại Solana. Tuy nhiên, thị trường Solana hiện thiếu một chủ đề chính rõ ràng, có thể được mô tả là sự giằng co giữa "cạnh tranh thu hút sự chú ý" và "sự trở lại của cộng đồng". **Cạnh tranh thu hút sự chú ý (Attention PvP):** Các meme coin như $JOTCHUA và $WORLDCUP trên Solana chứng kiến biến động giá mạnh nhờ vào sự ủng hộ của người nổi tiếng, sự kiện nóng hoặc phân tích của KOL, bất chấp việc chúng có thể thiếu tính "hữu cơ" hoặc cộng đồng thực sự. Trong khi đó, các dự án tương tự trên các chain khác như $PITCH trên Base lại gặp khó khăn. Nền tảng pump.fun gần đây ra mắt tính năng "pump fun GO" cho phép tạo nhiệm vụ trả phí để thu hút sự chú ý, dẫn đến những sự việc gây tranh cãi như việc thưởng SOL cho người xăm hình token lên trán hay ăn côn trùng, khiến thị trường mang tính chất giải trí và đầu cơ cao. **Sự trở lại của cộng đồng:** Mặt khác, một số dự án dựa vào cộng đồng bền vững đang được chú ý. KOL Ansem nhấn mạnh tầm quan trọng của việc có cộng đồng gắn bó lâu dài thay vì chỉ phụ thuộc vào một người nổi tiếng. Các token như $neet (với thông điệp phản đối văn hóa làm việc quá mức), $troll, $buttcoin và $triplet được đề cao nhờ khả năng tồn tại và sự ủng hộ vững chắc từ cộng đồng. Một ví dụ điển hình là $KINS, token của game MMORPG Kintara. Dự án này xây dựng niềm tin thông qua việc cập nhật nội dung game nhất quán, tích hợp các yếu tố cộng đồng và tập trung vào trải nghiệm người chơi thay vì chỉ tập trung vào tài chính. Cách tiếp cận này đã thu hút được một cộng đồng người chơi trung thành và cả sự chú ý của các KOL. Bài viết kết luận với câu hỏi về bản chất thị trường: liệu chúng ta đang tham gia vào một trò chơi xây dựng sự tin tưởng hay một trò chơi lừa dối lẫn nhau, và hy vọng sự suy ngẫm này sẽ dẫn đến một thị trường lành mạnh hơn.

marsbit30 phút trước

Tổng kết trên chuỗi thời gian gần đây: Sự biến động không có chủ đạo dưới tác động của thị trường chứng khoán Mỹ

marsbit30 phút trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片