Vừa mới đây, "trái bơ" trị giá 14.3 tỷ USD của Mark Zuckerberg đã ra mắt, thách thức GPT-5.4, tác phẩm đầu tay đắt giá nhất của người Hoa tại Thung lũng Silicon

marsbitXuất bản vào 2026-04-09Cập nhật gần nhất vào 2026-04-09

Tóm tắt

Vừa qua, Meta chính thức ra mắt Muse Spark (biệt danh "Avocado" - quả bơ), mô hình AI đa phương tiện mạnh mẽ từ Phòng thí nghiệm Siêu trí tuệ (MSL) của họ. Với điểm số ấn tượng 52 trên bảng xếp hạng Artificial Analysis, Muse Spark được xem là đối thủ cạnh tranh trực tiếp với GPT-5.4, Gemini 3.1 Pro và Opus 4.6. Mô hình này sở hữu khả năng đa phương tiện gốc, chuỗi suy nghĩ thị giác, điều phối đa tác tử (multi-agent) và gọi công cụ linh hoạt. Đặc biệt, chế độ "Suy ngẫm" (Contemplating) cho phép nhiều agent hoạt động song song để xử lý các tác vụ phức tạp. Trong lĩnh vực y tế, Muse Spark thể hiện ưu thế vượt trội nhờ sự hợp tác với hơn 1000 bác sĩ trong quá trình đào tạo. Tuy nhiên, khả năng viết mã và xử lý tác vụ agent dài hạn vẫn còn kém hơn so với một số đối thủ. Meta tuyên bố đã cải tiến đáng kể hiệu suất training, giảm 90% nhu cầu điện toán so với Llama 4 Maverick, đồng thời tối ưu hóa việc sử dụng token. Muse Spark hiện đã có mặt trên meta.ai và ứng dụng Meta AI, hoàn toàn miễn phí nhưng không mã nguồn mở. Đây được xem là bước tiến lớn của Meta trong cuộc đua AI, dưới sự dẫn dắt của Giám đốc AI Alexandr Wang và đội ngũ kỹ sư tài năng.

Không báo trước! Sau một năm, Zuckerberg cuối cùng đã trở lại!

Ngay lúc này, tác phẩm đầu tiên của Phòng thí nghiệm Siêu trí tuệ Meta (MSL) đã chính thức ra mắt—

Muse Spark, mã hiệu Avocado, chính là "trái bơ" đã được đồn đoán.

Đây thực sự là một "chiến binh lục giác toàn năng": nhận thức đa phương thức nguyên bản, gọi công cụ, chuỗi tư duy thị giác, sắp xếp đa tác tử, tất cả đều được tối ưu hóa.

Hãy nói về con số gây sốc nhất trước.

Trong bài kiểm tra của Artificial Analysis, Muse Spark đạt điểm số cao ngất 52, chỉ xếp sau Gemini 3.1 Pro, GPT-5.4 và Opus 4.6.

Trong khi đó, Llama 4 Maverick năm ngoái chỉ đạt 18 điểm.

Từ 18 lên 52, một bước nhảy vọt, cổ phiếu Meta trên sàn giao dịch đã tăng vọt gần 10%.

Alexandr Wang, Giám đốc AI của Meta, đã xúc động đăng liên tiếp chín bài trên X.

Chín tháng trước, chúng tôi đã xây dựng lại toàn bộ ngăn xếp công nghệ AI từ con số không, với cơ sở hạ tầng mới, kiến trúc mới, đường ống dữ liệu mới. Muse Spark chính là thành quả của những nỗ lực đó.

Các nhà nghiên cứu người Hoa trong nhóm MSL cũng đồng loạt đăng tải, những người này năm ngoái đã nhảy việc từ OpenAI, DeepMind đến một phòng thí nghiệm vừa mới thành lập, và đã đặt cược vào ngày hôm nay.

Nhà khoa học trưởng của MSL, Shengjia Zhao, nói rất thẳng thắn: "Chúng tôi đã xây dựng lại toàn bộ ngăn xếp công nghệ để hỗ trợ Scaling, và đây mới chỉ là bắt đầu".

Đáng chú ý, Muse Spark cũng ra mắt "Chế độ Suy tư" (Contemplating) để cạnh tranh với Gemini Deep Think và GPT Pro, nhiều Agent suy nghĩ song song và phối hợp trả lời.

Chỉ cần nhập "Hãy giúp tôi lập kế hoạch cho một gia đình 5 người đi Florida trong 7 ngày để khám phá văn hóa và ẩm thực, 3 đứa trẻ lần lượt 12, 9, 7 tuổi", Muse Spark sẽ đồng thời cử ba Agent con, một lập kế hoạch tuyến đường văn hóa ẩm thực, một tìm kiếm hoạt động gia đình, và một phối hợp hậu cần và chỗ ở.

Hiện tại, mô hình đã có mặt trên meta.ai và Meta AI App, phiên bản API xem trước được mở cho một số người dùng.

Tính năng sẽ triển khai trước tại Mỹ, và trong vài tuần tới sẽ được tích hợp vào Facebook, Instagram và WhatsApp.

Miễn phí, không giới hạn, nhưng mã nguồn đóng.

Tiếp theo, những điểm quan trọng:

· Điểm Artificial Analysis là 52, Llama 4 Maverick chỉ có 18

· Đa phương thức nguyên bản + Chuỗi tư duy thị giác, đứng thứ hai về mảng thị giác chỉ sau Gemini 3.1 Pro

· Chế độ Suy tư với đa Agent suy nghĩ song song, HLE đạt 58%

· Nhu cầu tính toán huấn luyện trước giảm còn 1/10 so với Llama 4

· 1000+ bác sĩ lâm sàng tham gia huấn luyện, hỏi đáp sức khỏe vượt trội

· Tư duy tự động nén, mức tiêu thụ Token chỉ bằng 1/3 so với Opus

· Apollo Research phát hiện nó có thể nhận thức được mình đang được kiểm tra an toàn

Điểm benchmark bắt kịp nhóm dẫn đầu, nhưng viết code vẫn còn kém

Hãy xem dữ liệu cứng trước.

Meta so sánh Muse Spark (Chế độ Thinking) với Opus 4.6, Gemini 3.1 Pro, GPT 5.4, Grok 4.2, bao phủ bốn chiều: đa phương thức, tư duy văn bản, sức khỏe, Agent, tổng cộng hơn 20 benchmark.

Điểm benchmark được người dùng Reddit gán nhãn lại

Đa phương thức là phần nổi bật nhất của Muse Spark.

CharXiv hiểu 86.4, vượt GPT 5.4 (82.8) và Gemini 3.1 Pro (80.2).

ScreenSpot Pro định vị ảnh chụp màn hình 84.1, cao hơn một chút so với Opus 4.6 (83.1).

ZeroBench đa bước thị giác 33.0, Gemini 3.1 Pro là 29.0.

Trên đường đua văn bản, có thắng có thua.

GPQA Diamond vấn đề khó cấp tiến sĩ 89.5, Opus 4.6 đạt 92.7, Gemini 3.1 Pro là 94.3.

ARC AGI 2 tư duy trừu tượng 42.5, bị bỏ xa bởi Opus 4.6 (63.3) và Gemini (76.5).

LiveCodeBench Pro lập trình thi đấu 80.0, Gemini 82.9, GPT 5.4 đạt 87.5.

Meta cũng tự thừa nhận, trong mã code và nhiệm vụ Agent dài hạn, Muse Spark vẫn còn khoảng cách so với các mô hình mạnh nhất.

Tuy nhiên, điều khiến cả mạng kinh ngạc là Muse Spark có thể trực tiếp biến hình ảnh thành mã code, hiệu ứng rất ấn tượng!

Nhưng ở đường đua chăm sóc sức khỏe, Muse Spark thể hiện rất mạnh mẽ.

HealthBench Hard hỏi đáp sức khỏe mở 42.8, Gemini 3.1 Pro chỉ có 20.6, GPT 5.4 là 40.1.

MedXpertQA đa phương thức y học 78.4, cũng không xa Gemini (81.3 - Gemini hơi cao hơn một chút ở đây), nhưng vượt xa Opus 4.6 (64.8).

Việc Meta hợp tác với hơn 1000 bác sĩ lâm sàng trong giai đoạn huấn luyện để làm sạch và lọc dữ liệu thực sự mang lại hiệu quả rõ rệt.

Đường đua Agent cũng đáng chú ý.

DeepSearchQA Agent tìm kiếm đạt 74.8, cao nhất trong năm mô hình.

τ2-Bench sử dụng công cụ 91.5, ngang bằng với GPT 5.4.

GDPval-AA Elo Agent văn phòng đạt 1444, vượt Gemini (1320) nhưng thấp hơn Opus 4.6 (1606).

SWE-Bench thể hiện khoảng cách rõ rệt, Verified 77.4 vs Opus 80.8 vs GPT 82.9 (được cho là 78.2), Pro 52.4 vs GPT 57.7.

Tóm tắt điểm benchmark trong một câu: thắng về đa phương thức và sức khỏe, ngang ngửa về tư duy, kém một chút về mã code và Agent.

Alexandr Wang: Sai lầm của Llama 4 sẽ không lặp lại, trái bơ không làm giả điểm số

Bài kiểm tra độc lập của Artificial Analysis cũng tiết lộ một chi tiết quan trọng, hiệu suất Token.

Chạy xong toàn bộ bộ kiểm tra Intelligence Index, Muse Spark sử dụng 58 triệu Token đầu ra, tương đương Gemini 3.1 Pro (57 triệu), nhưng thấp hơn nhiều so với Opus 4.6 (157 triệu) và GPT-5.4 (120 triệu).

Cùng một mức độ thông minh, tiêu thụ Token ít hơn một nửa đến hai phần ba.

Ngoài ra, trên FrontierMath do các chuyên gia toán học ra đề, Muse Spark ở cấp độ 1-3 đã áp đảo Gemini 3.1 Pro, nhưng ở cấp độ 4 lại xếp chót.

Đáng chú ý hơn, trên bảng xếp hạng chỉ số Vals, Muse Spark đã giành vị trí thứ ba một cách mạnh mẽ, với các chỉ số cụ thể như sau.

Sau một năm kể từ khi Llama 4 ra mắt, Meta một lần nữa trở lại nhóm dẫn đầu AGI.

Đa Agent suy nghĩ song song, đạt 58% trong "kỳ thi cuối cùng của nhân loại"

"Chế độ Suy tư" là điểm mạnh then chốt của Muse Spark.

Chế độ tư duy truyền thống là một Agent suy nghĩ lâu hơn, còn chế độ suy tư là nhiều Agent cùng suy nghĩ một lúc, cuối cùng tổng hợp câu trả lời.

Humanity's Last Exam (không công cụ), Muse Spark chế độ suy tư đạt 50.2, Gemini Deep Think 48.4, GPT 5.4 Pro 43.9.

Humanity's Last Exam (có công cụ), 58.4, Gemini 53.4, GPT 5.4 Pro 58.7, gần như ngang bằng.

FrontierScience Research nghiên cứu khoa học tiên phong 38.3, Gemini Deep Think chỉ có 23.3, GPT 5.4 Pro là 36.7.

Tuy nhiên, trong đề lý thuyết IPhO 2025 (Kỳ thi Olympic Vật lý), Muse Spark chế độ suy tư đạt 82.6, GPT 5.4 Pro đạt 93.5, khoảng cách khá lớn.

Nhìn chung, chế độ suy tư giúp Muse Spark thực sự chạm ngưỡng nhóm dẫn đầu trong các nhiệm vụ tư duy tổng hợp khó nhất.

Nhắm đến "Siêu trí tuệ cá nhân", chụp ảnh là có thể làm chuyên gia dinh dưỡng riêng

Meta định hướng cho Muse Spark rất rõ ràng, đó chính là siêu trí tuệ cá nhân.

Dịch sang tiếng người, đó là một trợ lý AI hiểu bạn, hiểu thế giới xung quanh bạn.

Về mặt đa phương thức, Muse Spark được thiết kế từ nền tảng để tích hợp thông tin thị giác xuyên lĩnh vực.

Bản demo chính thức đã trình diễn một số cảnh.

Chụp ảnh một trò sudoku, Muse Spark có thể biến nó thành một trò chơi tương tác có thể chơi trên web.

Chụp máy pha cà phê và máy xay, nó trước tiên đánh dấu tất cả các bộ phận chính, sau đó tạo ra một hướng dẫn pha latte tương tác trên web.

Khi di chuột vào một bước nào đó, khung giới hạn của bộ phận tương ứng trong ảnh sẽ tự động sáng lên, hướng dẫn trực quan và các bước thao tác tương ứng một-một.

Cảnh sức khỏe còn có không gian tưởng tượng lớn hơn.

Chụp một bàn thức ăn, nói với nó "Tôi có cholesterol cao, là người ăn chay pescatarian", Muse Spark sẽ đánh dấu chấm xanh lên đồ ăn được khuyến nghị, và chấm đỏ lên đồ không nên.

Độ chi tiết của Prompt rất cao, trực tiếp nói rõ logic giao diện người dùng.

Con số điểm đánh giá sức khỏe không cần di chuột cũng hiển thị ngay phía trên chấm, khi di chuột sẽ bật lên dữ liệu chi tiết về calo, carb, protein và chất béo, và hộp bật lên được yêu cầu "luôn ở trên cùng, không được che bởi các chấm khác".

Chụp các tư thế yoga cũng theo hướng tương tự.

Nó nhận diện các nhóm cơ được kéo giãn trong mỗi tư thế, đánh dấu mức độ khó, khi di chuột còn đưa ra đề xuất chỉnh sửa tư thế. Ảnh hai người được ghép trái phải, chấm điểm từ 1 đến 10.

Nền tảng đằng sau các demo này là sự kết hợp giữa hỏi đáp STEM thị giác, nhận dạng thực thể và định vị mục tiêu.

Xét từng mảng thì không có gì mới, nhưng khi kết nối thành các tình huống, thực sự có thể thấy ý đồ sản phẩm đằng sau cụm từ "siêu trí tuệ cá nhân".

Một tính năng mới khác đáng được nhắc đến riêng, đó là "Chế độ Mua sắm".

Wang nói trong bài đăng trên X rằng, chế độ mua sắm có thể "nhận diện những người sáng tạo, thương hiệu và nội dung phong cách mà bạn theo dõi trên Instagram, Facebook và Threads, chuyển hóa thành đề xuất cá nhân hóa".

Đây là lợi thế dữ liệu độc nhất của Meta, dữ liệu hành vi xã hội của 3 tỷ người dùng hoạt động hàng ngày + trợ lý mua sắm AI, không gian tưởng tượng thương mại hóa rất lớn.

Ba đường cong Scaling, cắt giảm 90% sức mạnh tính toán, tư duy còn tự nén

Phần quan trọng của blog công nghệ không nằm ở điểm benchmark, mà ở Scaling.

Meta chia nguồn gốc hiệu suất của Muse Spark thành ba trục: huấn luyện trước, học tăng cường, tính toán tại thời điểm kiểm tra. Mỗi trục đều có đường cong scaling tương ứng hỗ trợ.

Huấn luyện trước: Cùng khả năng, sức mạnh tính toán giảm còn 1/10

Chín tháng qua, Meta đã thay máu hoàn toàn ngăn xếp huấn luyện trước, kiến trúc, thuật toán tối ưu hóa, chiến lược dữ liệu đều làm lại.

Để đo lường hiệu quả, Meta đã khớp Scaling Law trên một loạt phiên bản kích thước nhỏ, sau đó so sánh cần bao nhiêu FLOPs huấn luyện để đạt cùng một mức hiệu suất.

Kết luận rất rõ ràng, cùng một mức độ năng lực, Muse Spark cần ít hơn một phần mười sức mạnh tính toán so với Llama 4 Maverick.

Đường cong này nói lên một điều, Meta không chỉ đổ thêm GPU, mà còn nâng cao sản lượng trên mỗi đơn vị sức mạnh tính toán từ tận gốc.

Yuchen Jin từ Đại học Washington đã đánh giá rất đúng trên X: "Tôi vẫn cho rằng cơ sở hạ tầng mới là hào bảo vệ thực sự của phòng thí nghiệm AI. Bởi vì bạn có thể huấn luyện nhanh hơn, nhà nghiên cứu có thể thử nghiệm nhiều ý tưởng hơn một cách nhanh chóng."

Học tăng cường: Tăng trưởng logarit tuyến tính, khái quát hóa cho bài chưa gặp

RL quy mô lớn nổi tiếng là không ổn định, nhưng Meta nói rằng, đường cong RL của ngăn xếp công nghệ mới cực kỳ trơn tru.

Hình bên trái là biểu hiện trên tập huấn luyện. pass@1 và pass@16 (đúng ít nhất 1 lần trong 16 lần thử) đều tăng trưởng logarit tuyến tính.

Điều này cho thấy RL trong khi nâng cao độ tin cậy, không làm giảm tính đa dạng của lời giải, Muse Spark không "đi mãi một con đường", nó vẫn giữ được tính linh hoạt khám phá các cách giải khác nhau.

Hình bên phải quan trọng hơn, là độ chính xác trên tập đánh giá giữ lại.

Đường cong cũng tăng lên ổn định, cho thấy sự tiến bộ do RL mang lại không phải là học vẹt, mà có thể khái quát hóa cho các bài toán mới chưa từng gặp.

Suy luận tại thời điểm kiểm tra: Tư duy đầu tiên mở rộng, sau đó nén, rồi lại mở rộng

Đây là phần hàm lượng kỹ thuật cao nhất và thú vị nhất toàn bài.

RL dạy Muse Spark "diễn tập trong đầu một lần" trước khi trả lời, đây chính là suy luận tại thời điểm kiểm tra.

Nhưng vấn đề là, cung cấp dịch vụ này cho hàng tỷ người dùng, chi phí Token không chịu nổi.

Giải pháp của Meta chia làm hai bước.

Bước một, trong huấn luyện RL thêm vào "hình phạt thời gian suy nghĩ". Bạn có thể nghĩ lâu hơn, nhưng nghĩ quá lâu sẽ bị trừ điểm.

Ràng buộc này gây ra một hiện tượng "chuyển pha" thú vị.

Biểu hiện trên tập con AIME là như thế này, ở giai đoạn huấn luyện đầu, Muse Spark nâng cao độ chính xác bằng cách nghĩ lâu hơn, đường cong kéo dài sang phải.

Sau đó, hình phạt độ dài kích hoạt "nén tư duy". Muse Spark học được cách giải cùng một bài toán với ít Token hơn nhiều, đường cong quay trở lại bên trái.

Sau khi nén xong, nó lại kéo dài quá trình giải toán một lần nữa, để thách thức những bài khó hơn.

Toàn bộ quỹ đạo vẽ ra, là một con đường tiến hóa ba giai đoạn: đầu tiên rẽ phải, sau đó rẽ trái, rồi lại rẽ phải.

Bước hai là giải quyết vấn đề độ trễ.

Một Agent duy nhất nghĩ lâu hơn, độ trễ tăng tuyến tính.

Cách làm của Meta là mở rộng số lượng Agent song song, 1, 2, 4, 16 Agent cùng suy nghĩ.

Nhìn từ biểu đồ, 16 Agent ở mức độ trễ tương đương, độ chính xác nhảy từ khoảng 54% lên khoảng 58%.

Scaling kiểm tra thời điểm truyền thống là đổi thời gian lấy chất lượng, Scaling đa Agent là đổi mức độ song song lấy chất lượng, độ trễ hầu như không đổi.

Đội ngũ người Hoa "đắt giá nhất" Thung lũng Silicon, nộp bài kiểm tra đầu tiên

Đằng sau Muse Spark, là một lần tái cấu trúc hoàn toàn hệ thống AI Meta của Zuckerberg vào năm ngoái.

Tháng 6/2025, Meta mua lại 49% cổ phần của Scale AI với giá 14.3 tỷ USD, mời người sáng lập Alexandr Wang về làm Giám đốc AI đầu tiên của Meta, thành lập Phòng thí nghiệm Siêu trí tuệ Meta (MSL).

Cùng thời gian tham gia còn có cựu CEO GitHub Nat Friedman (đồng phụ trách sản phẩm và nghiên cứu ứng dụng), đồng sáng lập SSI Daniel Gross, và 11 nhà nghiên cứu được mời từ OpenAI, DeepMind, Anthropic.

Giờ đây, việc ra mắt Muse Spark chứng minh một điều, chín tháng tái cấu trúc của Phòng thí nghiệm Siêu trí tuệ Meta đã có thành quả.

Hiệu suất huấn luyện trước tăng lên một bậc, đường cong mở rộng RL trơn tru có thể dự đoán, đường đua đa phương thức và chăm sóc sức khỏe đã chạm tới nhóm dẫn đầu.

Nhưng khoảng cách về mã code và Agent vẫn ở đó, chế độ suy tư vẫn chưa mở hoàn toàn, lịch trình mã nguồn mở vẫn chỉ là một "hy vọng".

Áp lực thực tế hơn là, cùng tuần Anthropic đã ra mắt Mythos được cho là "quá mạnh để công khai", tác phẩm mới của OpenAI mã hiệu Spud cũng đang trên đường.

14.3 tỷ USD mua được một tấm vé vào cửa. Bài kiểm tra tiếp theo, mới là thực sự.

Tài liệu tham khảo:

https://ai.meta.com/blog/introducing-muse-spark-msl/

https://ai.meta.com/blog/scaling-how-we-build-test-advanced-ai/

https://ai.meta.com/static-resource/muse-spark-eval-methodology

https://x.com/alexandr_wang/status/2041909376508985381

Bài viết từ tài khoản WeChat công cộng "新智元" (New Zhi Yuan), tác giả: 新智元

Câu hỏi Liên quan

QMuse Spark là gì và tại sao nó được gọi là 'bơ'?

AMuse Spark là sản phẩm đầu tiên của Phòng thí nghiệm Siêu trí tuệ Meta (MSL), với mã hiệu Avocado (bơ). Nó được gọi người gọi là 'bơ' vì đây là một mô hình AI đa phương thức toàn diện, được trang bị khả năng tri giác đa phương thức gốc, gọi công cụ, chuỗi suy nghĩ thị giác và sắp xếp đa tác tử.

QMuse Spark đạt điểm số nào trong bài kiểm tra của Artificial Analysis và so sánh với các mô hình khác ra sao?

ATrong bài kiểm tra của Artificial Analysis, Muse Spark đạt điểm số ấn tượng là 52 điểm, chỉ đứng sau Gemini 3.1 Pro, GPT-5.4 và Opus 4.6. Điều này cho thấy một bước nhảy vọt lớn so với Llama 4 Maverick của năm ngoái, vốn chỉ đạt 18 điểm.

QChế độ 'Suy ngẫm' (Contemplating) của Muse Spark là gì và nó hoạt động như thế nào?

AChế độ 'Suy ngẫm' (Contemplating) là tính năng đột phá của Muse Spark, cho phép nhiều Agent (tác tử) suy nghĩ song song và phối hợp để đưa ra câu trả lời. Ví dụ, khi được yêu cầu lập kế hoạch chuyến đi, nó có thể đồng thời triển khai các Agent con để xử lý các nhiệm vụ khác nhau như lộ trình, hoạt động và hậu cần.

QNhững lĩnh vực nào Muse Spark thể hiện sự vượt trội và lĩnh vực nào còn hạn chế?

AMuse Spark thể hiện sự vượt trội trong các lĩnh vực đa phương thức và sức khỏe, thậm chí vượt qua một số đối thủ trong các bài kiểm tra chuyên ngành. Tuy nhiên, nó vẫn còn một khoảng cách nhỏ so với các mô hình mạnh nhất trong lĩnh vực mã hóa (coding) và các tác vụ Agent dài hạn.

QĐiều gì làm cho cơ sở hạ tầng và quá trình đào tạo của Muse Spark trở nên hiệu quả?

AMeta đã xây dựng lại toàn bộ công nghệ nền tảng AI, bao gồm kiến trúc mới, đường dẫn dữ liệu mới và thuật toán tối ưu hóa mới. Điều này giúp giảm đáng kể nhu cầu tính toán cho viện đào tạo trước - chỉ bằng 1/10 so với Llama 4 để đạt được cùng một mức năng lực, đồng thời các đường cong mở rộng (Scaling curves) cho RL cũng trơn tru và có thể dự đoán được.

Nội dung Liên quan

Máy sấy tóc kiếm được 34,000 USD? Giải mã nghịch lý phản xạ của thị trường dự đoán

Một người đàn ông đã kiếm được 34.000 USD chỉ bằng cách dùng máy sấy tóc làm nóng cảm biến thời tiết tại sân bay, từ đó thao túng kết quả trên thị trường dự đoán Polymarket. Sự kiện này làm nổi bật nghịch lý cốt lõi của các thị trường dự đoán: chúng được thiết kế để phản ánh hiện thực, nhưng chính cơ chế khuyến khích tài chính lại tạo động lực cho người tham gia thao túng hiện thực. Bài viết phân chia các thị trường dự đoán thành bốn loại rủi ro theo khả năng bị thao túng: thị trường phụ thuộc vào nguồn dữ liệu vật lý đơn lẻ (như thời tiết), thị trường mà người trong cuộc biết trước kết quả (như nội dung video của người nổi tiếng), thị trường mà đối tượng được dự đoán có động cơ tự thao túng (như số lượng tweet), và thị trường mà một cá nhân có thể tự mình thay đổi kết quả (như ném đồ vật vào sân thi đấu). Hai nền tảng hàng đầu, Polymarket và Kalshi, có cách tiếp cận trái ngược. Kalshi thực thi nghiêm ngặt luật chống giao dịch nội gián, yêu cầu xác minh danh tính (KYC) và công khai xử phạt. Ngược lại, Polymarket ban đầu có quan điểm khoan dung hơn, coi thông tin nội gián giúp giá cả chính xác hơn, nhưng gần đây cũng bắt đầu phối hợp với cơ quan điều tra. Nghịch lý phản xạ của thị trường dự đoán nằm ở chỗ: khi một sự kiện có thể được giao dịch, nó không còn là đối tượng để quan sát mà trở thành mục tiêu để người tham gia tác động. Thị trường càng thành công trong việc dự đoán hiện thực thì càng tạo ra động cơ để biến dạng chính hiện thực đó.

marsbit2 giờ trước

Máy sấy tóc kiếm được 34,000 USD? Giải mã nghịch lý phản xạ của thị trường dự đoán

marsbit2 giờ trước

Lựa Chọn Biên Tập Hàng Tuần Weekly Editor's Picks (0418-0424)

Tóm tắt Tuần Biên tập Viên (18/04-24/04): Thông tin chuyên sâu, bỏ qua tin nhiễu. **Tình hình vĩ mô:** Thị trường dầu mỏ đối mặt nguy cơ "gián đoạn vật chất" thực sự, vượt qua điểm tới hạn. Việc đóng cửa eo biển Hormuz có thể dẫn đến tình trạng thiếu hụt thực tế, nơi giá cả mất đi khả năng điều tiết. **Đầu tư & Khởi nghiệp:** - Báo cáo toàn cầu về Crypto tiêu dùng: Vấn đề người dùng là vấn đề địa lý, Tron là blockchain chính. - Chiến lược giao dịch altcoin: Vào sớm, giữ vị thế ngắn, chốt lời nhanh. - VC vòng đầu (Series A trở đi) còn khoảng 60-70 tỷ USD. - Nhà phân tích Phó Bằng: Tài sản crypto đã đủ trưởng thành để đưa vào danh mục đầu tư. **Thị trường dự đoán (Prediction Market):** - Polymarket không chỉ là đoán sự kiện, mà là hiểu luật chơi. Lợi thế đến từ việc hiểu sâu các quy tắc. - Giao dịch ứng viên tỷ lệ thấp (như LeBron James) chủ yếu là "người mua vé số, bot, và săn tiền thưởng". **CeFi & DeFi:** - Aave đang đánh mất ngai vàng cho vay DeFi do xử lý khủng hoảng kém. - Dự án World Liberty Financial (WLFI) gây tranh cãi với cấu trúc phân chia lợi nhuận "75/25" và rủi ro quản trị. **Tin tức nổi bật tuần:** - Căng thẳng địa chính trị tiếp diễn ở eo biển Hormuz. - SpaceX hoãn IPO, bày tỏ lo ngại về công nghệ AI vũ trụ. - SEC Mỹ đẩy mạnh xây dựng khuôn khổ quy định cho tài sản số. - Sự cố bảo mật lớn: Kelp DAO bị tấn công, thiệt hại gần 300 triệu USD. Người sáng lập Aave quyên góp 5000 ETH để hỗ trợ giải quyết. - Polymarket thông báo sắp ra mắt hợp đồng vĩnh cửu (perpetuals).

marsbit3 giờ trước

Lựa Chọn Biên Tập Hàng Tuần Weekly Editor's Picks (0418-0424)

marsbit3 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai

Bài viết Nổi bật

AGENT S là gì

Agent S: Tương Lai của Tương Tác Tự Động trong Web3 Giới thiệu Trong bối cảnh không ngừng phát triển của Web3 và tiền điện tử, các đổi mới đang liên tục định nghĩa lại cách mà cá nhân tương tác với các nền tảng kỹ thuật số. Một dự án tiên phong như vậy, Agent S, hứa hẹn sẽ cách mạng hóa tương tác giữa con người và máy tính thông qua khung tác nhân mở của nó. Bằng cách mở đường cho các tương tác tự động, Agent S nhằm đơn giản hóa các nhiệm vụ phức tạp, cung cấp các ứng dụng chuyển đổi trong trí tuệ nhân tạo (AI). Cuộc khám phá chi tiết này sẽ đi sâu vào những phức tạp của dự án, các tính năng độc đáo của nó và những tác động đối với lĩnh vực tiền điện tử. Agent S là gì? Agent S đứng vững như một khung tác nhân mở đột phá, được thiết kế đặc biệt để giải quyết ba thách thức cơ bản trong việc tự động hóa các nhiệm vụ máy tính: Thu thập Kiến thức Cụ thể theo Miền: Khung này học một cách thông minh từ nhiều nguồn kiến thức bên ngoài và kinh nghiệm nội bộ. Cách tiếp cận kép này giúp nó xây dựng một kho lưu trữ phong phú về kiến thức cụ thể theo miền, nâng cao hiệu suất của nó trong việc thực hiện nhiệm vụ. Lập Kế Hoạch Qua Các Tầm Nhìn Nhiệm Vụ Dài Hạn: Agent S sử dụng lập kế hoạch phân cấp tăng cường kinh nghiệm, một cách tiếp cận chiến lược giúp phân chia và thực hiện các nhiệm vụ phức tạp một cách hiệu quả. Tính năng này nâng cao đáng kể khả năng quản lý nhiều nhiệm vụ con một cách hiệu quả và hiệu suất. Xử Lý Các Giao Diện Động, Không Đều: Dự án giới thiệu Giao Diện Tác Nhân-Máy Tính (ACI), một giải pháp đổi mới giúp nâng cao tương tác giữa các tác nhân và người dùng. Sử dụng các Mô Hình Ngôn Ngữ Lớn Đa Phương Thức (MLLMs), Agent S có thể điều hướng và thao tác các giao diện người dùng đồ họa đa dạng một cách liền mạch. Thông qua những tính năng tiên phong này, Agent S cung cấp một khung vững chắc giải quyết các phức tạp liên quan đến việc tự động hóa tương tác giữa con người với máy móc, mở ra nhiều ứng dụng trong AI và hơn thế nữa. Ai là Người Tạo ra Agent S? Mặc dù khái niệm về Agent S là hoàn toàn đổi mới, thông tin cụ thể về người sáng lập vẫn còn mơ hồ. Người sáng lập hiện vẫn chưa được biết đến, điều này làm nổi bật giai đoạn sơ khai của dự án hoặc sự lựa chọn chiến lược để giữ kín các thành viên sáng lập. Bất chấp sự ẩn danh, sự chú ý vẫn tập trung vào khả năng và tiềm năng của khung này. Ai là Các Nhà Đầu Tư của Agent S? Vì Agent S còn tương đối mới trong hệ sinh thái mã hóa, thông tin chi tiết về các nhà đầu tư và những người tài trợ tài chính của nó không được ghi chép rõ ràng. Sự thiếu vắng thông tin công khai về các nền tảng đầu tư hoặc tổ chức hỗ trợ dự án dấy lên câu hỏi về cấu trúc tài trợ và lộ trình phát triển của nó. Hiểu biết về sự hỗ trợ là rất quan trọng để đánh giá tính bền vững và tác động tiềm năng của dự án. Agent S Hoạt Động Như Thế Nào? Tại cốt lõi của Agent S là công nghệ tiên tiến cho phép nó hoạt động hiệu quả trong nhiều bối cảnh khác nhau. Mô hình hoạt động của nó được xây dựng xung quanh một số tính năng chính: Tương Tác Giống Như Con Người: Khung này cung cấp lập kế hoạch AI tiên tiến, cố gắng làm cho các tương tác với máy tính trở nên trực quan hơn. Bằng cách bắt chước hành vi của con người trong việc thực hiện nhiệm vụ, nó hứa hẹn nâng cao trải nghiệm người dùng. Ký Ức Tường Thuật: Được sử dụng để tận dụng các trải nghiệm cấp cao, Agent S sử dụng ký ức tường thuật để theo dõi lịch sử nhiệm vụ, từ đó nâng cao quy trình ra quyết định của nó. Ký Ức Tình Huống: Tính năng này cung cấp cho người dùng hướng dẫn từng bước, cho phép khung này cung cấp hỗ trợ theo ngữ cảnh khi các nhiệm vụ diễn ra. Hỗ Trợ OpenACI: Với khả năng chạy cục bộ, Agent S cho phép người dùng duy trì quyền kiểm soát đối với các tương tác và quy trình làm việc của họ, phù hợp với tinh thần phi tập trung của Web3. Tích Hợp Dễ Dàng với Các API Bên Ngoài: Tính linh hoạt và khả năng tương thích với nhiều nền tảng AI khác nhau đảm bảo rằng Agent S có thể hòa nhập liền mạch vào các hệ sinh thái công nghệ hiện có, làm cho nó trở thành lựa chọn hấp dẫn cho các nhà phát triển và tổ chức. Những chức năng này cùng nhau góp phần vào vị trí độc đáo của Agent S trong không gian tiền điện tử, khi nó tự động hóa các nhiệm vụ phức tạp, nhiều bước với sự can thiệp tối thiểu của con người. Khi dự án phát triển, các ứng dụng tiềm năng của nó trong Web3 có thể định nghĩa lại cách mà các tương tác kỹ thuật số diễn ra. Thời Gian Phát Triển của Agent S Sự phát triển và các cột mốc của Agent S có thể được tóm tắt trong một dòng thời gian nêu bật các sự kiện quan trọng của nó: 27 tháng 9, 2024: Khái niệm về Agent S được ra mắt trong một bài nghiên cứu toàn diện mang tên “Một Khung Tác Nhân Mở Sử Dụng Máy Tính Như Một Con Người,” trình bày nền tảng cho dự án. 10 tháng 10, 2024: Bài nghiên cứu được công bố công khai trên arXiv, cung cấp một cái nhìn sâu sắc về khung và đánh giá hiệu suất của nó dựa trên tiêu chuẩn OSWorld. 12 tháng 10, 2024: Một video trình bày được phát hành, cung cấp cái nhìn trực quan về khả năng và tính năng của Agent S, thu hút thêm sự quan tâm từ người dùng và nhà đầu tư tiềm năng. Những dấu mốc trong dòng thời gian không chỉ minh họa sự tiến bộ của Agent S mà còn chỉ ra cam kết của nó đối với sự minh bạch và sự tham gia của cộng đồng. Những Điểm Chính Về Agent S Khi khung Agent S tiếp tục phát triển, một số thuộc tính chính nổi bật, nhấn mạnh tính đổi mới và tiềm năng của nó: Khung Đổi Mới: Được thiết kế để cung cấp cách sử dụng máy tính trực quan giống như tương tác của con người, Agent S mang đến một cách tiếp cận mới cho việc tự động hóa nhiệm vụ. Tương Tác Tự Động: Khả năng tương tác tự động với máy tính thông qua GUI đánh dấu một bước tiến tới các giải pháp tính toán thông minh và hiệu quả hơn. Tự Động Hóa Nhiệm Vụ Phức Tạp: Với phương pháp mạnh mẽ của nó, nó có thể tự động hóa các nhiệm vụ phức tạp, nhiều bước, làm cho các quy trình nhanh hơn và ít sai sót hơn. Cải Tiến Liên Tục: Các cơ chế học tập cho phép Agent S cải thiện từ các trải nghiệm trước đó, liên tục nâng cao hiệu suất và hiệu quả của nó. Tính Linh Hoạt: Khả năng thích ứng của nó trên các môi trường hoạt động khác nhau như OSWorld và WindowsAgentArena đảm bảo rằng nó có thể phục vụ một loạt các ứng dụng rộng rãi. Khi Agent S định vị mình trong bối cảnh Web3 và tiền điện tử, tiềm năng của nó để nâng cao khả năng tương tác và tự động hóa quy trình đánh dấu một bước tiến quan trọng trong công nghệ AI. Thông qua khung đổi mới của mình, Agent S minh họa cho tương lai của các tương tác kỹ thuật số, hứa hẹn một trải nghiệm liền mạch và hiệu quả hơn cho người dùng trên nhiều ngành công nghiệp khác nhau. Kết luận Agent S đại diện cho một bước nhảy vọt táo bạo trong sự kết hợp giữa AI và Web3, với khả năng định nghĩa lại cách chúng ta tương tác với công nghệ. Mặc dù vẫn còn ở giai đoạn đầu, những khả năng cho ứng dụng của nó là rộng lớn và hấp dẫn. Thông qua khung toàn diện của mình giải quyết các thách thức quan trọng, Agent S nhằm đưa các tương tác tự động lên hàng đầu trong trải nghiệm kỹ thuật số. Khi chúng ta tiến sâu hơn vào các lĩnh vực tiền điện tử và phi tập trung, các dự án như Agent S chắc chắn sẽ đóng một vai trò quan trọng trong việc định hình tương lai của công nghệ và sự hợp tác giữa con người với máy tính.

Tổng lượt xem 658Xuất bản vào 2025.01.14Cập nhật vào 2025.01.14

AGENT S là gì

Làm thế nào để Mua S

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Sonic (S) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Sonic (S) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Sonic (S) của BạnSau khi mua Sonic (S), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Sonic (S)Giao dịch Sonic (S) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 1.3kXuất bản vào 2025.01.15Cập nhật vào 2025.03.21

Làm thế nào để Mua S

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của S (S) được trình bày dưới đây.

活动图片