Топовые ИИ-модели не осилили видеоигры девяностых

cryptonews.ruXuất bản vào 2025-03-21Cập nhật gần nhất vào 2025-04-21

Даже самые продвинутые ИИ-модели не способны эффективно играть в классический шутер от первого лица Doom. К такому выводу пришли эксперты после проверки нейросетей в новом бенчмарке VideoGameBench.

Claude can play Pokemon, but can it play DOOM?

With a simple agent, we let VLMs play it, and found Sonnet 3.7 to get the furthest, finding the blue room!

Our VideoGameBench (twenty games from the 90s) and agent are open source so you can try it yourself now —> 🧵 pic.twitter.com/vl9NNZPBHY

— Alex Zhang (@a1zhang) April 17, 2025

Тест призван проверить способность современных нейросетей играть и побеждать в 20 популярных видеоиграх. Использовать они могут только информацию с экрана.

«Современные модели VLM с трудом справляются с видеоиграми из-за высокой задержки вывода. Когда агент делает снимок экрана и запрашивает VLM о том, какое действие ему следует предпринять, к моменту получения ответа состояние игры значительно меняется, и действие уже неактуально», — отметили исследователи.

Для теста использовались классические игры из 1990 годов из-за простых визуальных эффектов и различных стилей ввода вроде мыши, клавиатуры и игрового контроллера. Такой подход позволяет проверить у модели пространственное мышление и «зрение».

VideoGameBench разработан ученым и ИИ-исследователем Алексом Чжаном. В бенчмарк входят Warcraft II, Age of Empires, Prince of Persia и другие игры.

Список игр из бенчмарка VideoGameBench. Данные: сайт vgbench.

Sonnet 3.7 справилась с Doom лучше остальных — нейросеть нашла синюю комнату.

Исследователи подчеркнули, что задержка реакции — главная проблема в шутерах от первого лица. В быстро меняющейся обстановке враг может переместиться или даже добраться до игрока раньше его реакции на происходящее.

Помимо проблем с пониманием игрового окружения, модели также не могли выполнить основные действия.

«Мы часто наблюдали случаи, когда агент не мог понять, как его действия вроде движения вправо будут отображаться на экране. Самой распространенной ошибкой среди всех протестированных нами пограничных моделей оказалась неспособность надежно управлять мышью в таких играх, как Civilization и Warcraft II, где очень важны точные и частые движения», — отметили эксперты.

Также модели не всегда понимают игровые механики, когда нет прямой инструкции о необходимых действиях.

Напомним, в феврале ИИ-стартап Anthropic представил свою «самую интеллектуальную модель» Claude 3.7 Sonnet, которая прошла игру Pokemon.

Nội dung Liên quan

STRC Không Về Mốc, BTC Sẽ Không Có Thị Trường Tăng Giá

Tình trạng "mất neo" của cổ phiếu ưu đãi STRC của MicroStrategy tiếp tục trầm trọng, giá đã giảm xuống khoảng 75 USD, cách xa mệnh giá mục tiêu 100 USD. Điều này làm tắc nghẽn kênh huy động vốn quan trọng, hiệu quả và chi phí thấp nhất của công ty. Vấn đề nghiêm trọng hơn là STRC tạo ra gánh nặng dòng tiền lớn. Với quy mô phát hành khoảng 104,9 tỷ USD và cổ tức hiện tại 11,5%, MicroStrategy phải chi trả hơn 1,2 tỷ USD tiền mặt mỗi năm chỉ cho STRC. Dự trữ tiền mặt khoảng 1,4 tỷ USD của công ty hiện chỉ đủ trang trải chi phí cổ tức ưu đãi trong chưa đầy một năm. Để giải quyết khủng hoảng thanh khoản và duy trì hoạt động, MicroStrategy có ba lựa chọn chính, nhưng đều kém hấp dẫn: 1) Phát hành cổ phiếu phổ thông (MSTR), nhưng sẽ làm loãng lợi ích BTC trên mỗi cổ phiếu - nền tảng cốt lõi của mô hình kinh doanh; 2) Phát hành nợ mới với chi phí cao hơn, làm trầm trọng thêm gánh nặng tài chính; 3) Bán Bitcoin dự trữ, nhưng hành động này có nguy cơ kích hoạt phản ứng dây chuyền tiêu cực trên thị trường. Gần đây, MicroStrategy dường như đã chọn con đường đầu tiên. Công ty đã huy động được 335,5 triệu USD thông qua phát hành cổ phiếu phổ thông, nhưng chỉ sử dụng khoảng 10% (34,9 triệu USD) để mua thêm Bitcoin, phần lớn còn lại được dùng để bổ sung dự trữ tiền mặt. Điều này dẫn đến sự pha loãng lợi ích BTC trên mỗi cổ phiếu MSTR. Tác động đến thị trường Bitcoin là đáng kể. MicroStrategy, từng là người mua biên lớn nhất và ổn định, giờ đây dòng vốn mới chảy vào BTC đã giảm mạnh. Tệ hơn, công ty có thể trở thành một nguồn bán tiềm tàng nếu buộc phải bán BTC để tạo thanh khoản. Sự thay đổi này từ lực mua sang rủi ro bán hàng khiến MicroStrategy từ một trụ cột hỗ trợ thị trường trở thành một mối đe dọa tiềm ẩn đối với giá Bitcoin.

marsbit18 phút trước

STRC Không Về Mốc, BTC Sẽ Không Có Thị Trường Tăng Giá

marsbit18 phút trước

STRC không hồi neo, BTC sẽ không có thị trường tăng giá

Bài viết phân tích tình trạng "thoát neo" nghiêm trọng của cổ phiếu ưu đãi STRC của MicroStrategy (MSTR), giá đã giảm xuống dưới 80 USD, cách xa mệnh giá mục tiêu 100 USD. Việc này làm tê liệt kênh huy động vốn hiệu quả nhất của công ty. STRC, từng được Michael Saylor ca ngợi là công cụ huy động vốn "hoàn hảo" với chi phí thấp, giờ đây không chỉ mất khả năng huy động vốn mới mà còn trở thành gánh nặng dòng tiền với nghĩa vụ chi trả cổ tức tiền mặt hằng năm lên tới hơn 1,2 tỷ USD. MicroStrategy hiện chỉ còn khoảng 1,4 tỷ USD tiền mặt, khó đủ trang trải cổ tức ưu đãi trong một năm. Để giải quyết, công ty đang dồn vào phát hành cổ phiếu phổ thông (MSTR) để huy động tiền, nhưng phần lớn số tiền này hiện được dùng để bổ sung dự trữ tiền mặt thay vì mua thêm Bitcoin (BTC), dẫn đến pha loãng giá trị BTC trên mỗi cổ phiếu MSTR. Các lựa chọn khác như phát hành trái phiếu mới hay bán BTC đều rủi ro và tốn kém. Là người mua ròng BTC lớn nhất thị trường, việc MicroStrategy giảm mua và có nguy cơ phải bán BTC để tạo thanh khoản đe dọa chuyển công ty từ lực đẩy chính của thị trường thành mối đe dọa tiềm tàng. Tác giả kết luận rằng chừng nào STRC còn chưa trở lại mệnh giá, áp lực tài chính sẽ tiếp tục hạn chế khả năng mua BTC của MicroStrategy và gây rủi ro cho thị trường.

Odaily星球日报19 phút trước

STRC không hồi neo, BTC sẽ không có thị trường tăng giá

Odaily星球日报19 phút trước

Khảo sát liệu xu hướng tăng của STABLE có bền vững sau đợt tăng giá 5% mới nhất

Trong khi thị trường tiền điện tử nói chúng thể hiện sự yếu kém, STABLE đã cho thấy sức bền đáng chú ý. Từ mức hỗ trợ 0.33 USD vào ngày 24/6, đồng tiền này đã tăng lên mức cao cục bộ 0.365 USD và giao dịch quanh 0.362 USD tại thời điểm viết bài, tăng 5.5% trong 24 giờ. Khối lượng giao dịch cũng tăng 25%, lên 20.8 triệu USD. Biểu đồ hàng ngày cho thấy cấu trúc tăng giá được củng cố khi giá vượt trên các đường trung bình động ngắn và dài hạn. Chỉ số SMI cũng có xu hướng tăng, phản ánh động lượng cải thiện. Dòng tiền ròng trên thị trường giao ngay liên tục ở vùng âm, với dòng ra lớn hơn dòng vào, cho thấy nhu cầu mua mạnh mẽ. Tuy nhiên, sức mạnh này tiềm ẩn rủi ro. Chỉ số Phân kỳ Giá/DAA (Địa chỉ Hoạt động) vẫn âm trong 7 ngày liên tiếp, cho thấy sự tham gia của người dùng trên mạng lưới yếu và không theo kịp đà tăng giá. Điều này có thể dẫn đến điều chỉnh giảm. Dự báo, nếu đà tăng tiếp tục, STABLE có thể đóng cửa trên 0.36 USD và thử thách ngưỡng kháng cự 0.40 USD. Ngược lại, nếu thất bại, giá có thể giảm về vùng hỗ trợ 0.32-0.34 USD.

ambcrypto30 phút trước

Khảo sát liệu xu hướng tăng của STABLE có bền vững sau đợt tăng giá 5% mới nhất

ambcrypto30 phút trước

Tornado Cash Lại Bị Tấn Công Quản Trị: Một Đề Xuất Giả Nhắm Vào Kho Bạc Cộng Đồng 23 Triệu USD

Vào ngày 25 tháng 6 năm 2026, một đề xuất quản trị (số 67) đáng ngờ đã xuất hiện trên DAO Tornado Cash. Đề xuất này, có vẻ chính thức với tiêu đề về cơ cấu phí và đốt token, thực chất là một cuộc tấn công lừa đảo. Nhà nghiên cứu Sergey Shemyakov (L2BEAT) và Pascal Caversaccio (Security Alliance) đã phát hiện mã hợp đồng của đề xuất chưa được xác minh. Sau khi phân tích, họ phát hiện mã độc chứa một hàm "governance" trả về địa chỉ ví của kẻ tấn công, với mục đích thay thế địa chỉ quản trị hợp lệ của giao thức. Địa chỉ tấn công (0x5efda50f22d34f272c7077689d6abc42f15e285f) được ngụy trang rất giống với địa chỉ thật (0x5efda50f22d34F262c29268506C5Fa42cB56A1Ce). Nếu đề xuất được thông qua, kẻ tấn công có thể chiếm quyền kiểm soát, rút khoảng 23 triệu USD TORN từ kho bạc cộng đồng và làm tê liệt giao thức. Địa chỉ tạo đề xuất nhận tiền từ Railgun, một giao thức riêng tư khác, khiến việc truy vết trở nên khó khăn. Hiện tại, đề xuất nhận 0 phiếu thuận và 27,163 phiếu chống (100%), và khó có khả năng đạt số phiếu tối thiểu để thông qua. Đây là lần thứ hai Tornado Cash bị tấn công quản trị kiểu này, cho thấy lỗ hổng cấu trúc chưa được khắc phục. Sự việc cảnh báo về rủi ro phổ biến trong DAO, nơi quyền lực dựa trên token có thể bị thao túng. Đối với người dùng, khuyến nghị là theo dõi cảnh báo từ các nhà nghiên cứu bảo mật, từ chối các đề xuất hợp đồng chưa xác minh và ủy quyền biểu quyết. Đối với nhà phát triển, việc tích hợp "timelock" (khóa thời gian) là biện pháp phòng thủ quan trọng.

Foresight News40 phút trước

Tornado Cash Lại Bị Tấn Công Quản Trị: Một Đề Xuất Giả Nhắm Vào Kho Bạc Cộng Đồng 23 Triệu USD

Foresight News40 phút trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片