Предсказания плей-офф Чемпионата мира: Насколько отличаются разные уровни ИИ?
Кубок мира: насколько различны прогнозы разных ИИ в плей-офф?
В ходе нынешнего Кубка мира Odaily Planet Daily перед каждым матчем плей-офф запрашивал прогнозы у различных ИИ-моделей (ChatGPT, Grok, Qwen, DeepSeek, Gemini, Claude), а затем сравнивал их с реальными результатами.
Наиболее запоминающимся стал точный прогноз DeepSeek и Gemini в матче Нидерланды – Марокко. Обе модели предсказали ничью в основное время и победу Марокко в серии пенальти, что полностью совпало с реальным исходом (1:1, 3:2 по пенальти). Gemini особенно точно описала сценарий матча.
Grok и Qwen проявили себя как «специалисты по точному счету». Они верно предсказали конкретные результаты в нескольких матчах, где был явный фаворит: Канада 1:0 ЮАР, Бразилия 2:1 Япония, Норвегия 2:1 Кот-д’Ивуар. Их сила — в точном определении того, выиграет ли фаворит уверенно или с трудом.
ChatGPT и Claude показали себя как «аналитики». Их прогнозы по итоговому счету часто были менее точны, но они регулярно верно указывали на потенциальные сложности для фаворитов и факторы, которые могут сделать матч напряженным (например, в матчах Бразилия – Япония или Англия – ДР Конго). Однако им не хватало решимости предсказать крупную сенсацию.
Все модели единодушно ошиблись в матче Германия – Парагвай, предрекая легкую победу немцев. Ни одна не учла способность Парагвая затянуть матч и вывести его в серию пенальти, где Германия и проиграла.
Вывод: не существует одной «самой точной» модели. У каждой свои сильные стороны: DeepSeek и Gemini смело предсказывают неочевидные исходы, Grok и Qwen точны в счете в матчах с фаворитом, а ChatGPT и Claude лучше всего анализируют потенциальный ход игры. Выбор модели зависит от того, что именно вам нужно: смелый прогноз на сенсацию, точный счет или глубокий анализ возможных сценариев матча.
Odaily星球日报1 ч. назад