Google Deep Think доминирует в восьми языковых олимпиадах, самостоятельно решает 4 нерешенные проблемы, рушит барьеры в науке

marsbitОпубликовано 2026-04-08Обновлено 2026-04-08

Введение

Google DeepMind представила новый ИИ Gemini Deep Think, который показал выдающиеся результаты в восьми международных олимпиадах на разных языках, включая русский. Модель достигла уровня золотых медалистов в математических, физических и химических соревнованиях, а также продемонстрировала мощные способности в программировании. Особенно впечатляющими стали результаты на японском и французском языках, где ИИ набрал 100% баллов. На китайском языке модель показала высокий результат в математической олимпиаде (86,3%), но менее впечатляющий — в программировании (63,3%), что указывает на различия между чистым推理 и практической реализацией кода. Google подчеркивает, что цель проекта —打破语言ковые барьеры в научных исследованиях, позволяя учёным со всего мира использовать ИИ на родном языке. Модель уже помогла решить несколько нерешённых математических проблем и участвовала в написании научных работ. Однако некоторые эксперты отмечают, что результаты пока не имеют независимого подтверждения, и детали тестирования не раскрыты.

«Deep Think превзошел/сравнялся с конкурентами во всех соревнованиях»!

Только что старший исследователь Google DeepMind Conglong Li на платформе X опубликовал 12 постов, представив беспрецедентный отчет об успехах.

Один ИИ, один и тот же «мозг», восемь экзаменов на разных языках, все сданы на высокие баллы.

Для любой модели такие результаты являются исключительными.

От золотой медали IMO до полного охвата региональных олимпиад

Этот успех Deep Think в достижении высоких результатов в различных рейтингах — не внезапная единичная вспышка, а кривая развития способностей, которая формировалась почти год.

Сначала — покорение самого сложного поля логических рассуждений.

В июле 2025 года Gemini Deep Think впервые достиг уровня золотой медали на Международной математической олимпиаде (IMO), набрав 35 баллов из 42. В то же время показал аналогично высокий уровень на финале мирового чемпионата ICPC.

Эти два достижения уже официально опубликованы в блоге DeepMind.

Google DeepMind затем внес эти результаты в официальный блог, обозначив их как знак того, что Deep Think преодолел «порог мировых соревнований» в математике и программировании.

Затем Deep Think начал переход от «чемпионского прорыва в отдельных дисциплинах» к «системной проверке на кросс-языковых, междисциплинарных и разнообразных сценариях».

В феврале 2026 года Google опубликовал три статьи в блоге.

Одна представила саму модель Gemini 3.1 Pro, другая — крупное обновление специального режима рассуждений Deep Think, третья — от команды научных открытий DeepMind, которая напрямую позиционирует Deep Think как «мультипликатор человеческого интеллекта».

Обновленный Deep Think представил ряд жестких показателей:

Humanity's Last Exam — 48.4% (без инструментальной помощи), ARC-AGI-2 — 84.6% (официальная проверка фонда ARC Prize), рейтинг Elo в соревновательном программировании Codeforces — 3455, письменные части Международной физической олимпиады 2025 и Международной химической олимпиады — на уровне золотой медали.

Эта траектория очень четкая: сначала использовать мировые соревнования, такие как IMO и ICPC, чтобы доказать свои мощные способности к рассуждению, а затем использовать результаты многоязыковых, региональных и междисциплинарных олимпиад, чтобы доказать свою универсальную способность к глубоким рассуждениям со стабильным переносом между языками и областями.

Эволюция способностей Gemini Deep Think от золотой медали IMO до ускорения научных исследований уровня PhD

Детальный разбор табеля успеваемости на 8 языках

Теперь давайте подробно рассмотрим этот табель.

Японский язык наиболее яркий.

35-я Японская математическая олимпиада (JMO Finals) 2025 года — идеальный результат.

Азиатский предварительный этап ICPC в Японии — идеальный результат.

При этом результат JMO Finals даже превысил уровень 80% от наивысшего балла в том году, достигнув стандарта, официально называют «эквивалентным золотой медали».

Французский язык также на 100%.

С китайским интереснее.

На 41-й Китайской математической олимпиаде (CMO) Deep Think набрал 86.3%, что очень впечатляюще. Но на Китайской олимпиаде по информатике (NOI) — только 63.3%.

Разрыв между 86.3% и 63.3% очерчивает реальные границы способности ИИ к рассуждению.

В математических олимпиадах модель сталкивается с абстрактными выводами, построением доказательств и многошаговыми умозаключениями, что как раз является сильной стороной Deep Think.

Но в олимпиадах по информатике проблема заключается не только в том, чтобы «понять», но и в переводе логики в исполняемый код, контроле граничных условий, учете ограничений сложности и избежании ошибок на уровне реализации.

Первое ближе к чистым рассуждениям, второе требует одновременного прохождения «рассуждений + проектирования алгоритмов + инженерной реализации».

В результатах олимпиад на других языках — корейском, хинди, вьетнамском, русском, португальском — Deep Think также превзошел конкурентов или, по крайней мере, сравнялся с ними.

Если снова объединить японский, французский и китайский, то最不обычным в этот раз является не то, что какая-то одна дисциплина была сдана на идеальный балл, а то, что одна и та же модель, одна и та же система рассуждений Deep Think, на экзаменационных работах на multiple языках показала результаты уровня первого эшелона.

Насколько надежен этот табель?

Но здесь есть ключевой пробел:

Conglong Li не привел конкретных сравнительных данных конкурентов: все результаты получены из внутреннего тестирования Google. Нет независимого повторения третьей стороной, нет официального подтверждения организаторами олимпиад, методы оценки полностью не раскрыты.

Каждая задача решалась один раз или много раз с выбором лучшего результата? Сколько вычислительных ресурсов было использовано при рассуждении? Было ли вмешательство ручного prompt-инжиниринга?

Эти детали, напрямую влияющие на ценность результатов, также не упомянуты.

Еще один момент, который легко пренебречь: все эти экзамены являются региональными отборочными турами, а не международными финалами.

Между сложностью задач региональных этапов и международных финалов — разница в orders величины.

Исследователь четко сказал, что эти результаты «будут включены в model card», но на момент публикации model card еще не обновлена.

Таким образом, пока это все еще похоже на табель, который ученик сам оценил, сам опубликовал и еще не передал в учебную часть для заверения печатью.

Многоязыковая справедливость в науке — забытое настоящее поле битвы

Почему Google专门 потратил силы на оценку региональных олимпиад на 8 языках?

Текущая оценка способностей ИИ к рассуждению почти полностью основана на английском языке.

MATH, GSM8K, HumanEval, ARC-AGI... все это на английском.

Всем математикам, физикам, инженерам мира, чей родной язык не английский, при использовании научных инструментов ИИ приходится сначала преодолевать языковой барьер.

Google выбрал эти 8 языков не случайно.

Японский, корейский, китайский покрывают важные научные центры Восточной Азии, хинди, вьетнамский — emerging рынки, французский, русский, португальский — Европу и Южную Америку.

Вместе это — большая часть глобального научного производства.

DeepMind в официальном блоге позиционирует Deep Think как «мультипликатор человеческого интеллекта», заявляя, что он может «обрабатывать поиск знаний и строгую проверку, позволяя ученым сосредоточиться на концептуальной глубине и творческом направлении».

В сочетании с этими многоязыковыми результатами, подтекст этих слов понять нетрудно: этот мультипликатор предназначен не только для ученых, говорящих на английском.

Более примечательно то, как далеко Deep Think уже продвинулся в научном применении.

DeepMind представила интеллектуального агента для математических исследований под названием Aletheia, работающего на основе Deep Think, который может автономно генерировать, проверять и修订ить решения исследовательских математических проблем.

Aletheia, управляемый Deep Think, способен к итеративному生成, проверке и исправлению исследовательских математических проблем

Aletheia уже参与 создании нескольких исследовательских статей, одна из которых полностью выполнена ИИ самостоятельно, вычислив specific структурные константы в арифметической геометрии.

Кроме того, в полуавтономной оценке 700 открытых математических проблем он独立 решил 4 ранее нерешенные проблемы.

Режим Gemini Deep Think также показал огромный потенциал в области компьютерных наук, физики, экономики и других областях.

В области компьютерных наук Deep Think помог опровергнуть гипотезу, остававшуюся нерешенной в течение десяти лет, в области физики нашел новое аналитическое решение для гравитационного излучения космических струн, в области экономики расширил теорему теории аукционов.

Схема процесса рассуждений ИИ, показывающая, как крупномасштабное исследование пространства решений на сетевом уровне агрегируется в структурированные рассуждения и подтверждается с помощью автоматизированной и ручной проверки.

Совместно с экспертами, решая 18 исследовательских难题, расширенная версия Gemini Deep Think помогла突破 long-standing bottlenecks в областях алгоритмов, машинного обучения и комбинаторной оптимизации, теории информации以及 экономики.

Это уже далеко выходит за рамки «решения олимпиадных задач».

Пока конкуренты соревнуются в рейтингах английских benchmark'ов, Google уже нашел новое поле битвы в области «ускорителей научных исследований с ИИ».

Самое важное в этом деле — не баллы,真正的 сигнал behind it заключается в том, что языковые барьеры инструментов ИИ для науки решаются как инженерная проблема.

Если этот путь будет пройден, ученые всего мира, ведущие исследования на японском, корейском, китайском, хинди, впервые окажутся на одной стартовой линии с носителями английского языка.

На этот раз Google уже выложил карты на стол.

Что касается того, кто из конкурентов сделает ответный ход,相信 мы скоро это увидим.

Источники:

https://blog.google/intl/ja-jp/company-news/technology/gemini-31-pro-gemini-31-pro-deep-think/%20

https://deepmind.google/blog/accelerating-mathematical-and-scientific-discovery-with-gemini-deep-think/%20

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/%20

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/

Статья из WeChat Official Account «新智元» (XinZhiYuan), автор: 新智元

Связанные с этим вопросы

QЧто такое Deep Think от Google и каковы его основные достижения?

ADeep Think — это продвинутая система искусственного интеллекта, разработанная Google DeepMind, предназначенная для сложных рассуждений и решения задач. Она продемонстрировала выдающиеся результаты в различных международных олимпиадах, включая золотой уровень на Международной математической олимпиаде (IMO) и высокие показатели в ICPC, а также решила несколько ранее нерешённых научных проблем.

QНа каких языках Deep Think показал высокие результаты в олимпиадах?

ADeep Think продемонстрировал высокие результаты на восьми языках: японском (например, идеальный балл на Japanese Mathematical Olympiad), китайском, французском (100%), корейском, хинди, вьетнамском, русском и португальском. Это включает математические, programming и научные олимпиады.

QКакие научные проблемы решил Deep Think самостоятельно?

ADeep Think автономно решил четыре ранее нерешённые математические задачи из набора из 700 открытых проблем. Кроме того, он помог опровергнуть десятилетнюю гипотезу в computer science, нашёл новые аналитические решения для гравитационного излучения космических струн в физике и расширил теорему в auction theory в экономике.

QНасколько надёжны заявленные результаты Deep Think?

AРезультаты были представлены исследователем Google DeepMind, но пока отсутствует независимая проверка или официальное подтверждение от организаций олимпиад. Детали методики тестирования, использование вычислительных ресурсов и возможное вмешательство человека не раскрыты, что оставляет вопросы о полной достоверности без обновления model card.

QКак Deep Think влияет на научные исследования и многоязычное равенство?

ADeep Think позиционируется как «мультипликатор человеческого интеллекта», способный работать на multiple languages, что снижает языковой барьер в науке. Это позволяет исследователям из неанглоязычных стран (например, Японии, Китая, Индии) использовать ИИ на родном языке, потенциально уровнять их возможности с англоязычными учёными и ускорить глобальные научные открытия.

Похожее

ПОСЛЕДНИЕ НОВОСТИ: Дональд Трамп сделал резкое заявление по поводу Ирана! Он остановил атаки

Президент США Дональд Трамп заявил о приостановке запланированных масштабных военных действий против Ирана. Это решение было принято после обращения к нему Саудовской Аравии, ОАЭ, Катара и самого Ирана с просьбой предоставить время для дипломатических переговоров. Союзники в регионе полагают, что соглашение близко. Первоначальный этап переговоров будет сосредоточен на вопросах безопасности и возобновлении нормальной работы Ормузского пролива — ключевого маршрута для мировой нефтеторговли, чья безопасность критически важна для глобальных цен на энергоносители. После решения этих вопросов планируется начать переговоры по иранской ядерной программе. Новый раунд переговоров с Ираном начнётся завтра. В своём выступлении Трамп также коснулся темы валютного рынка, заявив, что США вмешались в поддержку японской иены, подчеркнув крепкие союзнические и взаимовыгодные экономические отношения с Японией.

cryptonews.ru1 ч. назад

ПОСЛЕДНИЕ НОВОСТИ: Дональд Трамп сделал резкое заявление по поводу Ирана! Он остановил атаки

cryptonews.ru1 ч. назад

Банк Италии не увидел системных преимуществ стейблкоинов в переводах

Исследование Банка Италии показало, что стейблкоины (на примере USDC) не демонстрируют устойчивых системных преимуществ в стоимости и скорости международных денежных переводов по сравнению с традиционными сервисами. Анализ транзакций на 200 USDC в 10 платежных коридорах (Италия — Бразилия, Аргентина, Япония, ОАЭ, ЮАР и др.) выявил, что финальная стоимость переводов варьировалась от 0,3% до почти 9%. Сроки исполнения колебались от менее 20 минут в коридорах с инфраструктурой мгновенных платежей до 1-2 рабочих дней в ее отсутствие. Ключевые издержки и задержки связаны не с комиссиями блокчейна, а с процессами конвертации в фиатные валюты и работой локальных платежных систем. Хотя в большинстве изучных направлений стоимость переводов со стейблкоинами была ниже среднемирового показателя в 6,65%, по сравнению с сервисом Wise преимущество наблюдалось только в трех из семи сопоставимых случаев. Авторы отмечают, что преимущества стейблкоинов могли бы быть более заметны, если бы их можно было напрямую тратить без конвертации. Также подчеркивается, что запретительное регулирование не устраняет спрос на стейблкоины, а излишне жесткие правила лишь усложняют их использование для розничных клиентов. В контексте исследования упоминается значительное снижение общей капитализации рынка стейблкоинов в июле.

cryptonews.ru2 ч. назад

Банк Италии не увидел системных преимуществ стейблкоинов в переводах

cryptonews.ru2 ч. назад

«Биткойн-бум» в разгаре: новое заявление Сэйлора вызвало спекуляции о покупках

Исполнительный председатель MicroStrategy Майкл Сэйлор 2 августа опубликовал сообщение «Bitcoin Drive engaged», что вызвало спекуляции о новой покупке биткойнов компанией. Его отчет показал, что резерв MicroStrategy составляет 843 775 BTC стоимостью около $53,25 млрд, со средней себестоимостью $75 653 и нереализованным убытком в $10,58 млрд. Ранее аналогичный сигнал предшествовал объявлению о пополнении долларового резерва. В то же время, реестр компании отразил две недавние продажи на общую сумму 3 588 BTC, сократив запасы. Эти продажи, согласно документам SEC, были проведены для финансирования выплат по привилегированным акциям. Неделей ранее компания не покупала биткойны, увеличив свой долларовый резерв примерно до $3,75 млрд. Финансовые риски остаются высокими после отчетности об операционном убытке в $8,33 млрд за второй квартал 2026 года. Ожидается, что обновление данных в понедельник покажет, означает ли сообщение Сэйлора возврат к накоплению биткойнов, поскольку компания балансирует между своими крупными запасами криптовалюты и растущими денежными обязательствами.

cryptonews.ru2 ч. назад

«Биткойн-бум» в разгаре: новое заявление Сэйлора вызвало спекуляции о покупках

cryptonews.ru2 ч. назад

Паттерн на графике биткоина «голоса и плечи» сулит подъём к $67,200

Несмотря на медленное снижение в начале августа, на графике биткоина формируется перевёрнутая разворотная модель «голова и плечи». Цена $BTC колеблется около $63,200, формируя правое плечо, что является основным поводом для краткосрочного оптимизма. Ключевой вопрос — хватит ли покупателям сил для рывка к уровню $67,200 для подтверждения разворота. В то же время в паре ETH/BTC уже пробито разворотное дно. Ethereum демонстрирует относительную силу, закрепился в восходящем тренде и движется к цели 0,0312, а против доллара тестирует уровень $1875, открывая путь к $2163. Эта ротация капитала в пользу ETH лишает биткоин объёма, необходимого для быстрого роста. Таким образом, ситуация для биткоина остаётся напряжённой: либо он в ближайшие дни последует примеру Ethereum и осуществит быстрый рост выше $67,200, либо, если атака на «шею» паттерна не состоится, медведи возьмут контроль и отправят цену к уровням поддержки $60,000 и $58,000.

cryptonews.ru2 ч. назад

Паттерн на графике биткоина «голоса и плечи» сулит подъём к $67,200

cryptonews.ru2 ч. назад

Акции компаний, занимающихся искусственным интеллектом, торгуются как «мемокоины», в то время как биткоин практически не меняет цены — обзор недели

В еженедельном обзоре рассматривается волатильность на рынках, вызванная распродажей в секторе ИИ и проблемами крупного хедж-фонда «Situational Awareness», что привело к значительным падениям на азиатских фондовых рынках. Акцентируется внимание на макроэкономических факторах, включая политику ФРС и интервенции Банка Японии. В криптосфере обсуждаются закрытие бирж BitMart и банкротство Storj Labs, трудности компаний вроде Coinbase, а также действия MicroStrategy по наращиванию резервов. Поднимаются темы инсайдерской торговли на Hyperliquid и отключения малопопулярных активов в Aave. Отдельно выделяется энтузиазм венчурных инвесторов вокруг Bittensor ($TAO). Завершается обзор серьёзным предупреждением об уязвимости аппаратных кошельков Coldcard, призывая пользователей к немедленным действиям и повышенной бдительности при самохранении активов.

cryptonews.ru2 ч. назад

Акции компаний, занимающихся искусственным интеллектом, торгуются как «мемокоины», в то время как биткоин практически не меняет цены — обзор недели

cryptonews.ru2 ч. назад

Торговля

Спот

Google Deep Think доминирует в восьми языковых олимпиадах, самостоятельно решает 4 нерешенные проблемы, рушит барьеры в науке

Введение

От золотой медали IMO до полного охвата региональных олимпиад

Детальный разбор табеля успеваемости на 8 языках

Насколько надежен этот табель?

Многоязыковая справедливость в науке — забытое настоящее поле битвы

Связанные с этим вопросы

Похожее

ПОСЛЕДНИЕ НОВОСТИ: Дональд Трамп сделал резкое заявление по поводу Ирана! Он остановил атаки

Банк Италии не увидел системных преимуществ стейблкоинов в переводах

«Биткойн-бум» в разгаре: новое заявление Сэйлора вызвало спекуляции о покупках

Паттерн на графике биткоина «голоса и плечи» сулит подъём к $67,200

Акции компаний, занимающихся искусственным интеллектом, торгуются как «мемокоины», в то время как биткоин практически не меняет цены — обзор недели

Торговля

Популярные категории

Популярные теги