Десятки миллионов ошибок в час: исследование раскрывает «иллюзию точности» AI-поиска Google

marsbitОпубликовано 2026-04-13Обновлено 2026-04-13

Введение

Автор: Клод, Deep Chao TechFlow Согласно совместному исследованию The New York Times и стартапа Oumi, функция AI Overviews (ИИ-сводки) в Google Search демонстрирует точность около 91%. Однако, учитывая масштаб Google (5 триллионов запросов в год), это означает, что система ежечасно генерирует десятки миллионов ошибочных ответов — более 57 миллионов. Проблема усугубляется тем, что даже когда ответ верен, более половины (56% для Gemini 3) цитируемых источников не подтверждают выводы, сделанные ИИ. Часто используются низкокачественные источники, такие как Facebook и Reddit. Еще одной серьёзной проблемой является уязвимость к манипуляциям. Тест BBC показал, что ложная информация из намеренно сфабрикованной статьи начала появляться в ответах ИИ менее чем за 24 часа. Google оспаривает методологию исследования, заявляя о «серьёзных недостатках», включая использование другого ИИ (HallOumi) для оценки и нереалистичные тестовые запросы. Внутренние тесты Google показывают, что их модель Gemini 3 вне поисковой системы имеет уровень ошибок в 28%, но компания утверждает, что интеграция с поиском значительно повышает её точность.

Автор: Клод, Deep Chao TechFlow

Глубинный обзор: Совместное тестирование The New York Times и AI-стартапа Oumi показало, что точность функции AI-анонсов (AI Overviews) в поиске Google составляет около 91%. Однако с учётом масштаба Google, обрабатывающего 5 триллионов поисковых запросов в год, это означает, что ежечасно генерируются десятки миллионов ошибочных ответов. Что ещё серьёзнее, даже при правильных ответах более половины ссылок на источники не подтверждают выводы.

Google в беспрецедентных масштабах поставляет пользователям недостоверную информацию, и большинство об этом даже не подозревает.

Согласно The New York Times, AI-стартап Oumi по её заказу провёл оценку точности функции AI Overviews от Google с использованием отраслевого стандартного теста SimpleQA, разработанного OpenAI. Тестирование охватило 4326 поисковых запросов и проводилось в два этапа: в октябре прошлого года (на движке Gemini 2) и в феврале этого года (после обновления до Gemini 3). Результаты показали, что точность Gemini 2 составила около 85%, а Gemini 3 повысила её до 91%.

91% звучит неплохо, но в масштабах Google это выглядит иначе. Google обрабатывает около 5 триллионов поисковых запросов в год. При 9% уровне ошибок AI Overviews ежечасно генерирует более 57 миллионов неточных ответов, что приближается к 1 миллиону в минуту.

Ответ верный, но источник ошибочен

Беспокойнее, чем точность, является проблема «отрыва» источников цитирования.

Данные Oumi показывают, что во времена Gemini 2 в 37% правильных ответов существовала проблема «необоснованного цитирования», когда прикреплённые к AI-анонсу ссылки не подтверждали предоставленную информацию. После обновления до Gemini 3 этот показатель не снизился, а подскочил до 56%. Иными словами, модель, давая правильные ответы, всё хуже «делает домашнюю работу».

Вопрос генерального директора Oumi Маноса Кукумидиса бьёт в самую суть: «Даже если ответ правильный, откуда ты знаешь, что он правильный? Как ты это проверишь?»

Массовое цитирование AI Overviews низкокачественных источников усугубляет эту проблему. Oumi обнаружила, что Facebook и Reddit являются вторым и четвёртым по частоте источниками цитирования для AI Overviews. Среди неточных ответов Facebook цитировался в 7% случаев, что выше, чем 5% в точных ответах.

Фальшивая статья журналиста BBC «отравила» систему за 24 часа

Ещё один серьёзный недостаток AI Overviews — чрезвычайная лёгкость манипулирования.

Один журналист BBC провёл тест с помощью намеренно сфабрикованной фальшивой статьи, и менее чем за 24 часа AI-анонс Google начал представлять содержащуюся в ней ложную информацию как факт для пользователей.

Это означает, что любой, кто понимает механизм работы системы, может «отравить» AI-результаты поиска, публикуя ложный контент и накручивая его трафик. Пресс-секретарь Google Нед Адрианс в ответ на это заявил, что AI-функция поиска построена на тех же механизмах ранжирования и безопасности, что и блокировка спама, и что «большинство примеров в тесте — это нереалистичные запросы, которые люди на самом деле не ищут».

Возражение Google: проблемы в самом тесте

Google выдвинула ряд претензий к исследованию Oumi. Пресс-секретарь компании назвал это исследование «имеющим серьёзные недостатки»,理由包括: сам эталонный тест SimpleQA содержит неточную информацию; Oumi использовала собственную AI-модель HallOumi для оценки другой AI, что могло внести дополнительную погрешность; содержание теста не отражает реальное поведение пользователей при поиске.

Внутреннее тестирование Google также показало, что при самостоятельной работе Gemini 3 вне框架 поиска Google доля ложных выводов достигает 28%. Но Google подчеркивает, что AI Overviews, используя систему поискового ранжирования, повышает точность и работает лучше, чем модель сама по себе.

Однако, как указывает PCMag, возникает логический парадокс: если ваш довод в защиту — «отчёт, указывающий на неточность нашего AI, сам использует возможно неточный AI», то это вряд ли усилит доверие пользователей к точности вашего продукта.

Связанные с этим вопросы

QКакова точность функции AI Overviews в Google Поиске по данным тестирования?

AСогласно тестированию, проведенному компанией Oumi, точность AI Overviews составляет около 91% при использовании Gemini 3.

QСколько неточных ответов в час генерирует функция AI Overviews из-за масштабов Google?

AПри годовом объеме в 5 триллионов поисковых запросов и 9% уровне ошибок, AI Overviews генерирует более 57 миллионов неточных ответов в час.

QВ чем заключается проблема «необоснованных ссылок» в ответах AI Overviews?

AПроблема «необоснованных ссылок» означает, что ссылки, прилагаемые к ответам ИИ, не подтверждают предоставленную информацию. Эта проблема возросла с 37% до 56% после обновления до Gemini 3.

QКакие платформы часто цитируются в неточных ответах AI Overviews?

AFacebook и Reddit являются вторым и четвертым по частоте источниками цитирования. В неточных ответах Facebook цитируется в 7% случаев.

QКак Google ответил на критику точности AI Overviews?

AGoogle оспорил методы тестирования, заявив, что исследование имеет «серьезные недостатки», включая использование спорного бенчмарка SimpleQA и модели HallOumi от Oumi для оценки, что могло внести дополнительные ошибки.

Похожее

Приоритетные акции STRC потеряли 11% от номинала. Крутится ли ещё «вечный двигатель» Strategy?

Автор: Azuma, Odaily Planet Daily Привилегированные акции STRC компании MicroStrategy в настоящее время переживают устойчивое «открепление» от своей целевой номинальной стоимости. С 15 мая цена STRC постепенно отклонялась от целевого значения в 100 долларов, а в последние дни скидка значительно увеличилась, достигнув минимума в 83,26 доллара. На закрытии торгов в четверг цена составила 88,59 доллара, что более чем на 11% ниже целевой номинальной стоимости. STRC — это бессрочные привилегированные акции, выпущенные MicroStrategy в 2025 году. Они имеют фиксированную целевую номинальную стоимость в 100 долларов и относительно стабильные дивиденды. В цикле расширения баланса MicroStrategy STRC играет ключевую роль как мощный двигатель капитала: пока рыночная цена STRC стабильно составляет 100 долларов или выше, компания может постоянно выпускать новые акции по механизму ATM, привлекать фиатные деньги и направлять их на покупку биткоинов, не размывая права акционеров обычных акций MSTR. Однако для бесперебойной работы этого цикла необходимо, чтобы цена STRC оставалась около 100 долларов. Несмотря на то что MicroStrategy увеличила дивиденды до 11,5% и перешла на полумесячные выплаты, чтобы исправить ситуацию, «открепление» не было эффективно устранено. Основные причины «открепления»: 1. **Технические факторы**: Снижение может быть частично связано с цепной реакцией принудительного закрытия позиций со стороны арбитражных средств, использующих кредитное плечо. 2. **Потеря доверия**: Более глубокая проблема заключается в обеспокоенности рынка ликвидностью MicroStrategy. Анализ JPMorgan показывает, что денежных резервов компании хватит лишь на покрытие дивидендных выплат по привилегированным акциям на 6,3 месяца. Хотя MicroStrategy заявляет, что её биткоин-резервы могут покрывать выплаты в течение 32 лет, это предполагает возможность продажи BTC при необходимости. Первая продажа 32 биткоинов компанией в начале месяца, хотя и представленная как «тест», подорвала ключевой нарратив о том, что MicroStrategy никогда не будет продавать BTC для финансирования операций, заставив рынок переоценить риски. Если STRC продолжит торговаться со скидкой, способность MicroStrategy привлекать финансирование ослабнет. В случае истощения денежных резервов опасения по поводу возможной продажи биткоинов для выплаты дивидендов усилятся. Поскольку MicroStrategy была одним из крупнейших покупателей биткоина на рынке, превращение её покупательского спроса в потенциальное давление продавца может оказать значительное негативное влияние на цену BTC.

marsbit21 мин. назад

Приоритетные акции STRC потеряли 11% от номинала. Крутится ли ещё «вечный двигатель» Strategy?

marsbit21 мин. назад

Только что лауреат Нобелевской премии стал новым сотрудником Anthropic

Нобелевский лауреат Джон Джампер, ключевой руководитель проекта AlphaFold, покинул Google DeepMind после почти девяти лет работы и присоединился к компании Anthropic. Его уход последовал за переходом Ноама Шазера, одного из создателей архитектуры Transformer, из Google в OpenAI, что означает потерю двух ведущих специалистов для Google менее чем за 72 часа. Джон Джампер возглавил команду AlphaFold всего через шесть месяцев после защиты докторской диссертации, несмотря на ограниченный опыт в глубоком обучении. Под его руководством AlphaFold совершила революцию в структурной биологии, решив проблему сворачивания белка и предсказав структуры сотен миллионов белков, что в тысячу раз превысило объем данных, собранных за десятилетия экспериментальными методами. В 2024 году, в возрасте 39 лет, он получил Нобелевскую премию по химии. Его переход в Anthropic знаменует усиление конкуренции в области ИИ для наук о жизни. Anthropic недавно приобрела биотехнологическую компанию Coefficient Bio и развивает собственные «мокрые» лаборатории. OpenAI также активно инвестирует в это направление, выпустив модель GPT-Rosalind и планируя вложения в размере 1 миллиарда долларов. Google DeepMind, через свой спин-офф Isomorphic Labs, продолжает сотрудничать с крупными фармацевтическими компаниями. Уход ведущих ученых из Google вызывает вопросы о способности крупных корпораций удерживать таланты, которые стремятся оказывать непосредственное влияние на траекторию развития компаний. Битва между Anthropic, OpenAI и Google за лидерство в применении ИИ в биологии и медицине вступает в решающую фазу.

marsbit27 мин. назад

Только что лауреат Нобелевской премии стал новым сотрудником Anthropic

marsbit27 мин. назад

Падение STRC Strategy демонстрирует риски, скрывающиеся за кредитными продуктами, связанными с Bitcoin

Стратегия STRC демонстрирует риски кредитных продуктов, связанных с биткоином. Привилегированные акции Strategy (STRC) упали значительно ниже номинала в $100, достигнув минимума в $82.53, что высветило уязвимость таких инструментов. Гендиректор Strive Мэтт Коул объяснил это сбросом левериджа, а не дефолтом эмитента, подчеркнув роль вынужденной продажи при маржинальном давлении. Этот эпизод показывает, как кредитные продукты, привязанные к биткоин-казначейским стратегиям, могут подвергаться резким распродажам из-за рычагов, даже если базовая компания устойчива. История предупреждает об усложнении финансовых инструментов вокруг биткоина и их чувствительности к ликвидности и волатильности. Ключевой вывод: спад STRC — это урок о рисках левериджа, а не о кредитоспособности Strategy.

bitcoinist6 ч. назад

Падение STRC Strategy демонстрирует риски, скрывающиеся за кредитными продуктами, связанными с Bitcoin

bitcoinist6 ч. назад

Высокий суд Австралии одержал крупную победу для ASIC в деле о криптодоходности Block Earner

Высший суд Австралии единогласно поддержал позицию Комиссии по ценным бумагам и инвестициям (ASIC) в деле против компании Block Earner. Суд постановил, что её продукт "Earner" с фиксированной доходностью, предлагавшийся в 2022 году, является финансовым продуктом и деривативом по существующему законодательству. Это означает, что для его предложения требовалась лицензия на предоставление финансовых услуг (AFSL). Дело возвращено в Федеральный суд для определения штрафных санкций. Данное решение создаёт важный прецедент, проясняя применение традиционного финансового регулирования к криптовалютным продуктам, предлагающим структурированную доходность. Оно подтверждает, что экономическая сущность продукта важнее его названия. Регуляторы теперь имеют чёткие правовые основания рассматривать подобные продукты как инвестиционные инструменты, требующие лицензирования. Хотя оспариваемый продукт более не предлагается, это решение затрагивает многие существующие и планируемые криптопродукты в Австралии и отражает глобальный тренд на подчинение крипто-доходных продуктов установленным регуляторным режимам. Для индустрии это означает необходимость переоценки соответствия продуктов законодательству, а для потребителей — напоминание о рисках, связанных с нелицензированными доходными продуктами.

bitcoinist9 ч. назад

Высокий суд Австралии одержал крупную победу для ASIC в деле о криптодоходности Block Earner

bitcoinist9 ч. назад

Blockchain.com расширяет доступ к токенизированным акциям через Ondo Finance

Блокчейн-кошелек Blockchain.com расширяет доступ к токенизированным акциям и ETF США через интеграцию с Ondo Finance. Партнерство позволяет соответствующим критериям пользователям, особенно за пределами США, получать доступ к традиционным финансовым активам напрямую через привычный криптокошелек, минуя традиционные брокерские платформы. Ondo Finance, известный игрок на рынке токенизированных реальных активов (RWA), обеспечивает технологическую и регуляторную основу для этих активов. Эта интеграция является частью общей тенденции, когда криптоплатформы стремятся сделать токенизированные традиционные активы такими же простыми в использовании, как и обычные криптотокены. Однако широкому внедрению все еще могут препятствовать вопросы регулирования, хранения активов и их выкупа.

bitcoinist11 ч. назад

Blockchain.com расширяет доступ к токенизированным акциям через Ondo Finance

bitcoinist11 ч. назад

Торговля

Спот
Фьючерсы
活动图片