Десятки миллионов ошибок в час: исследование раскрывает «иллюзию точности» AI-поиска Google

marsbitОпубликовано 2026-04-13Обновлено 2026-04-13

Введение

Автор: Клод, Deep Chao TechFlow Согласно совместному исследованию The New York Times и стартапа Oumi, функция AI Overviews (ИИ-сводки) в Google Search демонстрирует точность около 91%. Однако, учитывая масштаб Google (5 триллионов запросов в год), это означает, что система ежечасно генерирует десятки миллионов ошибочных ответов — более 57 миллионов. Проблема усугубляется тем, что даже когда ответ верен, более половины (56% для Gemini 3) цитируемых источников не подтверждают выводы, сделанные ИИ. Часто используются низкокачественные источники, такие как Facebook и Reddit. Еще одной серьёзной проблемой является уязвимость к манипуляциям. Тест BBC показал, что ложная информация из намеренно сфабрикованной статьи начала появляться в ответах ИИ менее чем за 24 часа. Google оспаривает методологию исследования, заявляя о «серьёзных недостатках», включая использование другого ИИ (HallOumi) для оценки и нереалистичные тестовые запросы. Внутренние тесты Google показывают, что их модель Gemini 3 вне поисковой системы имеет уровень ошибок в 28%, но компания утверждает, что интеграция с поиском значительно повышает её точность.

Автор: Клод, Deep Chao TechFlow

Глубинный обзор: Совместное тестирование The New York Times и AI-стартапа Oumi показало, что точность функции AI-анонсов (AI Overviews) в поиске Google составляет около 91%. Однако с учётом масштаба Google, обрабатывающего 5 триллионов поисковых запросов в год, это означает, что ежечасно генерируются десятки миллионов ошибочных ответов. Что ещё серьёзнее, даже при правильных ответах более половины ссылок на источники не подтверждают выводы.

Google в беспрецедентных масштабах поставляет пользователям недостоверную информацию, и большинство об этом даже не подозревает.

Согласно The New York Times, AI-стартап Oumi по её заказу провёл оценку точности функции AI Overviews от Google с использованием отраслевого стандартного теста SimpleQA, разработанного OpenAI. Тестирование охватило 4326 поисковых запросов и проводилось в два этапа: в октябре прошлого года (на движке Gemini 2) и в феврале этого года (после обновления до Gemini 3). Результаты показали, что точность Gemini 2 составила около 85%, а Gemini 3 повысила её до 91%.

91% звучит неплохо, но в масштабах Google это выглядит иначе. Google обрабатывает около 5 триллионов поисковых запросов в год. При 9% уровне ошибок AI Overviews ежечасно генерирует более 57 миллионов неточных ответов, что приближается к 1 миллиону в минуту.

Ответ верный, но источник ошибочен

Беспокойнее, чем точность, является проблема «отрыва» источников цитирования.

Данные Oumi показывают, что во времена Gemini 2 в 37% правильных ответов существовала проблема «необоснованного цитирования», когда прикреплённые к AI-анонсу ссылки не подтверждали предоставленную информацию. После обновления до Gemini 3 этот показатель не снизился, а подскочил до 56%. Иными словами, модель, давая правильные ответы, всё хуже «делает домашнюю работу».

Вопрос генерального директора Oumi Маноса Кукумидиса бьёт в самую суть: «Даже если ответ правильный, откуда ты знаешь, что он правильный? Как ты это проверишь?»

Массовое цитирование AI Overviews низкокачественных источников усугубляет эту проблему. Oumi обнаружила, что Facebook и Reddit являются вторым и четвёртым по частоте источниками цитирования для AI Overviews. Среди неточных ответов Facebook цитировался в 7% случаев, что выше, чем 5% в точных ответах.

Фальшивая статья журналиста BBC «отравила» систему за 24 часа

Ещё один серьёзный недостаток AI Overviews — чрезвычайная лёгкость манипулирования.

Один журналист BBC провёл тест с помощью намеренно сфабрикованной фальшивой статьи, и менее чем за 24 часа AI-анонс Google начал представлять содержащуюся в ней ложную информацию как факт для пользователей.

Это означает, что любой, кто понимает механизм работы системы, может «отравить» AI-результаты поиска, публикуя ложный контент и накручивая его трафик. Пресс-секретарь Google Нед Адрианс в ответ на это заявил, что AI-функция поиска построена на тех же механизмах ранжирования и безопасности, что и блокировка спама, и что «большинство примеров в тесте — это нереалистичные запросы, которые люди на самом деле не ищут».

Возражение Google: проблемы в самом тесте

Google выдвинула ряд претензий к исследованию Oumi. Пресс-секретарь компании назвал это исследование «имеющим серьёзные недостатки»,理由包括: сам эталонный тест SimpleQA содержит неточную информацию; Oumi использовала собственную AI-модель HallOumi для оценки другой AI, что могло внести дополнительную погрешность; содержание теста не отражает реальное поведение пользователей при поиске.

Внутреннее тестирование Google также показало, что при самостоятельной работе Gemini 3 вне框架 поиска Google доля ложных выводов достигает 28%. Но Google подчеркивает, что AI Overviews, используя систему поискового ранжирования, повышает точность и работает лучше, чем модель сама по себе.

Однако, как указывает PCMag, возникает логический парадокс: если ваш довод в защиту — «отчёт, указывающий на неточность нашего AI, сам использует возможно неточный AI», то это вряд ли усилит доверие пользователей к точности вашего продукта.

Связанные с этим вопросы

QКакова точность функции AI Overviews в Google Поиске по данным тестирования?

AСогласно тестированию, проведенному компанией Oumi, точность AI Overviews составляет около 91% при использовании Gemini 3.

QСколько неточных ответов в час генерирует функция AI Overviews из-за масштабов Google?

AПри годовом объеме в 5 триллионов поисковых запросов и 9% уровне ошибок, AI Overviews генерирует более 57 миллионов неточных ответов в час.

QВ чем заключается проблема «необоснованных ссылок» в ответах AI Overviews?

AПроблема «необоснованных ссылок» означает, что ссылки, прилагаемые к ответам ИИ, не подтверждают предоставленную информацию. Эта проблема возросла с 37% до 56% после обновления до Gemini 3.

QКакие платформы часто цитируются в неточных ответах AI Overviews?

AFacebook и Reddit являются вторым и четвертым по частоте источниками цитирования. В неточных ответах Facebook цитируется в 7% случаев.

QКак Google ответил на критику точности AI Overviews?

AGoogle оспорил методы тестирования, заявив, что исследование имеет «серьезные недостатки», включая использование спорного бенчмарка SimpleQA и модели HallOumi от Oumi для оценки, что могло внести дополнительные ошибки.

Похожее

BIT Исследование: Ликвидность уходит, повторит ли биткоин сценарий формирования дна 2022 года?

В настоящее время рынок находится на этапе коррекции, определяемом ожиданиями относительно политики и изменениями ликвидности. Несмотря на кратковременный отскок биткоина от технически перепроданных уровней благодаря смягчению геополитики и сильным результатам IPO SpaceX, неожиданные жесткие сигналы нового председателя ФРС Кевина Уорша лишили рынок ожидаемой поддержки смягчения. Одновременно с этим ликвидность стейблкоинов продолжает сокращаться, приток новых средств явно недостаточен, и рынок вновь вступил в типичный для летнего сезона период низкой активности. С текущей точки ценообразования рынку по-прежнему не хватает макроэкономических катализаторов, способных запустить новый раунд роста. Ежедневные объемы торгов заметно сократились по сравнению с пиковыми периодами 2025 года, темпы роста стейблкоинов продолжают замедляться, а поддерживающий эффект от покупок биткоина компанией Strategy (бывшая MicroStrategy) через финансирование привилегированными акциями STRC также постепенно ослабевает. Под совместным давлением политической неопределенности, сезонной слабости и сокращения ликвидности краткосрочные перспективы биткоина остаются под давлением. Модель тенденций показывает, что пока биткоин остается ниже 73 700 долларов, общий тренд сохраняет медвежий характер. Уровень поддержки в 62 446 долларов остается ключевым; его пробитие может ускорить нисходящее движение. Однако, аналогично процессу формирования дна в 2022 году, рынок может пройти через длительную фазу консолидации для постепенного формирования цикличного минимума. Ликвидность продолжает сокращаться. Ежедневный объем торгов иногда падает до около 500 миллиардов долларов, что составляет лишь около 25% от пиковых значений 2025 года. Рост стейблкоинов USDT и USDC также значительно замедлился. Приток средств в ETF на биткоин и от Strategy заметно ослаб. 30-дневный чистый отток средств сохраняется. В целом, при уровне инфляции в 4,2%, который значительно превышает цель ФРС в 2%, и под совместным влиянием жесткой позиции ФРС, сезонной летней слабости и недостатка ликвидности, у биткоина в краткосрочной перспективе по-прежнему недостаточно оснований для устойчивого удержания выше 60 000 долларов. Тем не менее, по мере постепенной очистки рынка текущая коррекция может сформировать цикличный минимум этим летом. Цена может не сразу начать новый раунд роста, но этот процесс, возможно, готовит почву для следующего бычьего цикла.

marsbit15 мин. назад

BIT Исследование: Ликвидность уходит, повторит ли биткоин сценарий формирования дна 2022 года?

marsbit15 мин. назад

Азартная ставка майнеров на ИИ: оценка вступает в фазу дифференциации, борьба за выживание усложняется

Автор: Nancy, PANews На фоне продолжающегося спада на рынке криптоактивов майнинговые компании сталкиваются с растущим давлением. В поисках новых источников роста всё больше майнеров ускоряют переход в сферу искусственного интеллекта (ИИ). Этот нарратив трансформации быстро завоевал расположение рынка капитала, вызвав значительный рост акций многих компаний. Однако, хотя бизнес в сфере ИИ и открывает новые перспективы, он также влечёт за собой огромные капитальные затраты, постоянные инвестиции и длительные сроки окупаемости, вовлекая майнеров в новую ресурсоёмкую гонку. В условиях снижающейся прибыльности от майнинга эта азартная ставка на ИИ проверяет финансовые и операционные возможности компаний. Рыночная капитализация майнинговых компаний вступила в фазу дивергенции. Такие компании, как CoreWeave, стали новым эталоном оценки с капитализацией в десятки миллиардов долларов. Ранние последователи, начавшие трансформацию в 2022-2023 гг., и компании, активно подключившиеся в 2025 году, демонстрируют разную динамику акций. Рынок в значительной степени оценивает их будущий потенциал как операторов инфраструктуры для вычислений, а не текущую прибыльность. Трансформация сталкивается с серьёзными вызовами. Прибыльность майнинга биткойна снижается, а конкуренция обостряется. Хотя такие активы майнеров, как энергоресурсы и готовая инфраструктура, высоко ценятся в эпоху ИИ, сам переход сопряжён с трудностями. Оценка компаний будет эволюционировать от оценки объёма электроэнергии к способности реализовывать проекты и, в конечном итоге, к показателям денежного потока и качества клиентской базы. Ключевыми факторами станут своевременное выполнение проектов в рамках бюджета и привлечение крупных, надёжных арендаторов, таких как Microsoft или Amazon. По оценкам VanEck, для перехода отрасли требуются колоссальные инвестиции: краткосрочный дефицит финансирования составляет около 500 млрд долларов, а долгосрочные потребности могут достичь 2,21 трлн долларов. Для покрытия этих затрат компании прибегают к выпуску конвертируемых облигаций, продаже биткойнов из резервов и заключению долгосрочных контрактов на услуги ИИ/высокопроизводительных вычислений (HPC), чтобы зафиксировать будущие доходы и привлечь финансирование. В итоге, переход в сферу ИИ открывает для майнинговых компаний путь с гораздо большим потенциалом, чем традиционный майнинг, но по своей сути это долгосрочная конкуренция, требующая значительных финансовых ресурсов и безупречной операционной эффективности.

marsbit42 мин. назад

Азартная ставка майнеров на ИИ: оценка вступает в фазу дифференциации, борьба за выживание усложняется

marsbit42 мин. назад

Приоритетные акции STRC потеряли 11% от номинала. Крутится ли ещё «вечный двигатель» Strategy?

Автор: Azuma, Odaily Planet Daily Привилегированные акции STRC компании MicroStrategy в настоящее время переживают устойчивое «открепление» от своей целевой номинальной стоимости. С 15 мая цена STRC постепенно отклонялась от целевого значения в 100 долларов, а в последние дни скидка значительно увеличилась, достигнув минимума в 83,26 доллара. На закрытии торгов в четверг цена составила 88,59 доллара, что более чем на 11% ниже целевой номинальной стоимости. STRC — это бессрочные привилегированные акции, выпущенные MicroStrategy в 2025 году. Они имеют фиксированную целевую номинальную стоимость в 100 долларов и относительно стабильные дивиденды. В цикле расширения баланса MicroStrategy STRC играет ключевую роль как мощный двигатель капитала: пока рыночная цена STRC стабильно составляет 100 долларов или выше, компания может постоянно выпускать новые акции по механизму ATM, привлекать фиатные деньги и направлять их на покупку биткоинов, не размывая права акционеров обычных акций MSTR. Однако для бесперебойной работы этого цикла необходимо, чтобы цена STRC оставалась около 100 долларов. Несмотря на то что MicroStrategy увеличила дивиденды до 11,5% и перешла на полумесячные выплаты, чтобы исправить ситуацию, «открепление» не было эффективно устранено. Основные причины «открепления»: 1. **Технические факторы**: Снижение может быть частично связано с цепной реакцией принудительного закрытия позиций со стороны арбитражных средств, использующих кредитное плечо. 2. **Потеря доверия**: Более глубокая проблема заключается в обеспокоенности рынка ликвидностью MicroStrategy. Анализ JPMorgan показывает, что денежных резервов компании хватит лишь на покрытие дивидендных выплат по привилегированным акциям на 6,3 месяца. Хотя MicroStrategy заявляет, что её биткоин-резервы могут покрывать выплаты в течение 32 лет, это предполагает возможность продажи BTC при необходимости. Первая продажа 32 биткоинов компанией в начале месяца, хотя и представленная как «тест», подорвала ключевой нарратив о том, что MicroStrategy никогда не будет продавать BTC для финансирования операций, заставив рынок переоценить риски. Если STRC продолжит торговаться со скидкой, способность MicroStrategy привлекать финансирование ослабнет. В случае истощения денежных резервов опасения по поводу возможной продажи биткоинов для выплаты дивидендов усилятся. Поскольку MicroStrategy была одним из крупнейших покупателей биткоина на рынке, превращение её покупательского спроса в потенциальное давление продавца может оказать значительное негативное влияние на цену BTC.

marsbit1 ч. назад

Приоритетные акции STRC потеряли 11% от номинала. Крутится ли ещё «вечный двигатель» Strategy?

marsbit1 ч. назад

Только что лауреат Нобелевской премии стал новым сотрудником Anthropic

Нобелевский лауреат Джон Джампер, ключевой руководитель проекта AlphaFold, покинул Google DeepMind после почти девяти лет работы и присоединился к компании Anthropic. Его уход последовал за переходом Ноама Шазера, одного из создателей архитектуры Transformer, из Google в OpenAI, что означает потерю двух ведущих специалистов для Google менее чем за 72 часа. Джон Джампер возглавил команду AlphaFold всего через шесть месяцев после защиты докторской диссертации, несмотря на ограниченный опыт в глубоком обучении. Под его руководством AlphaFold совершила революцию в структурной биологии, решив проблему сворачивания белка и предсказав структуры сотен миллионов белков, что в тысячу раз превысило объем данных, собранных за десятилетия экспериментальными методами. В 2024 году, в возрасте 39 лет, он получил Нобелевскую премию по химии. Его переход в Anthropic знаменует усиление конкуренции в области ИИ для наук о жизни. Anthropic недавно приобрела биотехнологическую компанию Coefficient Bio и развивает собственные «мокрые» лаборатории. OpenAI также активно инвестирует в это направление, выпустив модель GPT-Rosalind и планируя вложения в размере 1 миллиарда долларов. Google DeepMind, через свой спин-офф Isomorphic Labs, продолжает сотрудничать с крупными фармацевтическими компаниями. Уход ведущих ученых из Google вызывает вопросы о способности крупных корпораций удерживать таланты, которые стремятся оказывать непосредственное влияние на траекторию развития компаний. Битва между Anthropic, OpenAI и Google за лидерство в применении ИИ в биологии и медицине вступает в решающую фазу.

marsbit1 ч. назад

Только что лауреат Нобелевской премии стал новым сотрудником Anthropic

marsbit1 ч. назад

Падение STRC Strategy демонстрирует риски, скрывающиеся за кредитными продуктами, связанными с Bitcoin

Стратегия STRC демонстрирует риски кредитных продуктов, связанных с биткоином. Привилегированные акции Strategy (STRC) упали значительно ниже номинала в $100, достигнув минимума в $82.53, что высветило уязвимость таких инструментов. Гендиректор Strive Мэтт Коул объяснил это сбросом левериджа, а не дефолтом эмитента, подчеркнув роль вынужденной продажи при маржинальном давлении. Этот эпизод показывает, как кредитные продукты, привязанные к биткоин-казначейским стратегиям, могут подвергаться резким распродажам из-за рычагов, даже если базовая компания устойчива. История предупреждает об усложнении финансовых инструментов вокруг биткоина и их чувствительности к ликвидности и волатильности. Ключевой вывод: спад STRC — это урок о рисках левериджа, а не о кредитоспособности Strategy.

bitcoinist8 ч. назад

Падение STRC Strategy демонстрирует риски, скрывающиеся за кредитными продуктами, связанными с Bitcoin

bitcoinist8 ч. назад

Торговля

Спот

Фьючерсы

Десятки миллионов ошибок в час: исследование раскрывает «иллюзию точности» AI-поиска Google

Введение

Ответ верный, но источник ошибочен

Фальшивая статья журналиста BBC «отравила» систему за 24 часа

Возражение Google: проблемы в самом тесте

Связанные с этим вопросы

Похожее

BIT Исследование: Ликвидность уходит, повторит ли биткоин сценарий формирования дна 2022 года?

Азартная ставка майнеров на ИИ: оценка вступает в фазу дифференциации, борьба за выживание усложняется

Приоритетные акции STRC потеряли 11% от номинала. Крутится ли ещё «вечный двигатель» Strategy?

Только что лауреат Нобелевской премии стал новым сотрудником Anthropic

Падение STRC Strategy демонстрирует риски, скрывающиеся за кредитными продуктами, связанными с Bitcoin

Торговля

Популярные категории

Популярные теги