Следующее землетрясение в ИИ: почему настоящая опасность не в убийцах SaaS, а в революции вычислительной мощности?

marsbitОпубликовано 2026-02-11Обновлено 2026-02-11

Введение

Недавний ажиотаж вокруг того, как ИИ-приложения «убивают» традиционные SaaS-сервисы, может затмить более глубокую трансформацию: революцию в вычислительной мощности, которая угрожает доминированию NVIDIA. Ключевые изменения происходят по двум направлениям. Во-первых, алгоритмы становятся эффективнее. Архитектура MoE (Mixture of Experts), как в DeepSeek-V2, позволяет активировать лишь небольшую часть модели (9% параметров), сохраняя производительность на уровне GPT-4, но с затратами в 10 раз ниже. Во-вторых, появляются специализированные аппаратные решения для инференса, например, от Cerebras и Groq. Они используют встроенную память (SRAM) вместо внешней (HBM), что значительно ускоряет обработку данных. Комбинация этих подходов ведёт к обвальному снижению затрат на обучение и использование ИИ. Это ставит под вопрос монополию NVIDIA: если клиентам нужно меньше чипов, а альтернативы становятся доступнее, её рыночная доля и оценка могут резко сократиться. Таким образом, настоящая угроза — не в замене SaaS, а в смене парадигмы вычислений, где «лопаты» NVIDIA уже не единственным инструментом в мире ИИ.

Автор: Брюс

В последнее время весь технологический мир и инвестиционное сообщество пристально следят за одним и тем же: как приложения на основе ИИ «убивают» традиционный SaaS. С тех пор как @AnthropicAI представила Claude Cowork, демонстрируя, как легко она может помочь вам писать письма, создавать презентации и анализировать таблицы Excel, начала распространяться паника о «смерти программного обеспечения». Это действительно пугающе, но если ваш взгляд застрял только на этом, вы, возможно, упускаете настоящее землетрясение.

Это похоже на то, как мы все смотрим на воздушный бой дронов в небе, но никто не замечает, что тектонические плиты под нашими ногами тихо сдвигаются. Настоящий шторм скрыт под поверхностью, в углу, который большинство не видит: вычислительная основа всего мира ИИ переживает «тихую революцию».

И эта революция может закончить грандиозную вечеринку, которую с таким размахом устроила @nvidia, поставщик «лопат» для золотой лихорадки ИИ, гораздо раньше, чем все ожидали.

Два пути революции, которые сходятся

Эта революция — не единичное событие, а переплетение двух, казалось бы, независимых технологических направлений. Они подобны двум армиям, сходящимся в клещи, создавая угрозу гегемонии GPU от Nvidia.

Первый путь — это революция «похудения» алгоритмов.

Задумывались ли вы, нужно ли супермозгу задействовать все клетки для решения задачи? Очевидно, нет. В DeepSeek это поняли и создали архитектуру MoE (Mixture of Experts, смесь экспертов).

Представьте себе компанию, где работают сотни экспертов в разных областях. Но для решения каждой конкретной проблемы на совещание приглашают только двух-трех самых relevant специалистов, а не устраивают мозговой штурм со всеми. В этом гениальность MoE: огромная модель активирует для каждого вычисления лишь небольшую часть «экспертов», drastically экономя вычислительные ресурсы.

К чему это приводит? Модель DeepSeek-V2 номинально имеет 236 миллиардов «экспертов» (параметров), но для работы каждый раз активирует лишь 21 миллиард — менее 9% от общего числа. При этом ее производительность сравнима с GPT-4, которому нужно работать на 100% мощности. Что это значит? Способности ИИ и потребляемые им вычислительные ресурсы больше не связаны напрямую!

Раньше мы молчаливо соглашались: чем сильнее ИИ, тем больше видеокарт он сжигает. Теперь DeepSeek показывает, что с помощью умного алгоритма можно достичь того же результата за десятую часть стоимости. Это ставит под огромный вопрос саму необходимость GPU от Nvidia.

Второй путь — это революция «смены пути» в аппаратном обеспечении.

Работа ИИ делится на два этапа: обучение и вывод (инференс). Обучение — это как учеба, нужно прочитать горы книг, и здесь GPU, карты для параллельных вычислений по принципу «сила есть — ума не надо», действительно хороши. Но вывод — это как наше повседневное использование ИИ, где важнее скорость реакции.

У GPU при выводе есть врожденный недостаток: его память (HBM) является внешней, передача данных туда и обратно вызывает задержки. Это как если бы повару при готовке каждый раз приходилось бегать в соседнюю комнату к холодильнику за ingredients — как ни старайся, быстро не получится. А такие компании, как Cerebras и Groq, пошли другим путем, разработали специализированные чипы для инференса, встроили память (SRAM) прямо в чип, разместив «ingredients» под рукой, и добились «нулевой задержки» доступа.

Рынок уже проголосовал деньгами. OpenAI, с одной стороны, жалуется на неэффективность GPU от Nvidia для вывода, а с другой — заключает с Cerebras контракт на 100 миллиардов долларов на аренду их сервисов для инференса. Сама Nvidia тоже запаниковала и выложила 200 миллиардов долларов, чтобы купить Groq, лишь бы не отстать на этой новой трассе.

Когда пути сходятся: обвал стоимости

Теперь представим себе это: «похудевшая» по алгоритму MoE модель DeepSeek работает на «безмедлительном» чипе от Cerebras.

Что произойдет?

Обвал стоимости.

Во-первых, уменьшенная модель достаточно мала, чтобы целиком поместиться в собственную память чипа. Во-вторых, исчезает узкое место внешней памяти, и скорость реакции ИИ становится невероятно высокой. Конечный результат: стоимость обучения благодаря архитектуре MoE снижается на 90%, стоимость вывода благодаря специализированному hardware и разреженным вычислениям падает еще на порядок. В итоге общая стоимость владения и эксплуатации ИИ мирового класса может составить лишь 10-15% от стоимости традиционного решения на GPU.

Это не улучшение, это смена парадигмы.

Ковер выдергивают из-под трона Nvidia

Теперь должно быть понятно, почему это смертельнее «паники Cowork».

Сегодняшняя многотриллионная капитализация Nvidia построена на простой истории: ИИ — это будущее, а будущее ИИ зависит от наших GPU. Но теперь основа этой истории动摇ется.

На рынке обучения: даже если Nvidia сохранит монополию, но клиенты смогут обходиться в десять раз меньшим количеством карт, общий размер этого рынка может drastically сократиться.

На рынке вывода, этом в десять раз большем «пироге», у Nvidia не только нет абсолютного преимущества, но она еще и подвергается атаке со стороны Google, Cerebras и других «небожителей». Даже ее крупнейший клиент, OpenAI, перебегает к противнику.

Как только Уолл-стрит осознает, что «лопаты» Nvidia больше не являются единственным или даже лучшим выбором, что произойдет с оценкой, построенной на ожидании «вечной монополии»? Думаю, все понимают.

Таким образом, самая большая черная лебедь в ближайшие полгода может быть связана не с тем, какое приложение ИИ кого-то еще «убило», а с, казалось бы, незначительной технической новостью: например, новой статьей об эффективности алгоритма MoE или отчетом, показывающим резкий рост доли рынка специализированных чипов для инференса, которые тихо宣告ят о вступлении войны вычислительных мощностей в новую фазу.

Когда «лопаты» продавца перестают быть единственным выбором, его золотой век, вероятно, подходит к концу.

Трендовые криптовалюты

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

BrevisBREV

PancakeSwapCAKE

JUSTJST

Связанные с этим вопросы

QПочему автор считает, что настоящая опасность исходит не от «убийц SaaS», а от революции в вычислительной мощности?

AПотому что, хотя приложения ИИ, такие как Claude Cowork, меняют способы использования программного обеспечения, настоящий сдвиг происходит на фундаментальном уровне: в алгоритмах (как MoE от DeepSeek, снижающих потребность в вычислениях) и аппаратном обеспечении (специализированные чипы для вывода, как у Cerebras и Groq), что угрожает монополии NVIDIA и радикально снизит стоимость владения и эксплуатации ИИ.

QЧто такое архитектура MoE (Mixture of Experts) и как она экономит вычислительные ресурсы?

AАрхитектура MoE (Смесь экспертов) — это подход, при котором большая модель состоит из множества более мелких «экспертов» (подсетей). Для каждой конкретной задачи активируются только несколько наиболее релевантных экспертов, а не вся модель целиком. Например, DeepSeek-V2 имеет 236 миллиардов параметров, но для обработки запроса использует лишь 21 миллиард (около 9%), что drastically сокращает требуемые вычислительные мощности при сохранении высокой производительности.

QКаковы два основных недостатка GPU NVIDIA для задач вывода (inference) ИИ?

AВо-первых, память GPU (HBM) является внешней по отношению к вычислительным ядрам, что создает задержки при обмене данными (как если бы повару пришлось бегать за ингредиентами в другую комнату). Во-вторых, GPU спроектированы как универсальные процессоры для параллельных вычислений, что не является оптимальным для задач вывода, где критически важна низкая задержка.

QКак сочетание алгоритмических (MoE) и аппаратных (спецчипы) инноваций приведет к «обвалу costs»?

AСочетание «похудевших» благодаря MoE моделей (которые требуют меньше вычислений) и специализированных чипов для вывода (которые обеспечивают чрезвычайно низкую задержку за счет встроенной памяти, такой как SRAM) приведет к синергетическому эффекту. Модель помещается entirely в быструю on-chip память, устраняя узкие места. Это может снизить стоимость обучения на 90% и стоимость вывода на порядок, making стоимость владения мощным ИИ всего 10-15% от традиционных решений на GPU.

QПочему текущая монополия и высокая оценка NVIDIA на фондовом рынке могут оказаться под угрозой?

AРыночная капитализация NVIDIA основана на ожидании, что будущее ИИ будет зависеть от их GPU. Однако революция в вычислениях ставит это под сомнение: спрос на GPU для обучения может сократиться благодаря эффективным алгоритмам (MoE), а на огромном рынке вывода (в 10 раз больше) NVIDIA сталкивается с жесткой конкуренцией со стороны специализированных чипов (Cerebras, Groq, собственные чипы крупных клиентов like OpenAI). Если инвесторы поймут, что «лопаты» NVIDIA больше не являются единственным или лучшим выбором, это может привести к коррекции их завышенной оценки.

Похожее

Экстренная новость! Следующее поколение ИИ от OpenAI прорывает 10 задач уровня Филдсовской премии

У OpenAI произошел прорыв: их новая модель Astra решила 10 сложнейших математических проблем уровня Филдсовской премии. Среди достижений — построение первого примера несофической группы, опровергающее гипотезу Громова (1999 г.), прорыв в задаче упаковки сфер в высоких размерностях, где не было прогресса 46 лет, и опровержение гипотезы жесткости Конна. Результаты, изложенные в 249-страничной работе, проверены с помощью Lean 4. По оценкам, стоимость создания доказательств составила около 2000 долларов. Это событие знаменует поворотный момент, демонстрирующий способность ИИ совершать глубокие открытия в фундаментальной математике.

marsbit13 мин. назад

Экстренная новость! Следующее поколение ИИ от OpenAI прорывает 10 задач уровня Филдсовской премии

marsbit13 мин. назад

Как стать человеком, которого искусственный интеллект никогда не сможет заменить

В статье рассматривается вопрос о том, как остаться незаменимым в эпоху искусственного интеллекта. Автор утверждает, что вместо страха перед ИИ следует сосредоточиться на развитии качеств, которые машины не смогут заменить. Он критикует «зарплатное рабство» — зависимость от работы, не приносящей удовлетворения, и предлагает путь к финансовой независимости через создание собственного дела. Ключ к успеху — развитие пяти элементов: самостоятельности (агентности), вкуса, умения убеждать, упорства и способности к итерациям. Главное — не просто создавать что-либо (сегодня это может каждый), а создавать что-то ценное, востребованное и уметь это продвигать. Автор считает, что наиболее важным навыком будущего является создание контента (медиа), а не просто написание кода, поскольку ценность контента субъективна и требует уникального человеческого вкуса и суждения. ИИ может помочь в производстве, но не заменит оригинальность мысли и связь с аудиторией. В качестве практического шага предлагается упражнение: за 15 минут ответить на вопросы, чтобы обнаружить свои уникальные знания, опыт и точку зрения, которые станут основой для личного бренда и дела жизни. Первый шаг — немедленно опубликовать свою основную идею, чтобы получить обратную связь от реального мира и начать процесс роста. Цель — стать «непригодным для найма», построив жизнь вокруг собственного творчества и экспертизы.

marsbit43 мин. назад

Как стать человеком, которого искусственный интеллект никогда не сможет заменить

marsbit43 мин. назад

Благодаря броскам кубиков ключи от биткоинов хранятся в автономном режиме, но не все будут этим заниматься

Статья посвящена практике генерации сид-фраз для биткоин-кошельков с помощью бросков кубиков в свете уязвимости, обнаруженной в аппаратных кошельках Coldcard. Подчеркивается, что физический бросок кубика (дающий около 2.6 бит энтропии за бросок) создает высококачественную случайность, поскольку предсказать результат практически невозможно из-за множества переменных. Для создания стандартной сид-фразы из 12 слов (128 бит энтропии) требуется около 50 бросков, а для повышенной безопасности рекомендуется 99 и более. В связи с инцидентом Coldcard, когда неисправный генератор случайных чисел в прошивке (2021-2026 гг.) мог создавать предсказуемые ключи, выяснилось, что сид-фразы, сгенерированные вручную через кубики, были защищены от этой уязвимости. Однако исследование показало, что другие функции устройства (создание бумажных кошельков, ключей для мультиподписи, паролей и т.д.) по-прежнему использовали скомпрометированный генератор, подвергая риску владельцев даже с безопасной основной сид-фразой. Автор отмечает, что, хотя метод с кубиками криптографически надежен, он непрактичен для массового использования из-за трудоемкости, высокой вероятности ошибок при вводе и необходимости строгой дисциплины для сохранения секретности процесса. Делается вывод, что будущее безопасности лежит в создании надежных аппаратных генераторов случайных чисел и понятных интерфейсов, а ручные методы остаются нишевым инструментом для опытных пользователей. Владельцам Coldcard рекомендуется обновить прошивку и проверить/заменить все ключи, сгенерированные уязвимыми функциями.

cryptonews.ru3 ч. назад

Благодаря броскам кубиков ключи от биткоинов хранятся в автономном режиме, но не все будут этим заниматься

cryptonews.ru3 ч. назад

Майкл Сэйлор заявил, что стало невозможно принять обновление биткойна, против которого он выступал!

Майкл Сэйлор заявил, что обновление BIP-110 для Bitcoin не сможет достичь необходимого порога в 55% добровольной поддержки майнеров в текущем цикле сложности. Согласно его данным, из 946 блоков, сгенерированных к настоящему моменту, только 24 содержали сигнал поддержки этого предложения, и все они исходили от майнеров DATUM через пул OCEAN. Сэйлор подчеркивает, что отсутствие сигналов от других майнеров означает отсутствие общего консенсуса. BIP-110 — это предложение, направленное на ограничение внесения в блокчейн Bitcoin данных, не связанных непосредственно с денежными переводами (например, изображений или текста). Сэйлор выступает против него, считая, что сеть не должна решать, какие транзакции являются «нужными», а правила не должны меняться по желанию небольшой группы. Он также утверждает, что заявленный уровень поддержки может быть искусственно завышен из-за автоматизированных процессов сигнализации.

cryptonews.ru4 ч. назад

Майкл Сэйлор заявил, что стало невозможно принять обновление биткойна, против которого он выступал!

cryptonews.ru4 ч. назад

Количество негативных комментариев о биткоине достигло исторического максимума: что это значит?

Аналитическая компания Santiment сообщает, что негативные комментарии о биткоине в социальных сетях достигли исторического максимума. Соотношение позитивных и негативных упоминаний упало до рекордно низкого уровня: на каждый негативный комментарий приходится лишь 0,58 позитивных. Основной причиной роста негатива стала уязвимость в прошивке аппаратных кошельков Coldcard, что подорвало доверие к системам холодного хранения, традиционно считающимся наиболее безопасными. В отличие от прошлых кризисов (таких как крах FTX или Mt. Gox), текущие обсуждения сфокусированы на безопасности аппаратных решений, а не на централизованных биржах. По данным Santiment, текущий уровень паники в социальных сетях даже превышает пики, зафиксированные во время событий этого года, связанных с геополитической напряженностью, и во время прошлых крупных криптовалютных кризисов. Таким образом, страх на рынке исторически значительно превосходит жадность. Компания подчеркивает, что данные пока отражают ситуацию лишь за один день.

cryptonews.ru5 ч. назад

Количество негативных комментариев о биткоине достигло исторического максимума: что это значит?

cryptonews.ru5 ч. назад

Торговля

Спот

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на AI (AI) представлены ниже.

Следующее землетрясение в ИИ: почему настоящая опасность не в убийцах SaaS, а в революции вычислительной мощности?

Введение

Два пути революции, которые сходятся

Когда пути сходятся: обвал стоимости

Ковер выдергивают из-под трона Nvidia

Трендовые криптовалюты

Связанные с этим вопросы

Похожее

Экстренная новость! Следующее поколение ИИ от OpenAI прорывает 10 задач уровня Филдсовской премии

Как стать человеком, которого искусственный интеллект никогда не сможет заменить

Благодаря броскам кубиков ключи от биткоинов хранятся в автономном режиме, но не все будут этим заниматься

Майкл Сэйлор заявил, что стало невозможно принять обновление биткойна, против которого он выступал!

Количество негативных комментариев о биткоине достигло исторического максимума: что это значит?

Торговля

Популярные статьи

AI Companions: Новое определение взаимодействия человека с ИИ

HTX Learn: пройдите обучение по "AI Companions" и разделите 10 000 USDT!

Неделя обучения по популярным токенам (2): 2026 может стать годом приложений реального времени, сектор AI продолжает оставаться в тренде

Обсуждения

Топ вопросы

Популярные категории

Популярные теги