DeepSeek проработал 12 часов: вычислительных мощностей отечественных больших моделей уже не хватает для амбиций?

marsbitОпубликовано 2026-04-03Обновлено 2026-04-03

Введение

28 марта 2024 года сервис искусственного интеллекта DeepSeek столкнулся с 12-часовым сбоем, который затронул как веб-версию, так и мобильное приложение. Пользователи столкнулись с ошибками входа, прерванными диалогами и потерей данных. Хотя официальной причиной называлась перегрузка из-за большого количества пользователей, данные показали, что всплеска трафика не было. Сбой, вероятно, связан с растущим разрывом между вычислительными мощностями и спросом. Развитие больших языковых моделей (LLM) требует всё больше ресурсов, а новые сценарии использования, такие как автоматизированные вызовы API («разведение лобстеров»), многократно увеличивают нагрузку. Это системная проблема: другие поставщики ИИ также вводят ограничения в часы пик. Грядущий выпуск DeepSeek V4 с улучшенными возможностями может усугубить проблему, если инфраструктура не будет масштабирована. Инцидент указывает на сдвиг в конкуренции: теперь ключевыми становятся не только возможности модели, но и надёжность, стоимость и инженерная инфраструктура. Это был не просто сбой, а сигнал для всей отрасли о необходимости инвестировать в устойчивые вычислительные системы.

Если вы пользовались ИИ вечером 29 марта, скорее всего, вы столкнулись с внезапным «отключением».

Эпицентром этого шторма стала ведущая китайская компания-разработчик больших моделей — DeepSeek. Начиная с 21:35 того вечера, её веб-версия и приложение почти одновременно выдали сбой: не удавалось войти, диалоги прерывались, контент терялся, а экраны заполнялись сообщениями «Сервер перегружен». Для обычных пользователей это было лишь временным неудобством, но для студентов, спешащих с курсовыми, и работников, укладывающихся в дедлайны, это стало скорее внезапной «катастрофой».

Что ещё больше раздражало, так это то, что сбой был не единичным коллапсом, а классическим «качелями». В 23:00 ненадолго восстановился, в 0:00 снова рухнул, экстренно чинился ночью и стабилизировался только к утру следующего дня.

Целых 12 часов нестабильной работы не только побили рекорд DeepSeek по длительности простоя, но и вызвали беспрецедентные сомнения в стабильности больших моделей.

01 Неожиданный коллапс: действительно ли проблема только в «слишком большом количестве людей»?

Первым объяснением, которое появилось после сбоя, было «слишком много пользователей, серверы не выдержали».

Звучало это разумно, но быстро было опровергнуто реальными данными. Согласно недавним рейтингам AI-приложений, месячная аудитория DeepSeek составляет примерно 150 миллионов. Хотя масштаб и немалый, взрывного роста не наблюдалось. Другими словами, это не был типичный «взрывной всплеск трафика».

Тогда вопрос становится ещё более интригующим: если количество пользователей не резко возросло, почему система вышла из-под контроля за такое короткое время?

Ответ, вероятно, кроется в более глубокой структуре.

02 Лобовое столкновение вычислительной мощности и спроса: скрытый кризис в индустрии ИИ

За последний год возможности больших моделей эволюционировали почти с видимой скоростью. От более длинного контекста до более сильных способностей к рассуждению и постоянного расширения мультимодальности — «потолок возможностей» моделей постоянно повышается.

Но в то же время放大уется более фундаментальная и ключевая проблема — предложение вычислительных мощностей постепенно приближается к пределу.

Каждый ответ большой модели по сути является потреблением вычислительной мощности. Чем больше модель, длиннее контекст и сложнее рассуждения, тем выше требуемые вычислительные ресурсы. Когда масштаб пользователей, частота вызовов и сложность модели растут одновременно, нагрузка на систему几乎是 неизбежна.

Именно в таком контексте этот сбой DeepSeek перестал быть единичным отказом и стал больше похож на «стресс-тест системного давления».

Согласно информации с платформы Tianyancha, аффилированное лицо DeepSeek продолжает усиливать布局 в направлениях разработки алгоритмов ИИ и инфраструктуры вычислительных мощностей,相关技术投入与产业协同正在不断强化.

На самом деле, под压力的不 только один DeepSeek. Недавно некоторые производители, включая MiniMax, начали ограничивать частоту вызовов в часы пик, а поставщики услуг вычислений, такие как阿里云, также в той или иной степени调整价格策略.

На поверхности это коммерческое поведение, но за ним кроется одна и та же реальность — предложение инфраструктуры ИИ не поспевает за скоростью роста спроса.

03 Ажиотаж «выращивания лобстеров»: незамеченный усилитель трафика

В этом инциденте есть ещё один容易被 упустить, но极具影响力的 фактор — так называемая玩法 «выращивания лобстеров».

По сути,这类玩法 заключается в постоянном вызове модели через API для автоматического выполнения задач, являясь ранней формой Agent-приложений. По сравнению с обычным диалогом, частота таких вызовов极高,甚至可以达到минутный甚至秒级触发.

Когда их используют少量 пользователей, это просто интересная попытка; но一旦形成规模, это быстро превращается в «усилитель» потребления вычислительной мощности. Это также объясняет, почему при отсутствии значительных изменений в общем количестве пользователей система всё равно может испытать что-то вроде «лавины».

В некотором смысле, этот сбой является классическим案例 «новые формы приложений атакуют старую инфраструктуру».

04 Приближается V4: большие ожидания и большее давление

Интересно, что этот 12-часовой сбой не только не ослабил рыночные ожидания от DeepSeek, но в некоторой степени даже усилил внимание.

Причина проста — скоро выйдет下一代 модель V4.

Согласно информации, распространяющейся в отрасли, DeepSeek V4 совершит скачок в нескольких ключевых возможностях: длина контекста,有望 с предыдущих128K токенов увеличиться до миллионного уровня, мультимодальные возможности и способности Agent также будут усилены. Что более важно, её адаптация к вычислительным мощностям может further склониться в сторону системы отечественных чипов, что имеет немалое значение для китайской экосистемы ИИ.

Но проблема同样 ясна: когда возможности модели further улучшаются, потребность в вычислительной мощности также放大ется. Если базовая инфраструктура не модернизируется同步, то подобные проблемы со стабильностью, скорее всего, возникнут снова.

05 От «конкуренции моделей» к «конкуренции инфраструктуры»

Оглядываясь на этот инцидент, его значение,或许, вышло за рамки отдельного продукта.

За последние два года фокус конкуренции в индустрии больших моделей始终 вращался вокруг «возможностей» — кто умнее, кто мощнее, кто лидирует в бенчмарках. Но с расширением масштабов应用, появляется новое измерение: стабильность и стоимость.

Пользователи开始 интересоваться не только «можно ли использовать», но и «можно ли использовать постоянно»; предприятия关注的也不再只是 показатели производительности, а общая стоимость эксплуатации и устойчивость.

Другими словами, конкуренция в ИИ迁移从 «уровня моделей» к «уровню инфраструктуры».

12-часовой простой DeepSeek больше похож на заранее поступившее напоминание: когда ИИ真正 вступает в阶段 массового применения, победу决定未必 самой моделью, а стоящими за нейвычислительными мощностями, архитектурой и инженерными возможностями.

06 Заключение: несчастный случай или сигнал?

Так что же означают эти 12 часов?

Их можно рассматривать и как意外 в процессе развития, и как «структурное предупреждение». Первое касается отдельной компании, второе — всей отрасли.

Можно быть уверенным, что по мере углубления применения ИИ подобные стресс-тесты будут появляться снова и снова. И каждое колебание будет推动整个行业向更成熟的阶段迈进一步.

В некотором смысле, этот коллапс DeepSeek — не конец, а начало.

И最后也想问一句: чем вы занимались с ИИ в те 12 часов?

本文来自微信公众号“铑科技”, автор: 铑科技

Связанные с этим вопросы

QЧто стало причиной 12-часового простоя DeepSeek 29 марта?

AСбой был вызван не внезапным всплеском пользовательской активности, а структурными проблемами, включая несоответствие между вычислительными мощностями и растущими потребностями модели, а также высокой частотой вызовов API из-за практики «разведения лобстеров» (автоматизированных агентов).

QКак инцидент с DeepSeek отразился на пользователях?

AПользователи столкнулись с невозможностью входа, обрывом диалогов, потерей данных и сообщениями о перегруженности серверов. Для студентов и работников, соблюдающих дедлайны, это вызвало серьезные неудобства.

QЧто такое практика «разведения лобстеров» и как она повлияла на сбой?

A«Разведение лобстеров» — это автоматизированное использование API для выполнения задач с высокой частотой вызовов (до минутных или секундных интервалов). Это действует как «усилитель» нагрузки на вычислительные ресурсы, способствуя перегрузке системы.

QКакие изменения ожидаются в DeepSeek V4 и какие проблемы могут возникнуть?

ADeepSeek V4, как ожидается, увеличит длину контекста до миллионов токенов, улучшит многомодальность и возможности агентов. Однако это также значительно увеличит потребность в вычислительных ресурсах, что может привести к повторным проблемам со стабильностью, если инфраструктура не будет модернизирована.

QКак инцидент повлиял на конкурентную среду в области ИИ?

AИнцидент сместил фокус конкуренции с чистой производительности моделей на стабильность, стоимость и инфраструктурную надежность. Это сигнализирует о переходе от «соревнования моделей» к «соревнованию инфраструктур» в отрасли.

Похожее

Высокий суд Австралии одержал крупную победу для ASIC в деле о криптодоходности Block Earner

Высший суд Австралии единогласно поддержал позицию Комиссии по ценным бумагам и инвестициям (ASIC) в деле против компании Block Earner. Суд постановил, что её продукт "Earner" с фиксированной доходностью, предлагавшийся в 2022 году, является финансовым продуктом и деривативом по существующему законодательству. Это означает, что для его предложения требовалась лицензия на предоставление финансовых услуг (AFSL). Дело возвращено в Федеральный суд для определения штрафных санкций. Данное решение создаёт важный прецедент, проясняя применение традиционного финансового регулирования к криптовалютным продуктам, предлагающим структурированную доходность. Оно подтверждает, что экономическая сущность продукта важнее его названия. Регуляторы теперь имеют чёткие правовые основания рассматривать подобные продукты как инвестиционные инструменты, требующие лицензирования. Хотя оспариваемый продукт более не предлагается, это решение затрагивает многие существующие и планируемые криптопродукты в Австралии и отражает глобальный тренд на подчинение крипто-доходных продуктов установленным регуляторным режимам. Для индустрии это означает необходимость переоценки соответствия продуктов законодательству, а для потребителей — напоминание о рисках, связанных с нелицензированными доходными продуктами.

bitcoinist1 ч. назад

Высокий суд Австралии одержал крупную победу для ASIC в деле о криптодоходности Block Earner

bitcoinist1 ч. назад

Blockchain.com расширяет доступ к токенизированным акциям через Ondo Finance

Блокчейн-кошелек Blockchain.com расширяет доступ к токенизированным акциям и ETF США через интеграцию с Ondo Finance. Партнерство позволяет соответствующим критериям пользователям, особенно за пределами США, получать доступ к традиционным финансовым активам напрямую через привычный криптокошелек, минуя традиционные брокерские платформы. Ondo Finance, известный игрок на рынке токенизированных реальных активов (RWA), обеспечивает технологическую и регуляторную основу для этих активов. Эта интеграция является частью общей тенденции, когда криптоплатформы стремятся сделать токенизированные традиционные активы такими же простыми в использовании, как и обычные криптотокены. Однако широкому внедрению все еще могут препятствовать вопросы регулирования, хранения активов и их выкупа.

bitcoinist3 ч. назад

Blockchain.com расширяет доступ к токенизированным акциям через Ondo Finance

bitcoinist3 ч. назад

CPU возвращается за игровой стол: начинается «игра на повышение» стоимостью 170 миллиардов долларов

6 июня 2026 года на выставке Computex NVIDIA анонсировала свой первый процессор Vera CPU, что знаменует серьезный вход компании на рынок серверных процессоров. Это событие подчеркивает растущую ключевую роль CPU в эпоху ИИ-агентов, когда задачи, связанные с выводом (инференсом) и управлением, требуют все большей вычислительной мощности и эффективности процессоров. Рынок серверных процессоров переживает бум. Прогнозы, такие как отчет UBS, предполагают, что его объем может вырасти с примерно 300 млрд долларов в 2025 году до 1700 млрд долларов к 2030 году. Основной драйвер роста — ИИ-агенты, которые выполняют сложные многошаговые задачи, требующие интенсивной работы CPU для управления потоками данных, вызова инструментов и обработки контекста. В таких сценариях нагрузка на CPU может достигать 70-90%, а соотношение CPU к GPU в системах стремится к 1:1, в отличие от 1:8 в эпоху обучения моделей. Это привело к изменению спроса и даже к росту цен на серверные CPU впервые за более чем десятилетие. AMD и Intel столкнулись с дефицитом мощностей. Спрос разделился на высокопроизводительные CPU для работы внутри стоек с GPU и более умеренные, но массовые CPU для развертывания независимых узлов агентов. Новая конкурентная динамика привлекла новых игроков, таких как NVIDIA с ее ARM-архитектурой, и открыла возможности для китайских производителей CPU, таких как Hygon (HaiGuang). Их рост поддерживается как общим рыночным бумом, так и политикой импортозамещения (программа «синьчуан»), требующей замены иностранного оборудования в государственном секторе к 2027 году. Таким образом, в центре следующего этапа развития ИИ находится не только GPU, но и эффективное взаимодействие CPU и GPU, что переопределяет ландшафт полупроводниковой индустрии.

marsbit3 ч. назад

CPU возвращается за игровой стол: начинается «игра на повышение» стоимостью 170 миллиардов долларов

marsbit3 ч. назад

Технологический поток Разведуправления: Директор по ИИ AMD публично раскритиковал Claude Code, заявив, что он «стал глупее и ленивее», Трамп заявил о полном прекращении огня в Ормузском проливе, но в проливе осталось около 80 морских мин

Эксклюзив Wired: SK Telecom, стратегический партнер Anthropic, находится под проверкой экспортного контроля США из-за возможного трансфера технологий модели Mythos. GLM-5.2 от китайской Z.AI: модель, по заявлениям, близкая по производительности к Claude Opus, полностью обходится без чипов Nvidia. В сфере чипов: MIT создает собственную ОС для изучения работы процессоров; ASML опровергает заявления США о поставках передовых EUV-установок в Китай; Amazon планирует продавать свои AI-чипы Trainium/Inferentia сторонним компаниям. Безопасность: обнаружено 10 тыс. репозиториев на GitHub, распространяющих вредоносное ПО; Apple исправила критическую уязвимость прослушки в Beats Studio Buds. На рынке: акции полупроводниковых компаний резко выросли (Intel +10.6%, Micron +8.7%); SpaceX упала на 3.56%. Геополитика и экономика: Несмотря на заявление Трампа о перемирии, в главном фарватере Ормузского пролива остается около 80 необезвреженных мин, что удерживает 80 супертанкеров с 80 млн баррелей нефти. Иран отменил дипломатическую поездку в Швейцарию. Основной контекст: Временная "разрядка" в геополитике контрастирует с глубокой и долгосрочной реструктуризацией глобальных технологических и полупроводниковых цепочек, где независимость от доминирующих игроков становится ключевым трендом.

marsbit3 ч. назад

Технологический поток Разведуправления: Директор по ИИ AMD публично раскритиковал Claude Code, заявив, что он «стал глупее и ленивее», Трамп заявил о полном прекращении огня в Ормузском проливе, но в проливе осталось около 80 морских мин

marsbit3 ч. назад

Южная Корея предпринимает шаги по регулированию трансграничных криптовалютных переводов в рамках новой системы

Южная Корея планирует включить финтех-компании в новую систему лицензирования трансграничных переводов виртуальных активов, которая должна быть введена в декабре. Согласно поправкам в Закон о валютных операциях, компаниям, осуществляющим такие переводы, необходимо будет зарегистрироваться в Министерстве экономики и финансов и отчитываться через национальную систему валютной отчётности. Это сделано для того, чтобы вывести криптовалютные переводы из-под неформального надзора и снизить риски отмывания денег. Изначально ожидалось, что доступ к системе получат в основном криптобиржи, такие как Upbit и Bithumb. Однако регуляторы, включая Банк Кореи, рассматривают возможность расширения круга участников, включив в него нетрадиционные криптоплатформы и финтех-фирмы, если они смогут эффективно осуществлять переводы. Министерство экономики и финансов и Банк Кореи совместно с отраслевыми участниками разрабатывают финальные правила реализации рамок регулирования до их запуска в декабре. Это происходит на фоне усиления надзора за цифровыми активами в стране, включая разработку правил для токенизированных ценных бумаг.

TheNewsCrypto5 ч. назад

Южная Корея предпринимает шаги по регулированию трансграничных криптовалютных переводов в рамках новой системы

TheNewsCrypto5 ч. назад

Торговля

Спот
Фьючерсы
活动图片