Преодолевая «стену памяти»: Революция на уровне пластины и маршруты вычислений в эпоху AI-инференса

marsbitОпубликовано 2026-06-05Обновлено 2026-06-05

Введение

В 2026 году мир ИИ достиг поворотного момента: крупнейшие облачные провайдеры впервые стали тратить на вывод моделей больше, чем на их обучение. Ключевой проблемой эпохи обучения была производительность вычислений, но в эпоху вывода главным узким местом стала «стена памяти» — задержки и энергозатраты на перемещение данных между памятью и процессором. Традиционные GPU, как у NVIDIA, упираются в ограничения пропускной способности памяти. Компания Cerebras Systems предлагает радикально другой подход — чип на целой кремниевой пластине (Wafer-Scale Engine, WSE-3). Эта архитектура размещает 44 ГБ сверхбыстрой SRAM-памяти прямо на кристалле, обеспечивая пропускную способность в тысячи раз выше, чем у HBM в GPU, что кардинально ускоряет генерацию токенов в больших языковых моделях (LLM). Ключевое преимущество Cerebras — минимальная задержка при выводе, особенно для первого токена и длинных контекстов. Однако у этого пути есть серьезные компромиссы: сложности с теплоотводом, ограниченная экосистема ПО, низкая внешняя пропускная способность и физические ограничения на дальнейшее увеличение объема SRAM с уменьшением техпроцесса. Крупные технологические компании (Google, AWS, Microsoft) в ответ развивают три направления: специализированные AI-чипы (ASIC), продвинутые стандартные технологии упаковки (как SoW от TSMC), которые могут нивелировать преимущество Cerebras, и оптические интерконнекты для преодоления «стены памяти». Cerebras сейчас сталкивается с вызовом масштабирования: круп...

2026 год стал знаковым переломным моментом в развитии глобального искусственного интеллекта — капитальные затраты на инференс у сверхмасштабных облачных провайдеров впервые в истории превысили капитальные затраты на обучение. Отраслевой фокус сместился с «создания больших моделей» на «использование больших моделей», а структура спроса на вычислительные ресурсы претерпела фундаментальный переворот.

В эпоху обучения ключевым противоречием вычислительной мощности была «двойная точность с плавающей запятой и масштаб кластера»; с наступлением эры инференса центральным противоречием стали «пропускная способность памяти и задержки связи».

Узким местом инференса больших моделей перестали быть только вычисления — веса модели, промежуточные активации и KV Cache нуждаются в частом обмене между внешней DRAM (например, HBM) и GPU. Чем больше модель, тем выше энергопотребление и задержки при перемещении данных, которые в конечном итоге значительно превышают энергопотребление самих вычислений, формируя тем самым «стену памяти».

GPU NVIDIA, построившие крепкую крепость на основе CUDA и NVLink, все же не могут избежать простоев GPU, вызванных узкими местами в пропускной способности.

Китайская компания, работающая с большими моделями, Zhipu, провела простой эксперимент: в кластере инференса на 512 GPU, оставив GPU, модель и код неизменными, просто повысив лимит пропускной способности сети с 200 ГБ/с до 400 ГБ/с, пропускная способность инференса сразу выросла на 10%, а задержка выдачи первого токена снизилась на 19% — принцип прост: стоит лишь расширить дорогу, и машины смогут ехать быстрее.

Однако архитектуры, отличные от GPU, представленные такими компаниями, как Cerebras, похоже, пробивают брешь в этой «стене памяти».

Сравнение размеров чипа Cerebras WSE-3 и GPU NVIDIA B200

Сущность Cerebras: вычислительная машина на основе SRAM с памятью рядом с ядром

Cerebras Systems была основана в Кремниевой долине Эндрю Фельдманом и другими, а первые члены команды основателей все были из компании SeaMicro, занимавшейся низкопотребляющими микросерверами, которая позже была приобретена AMD, после чего:

2015: команда основателей определила направление «вычислений на уровне пластины»;

2016: завершена регистрация, привлечен раунд финансирования A, начат скрытый этап разработки;

2019: выпущен первый продукт — чип WSE-1 и система CS-1, на основе технологии TSMC 16 нм;

2021: выпущено второе поколение продуктов на основе технологии TSMC 7 нм;

2024: выпущено третье поколение продуктов (WSE-3 / CS-3) на основе технологии TSMC 5 нм; чип и система полностью произведены в США, являясь подлинными чиповыми системами чисто американского производства.

Конфигурация системы CS-3, содержащей один чип WSE-3

Архитектурная философия процессора на уровне пластины (Wafer-Scale Engine, WSE) от Cerebras проста, прямолинейна и бьет точно в болевую точку: обменом на предельное увеличение физического пространства достигается предельное сокращение задержек при перемещении данных.

Обычные чипы режут пластину на множество маленьких кристаллов, как, например, делает NVIDIA со своими GPU. Cerebras поступает наоборот: не резать, а сделать из почти целой пластины один гигантский чип, называемый Wafer-Scale Engine (WSE).

Традиционные чипы формируются путем разрезания целой 300-миллиметровой пластины на сотни маленьких кристаллов; Cerebras же выбирает сохранить целую пластину, используя ее непосредственно как цельный чип. Новейший WSE-3 содержит 4 триллиона транзисторов, 900 тысяч AI-ядер, каждое из которых оснащено 48 КБ локальной SRAM, что обеспечивает общий объем внутрикристальной SRAM в 44 ГБ, предоставляя пропускную способность внутрикристальной памяти 21 ПБ/с и пропускную способность коммутационной сети 214 Пбит/с, что в тысячи раз превышает пропускную способность традиционной HBM.

Пропускная способность памяти Cerebras WSE в 2625 раз выше, чем у упакованного чипа NVIDIA B200, что ломает барьер пропускной способности памяти в сценариях инференса больших моделей.

В архитектуре Cerebras веса модели никогда не хранятся в SRAM на кристалле, а находятся во внешней памяти MemoryX и передаются слой за слоем на большой чип. Реализация заключается в раздельном хранении весов нейронной сети и вычислительных блоков.

Все веса модели хранятся внешне в модуле расширения памяти MemoryX, и веса, необходимые для вычисления каждого слоя сети, передаются в систему CS-3 по требованию, слой за слоем. Веса хранятся в DRAM и флэш-памяти MEMORY X и передаются в систему CS-3 на полной скорости пропускной способности. Эти веса не сохраняются в системе CS-3, даже временно не кэшируются; CS-3 полагается на базовый механизм потоковой передачи данных в ядре для выполнения вычислений.

Благодаря архитектуре на уровне пластины, Cerebras демонстрирует непреодолимые барьеры, подобные удару с более высокого измерения, в инференсе LLM, ограниченном пропускной способностью памяти. При генерации токена за токеном веса потоково передаются слой за слоем с внешнего MemoryX в CS-3; скорость обработки токенов для разных моделей в 1.5 - 5 раз выше, чем у NVIDIA B200.

Сравнение скорости обработки токенов GPU NVIDIA DGX B200 и чипа Cerebras CS-3 на разных больших моделях

Ключевое преимущество заключается в следующем: 44 ГБ внутрикристальной SRAM CS-3 обеспечивают сверхвысокую пропускную способность в 21 ПБ/с (в 2625 раз больше, чем у B200) и внутреннюю коммутацию в 214 Пбит/с, что позволяет потоковой передаче весов избавиться от ограничений интерфейса HBM. Поэтому особенно заметно превосходство в TTFT (Time To First Token, время от отправки запроса до возврата первым токеном моделью), при длинном контексте и рабочих нагрузках агентов.

Хотя веса хранятся внешне в MemoryX и загружаются слой за слоем по требованию без кэширования на кристалле, CS-3, полагаясь на базовый механизм потоков данных в ядрах, выполняет вычисления с полной точностью FP16 без потерь в SRAM; благодаря линейному масштабированию производительности, он также демонстрирует впечатляющую общую пропускную способность при конкурентном инференсе для нескольких пользователей.

Кроме пропускной способности, есть и преимущество в энергопотреблении. В недавнем выступлении председателя правления компании Zhongji InnoLight Лю Шэна также упоминалось, что требования клиентов к оптическим модулям составляют 1 пДж/бит, в то время как сейчас это 10 пДж/бит. В чипе Cerebras энергопотребление коммутации составляет всего 0.15 пДж/бит, тогда как энергопотребление коммутации текущих GPU составляет 10 пДж/бит.

Сравнение пропускной способности и энергопотребления архитектур коммутации Cerebras и GPU

Таким образом, если архитектура крупночиповых решений на уровне пластины от Cerebras станет мейнстримом для инференса или даже обучения AI, это, возможно, окажет значительное сдерживающее и структурно изменяющее влияние на объемы поставок традиционных оптических модулей и CPO (со-упакованной оптики). Основная логика заключается в следующем: высокий спрос на оптические модули и CPO по своей сути направлен на решение проблемы узких мест в пропускной способности «межчиповой» и «межузловой» коммутации в GPU-кластерах; архитектура же Cerebras как раз решает проблему путем «устранения распределенной коммутации».

Контр-интуиция: «истинные» и «ложные» недостатки крупночиповых решений на уровне пластины

В основе чипа всегда лежит принцип Trade Off (искусство компромиссов). Cerebras, добиваясь предельной пропускной способности внутрикристальной SRAM, также сталкивается с некоторыми проблемами.

Низкий выход годных?

Наоборот, размер одного AI-ядра уменьшен до 0.05 кв. мм (1% от размера одного вычислительного ядра H100), поэтому выход годных, наоборот, выше. Благодаря внутрикристальной маршрутизации можно отключать и обходить дефектные ядра, что повышает устойчивость к дефектам в 100 раз по сравнению с традиционными многоядерными процессорами. Фактически на чипе 1 миллион AI-ядер, но с учетом выхода годных, публично заявляется о 900 тысячах AI-ядер.

Специализируется только на инференсе, а не на обучении?

В течение нескольких лет после основания Cerebras обучение было основной темой, поэтому компания всегда много работала вокруг обучения. Просто после взрывного роста спроса на инференс все увидели, что ее преимущества в инференсе более очевидны.

На самом деле, упрощенные распределенные вычисления также приносят ряд преимуществ: снижение сложности кода и уменьшение накладных расходов на связь.

Для обучения модели с 175 миллиардами параметров на 4000 GPU обычно требуется около 20 тысяч строк кода для распределенного обучения.

Cerebras добилась эквивалентного обучения на 565 строках кода — вся модель может разместиться на пластине, и не требуется обработка сложностей распараллеливания данных.

Масштабирование SRAM закончилось, ключевые преимущества достигли физического потолка.

Продукт третьего поколения, основанный на 5 нм TSMC, имеет объем SRAM всего на 10% больше, чем продукт второго поколения на основе 7 нм TSMC; после 5 нм площадь ячейки SRAM практически не уменьшается с прогрессом технологического процесса.

Это означает, что Cerebras больше не сможет, как раньше, значимо увеличивать свое ключевое преимущество (объем SRAM) за счет перехода на более совершенные технологические процессы TSMC (например, с 5 нм на 3 нм).

Из-за ограничений по размеру пластины, возможностям охлаждения и производственной себестоимости ресурсы хранения, такие как внутрикристальная SRAM, не могут линейно масштабироваться синхронно с вычислительными ядрами, и соотношение ресурсов сталкивается с узким местом. Это практически блокирует ее путь эволюции.

Технические характеристики трех поколений продуктов Cerebras

Тройное испытание: охлаждение, технология и экосистема.

Концентрированное тепловыделение на всей пластине приводит к высокой плотности теплового потока, что требует использования специальных дата-центров и систем жидкостного охлаждения. Кроме того, универсальность экосистемы означает, что клиенты должны адаптироваться к ее кастомизированному программному стеку; совместимость с существующими универсальными фреймворками программирования, такими как CUDA, слабая, а затраты на портирование и адаптацию ПО высоки.

Низкая внешняя пропускная способность, ведущая к «изолированности» масштабирования.

Из-за ограничений физического проектирования на уровне пластины количество I/O-контактов, которые можно вывести на краях WSE, крайне ограничено, что приводит к I/O-пропускной способности всего в 150 ГБ/с. По сравнению с двунаправленной пропускной способностью NVLink от NVIDIA, достигающей 1.8 ТБ/с, это похоже на улитку. Это означает, что WSE чрезвычайно сложно масштабировать вовне с высокой скоростью. Хотя межсистемное соединение SwarmX от Cerebras работает неплохо, перед лицом очень больших моделей, требующих высокоскоростного межчипового взаимодействия, крайне низкая внешняя пропускная способность становится структурным физическим ограничением.

Борьба направлений: собственные разработки крупных компаний, сколько осталось времени у Cerebras?

У крупных компаний есть не один способ решения проблемы «инференсу нужна более высокая пропускная способность + меньшая задержка», они ведут наступление по трем параллельным направлениям, осаждая технологические преимущества стартапов.

1. Собственные ASIC-чипы

Google TPU v8 уже разделился на две версии: training-specific и inference-specific; AWS Trainium 4 в пути; Microsoft Maia уже используется внутри Azure, построен на основе технологии TSMC 3 нм, имеет нативные тензорные ядра FP8/FP4, переработанную систему памяти, оснащен 216 ГБ HBM3e, 272 МБ внутрикристальной SRAM; даже Anthropic начала оценку собственного inference chip.

Вероятность развития по этому пути очень высока, что напрямую приведет к сжатию TAM (общего доступного рынка) «закупок инференса у сторонних производителей» к 2028 году на 10% до 25%.

2. Технологическая универсализация пути стандартной упаковки (Packaging)

Это прямое сдерживание Cerebras с более высокой позиции.

SoW (System-on-Wafer) от TSMC уже широко доступна клиентам, CoWoS 9.5x interposer также будет запущена в 2027 году.

То, что делают эти два продукта — объединение нескольких кристаллов на уровне пластины — по сути является технологической универсализацией и демократизацией физической технологии Cerebras.

Vera Rubin от NVIDIA войдет в эту экосистему во второй половине 2026 года.

Хотя собственное cross-reticle stitching от Cerebras является эксклюзивным, максимальный срок его эксклюзивности составляет всего 2-3 года. После 2027-2028 годов его технологический барьер будет размыт передовыми решениями TSMC в области упаковки.

3. Прорыв в области оптической коммутации/оптических вычислений

Пределы коммутации электронных чипов и стены памяти достигнуты; высокая пропускная способность, низкая задержка и нулевые перекрестные помехи фотоники являются окончательным решением.

Оптические направления, представленные такими компаниями, как Lumentum, набирают силу. Самое большое преимущество wafer-scale — это вычисления на кристалле, но модели неизбежно будут становиться все больше, и высокоскоростная коммутация за пределами wafer scale — это насущная необходимость.

По мере созревания CPO (со-упакованной оптики) и оптических соединений (Optical Interconnects), весьма вероятно, что в будущем мы увидим прямое внедрение оптического ввода-вывода в пластину WSE, ломающее оковы электрической коммутации; NVIDIA также может путем приобретения компаний, обладающих определенными архитектурными преимуществами (например, LPU, таких как Groq), в сочетании с оптической коммутацией разработать системы на уровне пластины, совместимые с существующим ПО сверхузлов NV.

Забег на краю пропасти: бизнес и поставки Cerebras

В настоящее время Cerebras сталкивается с забегом на краю пропасти, подстегиваемым огромными объемами заказов.

Сделки с ведущими крупными клиентами, такими как OpenAI, вынудили Cerebras трансформироваться из чиповой компании в нового типа облачного провайдера. Она больше не просто продает оборудование, ей необходимо в короткие сроки закрепить и построить огромные объемы энергетических мощностей и инфраструктуры для дата-центров.

Согласно требованиям контрактов, Cerebras должна поставлять мощность дата-центров в размере 250 МВт ежегодно в период с 2026 по 2028 год. Однако требования систем на уровне пластины к машинным залам чрезвычайно высоки, их нельзя просто впихнуть в традиционные IDC с воздушным охлаждением. В настоящее время прогресс Cerebras в подготовке мощностей дата-центров уже заметно отстает от требований контрактов.

От выпуска инженерных образцов до строительства заводов, от согласования энергоснабжения до развертывания систем охлаждения — это трясина капиталоемких и долгосрочных проектов.

Эпилог: Налево или направо?

Возвращаясь к первоначальному тезису, когда переломная точка в вычислительных мощностях для инференса уже наступила, ядро архитектуры вычислений всегда заключается в компромиссе.

Нет абсолютно правильного или ошибочного пути, есть лишь относительно оптимальное решение для самой важной рабочей нагрузки. А нагрузки уже меняются.

Cerebras идет налево, выбирая предельную физическую оптимизацию, обменивая целую пластину и огромный объем SRAM на предельно низкую задержку для одной задачи, что непобедимо в сценариях, крайне чувствительных к задержке первого токена.

NVIDIA идет направо, выбирая сохранение универсальности, используя HBM + NVLink + огромную пропускную способность кластера, чтобы справиться с тысячами изменений в нагрузках, оставаясь неизменной перед лицом перемен.

Бушующие ветра перемен, неясный путь вперед. Именно эта двойная неопределенность — технологическая и коммерческая — и рождает возможность для подрывных изменений. В потоке вычислительных мощностей, ведущих к AGI, еще рано делать окончательные выводы — потому что именно неопределенность создает возможности.

Эта статья взята с официального аккаунта WeChat «Исследовательский институт чесночных гранул», автор: ПиЛи Юся (Pili Youxia)

Трендовые криптовалюты

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

BrevisBREV

ZRX（0X）ZRX

PancakeSwapCAKE

Связанные с этим вопросы

QКаковы ключевые изменения в структуре спроса на вычислительные мощности в эпоху AI, начиная с 2026 года?

AС 2026 года капитальные затраты гипермасштабных облачных провайдеров на AI-инференс впервые в истории превысили затраты на обучение. Индустриальный фокус сместился с "создания больших моделей" на "использование больших моделей", что привело к фундаментальному перевороту в структуре спроса на вычислительные мощности.

QВ чем заключается архитектурная философия Wafer-Scale Engine (WSE) от Cerebras, и как она решает проблему "стены памяти"?

AФилософия архитектуры WSE от Cerebras заключается в максимальном использовании физического пространства для радикального снижения задержек перемещения данных. Вместо разрезания пластины на множество мелких чипов, компания использует почти всю цельную пластину как один гигантский чип. Это позволяет разместить огромный объем сверхбыстрой SRAM-памяти на кристалле, обеспечивая полосу пропускания в тысячи раз выше, чем у традиционной HBM, и тем самым преодолевая узкое место "стены памяти" в AI-инференсе.

QКаковы три основные проблемы (или "слабости"), с которыми сталкивается архитектура Cerebras WSE?

AАрхитектура Cerebras WSE сталкивается с тремя основными проблемами: 1) Физический предел масштабирования SRAM, который практически перестает уменьшаться после 5нм техпроцесса, ограничивая рост ключевого преимущества. 2) Проблемы с охлаждением, специализированной экосистемой ПО и необходимостью адаптации под заказные системы. 3) Низкая полоса пропускания за пределами чипа (I/O), что затрудняет высокоскоростное масштабирование и создание кластеров, делая его "изолированным" решением.

QКакие три пути исследуют крупные технологические компании для решения проблемы высокой пропускной способности и низкой задержки в инференсе, угрожая позициям Cerebras?

AКрупные компании исследуют три параллельных пути: 1) Разработка собственных специализированных ASIC-чипов для инференса (например, Google TPU v8, Microsoft Maia). 2) Использование стандартных решений в области продвинутой упаковки, таких как SoW (System-on-Wafer) и CoWoS от TSMC, которые делают технологию склеивания кристаллов на уровне пластины общедоступной. 3) Прорыв в области оптических соединений и оптических вычислений, которые предлагают сверхвысокую пропускную способность и низкую задержку для преодоления ограничений электронных межсоединений.

QКак изменилась бизнес-модель Cerebras под давлением крупных заказов, и с какими вызовами она столкнулась?

AПод давлением крупных заказов от таких компаний, как OpenAI, Cerebras трансформировалась из производителя чипов в поставщика облачных услуг. Теперь компания обязана в сжатые сроки обеспечить и построить огромные объемы мощностей центров обработки данных. Согласно контрактам, ей необходимо ежегодно с 2026 по 2028 год вводить в эксплуатацию центры мощностью 250 МВт. Основная проблема заключается в том, что системы Cerebras требуют специализированных ЦОД с жидкостным охлаждением, и развертывание такой тяжелой инфраструктуры с длительным циклом строительства отстает от графика, требуемого контрактами.

Похожее

Stratosphere, Pudgy Penguins и Streamex провели VIP-ужин Founders Table во время ETHConf 2026 и NYC Tech Week

Нью-Йорк, 18 июня 2026 года, Chainwire. Стратосфера, Pudgy Penguins и Streamex провели закрытый VIP-ужин Founders Table в Нью-Йорке в рамках ETHConf 2026 и NYC Tech Week. Мероприятие собрало лидеров из сфер цифровых активов, технологий, ИИ, традиционных финансов и институционального капитала. Ужин состоялся 9 июня для отобранного круга основателей, операторов, фондов, топ-менеджеров и институциональных лидеров. Формат Founders Table предусматривает приватную атмосферу без формальной программы, чтобы способствовать естественному общению. Среди гостей были представители Citi, BitMine, BitGo, Mirae Asset Securities USA, Experian, Pyth Network и других компаний. Stratosphere предоставила сеть контактов, Pudgy Penguins — сильный потребительский бренд в цифровых активах, а Streamex — экспертизу в области токенизированных товарных рынков, таких как золото. Основатель Stratosphere Хассан Шейх отметил оптимизм относительно следующей фазы развития цифровых активов, особенно токенизации товаров. Серия ужинов Founders Table будет продолжена на других крупных конференциях, объединяя основателей, капитал и институции.

TheNewsCrypto11 мин. назад

Stratosphere, Pudgy Penguins и Streamex провели VIP-ужин Founders Table во время ETHConf 2026 и NYC Tech Week

TheNewsCrypto11 мин. назад

Панель ставок на Polymarket заработала благодаря коду, но Polymarket — не лучшее место для «арбитража»

В статье рассказывается о создании пользовательской панели мониторинга для платформы прогнозирования Polymarket, которая помогла автору достичь 30% доходности за несколько недель при стартовом капитале в $1600. Однако автор подчеркивает, что основная цель статьи — не продвижение Polymarket как источника легкой прибыли, а предупреждение о рисках и структурных ловушках этой платформы. Ключевые выводы автора: 1. **Polymarket — не место для арбитража.** Это рынок, где высока зависимость от интерпретации правил и информационного преимущества. Даже при высокой уверенности в исходе события всегда существует риск полной потери инвестиции в случае ошибки. 2. **Управление рисками и диверсификация важнее поиска «верных ставок».** * Автор внедрил систему классификации ставок по уровням уверенности (T1, T2, T3) с строгими лимитами на размер позиции для каждого уровня. * Важна **истинная диверсификация** по некоррелирующим темам (например, Восточная Азия, Ближний Восток, криптовалюты), а не просто участие во множестве рынков с общей базовой переменной. * Высокая вероятность успеха (например, 95%) не оправдывает крупную позицию, так как даже малая вероятность провала означает потерю 100% вложенных средств. 3. **Математическое ожидание и хвостовые риски.** Необходимо оценивать не только потенциальную доходность, но и разницу между личной оценкой вероятности и рыночной ценой, а также влияние потери всей позиции на общий портфель. 4. **Polymarket как тренировочный полигон.** Автор рассматривает платформу скорее как инструмент для тренировки аналитического мышления и дисциплины в условиях неопределенности, чем как источник стабильного дохода. В заключение, автор отмечает, что ценность созданной панели заключается не в подсчете прибыли, а в наложении строгих рамок управления капиталом и рисками на интуитивные решения, превращая разрозненные ставки в систематизированный процесс.

marsbit59 мин. назад

Панель ставок на Polymarket заработала благодаря коду, но Polymarket — не лучшее место для «арбитража»

marsbit59 мин. назад

Разбор роста Notion: от приложения для заметок до 100 миллионов пользователей — как Notion построил тройную маховик роста на основе продукта, шаблонов и сообщества

Notion — это уникальный пример роста SaaS-компании, который основан не на одной функции или агрессивном маркетинге, а на взаимосвязанной системе из трех «маховиков роста»: продукта, шаблонов и сообщества. Изначально Notion начинал как сложный инструмент для создания пользовательских рабочих пространств, но после перезапуска команда сосредоточилась на модульности и простоте. Это позволило превратить его в гибкую платформу, где пользователи могут комбинировать блоки для различных задач — от ведения заметок до управления проектами. Первый маховик — Product-Led Growth (PLG). Свободный план позволил быстро привлечь студентов, создателей и стартапы. Продукт обладает встроенными вирусными механиками: страницы и шаблоны легко делиться, а необходимость сотрудничества естественным образом приводит к приглашению новых пользователей. Второй маховик — экономика шаблонов. Высокая гибкость Notion может отпугнуть новичков. Шаблоны решают эту проблему, превращая абстрактные возможности в готовые решения для конкретных сценариев (планирование, учёба, управление контентом). Пользователи и создатели генерируют тысячи шаблонов, что расширяет экосистему, улучшает SEO и создаёт сообщество заинтересованных создателей. Третий маховик — сообщество. Пользователи делятся своими рабочими процессами, обучают других и формируют идентичность вокруг философии «лучших способов работы». Программа Ambassador помогает локализовать контент и проводить мероприятия по всему миру, превращая пользователей в активных евангелистов. Notion успешно перешёл от индивидуальных пользователей к корпоративному рынку благодаря стратегии «снизу вверх»: сотрудники сначала используют его неформально, а затем компании официально внедряют его для команд. В эпоху ИИ Notion интегрирует возможности искусственного интеллекта непосредственно в рабочие процессы (написание, суммирование, управление знаниями), что повышает ценность платформы и открывает новые сценарии использования. Секрет устойчивого роста Notion заключается не в отдельных функциях, а в целостной экосистеме, где продукт, пользовательский контент и сообщество взаимно усиливают друг друга, создавая значительные барьеры для конкурентов.

marsbit3 ч. назад

Разбор роста Notion: от приложения для заметок до 100 миллионов пользователей — как Notion построил тройную маховик роста на основе продукта, шаблонов и сообщества

marsbit3 ч. назад

Руководство по тестированию AI-карты WeChat: Наступила ли эпоха AI Shopping?

**Автор:** Alan | Команда Biteye **Дата:** 17 июня **Что это?** WeChat Pay представил «AI Special Card» — специальную карту для оплаты через ИИ-агентов, начиная с WorkBuddy. Это не отдельная карта, а изолированный «кошелёк» внутри WeChat Pay. Пользователи пополняют его с основного баланса, и платежи агентов списываются оттуда, а не с основных средств. **Как работает?** 1. Агент (например, WorkBuddy) инициирует платёж. 2. Пользователь сканирует QR-код для подтверждения в приложении WeChat. 3. Средства списываются с баланса AI-карты. 4. Основной счёт WeChat Pay не затрагивается. **Текущие возможности:** Платежи за цифровой контент, API, инструменты, подписки (хотя на практике найти такие сценарии сложно). **Тест: Заказ Bubble Tea через WorkBuddy (Неудача)** * WorkBuddy не может заказать напрямую, требуется вызов стороннего навыка (Skill), например, «Meituan Life Assistant». * Процесс требует авторизации в Meituan, что расходует много внутренних баллов WorkBuddy. * Агент успешно сгенерировал ссылку на оплату через AI Special Card, и платёж прошёл. * **Но:** Была куплена не та позиция (неправильный купон Meituan), а не конкретный напиток. **Вывод:** Проблема не в платежах, а в исполнении задачи агентом. AI Special Card решает только вопрос безопасного списания средств, но не гарантирует, что агент правильно поймёт запрос, выберет товар и выполнит заказ. Платёж остаётся под полным контролем пользователя. **Рекомендации:** Можно опробовать с небольшой суммой для цифровых услуг, но всегда проверяйте детали покупки перед подтверждением платежа.

marsbit3 ч. назад

Руководство по тестированию AI-карты WeChat: Наступила ли эпоха AI Shopping?

marsbit3 ч. назад

На 10 миллиардов долларов: Qualcomm покупает компанию легендарного инженера Jim Keller

По сообщениям, компания Qualcomm ведет переговоры о приобретении стартапа Tenstorrent, занимающегося разработкой ИИ-чипов, за 8-10 миллиардов долларов. Эта сделка может стать крупнейшим приобретением в области ИИ-чипов за последние годы. Tenstorrent, возглавляемый легендарным проектировщиком Джимом Келлером, известен своими разработками в области ускорителей ИИ и процессоров на архитектуре RISC-V. Для Qualcomm, чьи доходы сильно зависят от рынка смартфонов, эта покупка стала бы стратегическим шагом для диверсификации бизнеса, особенно в таких сферах, как центры обработки данных и облачные вычисления. Ключевым преимуществом Tenstorrent является его «анти-Nvidia» подход: компания использует более доступные компоненты, такие как GDDR6 и SRAM, вместо дорогой памяти HBM, а также стандартный Ethernet для соединения ускорителей. Это позволяет создавать высокопроизводительные вычислительные платформы по значительно более низкой цене. Кроме того, технология высокопроизводительных RISC-V CPU от Tenstorrent может предложить Qualcomm альтернативу архитектуре Arm, снизив зависимость от лицензионных соглашений. Разработки стартапа для автомобильного рынка (например, проект Alexandria) также хорошо сочетаются со стратегией Qualcomm в области автомобильных решений. Однако сделка вызывает вопросы из-за высокой оценки стартапа, рисков интеграции технологий и необходимости сохранения ключевой команды Tenstorrent. Аналитики предполагают, что оплата может быть частично привязана к будущим коммерческим успехам компании.

marsbit4 ч. назад

На 10 миллиардов долларов: Qualcomm покупает компанию легендарного инженера Jim Keller

marsbit4 ч. назад

Торговля

Спот

Фьючерсы

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на ERA (ERA) представлены ниже.

Преодолевая «стену памяти»: Революция на уровне пластины и маршруты вычислений в эпоху AI-инференса

Введение

Сущность Cerebras: вычислительная машина на основе SRAM с памятью рядом с ядром

Контр-интуиция: «истинные» и «ложные» недостатки крупночиповых решений на уровне пластины

Борьба направлений: собственные разработки крупных компаний, сколько осталось времени у Cerebras?

Забег на краю пропасти: бизнес и поставки Cerebras

Эпилог: Налево или направо?

Трендовые криптовалюты

Связанные с этим вопросы

Похожее

Stratosphere, Pudgy Penguins и Streamex провели VIP-ужин Founders Table во время ETHConf 2026 и NYC Tech Week

Панель ставок на Polymarket заработала благодаря коду, но Polymarket — не лучшее место для «арбитража»

Разбор роста Notion: от приложения для заметок до 100 миллионов пользователей — как Notion построил тройную маховик роста на основе продукта, шаблонов и сообщества

Руководство по тестированию AI-карты WeChat: Наступила ли эпоха AI Shopping?

На 10 миллиардов долларов: Qualcomm покупает компанию легендарного инженера Jim Keller

Торговля

Популярные статьи

Как купить ERA

Обсуждения

Топ вопросы

Популярные категории

Популярные теги