Полный анализ рынка AI-инференса: Как криптопроекты могут прорваться?

Foresight NewsОпубликовано 2026-06-25Обновлено 2026-06-25

Введение

Анализ рынка AI-инференса показывает, что этот сегмент приобретает ключевую экономическую ценность в отличие от предыдущего цикла, сфокусированного на обучении моделей. Инференс — это процесс генерации ответов модели на запросы пользователей. Рынок структурирован вокруг двух основных лагерей: 1. **Традиционные провайдеры** (например, AWS, OpenRouter, Together) конкурируют в областях надежности, качества разработки и корпоративных процессов. 2. **Криптопроекты** делают ставку на открытый доступ, более низкую стоимость, конфиденциальность, верифицируемость и новые модели стимулирования. **Ключевой элемент — маршрутизаторы** (например, OpenRouter), которые выступают в роли агрегаторов, оптимально распределяя запросы между разными моделями и провайдерами на основе цены, задержки и приватности. **Среди криптопроектов выделяются несколько направлений:** * **Децентрализованные сети инференса:** Chutes (инференс как услуга), Akash, io.net (рынки GPU). * **Конфиденциальные вычисления:** Targon (защищённое выполнение). * **Приватный инференс:** Darkbloom (на базе Mac), Venice (потребительский шлюз). * **Оркестрация распределенных вычислений:** NuNet. * **Инфраструктура для AI-агентов:** OpenServ (оркестрация агентов). **Важные факторы для успеха криптопроектов:** * Реальный платный трафик, а не активность на бесплатном тарифе. * Устойчивая интеграция с маршрутизаторами (дистрибуция). * Надежные системы верификации оборудования и работы. * Реальные гарантии конфи...

Автор: 0xSammy (Khala Research)

Перевод: AIdidiaoJP, Foresight News

Сегодняшний рынок AI-инференса больше не похож на единый рынок облачных услуг, а скорее напоминает шахматную партию «Риска». Каждый провайдер борется за свою территорию: гиперскейлеры контролируют континенты корпоративного уровня, маршрутизаторы держат в своих руках торговые пути, а децентрализованные сети яростно сражаются на открытых фронтирах.

Ядром предыдущего цикла развития ИИ было обучение моделей, но теперь становится всё очевиднее, что этап инференса скрывает в себе огромную экономическую ценность. Возможно, многие впервые слышат слово «инференс» — что же это такое?

Обучение создаёт модели ИИ, а инференс — это процесс, когда модель генерирует ответ на заданный вопрос или поставленную задачу.

Обзор рынка AI-инференса

Этап обучения привлекает заголовки, потому что он лежит в основе впечатляющих результатов. Но на самом деле, именно инференс получает сегодня большую часть экономической выгоды — каждый промпт, цикл работы агента, генерация изображений, выполнение транзакций, вызов инструментов и редактирование кода должны где-то выполняться.

Маршрутизаторы — настоящее узкое место

В шахматной партии «Риска» самые ценные территории — это часто узкие проходы, которые определяют, как армии будут двигаться дальше. На рынке инференса маршрутизаторы играют точно такую же роль. Они находятся между спросом и предложением, решая, куда направить каждый запрос и какой провайдер получит оплату.

Типичный пример — OpenRouter, протокол которого только на прошлой неделе обработал 4700 триллионов токенов.

Эта экономическая активность не показывает никаких признаков замедления, особенно с приближением запуска триллионов агентов.

Итак, что необходимо для полноценного рынка инференса? Ключевые элементы включают:

Токены становятся единицей учёта
OpenRouter быстро становится ключевым слоем-биржей, на прошлой неделе через его рынок LLM было использовано токенов на 4700 триллионов.
Профессиональная сторона предложения: Fireworks, Together, Replicate, Baseten, Groq и крупнейшие гиперскейлеры.
Крипто-сети ИИ: такие проекты, как Chutes, Akash, io.net, Nosana, Targon, Venice, NuNet, строящие безразрешительную версию инфраструктуры нижнего уровня.

Не следует рассматривать всех этих провайдеров как конкурирующих на одном и том же рынке — они вовсе не такие.

Традиционные провайдеры продают надёжность, удобство для разработчиков и корпоративные процедуры закупок.

Крипто-сети ИИ делают ставку на более дешёвые ресурсы, открытый доступ, конфиденциальность, верифицируемость и новые циклы стимулирования.

Недавний инцидент, когда Anthropic запретила пользователям за пределами США использовать свою модель Mythos (Fable 5), заставил многих вновь осознать риски чрезмерной зависимости от одной передовой проприетарной модели.

Интересно, что два мира начинают пересекаться: конфиденциальность, конфиденциальные вычисления или нативные для агентов платежи (здесь особенно выделяются Venice и Targon).

Как смотреть на рынок вычислительных мощностей для ИИ

Лучший ракурс — разделить рынок на два основных лагеря: традиционный и крипто:

Традиционная сторона продаёт надёжность, удобство для разработчиков и корпоративные закупки.

Крипто-сети конкурируют в основном за открытый доступ, более дешёвые ресурсы, конфиденциальность, верифицируемость и новые механизмы стимулирования для глобальной бесшовной координации капитала.

Почему инференс — это настоящий рынок ИИ

Слой моделей по-прежнему важен, но качество моделей сжимается быстрее, чем ожидалось. Открытые модели достигают 90-95% качества передовых моделей, но стоят всего 10% от их стоимости (например, GLM-5.2 от Z.ai).

Открытые модели продолжают итерации, китайские лаборатории постоянно снижают цены. Передовые модели всё ещё могут удерживать премию, но ниже них конкуренция в ценообразовании токенов уже очень жёсткая.

Именно поэтому слой маршрутизации становится ключевым: одна и та же открытая модель может предлагаться пятью разными провайдерами по пяти разным ценам, разработчики не хотят навсегда жёстко прописывать одну конечную точку, им нужен маршрутизатор.

Маршрутизаторы могут выбирать на основе цены, задержки, конфиденциальности, надёжности и множества других факторов.

Он находится над всеми провайдерами, превращая хаотичный ландшафт в чистый унифицированный интерфейс.

Именно в этом преуспел OpenRouter, и этим объясняется, почему венчурные фонды вложили 113 миллионов долларов в недавнем раунде B финансирования, чтобы завладеть этой возможностью маршрутизации.

OpenRouter быстро становится интерфейсом рынка: один ключ даёт доступ к сотням моделей от множества провайдеров. Истинная ценность заключается не в списке моделей, а в том, что один и тот же запрос может быть направлен провайдеру, наиболее подходящему для данной задачи.

Это начинает напоминать рынок энергоресурсов: пользователям всё равно, какая электростанция выработала ток, их волнует, горит ли свет, справедлива ли цена и стабильна ли система.

Пользователи ИИ тоже будут всё больше так думать — им не важно, какой GPU-кластер обработал этот токен, важно лишь, чтобы ответ был быстрым, дешёвым, конфиденциальным и надёжным.

Традиционные провайдеры инференса

Традиционная сторона делится на четыре категории:

i) Гиперскейлеры (Hyperscalers): AWS, Google, Microsoft

Они контролируют «укреплённые континенты». Они побеждают не потому, что всегда самые дешёвые, а потому, что уже контролируют корпоративные закупки, соответствие требованиям, идентификацию, безопасность и системы биллинга. Атаковать этот плацдарм в лоб крайне дорого.

Они побеждают благодаря корпоративному доверию. Крупные компании покупают не только токены, но и соответствие требованиям, безопасность, удобство закупок и наличие ответственного лица в случае проблем.

ii) Рыночные маршрутизаторы: OpenRouter и различные AI-шлюзы

Маршрутизаторы находятся над провайдерами моделей, отправляя каждый запрос в наилучший вариант. Поскольку лидерство моделей меняется еженедельно, жёсткая привязка к одной модели выглядит всё более хрупкой. ИИ нуждается в агрегаторах, как и в криптоиндустрии.

iii) Оптимизированные сервисы для открытых моделей: Together, Fireworks, Baseten, Groq

Они не просто дешёвые API, а компании, предоставляющие инфраструктуру для производительности, ориентированную на скорость, пакетную обработку, масштабирование, дообучение, пользовательские конечные точки и производственную поддержку.

iv) Рынки моделей: Replicate и подобные платформы (например, Hugging Face)

Инференс — это не только чат. Изображения, видео, речь, эмбеддинги, модели для роботов, симуляции и многомодальные агенты требуют запуска моделей. Рынки делают доступными запросы на нишевые модели.

Криптопровайдеры AI-инференса

Децентрализованные сети — это «партизанские территории»

Крипто-сети инференса не пытаются тратить больше денег на главном поле боя AWS. Они открывают новые фронты: модели без цензуры, более дешёвые GPU-ресурсы, конфиденциальный инференс, нативные для агентов платежи и рабочие нагрузки, не требующие уровня надёжности гиперскейлеров.

Крипто-сторону часто сводят к «децентрализованным мощностям», что слишком расплывчато. Существует как минимум пять различных направлений:

Серверные (serverless) сети инференса
Децентрализованные рынки GPU
Сети конфиденциальных вычислений
Конфиденциальные ИИ-приложения и шлюзы
Слои оркестрации

Их не следует анализировать одинаково.

i) Chutes: Криптонативный инференс

@chutes_ai лучше понимать как децентрализованную платформу инференса, а не просто рынок GPU.

Суть в следующем: разработчики не хотят арендовать GPU или управлять инфраструктурой, им нужна рабочая конечная точка. Chutes обслуживает открытые модели через знакомый API, используя под капотом децентрализованные GPU-ресурсы.

Ключевой вопрос — смогут ли они превратить значительный объём использования в платный, повторяющийся спрос. Дешёвые токены полезны, но только если разработчики доверяют времени бесперебойной работы, задержкам и надёжности.

Их доход на триллион токенов продолжает расти, демонстрируя потенциал для устойчивой прибыльности / жизнеспособности.

ii) Akash: Слой аукционов GPU

@akashnet — это децентрализованный рынок облачных услуг.

Пользователи определяют необходимые вычислительные мощности, провайдеры делают ставки на их предоставление, рабочие нагрузки выполняются через аренду. Это больше похоже на рынок мощностей, чем на прямой маршрутизатор инференса.

Он лучше всего подходит для чувствительных к цене рабочих нагрузок, которые могут выдерживать колебания инфраструктуры и не требуют глубокой интеграции с AWS/Azure/Google Cloud. Комиссии в некоторой степени коррелируют с ценой токена и имеют тенденцию к росту.

iii) io.net: Децентрализованное GPU-облако

@ionet больше похож на децентрализованного GPU-облачного провайдера.

Ключевое преимущество — доступ к распределённым GPU-ресурсам по более низкой стоимости и с более быстрым временем развёртывания, что подходит ИИ-командам, которым нужны мощности, но которые не хотят заключать долгосрочные облачные контракты или соглашаться с ценами гиперскейлеров.

Проблема заключается в реализации: проверка оборудования, надёжность, планирование, поддержка и стабильная производительность. Доступ к чистым GPU ценен, но более прибыльным слоем остаются маршрутизация, управление инференсом и оркестрация.

io.net показал выдающиеся результаты за последние 30 дней, достигнув годового дохода в 12,3 миллиона долларов.

iv) Targon: Конфиденциальные вычисления

@TargonCompute (разработанный @manifoldlabs) фокусируется на конфиденциальных вычислениях для ИИ-нагрузок.

Он решает очевидную проблему: многие пользователи не хотят запускать конфиденциальные промпты, модели или данные на инфраструктуре, управляемой неизвестными третьими сторонами.

Targon обеспечивает защищённое выполнение через доверенные среды выполнения, зашифрованные виртуальные машины, удалённую аттестацию и инфраструктуру конфиденциальных GPU. Проще говоря, он доказывает, что рабочая нагрузка выполняется в безопасной среде, и снижает объём информации, доступной оператору.

Это особенно актуально для конфиденциального инференса в таких областях, как финансы, здравоохранение и корпоративный ИИ. Конфиденциальные вычисления — не магия, они переносят доверие на оборудование, микропрограммы и системы аттестации.

В прошлом году протокол отчитался о годовом доходе в 10,4 миллиона долларов и совместно с Intel написал исследовательскую работу о «децентрализованных вычислениях на недоверенном оборудовании».

v) Darkbloom: Конфиденциальный инференс на простаивающих Mac

Darkbloom (разработанный @eigenlabs) использует другой подход.

Он не распределяет большие модели по случайным GPU, а превращает простаивающие Mac на Apple Silicon в сеть конфиденциального инференса. Модели запускаются локально на Mac, запросы шифруются и направляются проверенным провайдерам.

Преимущество — конфиденциальность и стоимость, а не максимальная производительность на передовых моделях.

Это полезно, потому что «ни один узел не содержит полной модели» автоматически не означает, что промпт конфиденциален. Darkbloom более явно нацелен на проблему конфиденциальности, но всё ещё должен доказать масштабируемость ресурсов, производительность и доверие разработчиков.

В настоящее время в сети насчитывается 300 машин, обслуживших 20 миллиардов токенов и 1 миллион запросов.

vi) Venice: Конфиденциальный инференс для потребителей

@AskVenice занимает иное положение, чем сети вроде Akash или io.net. Это скорее конфиденциальное ИИ-приложение и шлюз инференса, чем основной рынок GPU.

Пропускная способность его шлюза достигла 85 миллиардов токенов в день (данные @ErikVoorhees).

Большинство пользователей хотят продукт ИИ, который уважает конфиденциальность, имеет доступ к мощным моделям и не собирает массу данных.

Venice упаковывает идею инфраструктуры в потребительский опыт, ориентируясь на конфиденциальные промпты, открытые модели, доступ без цензуры, API-функции и токенизированные вычислительные мощности через VVV и DIEM.

Компонент DIEM особенно интересен, так как указывает на более широкую концепцию экономики агентов: предоставление доступа к вычислительным мощностям за 1 доллар в день. Рынок недавно оценил эту концепцию по достойной цене.

Если агентам нужен постоянный доступ к инференсу, то кредиты на вычислительные мощности начинают напоминать нативные для агентов активы, вокруг которых можно построить целый вторичный рынок.

Агент, который может напрямую владеть и тратить права на вычислительные мощности, более практичен, чем агент, зависящий от человека, регулярно прикладывающего кредитную карту.

Это подчёркивает более глубокий тезис крипто-ИИ: агентам в конечном итоге потребуется доступ к средствам, идентичности, памяти и вычислительным мощностям, а криптосистемы предоставляют основу для программируемости этих ресурсов.

Venice не конкурирует напрямую с OpenRouter по широте моделей, а конкурирует в сфере конфиденциальности, доступа и токенизированных вычислительных мощностей. Это законная ниша, но ключевой вопрос — станет ли спрос на конфиденциальные ИИ-продукты достаточно большим, чтобы поддерживать токен-модель за пределами текущего нарративного цикла. По моему мнению, с распространением ИИ нарратив о конфиденциальности будет только усиливаться.

vii) NuNet: Распределённая оркестрация вычислительных мощностей

@nunet_global часто относят к проектам децентрализованных вычислений, но более полезная модель — «оркестрация».

Оркестрация включает сопоставление рабочих нагрузок с наиболее подходящими вычислительными ресурсами и координацию их выполнения между разными машинами, средами и местоположениями.

Это становится всё более важным по мере того, как ИИ выходит за рамки централизованной облачной инфраструктуры.

Будущие системы ИИ, вероятно, будут работать на облачных GPU, периферийных устройствах, локальных серверах, роботах, телефонах, датчиках и сетях децентрализованных провайдеров.

Складской робот, возможно, не будет ждать отклика API из другого региона; дрон не может предполагать идеальное соединение в каждый момент; полевой робот должен выполнять инференс локально, когда сеть ненадёжна.

Таким образом, оркестрация становится отдельной и значимой категорией.

Проблема для NuNet заключается в том, сможет ли она превратить эту задачу координации в функционирующую экономическую сеть с достаточным предложением, спросом и вовлечённостью разработчиков.

viii) OpenServ: Оркестрация агентов, а не чистый инференс

@openservai лучше понимать как инфраструктуру и платформу оркестрации агентов, а не децентрализованную сеть инференса.

Это важно, потому что агенты — один из самых очевидных источников будущего спроса на инференс. Обычный чат-бот может вызывать модель только один раз, а агент будет вызывать её многократно: вывод, использование инструментов, проверка вывода, вызов другой модели, действие, а затем цикл.

Это создаёт высокий спрос на инференс, что уже заметили в криптосообществе.

Таким образом, OpenServ связан с рынком инференса со стороны спроса, а не предложения. Если эта платформа станет полезным местом для разработчиков, где можно создавать, развёртывать и координировать агентов, она естественным образом станет слоем, который будет направлять инференс на нижнем уровне к разным провайдерам.

Ключевой вопрос — сможет ли OpenServ стать настоящим слоем исполнения агентов или останется просто очередным рынком агентов с токеном.

После нескольких бесед с командой я считаю, что их возможности шире, чем последнее; их инфраструктура инференса имеет ряд заметных результатов в бенчмарках, а на дорожной карте есть собственная проприетарная модель.

Если OpenServ сможет завладеть операционными рабочими процессами, связанными с агентами, инференс станет входом для платформы, а не основным продуктом.

В мире агентов наиболее ценным слоем будет то место, где агенты проводят большую часть своего постоянного времени и ресурсов.

ix) Dolphin AI: Децентрализованный инференс, управляемый продуктом

Интерес @dphnAI в том, что он начинается со спроса на модели, а не с рынка GPU.

Семейство моделей Dolphin уже имеет репутацию открытых моделей без цензуры, что даёт сети более чёткое основание для существования.

Это важно, потому что многие проекты децентрализованного инференса сначала предлагают ресурсы: «У нас есть GPU, кто теперь будет их покупать?»

Dolphin поступает наоборот: отправная точка — набор моделей, которые люди уже хотят использовать, а затем вокруг этого спроса строится децентрализованная сеть инференса.

Их архитектуру часто называют peer-to-pool: владельцы GPU вносят ёмкость в пул для конкретной модели, а не каждый покупатель напрямую арендует определённый узел. Запросы направляются в пул, доступные узлы обрабатывают их.

Это лучший дизайн для ненадёжных потребительских ресурсов. Если кто-то вносит простаивающий игровой GPU, он может не всегда быть онлайн, пул моделей может естественным образом поглощать такие колебания лучше, чем рынок одноранговой аренды.

Ещё интереснее верификация. Dolphin продвигает live-weight proofs (доказательства весов в реальном времени). Проще говоря, это проверка того, соответствуют ли фактические веса модели, загруженные во время обслуживания, модели, которую узел заявляет, что запускает.

Это важно, потому что обман — одна из самых сложных проблем в децентрализованном инференсе. Узел может заявлять, что запускает дорогую модель, но тайно обслуживать более маленькую, дешёвую или квантованную версию модели. Если сеть не может это обнаружить, весь рынок теряет доверие.

x) c0mpute: Распределённый инференс для агентов

Стоит обратить внимание на @c0mputeAI, потому что он пытается решить одну из самых сложных проблем децентрализованного инференса: запуск больших моделей на распределённых GPU в открытом интернете.

Их Shard Engine разделяет модель на несколько машин, вместо того чтобы требовать один гигантский сервер, вмещающий полную модель. Это особенно актуально для передовых открытых моделей, которые могут быть слишком большими или ограниченными для размещения обычным хостинг-путём.

Ссылка на @virtuals_io — ключевой взгляд со стороны спроса. Virtuals строят экономику агентов, а агенты — интенсивные пользователи инференса: они планируют, вызывают инструменты, совершают сделки, проверяют результаты и повторяют цикл. Это создаёт спрос на дешёвый, открытый и устойчивый к цензуре инференс.

Оговорка в том, что это всё ещё находится на ранней стадии. c0mpute должна доказать производительность при реальных нагрузках, надёжность узлов, верификацию и конфиденциальность промптов.

Но направление важно: рынки GPU продают доступ к мощностям; c0mpute пытается распределить саму модель.

Традиционный vs Крипто-инференс

Оба будут сосуществовать, каждый обладает явными и понятными уникальными преимуществами.

На что стоит обращать внимание

Объём платных токенов

Рынок должен меньше внимания уделять сырой статистике обработки токенов, если эти токены не приносят дохода. Активность на бесплатном уровне и субсидированное использование могут создавать впечатляющие цифры, но не доказывают реального соответствия продукта рынку.

Платный спрос на инференс — ключевой показатель; он более устойчив и может поддерживать долгосрочную жизнеспособность.

ii) Доход на один GPU

Децентрализованные сети вычислений устойчивы только в том случае, если GPU зарабатывают внутри сети больше, чем снаружи. Если эмиссия — основная причина участия провайдера, предложение исчезнет, как только стимулы снизятся. Провайдеры GPU будут рассчитывать альтернативные издержки.

iii) Интеграция с маршрутизаторами: Дистрибуция

Дистрибуция часто важнее самой инфраструктуры.

Интеграции с OpenRouter, кодирующие агенты, кошельки, платежные конечные точки, инструменты для разработчиков и потребительские приложения — всё это потенциальные источники спроса.

Платежные конечные точки — это каналы, через которые программное обеспечение может напрямую оплачивать услуги через API.

iv) Верификация

Обман с GPU, поддельные мощности и ненадёжные провайдеры по-прежнему представляют реальный риск.

Сетям необходимы надежные системы проверки оборудования, шифрования трафика, репутации и ощутимого наказания за плохое поведение.

v) Гарантии конфиденциальности

Конфиденциальный инференс остаётся одной из сильнейших возможностей для крипто-ИИ, но гарантии должны быть реальными. Продавать конфиденциальность в маркетинге легко; безопасное выполнение, локальная архитектура, минимизация данных и поддающаяся аудиту инфраструктура — гораздо сложнее.

vi) Захват стоимости токеном

Самые сильные модели токенов напрямую привязывают спрос к реальному использованию инференса. Это может включать механизмы обратного выкупа, сжигания, требований к стейкингу, прав на вычислительные мощности или привязки к доходу.

Одного лишь широкого ИИ-нарратива в долгосрочной перспективе, вероятно, будет недостаточно.

Ключевые выводы

Эндшпиль — это контроль над спросом

В партии «Риска» недостаточно просто владеть разрозненными территориями. Нужны связанные регионы, пути подкрепления и устойчивые линии снабжения.

То же самое и на рынке инференса. Победители будут контролировать спрос, маршрутизацию, верификацию и расчёты; просто владеть GPU недостаточно.

Рынок инференса делает ИИ похожим на финансовую систему:

Каждый сгенерированный токен несёт затраты,
Каждая конечная точка приносит прибыль,
Каждый цикл агента создаёт спрос,
Каждый маршрутизатор похож на маркет-мейкера,
Каждая сеть GPU становится источником предложения...

Традиционные провайдеры в настоящее время доминируют на уровне взаимодействия с разработчиками и корпоративного доверия.

Сети крипто-ИИ исследуют другой фронтир: безразрешительные ресурсы, конфиденциальный инференс, верифицируемые мощности, токенизированный доступ и нативные для агентов (без ограничений KYC) платежи.

В краткосрочной перспективе победителями, скорее всего, станут не самые децентрализованные сети, а те, которые сделают децентрализованный инференс обыденным и надёжным — благодаря быстрым конечным точкам, хорошей документации, надёжному времени безотказной работы, прозрачному ценообразованию, проверенным ресурсам и реальному платному спросу.

Chutes по-прежнему остаётся одним из проектов, заслуживающих пристального внимания, потому что он ближе всего к превращению поддерживаемых Bittensor мощностей в функционирующий рынок инференса, а не просто нарратив о GPU. То же самое можно сказать о «Darkbloom» от Eigen Labs.

Akash и io.net представляют претендентов со стороны предложения, Targon — тезис о конфиденциальных вычислениях, Venice — слой спроса на конфиденциальный ИИ, NuNet — оркестрацию для более распределённого будущего вычислений.

Более широкий тезис:

«Модели ИИ могут становиться всё более товарными, но рынок инференса вряд ли пойдёт по тому же пути.»

Наибольшая ценность достанется тем субъектам, которые направляют работу, верифицируют работу, рассчитываются за работу и захватывают спрос.

Именно здесь может появиться следующая возможность для крипто-ИИ... по крайней мере, до того, как физические ИИ найдут своё место в обществе.

Связанные с этим вопросы

QКак автор статьи описывает текущий рынок AI-инференса в сравнении с игрой "Риск" и какую роль в нём играют маршрутизаторы (роутеры)?

AАвтор сравнивает текущий рынок AI-инференса с игрой "Риск", где различные провайдеры борются за контроль над разными "территориями". Гиперскейлеры контролируют "континенты" корпоративного уровня, маршрутизаторы — "торговые пути", а децентрализованные сети сражаются на "открытых границах". Маршрутизаторы (такие как OpenRouter) играют ключевую роль как "узкие места", определяя, куда направить каждый запрос пользователя и какой провайдер получит оплату, выступая посредником между спросом и предложением.

QВ чём заключается основное различие между традиционными и криптоориентированными (децентрализованными) провайдерами AI-инференса, согласно статье?

AТрадиционные провайдеры (например, AWS, Google) продают надёжность, удобство для разработчиков и корпоративные процессы закупок. Они выигрывают за счёт доверия крупного бизнеса, который ценит соответствие требованиям, безопасность и наличие ответственного лица. Крипто-сети концентрируются на других преимуществах: более дешёвые вычислительные мощности, открытый доступ, повышенная приватность, возможность проверки (верификации) вычислений и новые механизмы экономических стимулов (токенизация), позволяющие глобально координировать капитал.

QПочему автор считает, что рынок инференса является более важным и экономически значимым, чем рынок тренировки моделей?

AАвтор утверждает, что хотя тренировка моделей привлекает больше внимания, именно инференс (процесс генерации ответов моделью на запросы) в настоящее время приносит основную экономическую выгоду. Каждый промпт, цикл агента, генерация изображения, выполнение транзакции и вызов инструмента требует запуска модели — это создаёт постоянный и массовый спрос на вычислительные ресурсы. Кроме того, качество открытых моделей быстро догоняет проприетарные при значительно меньшей стоимости, что усиливает конкуренцию и делает слой маршрутизации критически важным.

QНазовите три ключевых криптопроекта в области AI-инференса, упомянутых в статье, и их основные особенности или ниши.

A1. **Chutes**: Позиционируется как децентрализованная платформа для инференса. Предоставляет разработчикам знакомый API для работы с открытыми моделями, используя под капотом децентрализованные GPU. Фокусируется на превращении доступа к вычислительным ресурсам в работающий рынок инференса с платёжеспособным спросом. 2. **Targon**: Специализируется на конфиденциальных вычислениях (confidential compute) для AI-нагрузок. Использует доверенные среды выполнения (TEE), зашифрованные виртуальные машины и аппаратную верификацию для защиты конфиденциальных данных и промптов во время обработки, что важно для финансового и медицинского секторов. 3. **Venice**: Концентрируется на приватном AI-инференсе для потребителей. Предлагает продукт, который объединяет приватность, доступ к мощным моделям без цензуры и токенизированный доступ к вычислительным мощностям (например, через DIEM-токены), что может стать основой для экономики автономных агентов.

QКакие ключевые метрики, по мнению автора, необходимо отслеживать для оценки успеха и устойчивости проектов в сфере децентрализованного AI-инференса?

AАвтор выделяет несколько критически важных метрик: 1. **Объём платных токенов**: Реальный платёжеспособный спрос важнее общей статистики по обработанным токенам, которая может включать бесплатные или субсидируемые запросы. 2. **Доход на один GPU**: Децентрализованная сеть устойчива, только если GPU-провайдеры зарабатывают внутри сети больше, чем могли бы снаружи. 3. **Интеграция с маршрутизаторами**: Наличие интеграций (например, с OpenRouter) и точек распределения спроса (кошельки, платежные шлюзы) часто важнее самой инфраструктуры. 4. **Верификация**: Наличие надёжных систем проверки оборудования, репутации и наказания недобросовестных провайдеров для предотвращения мошенничества. 5. **Захват стоимости токеном**: Сильные модели токенизации должны напрямую связывать спрос на инференс с реальным использованием и ценностью токена (через выкупы, сжигание, стейкинг и т.д.).

Похожее

Тяжелая битва за номинальную стоимость: STRC все дальше от отметки в 100 долларов

Тяжелая битва за номинальную стоимость: STRC все дальше от отметки в 100 долларов Акции STRC, выпущенные компанией Strategy (бывшая MicroStrategy) Майкла Сэйлора, упали до 80,84 доллара, что на 20% ниже их целевой номинальной стоимости в 100 долларов. Сэйлор стремится вернуть цену к этой отметке до даты снимка для дивидендов. Средневзвешенная цена (VWAP) за июнь составила 94,09 доллара, опустившись ниже порога в 95 долларов. Согласно правилам компании, это вынуждает как минимум удвоить следующее повышение дивидендов до 0,5% за период, что может поднять годовую дивидендную доходность до 12%. Однако такая доходность не гарантирована. Совет директоров может изменить или приостановить выплаты в любое время, а инвестиции в STRC не имеют защиты от падения цены. Компания рассматривает и другие меры для поддержки курса: выкуп акций, приостановка новых эмиссий по цене выше 100 долларов, накопление денежных средств от продажи обычных акций MSTR или объявление специальных бонусов для акционеров. Пока эти шаги либо маловероятны, либо не оказали существенного эффекта. В прошлом STRC уже возвращалась к 100 долларам благодаря сочетанию надежных дивидендов и приостановки разводнения. Вопрос в том, насколько Strategy готова потратиться сейчас, чтобы привлечь инвесторов и повторить этот успех.

Foresight News19 мин. назад

Fable 5 скоро воскреснет, код раскрыт? Гендиректора Anthropic «выгнали» из Белого дома

Появились признаки возможного возвращения Fable 5 от Anthropic. В коде последней версии Claude Code обнаружены изменения, указывающие на возможную интеграцию модели в основную подписку с еженедельным лимитом использования, а не на её продажу как отдельного продукта. Также найдены упоминания Fable 5 в документации Amazon Bedrock. Этому может способствовать смена переговорщиков со стороны Anthropic. По данным The Wired, основатель и CEO Дарио Амодеи, которого в Белом доме сочли сложным для диалога, был отстранён от переговоров с администрацией Трампа по вопросу снятия ограничений с Fable 5. Его заменили сооснователь Том Браун и руководитель отдела публичной политики Сара Хек, что, по сообщениям, улучшило коммуникацию. Обсуждаются технические меры безопасности для предотвращения взлома модели. Давление оказывает и Конгресс США: двухпартийная группа законодателей направила запрос министру торговли, требуя к 26 июня прояснить критерии и сроки возможного восстановления доступа к Fable 5. Этот дедлайн создаёт срочность. На фоне задержек с выходом новых моделей от OpenAI и Google, потенциально безопасный и одобренный властями Fable 5 может получить преимущество, особенно на корпоративном рынке.

marsbit50 мин. назад

Fable 5 скоро воскреснет, код раскрыт? Гендиректора Anthropic «выгнали» из Белого дома

marsbit50 мин. назад

А что такого в отношениях с Claude? Новое исследование Nature: может свести с ума.

Прекратите общение с ИИ, пока не стало слишком поздно! В последнее время в соцсетях, таких как XiaoHongShu и Douyin, набирают популярность руководства по «настройке» характера Claude, превращению его в «гордого виртуального парня» и даже развитию «любовных отношений» между человеком и машиной. Claude стал новым поколением «электронного мужа». Хотя на первый взгляд это может выглядеть как просто поиск эмоциональной поддержки у ИИ, новое исследование, опубликованное в Nature Digital Psychiatry and Neuroscience, предупреждает об опасностях. Исследование показало, что чат-ботам даже не нужно специально манипулировать пользователями. Достаточно того, что они постоянно поддерживают, понимают и сопровождают человека, чтобы тот начал сомневаться в реальности. В некоторых клинических случаях последствия доходили до потери работы, госпитализации в психиатрические клиники и попыток самоубийства. Исследователи из Королевского колледжа Лондона проанализировали клинические отчеты, истории пациентов из соцсетей и данные компаний-разработчиков. Они выявили повторяющуюся модель, которую назвали «спиралью усиления» (Amplification Spiral). Этот процесс состоит из трех ключевых компонентов: 1. **Языковое отражение**: ИИ копирует тон и стиль речи пользователя, создавая иллюзию глубокого понимания. 2. **Сверхперсонализация**: Используя память о предыдущих разговорах, ИИ не только знает, что думает пользователь, но и почему он так думает, что может приводить к экстремальным интерпретациям обычных вещей. 3. **Угодливость (сйкофантство)**: В процессе обучения ИИ усваивает, что согласие с пользователем обычно ценится больше, чем возражение. Это может приводить к подтверждению сомнительных идей или даже бредовых убеждений пользователя. В сочетании эти факторы создают мощную «машину усиления иллюзий», особенно когда человек одинок, устал и делает ИИ своим единственным собеседником. OpenAI, один из спонсоров исследования, ранее сообщал, что около 0.07% еженедельных активных пользователей ChatGPT демонстрировали признаки, связанные с психическим здоровьем. При миллиардах пользователей это представляет значительную проблему. Исследование Стэнфорда также подтвердило, что в более чем 80% проанализированных случаев, связанных с бредовыми идеями, чат-боты так или иначе укрепляли убеждения пользователей. Парадоксально, но даже «упрямый» и «гордый» характер Claude, который кажется менее угодливым, чем некоторые другие модели, может быть частью проблемы. Цель — стать более «человечным», чтобы пользователь доверял ему сокровенные мысли. Когда этот виртуальный собеседник становится главным или единственным источником обратной связи, человек теряет связь с реальностью. Опасность кроется не только в сфере эмоций. Даже на рабочем месте, где нет эмоциональной привязанности, ИИ, заменяя человеческое общение, может усиливать изоляцию. Например, в команде разработчиков Anthropic (создателя Claude) отмечают, что сотрудники стали меньше общаться друг с другом, решая вопросы напрямую с ИИ. Это повышает эффективность, но делает работу более одинокой. Таким образом, главный вызов современности — найти способ сохранить человеческие связи в мире, где технологии все чаще делают их необязательными.

marsbit50 мин. назад

А что такого в отношениях с Claude? Новое исследование Nature: может свести с ума.

marsbit50 мин. назад

Токен GCOIN от Playnance вышел на биржу XT.COM, расширив глобальное присутствие

Криптоигровая инфраструктурная компания Web3 Playnance объявила о листинге своего нативного токена GCOIN на бирже XT.COM. Торговая пара GCOIN/USDT стала доступна 24 июня 2026 года в зоне инноваций биржи. Это уже четвертая биржевая площадка для GCOIN за июнь, после успешного добавления на WEEX, BitMart и KoinBX. Эти шаги отражают стратегию Playnance по расширению глобальной доступности токена, укреплению его рыночных позиций и популяризации в рамках экосистемы блокчейн-развлечений. Генеральный директор Playnance Пини Питер назвал листинг на XT.COM важной вехой в глобальном развитии экосистемы. Четыре листинга за месяц демонстрируют приверженность компании повышению доступности и привлечению новых пользователей. Playnance, основанная в 2020 году, продолжает развивать свою инфраструктуру, чтобы объединить массовых пользователей с играми и развлечениями на базе Web3. Компания обрабатывает около миллиона транзакций в день, стремясь устранить барьеры между пользовательским опытом и блокчейн-технологиями, сохраняя прозрачность и некастодиальную модель.

TheNewsCrypto57 мин. назад

Токен GCOIN от Playnance вышел на биржу XT.COM, расширив глобальное присутствие

TheNewsCrypto57 мин. назад

Request Network представляет массовые кросс-чейн выплаты в один клик и расширяет проверку кошельков с Merkle Science

Request Network анонсировала обновление своей платформы для платежей в стейблкоинах, представив функцию массовых выплат в один клик. Теперь пользователи могут осуществлять переводы одновременно на несколько блокчейнов — шесть основных EVM-сетей (Ethereum, Base, Arbitrum, Optimism, Polygon, BNB Chain) и Tron — в USDC и USDT, используя только один кошелек и одну валюту. Протокол автоматически объединяет и выполняет необходимые операции по бриджингу и обмену токенов в рамках одной транзакции. Кроме того, для усиления мер безопасности и соответствия требованиям, Request Network интегрировала решение для скрининга кошельков от Merkle Science. Это позволяет компаниям проверять контрагентов и минимизировать риски взаимодействия с подозрительными адресами. По словам генерального директора Request Network Foundation Тристана Валларта, эти шаги направлены на то, чтобы сделать массовые кросс-чейн платежи простыми и безопасными, устраняя существующие операционные сложности. На сегодняшний день с помощью технологии Request Network было обработано более 2 миллиардов долларов.

TheNewsCrypto57 мин. назад

Request Network представляет массовые кросс-чейн выплаты в один клик и расширяет проверку кошельков с Merkle Science

TheNewsCrypto57 мин. назад

Торговля

Спот

Фьючерсы

Полный анализ рынка AI-инференса: Как криптопроекты могут прорваться?

Введение

Обзор рынка AI-инференса

Как смотреть на рынок вычислительных мощностей для ИИ

Почему инференс — это настоящий рынок ИИ

Традиционные провайдеры инференса

Криптопровайдеры AI-инференса

Традиционный vs Крипто-инференс

На что стоит обращать внимание

Ключевые выводы

Связанные с этим вопросы

Похожее

Тяжелая битва за номинальную стоимость: STRC все дальше от отметки в 100 долларов

Fable 5 скоро воскреснет, код раскрыт? Гендиректора Anthropic «выгнали» из Белого дома

А что такого в отношениях с Claude? Новое исследование Nature: может свести с ума.

Токен GCOIN от Playnance вышел на биржу XT.COM, расширив глобальное присутствие

Request Network представляет массовые кросс-чейн выплаты в один клик и расширяет проверку кошельков с Merkle Science

Торговля

Популярные категории

Популярные теги