Полный анализ рынка AI-инференса: Как криптопроекты могут прорваться?

Foresight NewsОпубликовано 2026-06-25Обновлено 2026-06-25

Введение

Анализ рынка AI-инференса показывает, что этот сегмент приобретает ключевую экономическую ценность в отличие от предыдущего цикла, сфокусированного на обучении моделей. Инференс — это процесс генерации ответов модели на запросы пользователей. Рынок структурирован вокруг двух основных лагерей: 1. **Традиционные провайдеры** (например, AWS, OpenRouter, Together) конкурируют в областях надежности, качества разработки и корпоративных процессов. 2. **Криптопроекты** делают ставку на открытый доступ, более низкую стоимость, конфиденциальность, верифицируемость и новые модели стимулирования. **Ключевой элемент — маршрутизаторы** (например, OpenRouter), которые выступают в роли агрегаторов, оптимально распределяя запросы между разными моделями и провайдерами на основе цены, задержки и приватности. **Среди криптопроектов выделяются несколько направлений:** * **Децентрализованные сети инференса:** Chutes (инференс как услуга), Akash, io.net (рынки GPU). * **Конфиденциальные вычисления:** Targon (защищённое выполнение). * **Приватный инференс:** Darkbloom (на базе Mac), Venice (потребительский шлюз). * **Оркестрация распределенных вычислений:** NuNet. * **Инфраструктура для AI-агентов:** OpenServ (оркестрация агентов). **Важные факторы для успеха криптопроектов:** * Реальный платный трафик, а не активность на бесплатном тарифе. * Устойчивая интеграция с маршрутизаторами (дистрибуция). * Надежные системы верификации оборудования и работы. * Реальные гарантии конфи...


Автор: 0xSammy (Khala Research)

Перевод: AIdidiaoJP, Foresight News


Сегодняшний рынок AI-инференса больше не похож на единый рынок облачных услуг, а скорее напоминает шахматную партию «Риска». Каждый провайдер борется за свою территорию: гиперскейлеры контролируют континенты корпоративного уровня, маршрутизаторы держат в своих руках торговые пути, а децентрализованные сети яростно сражаются на открытых фронтирах.


Ядром предыдущего цикла развития ИИ было обучение моделей, но теперь становится всё очевиднее, что этап инференса скрывает в себе огромную экономическую ценность. Возможно, многие впервые слышат слово «инференс» — что же это такое?


Обучение создаёт модели ИИ, а инференс — это процесс, когда модель генерирует ответ на заданный вопрос или поставленную задачу.


Обзор рынка AI-инференса


Этап обучения привлекает заголовки, потому что он лежит в основе впечатляющих результатов. Но на самом деле, именно инференс получает сегодня большую часть экономической выгоды — каждый промпт, цикл работы агента, генерация изображений, выполнение транзакций, вызов инструментов и редактирование кода должны где-то выполняться.


Маршрутизаторы — настоящее узкое место


В шахматной партии «Риска» самые ценные территории — это часто узкие проходы, которые определяют, как армии будут двигаться дальше. На рынке инференса маршрутизаторы играют точно такую же роль. Они находятся между спросом и предложением, решая, куда направить каждый запрос и какой провайдер получит оплату.


Типичный пример — OpenRouter, протокол которого только на прошлой неделе обработал 4700 триллионов токенов.


Эта экономическая активность не показывает никаких признаков замедления, особенно с приближением запуска триллионов агентов.



Итак, что необходимо для полноценного рынка инференса? Ключевые элементы включают:


  • Токены становятся единицей учёта
  • OpenRouter быстро становится ключевым слоем-биржей, на прошлой неделе через его рынок LLM было использовано токенов на 4700 триллионов.
  • Профессиональная сторона предложения: Fireworks, Together, Replicate, Baseten, Groq и крупнейшие гиперскейлеры.
  • Крипто-сети ИИ: такие проекты, как Chutes, Akash, io.net, Nosana, Targon, Venice, NuNet, строящие безразрешительную версию инфраструктуры нижнего уровня.


Не следует рассматривать всех этих провайдеров как конкурирующих на одном и том же рынке — они вовсе не такие.


Традиционные провайдеры продают надёжность, удобство для разработчиков и корпоративные процедуры закупок.


Крипто-сети ИИ делают ставку на более дешёвые ресурсы, открытый доступ, конфиденциальность, верифицируемость и новые циклы стимулирования.


Недавний инцидент, когда Anthropic запретила пользователям за пределами США использовать свою модель Mythos (Fable 5), заставил многих вновь осознать риски чрезмерной зависимости от одной передовой проприетарной модели.


Интересно, что два мира начинают пересекаться: конфиденциальность, конфиденциальные вычисления или нативные для агентов платежи (здесь особенно выделяются Venice и Targon).


Как смотреть на рынок вычислительных мощностей для ИИ


Лучший ракурс — разделить рынок на два основных лагеря: традиционный и крипто:



Традиционная сторона продаёт надёжность, удобство для разработчиков и корпоративные закупки.


Крипто-сети конкурируют в основном за открытый доступ, более дешёвые ресурсы, конфиденциальность, верифицируемость и новые механизмы стимулирования для глобальной бесшовной координации капитала.


Почему инференс — это настоящий рынок ИИ


Слой моделей по-прежнему важен, но качество моделей сжимается быстрее, чем ожидалось. Открытые модели достигают 90-95% качества передовых моделей, но стоят всего 10% от их стоимости (например, GLM-5.2 от Z.ai).



Открытые модели продолжают итерации, китайские лаборатории постоянно снижают цены. Передовые модели всё ещё могут удерживать премию, но ниже них конкуренция в ценообразовании токенов уже очень жёсткая.



Именно поэтому слой маршрутизации становится ключевым: одна и та же открытая модель может предлагаться пятью разными провайдерами по пяти разным ценам, разработчики не хотят навсегда жёстко прописывать одну конечную точку, им нужен маршрутизатор.



Маршрутизаторы могут выбирать на основе цены, задержки, конфиденциальности, надёжности и множества других факторов.



Он находится над всеми провайдерами, превращая хаотичный ландшафт в чистый унифицированный интерфейс.


Именно в этом преуспел OpenRouter, и этим объясняется, почему венчурные фонды вложили 113 миллионов долларов в недавнем раунде B финансирования, чтобы завладеть этой возможностью маршрутизации.



OpenRouter быстро становится интерфейсом рынка: один ключ даёт доступ к сотням моделей от множества провайдеров. Истинная ценность заключается не в списке моделей, а в том, что один и тот же запрос может быть направлен провайдеру, наиболее подходящему для данной задачи.


Это начинает напоминать рынок энергоресурсов: пользователям всё равно, какая электростанция выработала ток, их волнует, горит ли свет, справедлива ли цена и стабильна ли система.



Пользователи ИИ тоже будут всё больше так думать — им не важно, какой GPU-кластер обработал этот токен, важно лишь, чтобы ответ был быстрым, дешёвым, конфиденциальным и надёжным.


Традиционные провайдеры инференса



Традиционная сторона делится на четыре категории:


i) Гиперскейлеры (Hyperscalers): AWS, Google, Microsoft


Они контролируют «укреплённые континенты». Они побеждают не потому, что всегда самые дешёвые, а потому, что уже контролируют корпоративные закупки, соответствие требованиям, идентификацию, безопасность и системы биллинга. Атаковать этот плацдарм в лоб крайне дорого.


Они побеждают благодаря корпоративному доверию. Крупные компании покупают не только токены, но и соответствие требованиям, безопасность, удобство закупок и наличие ответственного лица в случае проблем.


ii) Рыночные маршрутизаторы: OpenRouter и различные AI-шлюзы


Маршрутизаторы находятся над провайдерами моделей, отправляя каждый запрос в наилучший вариант. Поскольку лидерство моделей меняется еженедельно, жёсткая привязка к одной модели выглядит всё более хрупкой. ИИ нуждается в агрегаторах, как и в криптоиндустрии.


iii) Оптимизированные сервисы для открытых моделей: Together, Fireworks, Baseten, Groq


Они не просто дешёвые API, а компании, предоставляющие инфраструктуру для производительности, ориентированную на скорость, пакетную обработку, масштабирование, дообучение, пользовательские конечные точки и производственную поддержку.


iv) Рынки моделей: Replicate и подобные платформы (например, Hugging Face)


Инференс — это не только чат. Изображения, видео, речь, эмбеддинги, модели для роботов, симуляции и многомодальные агенты требуют запуска моделей. Рынки делают доступными запросы на нишевые модели.


Криптопровайдеры AI-инференса


Децентрализованные сети — это «партизанские территории»


Крипто-сети инференса не пытаются тратить больше денег на главном поле боя AWS. Они открывают новые фронты: модели без цензуры, более дешёвые GPU-ресурсы, конфиденциальный инференс, нативные для агентов платежи и рабочие нагрузки, не требующие уровня надёжности гиперскейлеров.


Крипто-сторону часто сводят к «децентрализованным мощностям», что слишком расплывчато. Существует как минимум пять различных направлений:


  • Серверные (serverless) сети инференса
  • Децентрализованные рынки GPU
  • Сети конфиденциальных вычислений
  • Конфиденциальные ИИ-приложения и шлюзы
  • Слои оркестрации


Их не следует анализировать одинаково.


i) Chutes: Криптонативный инференс


@chutes_ai лучше понимать как децентрализованную платформу инференса, а не просто рынок GPU.


Суть в следующем: разработчики не хотят арендовать GPU или управлять инфраструктурой, им нужна рабочая конечная точка. Chutes обслуживает открытые модели через знакомый API, используя под капотом децентрализованные GPU-ресурсы.


Ключевой вопрос — смогут ли они превратить значительный объём использования в платный, повторяющийся спрос. Дешёвые токены полезны, но только если разработчики доверяют времени бесперебойной работы, задержкам и надёжности.


Их доход на триллион токенов продолжает расти, демонстрируя потенциал для устойчивой прибыльности / жизнеспособности.



ii) Akash: Слой аукционов GPU


@akashnet — это децентрализованный рынок облачных услуг.


Пользователи определяют необходимые вычислительные мощности, провайдеры делают ставки на их предоставление, рабочие нагрузки выполняются через аренду. Это больше похоже на рынок мощностей, чем на прямой маршрутизатор инференса.


Он лучше всего подходит для чувствительных к цене рабочих нагрузок, которые могут выдерживать колебания инфраструктуры и не требуют глубокой интеграции с AWS/Azure/Google Cloud. Комиссии в некоторой степени коррелируют с ценой токена и имеют тенденцию к росту.


iii) io.net: Децентрализованное GPU-облако


@ionet больше похож на децентрализованного GPU-облачного провайдера.


Ключевое преимущество — доступ к распределённым GPU-ресурсам по более низкой стоимости и с более быстрым временем развёртывания, что подходит ИИ-командам, которым нужны мощности, но которые не хотят заключать долгосрочные облачные контракты или соглашаться с ценами гиперскейлеров.


Проблема заключается в реализации: проверка оборудования, надёжность, планирование, поддержка и стабильная производительность. Доступ к чистым GPU ценен, но более прибыльным слоем остаются маршрутизация, управление инференсом и оркестрация.


io.net показал выдающиеся результаты за последние 30 дней, достигнув годового дохода в 12,3 миллиона долларов.



iv) Targon: Конфиденциальные вычисления


@TargonCompute (разработанный @manifoldlabs) фокусируется на конфиденциальных вычислениях для ИИ-нагрузок.


Он решает очевидную проблему: многие пользователи не хотят запускать конфиденциальные промпты, модели или данные на инфраструктуре, управляемой неизвестными третьими сторонами.


Targon обеспечивает защищённое выполнение через доверенные среды выполнения, зашифрованные виртуальные машины, удалённую аттестацию и инфраструктуру конфиденциальных GPU. Проще говоря, он доказывает, что рабочая нагрузка выполняется в безопасной среде, и снижает объём информации, доступной оператору.


Это особенно актуально для конфиденциального инференса в таких областях, как финансы, здравоохранение и корпоративный ИИ. Конфиденциальные вычисления — не магия, они переносят доверие на оборудование, микропрограммы и системы аттестации.


В прошлом году протокол отчитался о годовом доходе в 10,4 миллиона долларов и совместно с Intel написал исследовательскую работу о «децентрализованных вычислениях на недоверенном оборудовании».



v) Darkbloom: Конфиденциальный инференс на простаивающих Mac


Darkbloom (разработанный @eigenlabs) использует другой подход.


Он не распределяет большие модели по случайным GPU, а превращает простаивающие Mac на Apple Silicon в сеть конфиденциального инференса. Модели запускаются локально на Mac, запросы шифруются и направляются проверенным провайдерам.


Преимущество — конфиденциальность и стоимость, а не максимальная производительность на передовых моделях.


Это полезно, потому что «ни один узел не содержит полной модели» автоматически не означает, что промпт конфиденциален. Darkbloom более явно нацелен на проблему конфиденциальности, но всё ещё должен доказать масштабируемость ресурсов, производительность и доверие разработчиков.


В настоящее время в сети насчитывается 300 машин, обслуживших 20 миллиардов токенов и 1 миллион запросов.



vi) Venice: Конфиденциальный инференс для потребителей


@AskVenice занимает иное положение, чем сети вроде Akash или io.net. Это скорее конфиденциальное ИИ-приложение и шлюз инференса, чем основной рынок GPU.


Пропускная способность его шлюза достигла 85 миллиардов токенов в день (данные @ErikVoorhees).



Большинство пользователей хотят продукт ИИ, который уважает конфиденциальность, имеет доступ к мощным моделям и не собирает массу данных.


Venice упаковывает идею инфраструктуры в потребительский опыт, ориентируясь на конфиденциальные промпты, открытые модели, доступ без цензуры, API-функции и токенизированные вычислительные мощности через VVV и DIEM.


Компонент DIEM особенно интересен, так как указывает на более широкую концепцию экономики агентов: предоставление доступа к вычислительным мощностям за 1 доллар в день. Рынок недавно оценил эту концепцию по достойной цене.


Если агентам нужен постоянный доступ к инференсу, то кредиты на вычислительные мощности начинают напоминать нативные для агентов активы, вокруг которых можно построить целый вторичный рынок.


Агент, который может напрямую владеть и тратить права на вычислительные мощности, более практичен, чем агент, зависящий от человека, регулярно прикладывающего кредитную карту.


Это подчёркивает более глубокий тезис крипто-ИИ: агентам в конечном итоге потребуется доступ к средствам, идентичности, памяти и вычислительным мощностям, а криптосистемы предоставляют основу для программируемости этих ресурсов.


Venice не конкурирует напрямую с OpenRouter по широте моделей, а конкурирует в сфере конфиденциальности, доступа и токенизированных вычислительных мощностей. Это законная ниша, но ключевой вопрос — станет ли спрос на конфиденциальные ИИ-продукты достаточно большим, чтобы поддерживать токен-модель за пределами текущего нарративного цикла. По моему мнению, с распространением ИИ нарратив о конфиденциальности будет только усиливаться.


vii) NuNet: Распределённая оркестрация вычислительных мощностей


@nunet_global часто относят к проектам децентрализованных вычислений, но более полезная модель — «оркестрация».


Оркестрация включает сопоставление рабочих нагрузок с наиболее подходящими вычислительными ресурсами и координацию их выполнения между разными машинами, средами и местоположениями.



Это становится всё более важным по мере того, как ИИ выходит за рамки централизованной облачной инфраструктуры.


Будущие системы ИИ, вероятно, будут работать на облачных GPU, периферийных устройствах, локальных серверах, роботах, телефонах, датчиках и сетях децентрализованных провайдеров.


Складской робот, возможно, не будет ждать отклика API из другого региона; дрон не может предполагать идеальное соединение в каждый момент; полевой робот должен выполнять инференс локально, когда сеть ненадёжна.


Таким образом, оркестрация становится отдельной и значимой категорией.


Проблема для NuNet заключается в том, сможет ли она превратить эту задачу координации в функционирующую экономическую сеть с достаточным предложением, спросом и вовлечённостью разработчиков.


viii) OpenServ: Оркестрация агентов, а не чистый инференс


@openservai лучше понимать как инфраструктуру и платформу оркестрации агентов, а не децентрализованную сеть инференса.


Это важно, потому что агенты — один из самых очевидных источников будущего спроса на инференс. Обычный чат-бот может вызывать модель только один раз, а агент будет вызывать её многократно: вывод, использование инструментов, проверка вывода, вызов другой модели, действие, а затем цикл.


Это создаёт высокий спрос на инференс, что уже заметили в криптосообществе.


Таким образом, OpenServ связан с рынком инференса со стороны спроса, а не предложения. Если эта платформа станет полезным местом для разработчиков, где можно создавать, развёртывать и координировать агентов, она естественным образом станет слоем, который будет направлять инференс на нижнем уровне к разным провайдерам.


Ключевой вопрос — сможет ли OpenServ стать настоящим слоем исполнения агентов или останется просто очередным рынком агентов с токеном.


После нескольких бесед с командой я считаю, что их возможности шире, чем последнее; их инфраструктура инференса имеет ряд заметных результатов в бенчмарках, а на дорожной карте есть собственная проприетарная модель.


Если OpenServ сможет завладеть операционными рабочими процессами, связанными с агентами, инференс станет входом для платформы, а не основным продуктом.


В мире агентов наиболее ценным слоем будет то место, где агенты проводят большую часть своего постоянного времени и ресурсов.


ix) Dolphin AI: Децентрализованный инференс, управляемый продуктом


Интерес @dphnAI в том, что он начинается со спроса на модели, а не с рынка GPU.


Семейство моделей Dolphin уже имеет репутацию открытых моделей без цензуры, что даёт сети более чёткое основание для существования.


Это важно, потому что многие проекты децентрализованного инференса сначала предлагают ресурсы: «У нас есть GPU, кто теперь будет их покупать?»


Dolphin поступает наоборот: отправная точка — набор моделей, которые люди уже хотят использовать, а затем вокруг этого спроса строится децентрализованная сеть инференса.


Их архитектуру часто называют peer-to-pool: владельцы GPU вносят ёмкость в пул для конкретной модели, а не каждый покупатель напрямую арендует определённый узел. Запросы направляются в пул, доступные узлы обрабатывают их.


Это лучший дизайн для ненадёжных потребительских ресурсов. Если кто-то вносит простаивающий игровой GPU, он может не всегда быть онлайн, пул моделей может естественным образом поглощать такие колебания лучше, чем рынок одноранговой аренды.


Ещё интереснее верификация. Dolphin продвигает live-weight proofs (доказательства весов в реальном времени). Проще говоря, это проверка того, соответствуют ли фактические веса модели, загруженные во время обслуживания, модели, которую узел заявляет, что запускает.


Это важно, потому что обман — одна из самых сложных проблем в децентрализованном инференсе. Узел может заявлять, что запускает дорогую модель, но тайно обслуживать более маленькую, дешёвую или квантованную версию модели. Если сеть не может это обнаружить, весь рынок теряет доверие.


x) c0mpute: Распределённый инференс для агентов


Стоит обратить внимание на @c0mputeAI, потому что он пытается решить одну из самых сложных проблем децентрализованного инференса: запуск больших моделей на распределённых GPU в открытом интернете.


Их Shard Engine разделяет модель на несколько машин, вместо того чтобы требовать один гигантский сервер, вмещающий полную модель. Это особенно актуально для передовых открытых моделей, которые могут быть слишком большими или ограниченными для размещения обычным хостинг-путём.


Ссылка на @virtuals_io — ключевой взгляд со стороны спроса. Virtuals строят экономику агентов, а агенты — интенсивные пользователи инференса: они планируют, вызывают инструменты, совершают сделки, проверяют результаты и повторяют цикл. Это создаёт спрос на дешёвый, открытый и устойчивый к цензуре инференс.


Оговорка в том, что это всё ещё находится на ранней стадии. c0mpute должна доказать производительность при реальных нагрузках, надёжность узлов, верификацию и конфиденциальность промптов.


Но направление важно: рынки GPU продают доступ к мощностям; c0mpute пытается распределить саму модель.


Традиционный vs Крипто-инференс


Оба будут сосуществовать, каждый обладает явными и понятными уникальными преимуществами.



На что стоит обращать внимание


Объём платных токенов


Рынок должен меньше внимания уделять сырой статистике обработки токенов, если эти токены не приносят дохода. Активность на бесплатном уровне и субсидированное использование могут создавать впечатляющие цифры, но не доказывают реального соответствия продукта рынку.


Платный спрос на инференс — ключевой показатель; он более устойчив и может поддерживать долгосрочную жизнеспособность.


ii) Доход на один GPU


Децентрализованные сети вычислений устойчивы только в том случае, если GPU зарабатывают внутри сети больше, чем снаружи. Если эмиссия — основная причина участия провайдера, предложение исчезнет, как только стимулы снизятся. Провайдеры GPU будут рассчитывать альтернативные издержки.


iii) Интеграция с маршрутизаторами: Дистрибуция


Дистрибуция часто важнее самой инфраструктуры.


Интеграции с OpenRouter, кодирующие агенты, кошельки, платежные конечные точки, инструменты для разработчиков и потребительские приложения — всё это потенциальные источники спроса.


Платежные конечные точки — это каналы, через которые программное обеспечение может напрямую оплачивать услуги через API.


iv) Верификация


Обман с GPU, поддельные мощности и ненадёжные провайдеры по-прежнему представляют реальный риск.


Сетям необходимы надежные системы проверки оборудования, шифрования трафика, репутации и ощутимого наказания за плохое поведение.


v) Гарантии конфиденциальности


Конфиденциальный инференс остаётся одной из сильнейших возможностей для крипто-ИИ, но гарантии должны быть реальными. Продавать конфиденциальность в маркетинге легко; безопасное выполнение, локальная архитектура, минимизация данных и поддающаяся аудиту инфраструктура — гораздо сложнее.


vi) Захват стоимости токеном


Самые сильные модели токенов напрямую привязывают спрос к реальному использованию инференса. Это может включать механизмы обратного выкупа, сжигания, требований к стейкингу, прав на вычислительные мощности или привязки к доходу.


Одного лишь широкого ИИ-нарратива в долгосрочной перспективе, вероятно, будет недостаточно.


Ключевые выводы


Эндшпиль — это контроль над спросом


В партии «Риска» недостаточно просто владеть разрозненными территориями. Нужны связанные регионы, пути подкрепления и устойчивые линии снабжения.


То же самое и на рынке инференса. Победители будут контролировать спрос, маршрутизацию, верификацию и расчёты; просто владеть GPU недостаточно.


Рынок инференса делает ИИ похожим на финансовую систему:


  • Каждый сгенерированный токен несёт затраты,
  • Каждая конечная точка приносит прибыль,
  • Каждый цикл агента создаёт спрос,
  • Каждый маршрутизатор похож на маркет-мейкера,
  • Каждая сеть GPU становится источником предложения...


Традиционные провайдеры в настоящее время доминируют на уровне взаимодействия с разработчиками и корпоративного доверия.


Сети крипто-ИИ исследуют другой фронтир: безразрешительные ресурсы, конфиденциальный инференс, верифицируемые мощности, токенизированный доступ и нативные для агентов (без ограничений KYC) платежи.


В краткосрочной перспективе победителями, скорее всего, станут не самые децентрализованные сети, а те, которые сделают децентрализованный инференс обыденным и надёжным — благодаря быстрым конечным точкам, хорошей документации, надёжному времени безотказной работы, прозрачному ценообразованию, проверенным ресурсам и реальному платному спросу.


Chutes по-прежнему остаётся одним из проектов, заслуживающих пристального внимания, потому что он ближе всего к превращению поддерживаемых Bittensor мощностей в функционирующий рынок инференса, а не просто нарратив о GPU. То же самое можно сказать о «Darkbloom» от Eigen Labs.


Akash и io.net представляют претендентов со стороны предложения, Targon — тезис о конфиденциальных вычислениях, Venice — слой спроса на конфиденциальный ИИ, NuNet — оркестрацию для более распределённого будущего вычислений.


Более широкий тезис:


«Модели ИИ могут становиться всё более товарными, но рынок инференса вряд ли пойдёт по тому же пути.»


Наибольшая ценность достанется тем субъектам, которые направляют работу, верифицируют работу, рассчитываются за работу и захватывают спрос.


Именно здесь может появиться следующая возможность для крипто-ИИ... по крайней мере, до того, как физические ИИ найдут своё место в обществе.

Связанные с этим вопросы

QКак автор статьи описывает текущий рынок AI-инференса в сравнении с игрой "Риск" и какую роль в нём играют маршрутизаторы (роутеры)?

AАвтор сравнивает текущий рынок AI-инференса с игрой "Риск", где различные провайдеры борются за контроль над разными "территориями". Гиперскейлеры контролируют "континенты" корпоративного уровня, маршрутизаторы — "торговые пути", а децентрализованные сети сражаются на "открытых границах". Маршрутизаторы (такие как OpenRouter) играют ключевую роль как "узкие места", определяя, куда направить каждый запрос пользователя и какой провайдер получит оплату, выступая посредником между спросом и предложением.

QВ чём заключается основное различие между традиционными и криптоориентированными (децентрализованными) провайдерами AI-инференса, согласно статье?

AТрадиционные провайдеры (например, AWS, Google) продают надёжность, удобство для разработчиков и корпоративные процессы закупок. Они выигрывают за счёт доверия крупного бизнеса, который ценит соответствие требованиям, безопасность и наличие ответственного лица. Крипто-сети концентрируются на других преимуществах: более дешёвые вычислительные мощности, открытый доступ, повышенная приватность, возможность проверки (верификации) вычислений и новые механизмы экономических стимулов (токенизация), позволяющие глобально координировать капитал.

QПочему автор считает, что рынок инференса является более важным и экономически значимым, чем рынок тренировки моделей?

AАвтор утверждает, что хотя тренировка моделей привлекает больше внимания, именно инференс (процесс генерации ответов моделью на запросы) в настоящее время приносит основную экономическую выгоду. Каждый промпт, цикл агента, генерация изображения, выполнение транзакции и вызов инструмента требует запуска модели — это создаёт постоянный и массовый спрос на вычислительные ресурсы. Кроме того, качество открытых моделей быстро догоняет проприетарные при значительно меньшей стоимости, что усиливает конкуренцию и делает слой маршрутизации критически важным.

QНазовите три ключевых криптопроекта в области AI-инференса, упомянутых в статье, и их основные особенности или ниши.

A1. **Chutes**: Позиционируется как децентрализованная платформа для инференса. Предоставляет разработчикам знакомый API для работы с открытыми моделями, используя под капотом децентрализованные GPU. Фокусируется на превращении доступа к вычислительным ресурсам в работающий рынок инференса с платёжеспособным спросом. 2. **Targon**: Специализируется на конфиденциальных вычислениях (confidential compute) для AI-нагрузок. Использует доверенные среды выполнения (TEE), зашифрованные виртуальные машины и аппаратную верификацию для защиты конфиденциальных данных и промптов во время обработки, что важно для финансового и медицинского секторов. 3. **Venice**: Концентрируется на приватном AI-инференсе для потребителей. Предлагает продукт, который объединяет приватность, доступ к мощным моделям без цензуры и токенизированный доступ к вычислительным мощностям (например, через DIEM-токены), что может стать основой для экономики автономных агентов.

QКакие ключевые метрики, по мнению автора, необходимо отслеживать для оценки успеха и устойчивости проектов в сфере децентрализованного AI-инференса?

AАвтор выделяет несколько критически важных метрик: 1. **Объём платных токенов**: Реальный платёжеспособный спрос важнее общей статистики по обработанным токенам, которая может включать бесплатные или субсидируемые запросы. 2. **Доход на один GPU**: Децентрализованная сеть устойчива, только если GPU-провайдеры зарабатывают внутри сети больше, чем могли бы снаружи. 3. **Интеграция с маршрутизаторами**: Наличие интеграций (например, с OpenRouter) и точек распределения спроса (кошельки, платежные шлюзы) часто важнее самой инфраструктуры. 4. **Верификация**: Наличие надёжных систем проверки оборудования, репутации и наказания недобросовестных провайдеров для предотвращения мошенничества. 5. **Захват стоимости токеном**: Сильные модели токенизации должны напрямую связывать спрос на инференс с реальным использованием и ценностью токена (через выкупы, сжигание, стейкинг и т.д.).

Похожее

Бывший инженер SpaceX применяет принципы первого принципа для переосмысления системы финансового исполнения

Финтех-проект Plan Execution Lab, основанный бывшим инженером SpaceX Lex Li, привлек инвестиции в ходе раунда финансирования, оценив компанию в $50 млн. Команда применяет принцип «первых принципов» из SpaceX к финансовой индустрии, стремясь не просто создать более быструю биржу, а переосмыслить саму основу рынка. По их мнению, ключевая функция финансов — не торговля, а **распределение капитала**, а самым устаревшим звеном является **исполнение**, до сих пор зависящее от ручного человеческого труда. С развитием AI и агентов скорость жизни стратегий резко сокращается. Plan Execution Lab видит будущее в **сетях исполнения (Execution Networks)**, где базовыми единицами являются не цельные стратегии, а модульные компоненты: управление рисками, распределение капитала, доступ к ликвидности и т.д. Для этого компания разрабатывает два продукта: 1. **PlanX** — протокол финансового исполнения, инфраструктура для миграции потоков с централизованных (CEX) на децентрализованные (DEX) рынки. 2. **Xgent** — автономная финансовая среда выполнения, которая превращает инвестиционные намерения пользователя в исполняемый граф действий, автоматически управляя рисками, ликвидностью и оптимизацией. Их долгосрочная цель — создать для эпохи автономных финансов аналог **Bloomberg Terminal**, единую операционную среду, где участники (ноды исполнения, поставщики ликвидности, агенты) совместно строят открытую сеть. Будущее, по мнению Lex Li, принадлежит не отдельным алгоритмам, а тем, кто обладает самой мощной и адаптивной **сетью исполнения**.

marsbit14 мин. назад

Бывший инженер SpaceX применяет принципы первого принципа для переосмысления системы финансового исполнения

marsbit14 мин. назад

Бывший инженер SpaceX использует первый принцип для реструктуризации финансовой системы исполнения

Проект финансовой инфраструктуры Plan Execution Lab, основанный бывшим инженером SpaceX Lex Li, привлек ангельское финансирование с оценкой в $50 млн. Команда применяет принцип первопричин (First Principles) для переосмысления финансовых рынков, ключевая функция которых, по их мнению, — не торговля, а распределение капитала через исполнение (execution). Они отмечают, что, несмотря на цифровизацию активов и расчетов, исполнение остается фрагментированным и зависимым от ручного труда. В эпоху AI и агентов стратегии быстро теряют эффективность, и главной проблемой становится не получение информации, а непрерывное и эффективное исполнение решений. Plan Execution Lab разрабатывает два ключевых продукта: 1. **PlanX** — протокол финансового исполнения, цель которого — стать инфраструктурой для миграции торгового потока с централизованных (CEX) на децентрализованные (DEX) рынки, предоставляя возможности для исполнения, управления рисками, ликвидности и координации расчетов. 2. **Xgent** — автономная финансовая среда выполнения, которая преобразует инвестиционные намерения пользователя в исполняемый граф, автоматически управляя рисками, ликвидностью и оптимизацией. Их долгосрочная цель — создать операционную среду для автономных финансовых агентов, аналогичную Bloomberg Terminal для людей. Будущая финансовая инфраструктура, по их видению, будет представлять собой сеть исполнения, построенную совместно участниками: узлами исполнения, поставщиками ликвидности, поставщиками стратегий и автономными агентами. Конкурентное преимущество смещается с обладания лучшей стратегией на обладание самой мощной сетью исполнения.

链捕手15 мин. назад

Бывший инженер SpaceX использует первый принцип для реструктуризации финансовой системы исполнения

链捕手15 мин. назад

Первый набор данных для обучения Doc2Repo на длинных последовательностях: Code Agent не только исправляет ошибки, но и начинает создавать репозитории

С развитием LLM Code Agent исследователи начинают переходить к более сложным задачам, приближенным к реальным сценариям, таким как генерация целого репозитория кода с нуля. Команда из Института искусственного интеллекта Гаолинь Китайского народного университета представила новый набор данных DeNovoSWE, предназначенный для длительных задач в области программной инженерии, особенно для создания репозиториев на уровне кода. DeNovoSWE использует методологию «Разделяй и властвуй» (Divide & Conquer) и механизм «Критика и исправление» (Critic & Repair) для создания высококачественных данных. Набор содержит 4 818 реальных примеров задач, что предоставляет масштабные данные для обучения Code Agent выполнению длительных операций. Эксперименты показали, что модель Qwen3-30B-A3B-Instruct, обученная на DeNovoSWE, значительно улучшила свои показатели: с 5,8% до 47,2% на BeyondSWE-Doc2Repo и с 4,3% до 23,0% на NL2RepoBench. Ключевая сложность задачи заключается в том, что агент должен воссоздать весь репозиторий, начиная только с документации, в очищенной среде без исходного кода, тестов и потенциальных утечек. Это требует навыков планирования архитектуры, создания модулей, определения API и обработки зависимостей. DeNovoSWE структурирует документацию по ключевым возможностям (capabilities) репозитория, обеспечивая ясность, полноту и соответствие критериям оценки. Результаты подтверждают, что данные, ориентированные на длительные задачи генерации репозиториев, более эффективны для развития соответствующих способностей Code Agent по сравнению с данными, сфокусированными только на исправлении ошибок. DeNovoSWE закладывает основу для следующего этапа развития код-агентов, способных понимать требования, планировать и создавать целые рабочие программные проекты.

marsbit31 мин. назад

Первый набор данных для обучения Doc2Repo на длинных последовательностях: Code Agent не только исправляет ошибки, но и начинает создавать репозитории

marsbit31 мин. назад

Даже CZ похвалил Hyperliquid как 'отличный', но его главное преимущество может быть и главным риском

Автор статьи анализирует комментарии основателя Binance Чанпэна Чжао (CZ) о децентрализованной бирже деривативов Hyperliquid. CZ назвал продукт "отличным", но отметил, что Binance не может конкурировать в её нише из-за её модели "без KYC и с нарративом децентрализации", так как сам не стал бы управлять таким бизнесом из-за рисков. Ключевой тезис: главное конкурентное преимущество Hyperliquid — доступ к торговле без строгой проверки личности (KYC) и с меньшими барьерами — одновременно является её главным регуляторным риском. Платформа работает в иной правовой плоскости, чем регулируемые биржи, такие как Binance. Статья подчеркивает, что регулируемые площадки (например, CME, Cboe) могут улучшать свои продукты, сокращая технологический разрыв, но не могут и не хотят отказываться от KYC и соответствия глобальным нормам. Таким образом, дифференциация Hyperliquid всё больше концентрируется именно на модели доступа, что привлекает пользователей, но и делает её главной мишенью для регуляторов. В качестве примера реального риска приводится предупреждение британского регулятора FCA против Hyperliquid за возможную работу без лицензии. Также упоминается судебный прецедент в США (дело CFTC против bZeroX/Ooki DAO), где регуляторы преследовали децентрализованные структуры за предложение деривативов. Вывод: будущее Hyperliquid зависит от того, сможет ли её "ров" — преимущество в виде лёгкого доступа — устоять под растущим давлением регулирования, особенно если регулируемый рынок предложит схожие продукты. Слова CZ чётко обозначили эту дилемму: то, что Binance не может скопировать, является и самым уязвимым местом Hyperliquid.

marsbit49 мин. назад

Даже CZ похвалил Hyperliquid как 'отличный', но его главное преимущество может быть и главным риском

marsbit49 мин. назад

Торговля

Спот
Фьючерсы
活动图片