Первый крупномасштабный генеративный модель Un-0, использующая физику в качестве вычислительного примитива, представлен. Снизит ли он энергопотребление ИИ в 1000 раз?

marsbitОпубликовано 2026-06-26Обновлено 2026-06-26

Введение

Компания Unconventional AI, основанная бывшим руководителем подразделения ИИ в Databricks Навином Рао, представила Un-0 — первую крупномасштабную генеративную модель, использующую физические системы в качестве вычислительного примитива. Un-0 представляет собой систему связанных осцилляторов (моделируемую уравнениями Курамото), динамика которой во времени генерирует изображения. Обученная на датасетах CIFAR-10 и ImageNet 64×64, модель с 3.22 млрд параметров достигла FID 6.74, что сопоставимо с ранними традиционными методами генерации. Ключевая цель разработки — радикальное повышение энергоэффективности ИИ: в перспективе энергопотребление при инференсе может быть снижено в 1000 раз за счёт замены цифровых вычислений на аналоговые физические процессы, объединяющие вычисление и память. Хотя текущая производительность Un-0 ещё не превосходит современные стандартные модели, она демонстрирует принципиальную возможность использования физической динамики для сложных задач ИИ и открывает путь к созданию нового класса энергоэффективных «неконвенциональных» вычислительных систем.

За последние десять лет цифровые вычисления на основе GPU доминировали в области ИИ. Казалось, что более крупные кластеры, более высокая пропускная способность, более мощные GPU и более плотные центры обработки данных — это основной путь к следующему поколению искусственного интеллекта.

Однако по мере того, как количество параметров моделей приближается к триллионам, в отрасли все чаще стали упоминать слово «энергопотребление». Более того, возник еще более фундаментальный вопрос: если ИИ продолжит развиваться по существующей схеме, откуда взять электроэнергию?

Несомненно, «счет за электричество» ИИ и энергопотребление постепенно превратились из операционных расходов в «структурное узкое место», сдерживающее развитие всей отрасли.

Перед лицом этого насущного энергетического кризиса на первый план вышел Naveen Rao, бывший глава AI в Databricks и легендарный предприниматель Кремниевой долины, со своим новым хардверным стартапом Unconventional AI.

Сегодня Unconventional AI официально объявила о выпуске своей первой модели Un-0 — модели генерации изображений, управляемой «системой связанных осцилляторов», которую можно рассматривать как пример новой физической вычислительной основы. На ImageNet 64×64 Un-0 достигла показателя FID 6,74, что по качеству уже приближается к уровню некоторых основных традиционных методов генерации изображений на момент их первоначального выпуска.

Навин Рао назвал ее «первой крупномасштабной генеративной моделью, построенной с использованием физики в качестве вычислительного примитива».

«Это знаменует собой момент "Hello World" для моделей на физической основе. Мы используем естественное поведение физической системы во времени, позволяя ей выполнять вычисления за нас. В конечном итоге это новый способ построения компьютеров, который потенциально может привести к значительному повышению энергоэффективности».

Более того, в интервью СМИ Навин Рао поставил еще более смелую "маленькую цель": в будущем, возможно, удастся снизить энергопотребление при выводе ИИ до одной тысячной от существующих систем.

Пример траектории эволюции во времени процесса генерации Un-0. Цвет каждой линии соответствует цвету близкого прямоугольника, в прямоугольнике указан класс и показан процесс постепенной генерации изображений этого класса с течением времени.

Официально был опубликован блог, представляющий Un-0. Давайте узнаем подробнее.

Отправная точка Un-0: пересмотр вычислений ИИ с использованием физической системы

Unconventional AI заявляет, что их цель — создать новый тип компьютера, который использует законы физики для выполнения вычислений, что позволит современному ИИ в будущем работать при значительно меньшем энергопотреблении, чем у сегодняшних машин, примерно в 1000 раз.

Поэтому они задались вопросом: Можно ли обучить физическую динамическую систему генерировать изображения на задачах масштабируемого уровня?

Сегодня самые мощные модели ИИ в основном являются традиционными глубокими сетями, особенно модели на основе Transformer. Однако помимо основного направления уже давно существуют исследования, пытающиеся повысить энергоэффективность с помощью динамического поведения физических систем, например, шума, изменения во времени, напряжения и тока в аналоговых цепях. Эти методы используют не традиционные цифровые значения, а естественный процесс эволюции самой физической системы.

Например, нейроморфные вычисления, сети Хопфилда, Reservoir Computing, а также недавно разработанные Hamiltonian Networks, Liquid Networks, Neural Wave Machines, Thermodynamic Computing и осцилляторы Курамото.

Un-0 — это новая попытка в этих нетрадиционных вычислительных направлениях. Но главная сложность заключается в следующем: чтобы использовать эти альтернативные методы вычислений, задачи ИИ должны быть эффективно сопоставлены с динамическим процессом физической системы. Un-0 призван проверить, можно ли разместить современные рабочие нагрузки ИИ на физической основе и, в конечном итоге, добиться большей эффективности, чем на современном оборудовании.

Принцип работы Un-0

По словам авторов, можно представить два метронома, тикающих рядом, как показано на рисунке ниже.

Каждый метроном в любой момент времени имеет «фазу», то есть текущее положение маятника в его цикле качания. Если два метронома стоят на одном столе, они влияют друг на друга через поверхность стола. В зависимости от силы взаимодействия, то есть силы связи, они могут постепенно синхронизироваться или войти в состояние синхронизации в противофазе.

Это и есть основная концепция осциллятора: каждый осциллятор имеет свою фазу и стремится вращаться с собственной частотой, но при этом подвергается влиянию соседних осцилляторов.

Если же расширить систему до нескольких тысяч осцилляторов, она становится еще интереснее. Между большим количеством осцилляторов существуют связи разной силы, и они самоорганизуются в определенные паттерны через взаимодействие, как показано на рисунке ниже.

Вычислительным ядром Un-0 является именно такая крупномасштабная группа осцилляторов, а сила связи между ними является основным обучаемым параметром модели.

Эти связанные осцилляторы обычно моделируются как «осцилляторы Курамото».

Конкретно, движение каждого осциллятора следует простому правилу, которое действует непрерывно во времени: с одной стороны, он вращается с собственной естественной частотой, а с другой — смещается под воздействием всех остальных осцилляторов.

Процесс эволюции этих осцилляторов во времени описывается следующим обыкновенным дифференциальным уравнением (ODE):

Каждый осциллятор i имеет фазу

∈[0,2π), где

обозначает его собственную частоту. Матрица

определяет силу связи, решая, с какой силой осциллятор j будет тянуть осциллятор i к синхронному состоянию или отталкивать от него.

Un-0 должен изучить именно матрицу связи K и собственные частоты ω — эти параметры совместно определяют саму физическую систему.

Unconventional AI приводит две причины выбора осцилляторов:

  • Первая причина исходит из мозга: В мозге широко распространены ритмическая активность и синхронные явления. Долгое время считалось, что эти явления могут участвовать в вычислительных процессах, например, связывать разрозненные признаки в целостное восприятие, контролировать обмен информацией между областями мозга, организовывать временную структуру нейронных импульсов и т. д. Связанные осцилляторы — одна из простейших математических моделей для описания такого поведения, поэтому они естественным образом подходят в качестве базовых единиц для нейроинспирированных вычислительных моделей.
  • Вторая причина носит более инженерный характер: Осцилляторы могут быть реализованы в виде физического примитива схемы. Unconventional AI считает, что систему связанных осцилляторов можно напрямую реализовать на CMOS или другой физической основе, позволяя физическому поведению самой системы вычислять динамическую эволюцию.

Ставка Un-0 заключается в следующем: если законы физики могут напрямую вычислять рабочие нагрузки ИИ, то будущая вычислительная основа может сильно отличаться от сегодняшних GPU.

Архитектура модели Un-0

Процесс генерации изображения в Un-0 примерно делится на пять шагов:

  • Случайная инициализация: Установка фаз всех осцилляторов в случайные углы (аналогично случайному шуму в диффузионных моделях);
  • Ввод направляющей категории: Использование меньшей группы «условных осцилляторов» для ввода метки класса (например, «вулкан», «ромашка»), направляя основной пул осцилляторов в определенном направлении эволюции;
  • Дать физике идти своим чередом: Освобождение системы, позволяя осцилляторам взаимодействовать и эволюционировать под действием физической динамики, пока они не стабилизируются;
  • Фиксация снимка: Запись фаз всех осцилляторов в определенный момент времени T, формирование числовой сетки в скрытом пространстве (Latent);
  • Рендеринг пикселей: Преобразование фазовой сетки в окончательные пиксели изображения с помощью традиционного декодера, на который приходится менее 13% параметров модели.

Связанные осцилляторы эволюционируют во времени под действием изученных связей. Между условными осцилляторами и основным пулом осцилляторов существует однонаправленная матрица низкого ранга для условной классификации, используемая для ввода информации о классе. В момент времени T система считывает состояние осцилляторов через декодер и генерирует изображение. Многократная выборка различных начальных условий позволяет генерировать соответствующее распределение изображений.

В процессе обучения модель изучает три типа параметров: как связаны осцилляторы (матрица K); собственная частота каждого осциллятора

; а также веса декодера. В целом, осцилляторная система берет на себя вычисления, которые в противном случае могли бы выполняться традиционными нейросетевыми слоями.

Unconventional AI поясняет, что такая архитектура выбрана для того, чтобы сама динамическая система имела максимальную свободу для выполнения вычислений.

При прямом распространении во время обучения модель просто устанавливает матрицу связи, частоты осцилляторов и начальные фазы, затем позволяет динамической системе эволюционировать и, наконец, считывает скрытые переменные изображения.

Это отличается от динамических методов генерации, таких как диффузионные модели и Flow Matching. Диффузионные модели и Flow Matching обычно явно направляют динамическую систему в процессе обучения, тогда как подход Un-0 больше похож на наблюдение за окончательными сгенерированными образцами и последующую оптимизацию всей динамической системы через функцию потерь.

Ценой этого является необходимость в более сложной функции потерь, поскольку сигнал обучения в основном исходит от самих сгенерированных образцов.

Как обучают Un-0?

Unconventional AI обучила модели трех масштабов на CIFAR-10 и ImageNet 64×64 соответственно, результаты следующие:

Результаты обучения на CIFAR-10

Результаты обучения на ImageNet 64×64

Согласно результатам, с увеличением количества осцилляторов показатель FID модели постоянно улучшается. Самая большая модель для ImageNet 64×64 использует 16384 осциллятора, общее количество параметров составляет около 322 миллионов, FID достигает 6,74.

В методе обучения использовалась новая предложенная функция потерь "Drifting Loss" ("Дрейфующие потери") в сочетании с экстрактором признаков DINOv2 и оптимизатором AdamW для сквозного обучения.

Что касается оценки, то для CIFAR-10 использовалось 50 тысяч сгенерированных образцов, и они сравнивались со справочной статистикой CIFAR-10 с помощью стандартного пакета и процесса оценки; для ImageNet 64×64 также использовалось 50 тысяч сгенерированных образцов, а FID вычислялся с помощью ADM evaluation suite.

Что касается вычислительных ресурсов, все модели для CIFAR-10 обучались на 1 GPU B200, а все модели для ImageNet 64×64 обучались на 8 GPU B200. На обучение самой большой модели для CIFAR-10 потребовалось 20 B200-часов, а самой большой модели для ImageNet 64×64 — 640 B200-часов.

По словам авторов, основным узким местом обучения является вычисление функции потерь "Drifting Loss", поскольку для этого требуется использование традиционного экстрактора признаков изображений и вычислений на нескольких видовых проекциях признаков.

Какое место занимает Un-0 в области генерации изображений?

Чтобы лучше продемонстрировать производительность Un-0, Unconventional AI поместила Un-0 на кривую «качество генерации vs количество параметров» для сравнения с традиционными и нетрадиционными моделями.

Соответствие между количеством параметров и значением FID в наборе данных CIFAR-10

Соответствие между количеством параметров и значением FID в изображениях размером 64×64

Вывод таков: Качество Un-0 уже сопоставимо с некоторыми ранними традиционными генераторами, а в некоторых сравнениях даже лучше, например, NCSN, DCGAN-TTUR, WGAN-GP, BigGAN, iDDPM, Consistency Models, TRACT и др. Но оно все еще отстает от более поздних высокопроизводительных традиционных моделей, таких как EDM и GDD.

Другими словами, Un-0 — не самая мощная на сегодняшний день модель генерации изображений, она больше похожа на отправную точку нового направления: ее производительность уже приближается к уровню многих классических генеративных моделей на момент их появления, но чтобы догнать последние достижения традиционного направления, необходима дальнейшая оптимизация алгоритмов, архитектуры и физических примитивов.

В целом, Un-0 демонстрирует возможность использования физических динамических систем для крупномасштабной генерации изображений в современном ИИ. Хотя текущая производительность при программной симуляции еще не достигла пика традиционного ИИ, она прокладывает многообещающий путь к будущей реализации «нетрадиционного аппаратного обеспечения ИИ» с энергоэффективностью, в тысячу раз превышающей современную...

Навин Рао также подчеркивает, что появление Un-0 показывает, что «вычисления — не исключительно человеческое изобретение». Они существуют повсюду в природе и физическом мире. Все физические процессы материальных объектов включают временное измерение, но современные вычислительные системы не используют его в полной мере.

«Мы как раз и разрабатываем это временное измерение».

Связь с энергоэффективностью здесь заключается в следующем: в современных машинах фон Неймановской архитектуры большая часть энергии расходуется на перемещение информации между памятью и вычислительными блоками, тогда как динамические системы объединяют вычисления и память в одну сущность. Более того, динамические системы могут быть устойчивы к шуму, что открывает новые возможности для экономии энергии на коммуникациях.

Un-0 представляет собой важный первый шаг в переходе вычислительной парадигмы к динамическим системам. «С выпуском этой модели мы устанавливаем связь между интеллектом и динамикой». Для вычислений ИИ динамика является естественной структурой выражения, нейронные сети по сути также можно рассматривать как динамические системы, поэтому сопоставление между ними будет более прямым.

«В мозге нет такой абстракции, как линейная алгебра, поэтому в каком-то смысле мы обходим промежуточные звенья».

Под публикацией многие пользователи также выразили ожидания.

«Фактически, такое повышение производительной эффективности огромно. Если эта технология получит широкое распространение, многие приложения, работающие локально, могут стать выполнимыми».

«Если эта технология выйдет на рынок, это будет невероятно продвинутая мозгоподобная технология».

Ссылки:

https://x.com/NaveenGRao/status/2070184079199494583

https://unconv.ai/blog/introducing-un-0-generating-images-with-coupled-oscillators/

https://techcrunch.com/2026/06/25/databricks-former-ai-chief-thinks-he-can-cut-ais-power-bill-by-1000x/

Эта статья взята с официального аккаунта WeChat «Машина-разум» (ID: almosthuman2014), автор: фокус на ИИ

Связанные с этим вопросы

QЧто такое модель Un-0 и чем она отличается от традиционных AI-моделей?

AUn-0 — это генерирующая модель изображений, разработанная компанией Unconventional AI. Её ключевое отличие заключается в том, что в качестве вычислительного «примитива» она использует не цифровые вычисления на GPU, а физическую динамическую систему — связанные осцилляторы (колебательные системы). Это позволяет модели полагаться на естественную эволюцию физической системы во времени для выполнения вычислений, что потенциально может значительно снизить энергопотребление.

QКакую основную проблему в развитии AI призван решить подход Unconventional AI?

AПодход Unconventional AI призван решить проблему огромного и растущего энергопотребления современных AI-систем. По мере роста параметров моделей до триллионов, энергозатраты становятся «структурным узким местом», угрожающим дальнейшему развитию отрасли. Цель компании — создать новый тип вычислительной техники, использующий законы физики для вычислений, что, по их оценкам, может снизить энергопотребление при инференсе (выводе) AI в 1000 раз по сравнению с текущими системами.

QКак работает вычислительное ядро модели Un-0?

AВычислительное ядро Un-0 представляет собой большую сеть связанных осцилляторов (колебателей), например, осцилляторов Курамото. Каждый осциллятор имеет свою собственную фазу и естественную частоту. Они связаны между собой с определённой силой (параметры матрицы связи K). Система запускается из случайного начального состояния, после чего осцилляторы взаимодействуют друг с другом, эволюционируя во времени согласно физическим законам динамики. Это взаимодействие и естественная эволюция системы во времени и составляют процесс вычисления. В определённый момент времени состояние осцилляторов считывается и преобразуется декодером в изображение.

QКаких результатов достигла модель Un-0 в тестах и как её производительность соотносится с традиционными моделями?

AНа наборе данных ImageNet 64x64 самая крупная версия Un-0 с 16 384 осцилляторами достигла показателя FID 6.74. Это качество сопоставимо с уровнем некоторых классических традиционных генеративных моделей на ранних этапах их развития (таких как NCSN, BigGAN, iDDPM). Однако Un-0 пока отстаёт по качеству от современных передовых традиционных моделей, таких как EDM. Таким образом, Un-0 демонстрирует жизнеспособность подхода, но не является самой производительной моделью на сегодняшний день.

QКаковы потенциальные преимущества использования физических систем для AI-вычислений, согласно статье?

AСогласно статье, потенциальные преимущества включают: 1) Резкое снижение энергопотребления (вплоть до 1000 раз) за счёт того, что физическая система сама выполняет вычисления своей эволюцией, устраняя необходимость в энергоёмкой пересылке данных между памятью и процессором в архитектуре фон Неймана. 2) Объединение вычислений и памяти в одной физической сущности. 3) Естественная устойчивость к шуму, что открывает дополнительные возможности для экономии энергии. 4) Более прямой путь к созданию энергоэффективного специализированного оборудования (чипов), которое имитирует такие физические процессы.

Похожее

Программа Chainlink Build переходит от выделения токенов проектов к прямым выплатам в LINK

Программа Chainlink Build меняет экономику партнерских отношений, отходя от выделения токенов проектов в пользу прямых коммерческих выплат в LINK. Это изменение позиционируется не как сворачивание программы, а как уточнение модели монетизации для повышения устойчивости. Новость важна, так как позволяет рынку оценить, движется ли криптосреда за счет реального внедрения технологий или спекуляций. Развитие происходит в период, когда альткойны все больше оцениваются по фундаментальным показателям: использование, ликвидность и развитие. Далее важно следить за подтверждением от первоисточников, данными блокчейна и реакцией ликвидности, чтобы понять, станет ли это устойчивым трендом или останется локальным событием.

bitcoinist37 мин. назад

Программа Chainlink Build переходит от выделения токенов проектов к прямым выплатам в LINK

bitcoinist37 мин. назад

Киты Cardano усиливают накопление вблизи многомесячных минимумов на фоне роста интереса к фьючерсам

Согласно данным Santiment, крупные держатели Cardano (киты) увеличивают накопление ADA, когда цена токена находится возле многомесячных минимумов поддержки. Параллельно растет и интерес на фьючерсном рынке. Эта активность указывает на возможную позиционную игру крупных игроков, но не гарантирует формирования ценового дна. Ситуация представляет интерес, так как она сочетает в себе ценовое действие, структуру рынка и нарратив, за которым следят трейдеры. Контекст важен: крипторынок в целом ищет четкое направление, и подобные события помогают оценить, движутся ли активами реальное внедрение или краткосрочные спекуляции. Следует следить за дальнейшими подтверждениями в данных от первичных источников, обновлениях ликвидности и общей реакции рынка, чтобы понять, является ли это началом устойчивого тренда или изолированным событием.

bitcoinist1 ч. назад

Киты Cardano усиливают накопление вблизи многомесячных минимумов на фоне роста интереса к фьючерсам

bitcoinist1 ч. назад

Краткосрочный восстановительный рост AVAX — это скрытый сигнал к продаже – Вот почему

Актив Avalanche (AVAX) продемонстрировал краткосрочный рост на 5,95% за последние 24 часа, выделившись на фоне общего рынка. Однако этот подъем сопровождается снижением объема торгов почти на 8%, что указывает на слабость покупательского интереса. Незначительный рост открытого интереса (3,3%) также подтверждает нерешительность спекулятивных трейдеров. На графике видно, что рост происходит от перепроданных уровней, достигнутых в июне, и цена приближается к ключевому сопротивлению в зоне $6,8. Более крупные цели для возможного отскока находятся на уровнях $8,11, $8,69 и $9,51. Структура на 4-часовом таймфрейме остается медвежьей, а текущий откат достиг «золотого кармана» (61,8%-78,6% по Фибоначчи), что является четким сигналом к продаже. Зона $6,8-$7,0 выступает как локальная зона предложения. **Итог:** Несмотря на краткосрочную силу, слабые объемы и медвежья структура предполагают, что рост AVAX может быть недолгим. Свинг-трейдерам стоит дождаться более существенного отскока для входа в позиции с убеждением, так как текущее соотношение риска и доходности невелико. Продавцам в зоне $6,8 следует быть готовыми к остановке убытков, если откат окажется сильнее ожидаемого.

ambcrypto1 ч. назад

Краткосрочный восстановительный рост AVAX — это скрытый сигнал к продаже – Вот почему

ambcrypto1 ч. назад

Caleb & Brown интегрирует Ripple Payments для ускорения фиатных расчетов клиентов

Криптоброкерская фирма Caleb & Brown внедрила решение Ripple Payments для ускорения обработки выводов клиентских средств в фиате, а именно в долларах США. Эта интеграция представлена как пример использования блокчейн-технологии для расчетов в качестве альтернативы более медленным банковским переводам. Важный нюанс, отмеченный в материале: для использования сервиса клиентам не обязательно владеть криптовалютой XRP. Развитие ситуации рассматривается в контексте оценки рынком реального внедрения технологий, а не краткосрочных спекуляций. На текущем этапе рынок криптоактивов ищет четкое направление, и подобные новости могут влиять на оценку не только Ripple и XRP, но и всей сферы B2B-платежей. Далее стоит следить за подтверждением тренда из первичных источников и данными об активности, а также за реакцией ликвидности рынка, поскольку даже значимые разработки не всегда немедленно отражаются на ценах в условиях общей осторожности трейдеров.

bitcoinist2 ч. назад

Caleb & Brown интегрирует Ripple Payments для ускорения фиатных расчетов клиентов

bitcoinist2 ч. назад

Торговля

Спот
活动图片