За последние десять лет цифровые вычисления на основе GPU доминировали в области ИИ. Казалось, что более крупные кластеры, более высокая пропускная способность, более мощные GPU и более плотные центры обработки данных — это основной путь к следующему поколению искусственного интеллекта.
Однако по мере того, как количество параметров моделей приближается к триллионам, в отрасли все чаще стали упоминать слово «энергопотребление». Более того, возник еще более фундаментальный вопрос: если ИИ продолжит развиваться по существующей схеме, откуда взять электроэнергию?
Несомненно, «счет за электричество» ИИ и энергопотребление постепенно превратились из операционных расходов в «структурное узкое место», сдерживающее развитие всей отрасли.
Перед лицом этого насущного энергетического кризиса на первый план вышел Naveen Rao, бывший глава AI в Databricks и легендарный предприниматель Кремниевой долины, со своим новым хардверным стартапом Unconventional AI.
Сегодня Unconventional AI официально объявила о выпуске своей первой модели Un-0 — модели генерации изображений, управляемой «системой связанных осцилляторов», которую можно рассматривать как пример новой физической вычислительной основы. На ImageNet 64×64 Un-0 достигла показателя FID 6,74, что по качеству уже приближается к уровню некоторых основных традиционных методов генерации изображений на момент их первоначального выпуска.
Навин Рао назвал ее «первой крупномасштабной генеративной моделью, построенной с использованием физики в качестве вычислительного примитива».
«Это знаменует собой момент "Hello World" для моделей на физической основе. Мы используем естественное поведение физической системы во времени, позволяя ей выполнять вычисления за нас. В конечном итоге это новый способ построения компьютеров, который потенциально может привести к значительному повышению энергоэффективности».

Более того, в интервью СМИ Навин Рао поставил еще более смелую "маленькую цель": в будущем, возможно, удастся снизить энергопотребление при выводе ИИ до одной тысячной от существующих систем.

Пример траектории эволюции во времени процесса генерации Un-0. Цвет каждой линии соответствует цвету близкого прямоугольника, в прямоугольнике указан класс и показан процесс постепенной генерации изображений этого класса с течением времени.
Официально был опубликован блог, представляющий Un-0. Давайте узнаем подробнее.
Отправная точка Un-0: пересмотр вычислений ИИ с использованием физической системы
Unconventional AI заявляет, что их цель — создать новый тип компьютера, который использует законы физики для выполнения вычислений, что позволит современному ИИ в будущем работать при значительно меньшем энергопотреблении, чем у сегодняшних машин, примерно в 1000 раз.
Поэтому они задались вопросом: Можно ли обучить физическую динамическую систему генерировать изображения на задачах масштабируемого уровня?
Сегодня самые мощные модели ИИ в основном являются традиционными глубокими сетями, особенно модели на основе Transformer. Однако помимо основного направления уже давно существуют исследования, пытающиеся повысить энергоэффективность с помощью динамического поведения физических систем, например, шума, изменения во времени, напряжения и тока в аналоговых цепях. Эти методы используют не традиционные цифровые значения, а естественный процесс эволюции самой физической системы.
Например, нейроморфные вычисления, сети Хопфилда, Reservoir Computing, а также недавно разработанные Hamiltonian Networks, Liquid Networks, Neural Wave Machines, Thermodynamic Computing и осцилляторы Курамото.
Un-0 — это новая попытка в этих нетрадиционных вычислительных направлениях. Но главная сложность заключается в следующем: чтобы использовать эти альтернативные методы вычислений, задачи ИИ должны быть эффективно сопоставлены с динамическим процессом физической системы. Un-0 призван проверить, можно ли разместить современные рабочие нагрузки ИИ на физической основе и, в конечном итоге, добиться большей эффективности, чем на современном оборудовании.
Принцип работы Un-0
По словам авторов, можно представить два метронома, тикающих рядом, как показано на рисунке ниже.

Каждый метроном в любой момент времени имеет «фазу», то есть текущее положение маятника в его цикле качания. Если два метронома стоят на одном столе, они влияют друг на друга через поверхность стола. В зависимости от силы взаимодействия, то есть силы связи, они могут постепенно синхронизироваться или войти в состояние синхронизации в противофазе.
Это и есть основная концепция осциллятора: каждый осциллятор имеет свою фазу и стремится вращаться с собственной частотой, но при этом подвергается влиянию соседних осцилляторов.
Если же расширить систему до нескольких тысяч осцилляторов, она становится еще интереснее. Между большим количеством осцилляторов существуют связи разной силы, и они самоорганизуются в определенные паттерны через взаимодействие, как показано на рисунке ниже.

Вычислительным ядром Un-0 является именно такая крупномасштабная группа осцилляторов, а сила связи между ними является основным обучаемым параметром модели.
Эти связанные осцилляторы обычно моделируются как «осцилляторы Курамото».
Конкретно, движение каждого осциллятора следует простому правилу, которое действует непрерывно во времени: с одной стороны, он вращается с собственной естественной частотой, а с другой — смещается под воздействием всех остальных осцилляторов.
Процесс эволюции этих осцилляторов во времени описывается следующим обыкновенным дифференциальным уравнением (ODE):

Каждый осциллятор i имеет фазу

∈[0,2π), где

обозначает его собственную частоту. Матрица

определяет силу связи, решая, с какой силой осциллятор j будет тянуть осциллятор i к синхронному состоянию или отталкивать от него.
Un-0 должен изучить именно матрицу связи K и собственные частоты ω — эти параметры совместно определяют саму физическую систему.
Unconventional AI приводит две причины выбора осцилляторов:
- Первая причина исходит из мозга: В мозге широко распространены ритмическая активность и синхронные явления. Долгое время считалось, что эти явления могут участвовать в вычислительных процессах, например, связывать разрозненные признаки в целостное восприятие, контролировать обмен информацией между областями мозга, организовывать временную структуру нейронных импульсов и т. д. Связанные осцилляторы — одна из простейших математических моделей для описания такого поведения, поэтому они естественным образом подходят в качестве базовых единиц для нейроинспирированных вычислительных моделей.
- Вторая причина носит более инженерный характер: Осцилляторы могут быть реализованы в виде физического примитива схемы. Unconventional AI считает, что систему связанных осцилляторов можно напрямую реализовать на CMOS или другой физической основе, позволяя физическому поведению самой системы вычислять динамическую эволюцию.
Ставка Un-0 заключается в следующем: если законы физики могут напрямую вычислять рабочие нагрузки ИИ, то будущая вычислительная основа может сильно отличаться от сегодняшних GPU.
Архитектура модели Un-0
Процесс генерации изображения в Un-0 примерно делится на пять шагов:
- Случайная инициализация: Установка фаз всех осцилляторов в случайные углы (аналогично случайному шуму в диффузионных моделях);
- Ввод направляющей категории: Использование меньшей группы «условных осцилляторов» для ввода метки класса (например, «вулкан», «ромашка»), направляя основной пул осцилляторов в определенном направлении эволюции;
- Дать физике идти своим чередом: Освобождение системы, позволяя осцилляторам взаимодействовать и эволюционировать под действием физической динамики, пока они не стабилизируются;
- Фиксация снимка: Запись фаз всех осцилляторов в определенный момент времени T, формирование числовой сетки в скрытом пространстве (Latent);
- Рендеринг пикселей: Преобразование фазовой сетки в окончательные пиксели изображения с помощью традиционного декодера, на который приходится менее 13% параметров модели.

Связанные осцилляторы эволюционируют во времени под действием изученных связей. Между условными осцилляторами и основным пулом осцилляторов существует однонаправленная матрица низкого ранга для условной классификации, используемая для ввода информации о классе. В момент времени T система считывает состояние осцилляторов через декодер и генерирует изображение. Многократная выборка различных начальных условий позволяет генерировать соответствующее распределение изображений.
В процессе обучения модель изучает три типа параметров: как связаны осцилляторы (матрица K); собственная частота каждого осциллятора

; а также веса декодера. В целом, осцилляторная система берет на себя вычисления, которые в противном случае могли бы выполняться традиционными нейросетевыми слоями.
Unconventional AI поясняет, что такая архитектура выбрана для того, чтобы сама динамическая система имела максимальную свободу для выполнения вычислений.
При прямом распространении во время обучения модель просто устанавливает матрицу связи, частоты осцилляторов и начальные фазы, затем позволяет динамической системе эволюционировать и, наконец, считывает скрытые переменные изображения.
Это отличается от динамических методов генерации, таких как диффузионные модели и Flow Matching. Диффузионные модели и Flow Matching обычно явно направляют динамическую систему в процессе обучения, тогда как подход Un-0 больше похож на наблюдение за окончательными сгенерированными образцами и последующую оптимизацию всей динамической системы через функцию потерь.
Ценой этого является необходимость в более сложной функции потерь, поскольку сигнал обучения в основном исходит от самих сгенерированных образцов.
Как обучают Un-0?
Unconventional AI обучила модели трех масштабов на CIFAR-10 и ImageNet 64×64 соответственно, результаты следующие:

Результаты обучения на CIFAR-10

Результаты обучения на ImageNet 64×64
Согласно результатам, с увеличением количества осцилляторов показатель FID модели постоянно улучшается. Самая большая модель для ImageNet 64×64 использует 16384 осциллятора, общее количество параметров составляет около 322 миллионов, FID достигает 6,74.
В методе обучения использовалась новая предложенная функция потерь "Drifting Loss" ("Дрейфующие потери") в сочетании с экстрактором признаков DINOv2 и оптимизатором AdamW для сквозного обучения.
Что касается оценки, то для CIFAR-10 использовалось 50 тысяч сгенерированных образцов, и они сравнивались со справочной статистикой CIFAR-10 с помощью стандартного пакета и процесса оценки; для ImageNet 64×64 также использовалось 50 тысяч сгенерированных образцов, а FID вычислялся с помощью ADM evaluation suite.
Что касается вычислительных ресурсов, все модели для CIFAR-10 обучались на 1 GPU B200, а все модели для ImageNet 64×64 обучались на 8 GPU B200. На обучение самой большой модели для CIFAR-10 потребовалось 20 B200-часов, а самой большой модели для ImageNet 64×64 — 640 B200-часов.
По словам авторов, основным узким местом обучения является вычисление функции потерь "Drifting Loss", поскольку для этого требуется использование традиционного экстрактора признаков изображений и вычислений на нескольких видовых проекциях признаков.
Какое место занимает Un-0 в области генерации изображений?
Чтобы лучше продемонстрировать производительность Un-0, Unconventional AI поместила Un-0 на кривую «качество генерации vs количество параметров» для сравнения с традиционными и нетрадиционными моделями.

Соответствие между количеством параметров и значением FID в наборе данных CIFAR-10

Соответствие между количеством параметров и значением FID в изображениях размером 64×64
Вывод таков: Качество Un-0 уже сопоставимо с некоторыми ранними традиционными генераторами, а в некоторых сравнениях даже лучше, например, NCSN, DCGAN-TTUR, WGAN-GP, BigGAN, iDDPM, Consistency Models, TRACT и др. Но оно все еще отстает от более поздних высокопроизводительных традиционных моделей, таких как EDM и GDD.
Другими словами, Un-0 — не самая мощная на сегодняшний день модель генерации изображений, она больше похожа на отправную точку нового направления: ее производительность уже приближается к уровню многих классических генеративных моделей на момент их появления, но чтобы догнать последние достижения традиционного направления, необходима дальнейшая оптимизация алгоритмов, архитектуры и физических примитивов.
В целом, Un-0 демонстрирует возможность использования физических динамических систем для крупномасштабной генерации изображений в современном ИИ. Хотя текущая производительность при программной симуляции еще не достигла пика традиционного ИИ, она прокладывает многообещающий путь к будущей реализации «нетрадиционного аппаратного обеспечения ИИ» с энергоэффективностью, в тысячу раз превышающей современную...
Навин Рао также подчеркивает, что появление Un-0 показывает, что «вычисления — не исключительно человеческое изобретение». Они существуют повсюду в природе и физическом мире. Все физические процессы материальных объектов включают временное измерение, но современные вычислительные системы не используют его в полной мере.
«Мы как раз и разрабатываем это временное измерение».

Связь с энергоэффективностью здесь заключается в следующем: в современных машинах фон Неймановской архитектуры большая часть энергии расходуется на перемещение информации между памятью и вычислительными блоками, тогда как динамические системы объединяют вычисления и память в одну сущность. Более того, динамические системы могут быть устойчивы к шуму, что открывает новые возможности для экономии энергии на коммуникациях.
Un-0 представляет собой важный первый шаг в переходе вычислительной парадигмы к динамическим системам. «С выпуском этой модели мы устанавливаем связь между интеллектом и динамикой». Для вычислений ИИ динамика является естественной структурой выражения, нейронные сети по сути также можно рассматривать как динамические системы, поэтому сопоставление между ними будет более прямым.
«В мозге нет такой абстракции, как линейная алгебра, поэтому в каком-то смысле мы обходим промежуточные звенья».
Под публикацией многие пользователи также выразили ожидания.
«Фактически, такое повышение производительной эффективности огромно. Если эта технология получит широкое распространение, многие приложения, работающие локально, могут стать выполнимыми».

«Если эта технология выйдет на рынок, это будет невероятно продвинутая мозгоподобная технология».

Ссылки:
https://x.com/NaveenGRao/status/2070184079199494583
https://unconv.ai/blog/introducing-un-0-generating-images-with-coupled-oscillators/
https://techcrunch.com/2026/06/25/databricks-former-ai-chief-thinks-he-can-cut-ais-power-bill-by-1000x/
Эта статья взята с официального аккаунта WeChat «Машина-разум» (ID: almosthuman2014), автор: фокус на ИИ





