Первый крупномасштабный генеративный модель Un-0, использующая физику в качестве вычислительного примитива, представлен. Снизит ли он энергопотребление ИИ в 1000 раз?

marsbitОпубликовано 2026-06-26Обновлено 2026-06-26

Введение

Компания Unconventional AI, основанная бывшим руководителем подразделения ИИ в Databricks Навином Рао, представила Un-0 — первую крупномасштабную генеративную модель, использующую физические системы в качестве вычислительного примитива. Un-0 представляет собой систему связанных осцилляторов (моделируемую уравнениями Курамото), динамика которой во времени генерирует изображения. Обученная на датасетах CIFAR-10 и ImageNet 64×64, модель с 3.22 млрд параметров достигла FID 6.74, что сопоставимо с ранними традиционными методами генерации. Ключевая цель разработки — радикальное повышение энергоэффективности ИИ: в перспективе энергопотребление при инференсе может быть снижено в 1000 раз за счёт замены цифровых вычислений на аналоговые физические процессы, объединяющие вычисление и память. Хотя текущая производительность Un-0 ещё не превосходит современные стандартные модели, она демонстрирует принципиальную возможность использования физической динамики для сложных задач ИИ и открывает путь к созданию нового класса энергоэффективных «неконвенциональных» вычислительных систем.

За последние десять лет цифровые вычисления на основе GPU доминировали в области ИИ. Казалось, что более крупные кластеры, более высокая пропускная способность, более мощные GPU и более плотные центры обработки данных — это основной путь к следующему поколению искусственного интеллекта.

Однако по мере того, как количество параметров моделей приближается к триллионам, в отрасли все чаще стали упоминать слово «энергопотребление». Более того, возник еще более фундаментальный вопрос: если ИИ продолжит развиваться по существующей схеме, откуда взять электроэнергию?

Несомненно, «счет за электричество» ИИ и энергопотребление постепенно превратились из операционных расходов в «структурное узкое место», сдерживающее развитие всей отрасли.

Перед лицом этого насущного энергетического кризиса на первый план вышел Naveen Rao, бывший глава AI в Databricks и легендарный предприниматель Кремниевой долины, со своим новым хардверным стартапом Unconventional AI.

Сегодня Unconventional AI официально объявила о выпуске своей первой модели Un-0 — модели генерации изображений, управляемой «системой связанных осцилляторов», которую можно рассматривать как пример новой физической вычислительной основы. На ImageNet 64×64 Un-0 достигла показателя FID 6,74, что по качеству уже приближается к уровню некоторых основных традиционных методов генерации изображений на момент их первоначального выпуска.

Навин Рао назвал ее «первой крупномасштабной генеративной моделью, построенной с использованием физики в качестве вычислительного примитива».

«Это знаменует собой момент "Hello World" для моделей на физической основе. Мы используем естественное поведение физической системы во времени, позволяя ей выполнять вычисления за нас. В конечном итоге это новый способ построения компьютеров, который потенциально может привести к значительному повышению энергоэффективности».

Более того, в интервью СМИ Навин Рао поставил еще более смелую "маленькую цель": в будущем, возможно, удастся снизить энергопотребление при выводе ИИ до одной тысячной от существующих систем.

Пример траектории эволюции во времени процесса генерации Un-0. Цвет каждой линии соответствует цвету близкого прямоугольника, в прямоугольнике указан класс и показан процесс постепенной генерации изображений этого класса с течением времени.

Официально был опубликован блог, представляющий Un-0. Давайте узнаем подробнее.

Отправная точка Un-0: пересмотр вычислений ИИ с использованием физической системы

Unconventional AI заявляет, что их цель — создать новый тип компьютера, который использует законы физики для выполнения вычислений, что позволит современному ИИ в будущем работать при значительно меньшем энергопотреблении, чем у сегодняшних машин, примерно в 1000 раз.

Поэтому они задались вопросом: Можно ли обучить физическую динамическую систему генерировать изображения на задачах масштабируемого уровня?

Сегодня самые мощные модели ИИ в основном являются традиционными глубокими сетями, особенно модели на основе Transformer. Однако помимо основного направления уже давно существуют исследования, пытающиеся повысить энергоэффективность с помощью динамического поведения физических систем, например, шума, изменения во времени, напряжения и тока в аналоговых цепях. Эти методы используют не традиционные цифровые значения, а естественный процесс эволюции самой физической системы.

Например, нейроморфные вычисления, сети Хопфилда, Reservoir Computing, а также недавно разработанные Hamiltonian Networks, Liquid Networks, Neural Wave Machines, Thermodynamic Computing и осцилляторы Курамото.

Un-0 — это новая попытка в этих нетрадиционных вычислительных направлениях. Но главная сложность заключается в следующем: чтобы использовать эти альтернативные методы вычислений, задачи ИИ должны быть эффективно сопоставлены с динамическим процессом физической системы. Un-0 призван проверить, можно ли разместить современные рабочие нагрузки ИИ на физической основе и, в конечном итоге, добиться большей эффективности, чем на современном оборудовании.

Принцип работы Un-0

По словам авторов, можно представить два метронома, тикающих рядом, как показано на рисунке ниже.

Каждый метроном в любой момент времени имеет «фазу», то есть текущее положение маятника в его цикле качания. Если два метронома стоят на одном столе, они влияют друг на друга через поверхность стола. В зависимости от силы взаимодействия, то есть силы связи, они могут постепенно синхронизироваться или войти в состояние синхронизации в противофазе.

Это и есть основная концепция осциллятора: каждый осциллятор имеет свою фазу и стремится вращаться с собственной частотой, но при этом подвергается влиянию соседних осцилляторов.

Если же расширить систему до нескольких тысяч осцилляторов, она становится еще интереснее. Между большим количеством осцилляторов существуют связи разной силы, и они самоорганизуются в определенные паттерны через взаимодействие, как показано на рисунке ниже.

Вычислительным ядром Un-0 является именно такая крупномасштабная группа осцилляторов, а сила связи между ними является основным обучаемым параметром модели.

Эти связанные осцилляторы обычно моделируются как «осцилляторы Курамото».

Конкретно, движение каждого осциллятора следует простому правилу, которое действует непрерывно во времени: с одной стороны, он вращается с собственной естественной частотой, а с другой — смещается под воздействием всех остальных осцилляторов.

Процесс эволюции этих осцилляторов во времени описывается следующим обыкновенным дифференциальным уравнением (ODE):

Каждый осциллятор i имеет фазу

∈[0,2π), где

обозначает его собственную частоту. Матрица

определяет силу связи, решая, с какой силой осциллятор j будет тянуть осциллятор i к синхронному состоянию или отталкивать от него.

Un-0 должен изучить именно матрицу связи K и собственные частоты ω — эти параметры совместно определяют саму физическую систему.

Unconventional AI приводит две причины выбора осцилляторов:

  • Первая причина исходит из мозга: В мозге широко распространены ритмическая активность и синхронные явления. Долгое время считалось, что эти явления могут участвовать в вычислительных процессах, например, связывать разрозненные признаки в целостное восприятие, контролировать обмен информацией между областями мозга, организовывать временную структуру нейронных импульсов и т. д. Связанные осцилляторы — одна из простейших математических моделей для описания такого поведения, поэтому они естественным образом подходят в качестве базовых единиц для нейроинспирированных вычислительных моделей.
  • Вторая причина носит более инженерный характер: Осцилляторы могут быть реализованы в виде физического примитива схемы. Unconventional AI считает, что систему связанных осцилляторов можно напрямую реализовать на CMOS или другой физической основе, позволяя физическому поведению самой системы вычислять динамическую эволюцию.

Ставка Un-0 заключается в следующем: если законы физики могут напрямую вычислять рабочие нагрузки ИИ, то будущая вычислительная основа может сильно отличаться от сегодняшних GPU.

Архитектура модели Un-0

Процесс генерации изображения в Un-0 примерно делится на пять шагов:

  • Случайная инициализация: Установка фаз всех осцилляторов в случайные углы (аналогично случайному шуму в диффузионных моделях);
  • Ввод направляющей категории: Использование меньшей группы «условных осцилляторов» для ввода метки класса (например, «вулкан», «ромашка»), направляя основной пул осцилляторов в определенном направлении эволюции;
  • Дать физике идти своим чередом: Освобождение системы, позволяя осцилляторам взаимодействовать и эволюционировать под действием физической динамики, пока они не стабилизируются;
  • Фиксация снимка: Запись фаз всех осцилляторов в определенный момент времени T, формирование числовой сетки в скрытом пространстве (Latent);
  • Рендеринг пикселей: Преобразование фазовой сетки в окончательные пиксели изображения с помощью традиционного декодера, на который приходится менее 13% параметров модели.

Связанные осцилляторы эволюционируют во времени под действием изученных связей. Между условными осцилляторами и основным пулом осцилляторов существует однонаправленная матрица низкого ранга для условной классификации, используемая для ввода информации о классе. В момент времени T система считывает состояние осцилляторов через декодер и генерирует изображение. Многократная выборка различных начальных условий позволяет генерировать соответствующее распределение изображений.

В процессе обучения модель изучает три типа параметров: как связаны осцилляторы (матрица K); собственная частота каждого осциллятора

; а также веса декодера. В целом, осцилляторная система берет на себя вычисления, которые в противном случае могли бы выполняться традиционными нейросетевыми слоями.

Unconventional AI поясняет, что такая архитектура выбрана для того, чтобы сама динамическая система имела максимальную свободу для выполнения вычислений.

При прямом распространении во время обучения модель просто устанавливает матрицу связи, частоты осцилляторов и начальные фазы, затем позволяет динамической системе эволюционировать и, наконец, считывает скрытые переменные изображения.

Это отличается от динамических методов генерации, таких как диффузионные модели и Flow Matching. Диффузионные модели и Flow Matching обычно явно направляют динамическую систему в процессе обучения, тогда как подход Un-0 больше похож на наблюдение за окончательными сгенерированными образцами и последующую оптимизацию всей динамической системы через функцию потерь.

Ценой этого является необходимость в более сложной функции потерь, поскольку сигнал обучения в основном исходит от самих сгенерированных образцов.

Как обучают Un-0?

Unconventional AI обучила модели трех масштабов на CIFAR-10 и ImageNet 64×64 соответственно, результаты следующие:

Результаты обучения на CIFAR-10

Результаты обучения на ImageNet 64×64

Согласно результатам, с увеличением количества осцилляторов показатель FID модели постоянно улучшается. Самая большая модель для ImageNet 64×64 использует 16384 осциллятора, общее количество параметров составляет около 322 миллионов, FID достигает 6,74.

В методе обучения использовалась новая предложенная функция потерь "Drifting Loss" ("Дрейфующие потери") в сочетании с экстрактором признаков DINOv2 и оптимизатором AdamW для сквозного обучения.

Что касается оценки, то для CIFAR-10 использовалось 50 тысяч сгенерированных образцов, и они сравнивались со справочной статистикой CIFAR-10 с помощью стандартного пакета и процесса оценки; для ImageNet 64×64 также использовалось 50 тысяч сгенерированных образцов, а FID вычислялся с помощью ADM evaluation suite.

Что касается вычислительных ресурсов, все модели для CIFAR-10 обучались на 1 GPU B200, а все модели для ImageNet 64×64 обучались на 8 GPU B200. На обучение самой большой модели для CIFAR-10 потребовалось 20 B200-часов, а самой большой модели для ImageNet 64×64 — 640 B200-часов.

По словам авторов, основным узким местом обучения является вычисление функции потерь "Drifting Loss", поскольку для этого требуется использование традиционного экстрактора признаков изображений и вычислений на нескольких видовых проекциях признаков.

Какое место занимает Un-0 в области генерации изображений?

Чтобы лучше продемонстрировать производительность Un-0, Unconventional AI поместила Un-0 на кривую «качество генерации vs количество параметров» для сравнения с традиционными и нетрадиционными моделями.

Соответствие между количеством параметров и значением FID в наборе данных CIFAR-10

Соответствие между количеством параметров и значением FID в изображениях размером 64×64

Вывод таков: Качество Un-0 уже сопоставимо с некоторыми ранними традиционными генераторами, а в некоторых сравнениях даже лучше, например, NCSN, DCGAN-TTUR, WGAN-GP, BigGAN, iDDPM, Consistency Models, TRACT и др. Но оно все еще отстает от более поздних высокопроизводительных традиционных моделей, таких как EDM и GDD.

Другими словами, Un-0 — не самая мощная на сегодняшний день модель генерации изображений, она больше похожа на отправную точку нового направления: ее производительность уже приближается к уровню многих классических генеративных моделей на момент их появления, но чтобы догнать последние достижения традиционного направления, необходима дальнейшая оптимизация алгоритмов, архитектуры и физических примитивов.

В целом, Un-0 демонстрирует возможность использования физических динамических систем для крупномасштабной генерации изображений в современном ИИ. Хотя текущая производительность при программной симуляции еще не достигла пика традиционного ИИ, она прокладывает многообещающий путь к будущей реализации «нетрадиционного аппаратного обеспечения ИИ» с энергоэффективностью, в тысячу раз превышающей современную...

Навин Рао также подчеркивает, что появление Un-0 показывает, что «вычисления — не исключительно человеческое изобретение». Они существуют повсюду в природе и физическом мире. Все физические процессы материальных объектов включают временное измерение, но современные вычислительные системы не используют его в полной мере.

«Мы как раз и разрабатываем это временное измерение».

Связь с энергоэффективностью здесь заключается в следующем: в современных машинах фон Неймановской архитектуры большая часть энергии расходуется на перемещение информации между памятью и вычислительными блоками, тогда как динамические системы объединяют вычисления и память в одну сущность. Более того, динамические системы могут быть устойчивы к шуму, что открывает новые возможности для экономии энергии на коммуникациях.

Un-0 представляет собой важный первый шаг в переходе вычислительной парадигмы к динамическим системам. «С выпуском этой модели мы устанавливаем связь между интеллектом и динамикой». Для вычислений ИИ динамика является естественной структурой выражения, нейронные сети по сути также можно рассматривать как динамические системы, поэтому сопоставление между ними будет более прямым.

«В мозге нет такой абстракции, как линейная алгебра, поэтому в каком-то смысле мы обходим промежуточные звенья».

Под публикацией многие пользователи также выразили ожидания.

«Фактически, такое повышение производительной эффективности огромно. Если эта технология получит широкое распространение, многие приложения, работающие локально, могут стать выполнимыми».

«Если эта технология выйдет на рынок, это будет невероятно продвинутая мозгоподобная технология».

Ссылки:

https://x.com/NaveenGRao/status/2070184079199494583

https://unconv.ai/blog/introducing-un-0-generating-images-with-coupled-oscillators/

https://techcrunch.com/2026/06/25/databricks-former-ai-chief-thinks-he-can-cut-ais-power-bill-by-1000x/

Эта статья взята с официального аккаунта WeChat «Машина-разум» (ID: almosthuman2014), автор: фокус на ИИ

Связанные с этим вопросы

QЧто такое модель Un-0 и чем она отличается от традиционных AI-моделей?

AUn-0 — это генерирующая модель изображений, разработанная компанией Unconventional AI. Её ключевое отличие заключается в том, что в качестве вычислительного «примитива» она использует не цифровые вычисления на GPU, а физическую динамическую систему — связанные осцилляторы (колебательные системы). Это позволяет модели полагаться на естественную эволюцию физической системы во времени для выполнения вычислений, что потенциально может значительно снизить энергопотребление.

QКакую основную проблему в развитии AI призван решить подход Unconventional AI?

AПодход Unconventional AI призван решить проблему огромного и растущего энергопотребления современных AI-систем. По мере роста параметров моделей до триллионов, энергозатраты становятся «структурным узким местом», угрожающим дальнейшему развитию отрасли. Цель компании — создать новый тип вычислительной техники, использующий законы физики для вычислений, что, по их оценкам, может снизить энергопотребление при инференсе (выводе) AI в 1000 раз по сравнению с текущими системами.

QКак работает вычислительное ядро модели Un-0?

AВычислительное ядро Un-0 представляет собой большую сеть связанных осцилляторов (колебателей), например, осцилляторов Курамото. Каждый осциллятор имеет свою собственную фазу и естественную частоту. Они связаны между собой с определённой силой (параметры матрицы связи K). Система запускается из случайного начального состояния, после чего осцилляторы взаимодействуют друг с другом, эволюционируя во времени согласно физическим законам динамики. Это взаимодействие и естественная эволюция системы во времени и составляют процесс вычисления. В определённый момент времени состояние осцилляторов считывается и преобразуется декодером в изображение.

QКаких результатов достигла модель Un-0 в тестах и как её производительность соотносится с традиционными моделями?

AНа наборе данных ImageNet 64x64 самая крупная версия Un-0 с 16 384 осцилляторами достигла показателя FID 6.74. Это качество сопоставимо с уровнем некоторых классических традиционных генеративных моделей на ранних этапах их развития (таких как NCSN, BigGAN, iDDPM). Однако Un-0 пока отстаёт по качеству от современных передовых традиционных моделей, таких как EDM. Таким образом, Un-0 демонстрирует жизнеспособность подхода, но не является самой производительной моделью на сегодняшний день.

QКаковы потенциальные преимущества использования физических систем для AI-вычислений, согласно статье?

AСогласно статье, потенциальные преимущества включают: 1) Резкое снижение энергопотребления (вплоть до 1000 раз) за счёт того, что физическая система сама выполняет вычисления своей эволюцией, устраняя необходимость в энергоёмкой пересылке данных между памятью и процессором в архитектуре фон Неймана. 2) Объединение вычислений и памяти в одной физической сущности. 3) Естественная устойчивость к шуму, что открывает дополнительные возможности для экономии энергии. 4) Более прямой путь к созданию энергоэффективного специализированного оборудования (чипов), которое имитирует такие физические процессы.

Похожее

Представлен 0,7-нм чип: Закон Мура снова в действии

Закон Мура снова в силе: IBM представила первый в мире процесс с технологией 0,7 нм. На чипе размером с ноготь можно разместить почти 100 миллиардов транзисторов, что вдвое превышает плотность 2-нм чипов. Ключевым прорывом стала архитектура NanoStack — первая в отрасли трехмерная вертикальная компоновка транзисторов на основе нанолистов. По сравнению с 2 нм, это дает прирост производительности на 50% или повышение энергоэффективности на 70%. Технология уже успешно протестирована в лаборатории, включая работу КМОП-инверторов и сокращение площади SRAM на 40%. IBM, которая больше не производит чипы, разрабатывает процесс для лицензирования производителям. Ожидается, что NanoStack может обеспечить дальнейшую миниатюризацию чипов как минимум на десять лет, а коммерческое производство может начаться в ближайшие пять лет.

marsbit13 мин. назад

Представлен 0,7-нм чип: Закон Мура снова в действии

marsbit13 мин. назад

Создатели ChatGPT уже не используют ChatGPT для работы

Разработчики ChatGPT уже практически не используют его для работы. В OpenAI основным инструментом стал AI-агент Codex. К июню 2026 года на него приходится 99,8% всех выходных токенов компании, тогда как менее года назад этот показатель не достигал 10%. Перелом наступил в сентябре, когда Codex, получив более мощную модель и новые функции, начал выполнять все более сложные задачи. Сотрудники предпочитают поручать ему целые рабочие процессы, а не вести диалог в чате. Это касается всех отделов — от инженерного до юридического и финансового. Ключевой сигнал — активный рост пользователей, не являющихся разработчиками. Они используют Codex для автоматизации рутинных задач, анализа документов и даже программирования. Более 25% задач от бизнес-пользователей связаны с написанием кода, что стирает границы между профессиями. Codex эволюционировал из инструмента для генерации кода в автономного агента, способного самостоятельно выполнять длительные многоэтапные задачи — от реализации и тестирования до отладки. Наиболее активные пользователи поручают ему объем работы, эквивалентный 60+ человеко-часам в день. Это знаменует смену парадигмы: вместо пошагового взаимодействия с чат-ботом пользователи все чаще делегируют AI-агентам выполнение целых комплексных задач, сохраняя за собой контроль и ответственность.

marsbit19 мин. назад

Создатели ChatGPT уже не используют ChatGPT для работы

marsbit19 мин. назад

Grayscale снижает комиссии перед запуском MSOL — Зададут ли институциональные инвесторы следующий рост Solana?

Институциональные действия на волатильном рынке редко являются случайностью. На фоне общего оттока средств с крипторынка (свыше $100 млрд на прошлой неделе) и падения общей капитализации до $1,99 трлн, Solana (SOL) демонстрирует признаки возможного расхождения с общей тенденцией. Ключевым событием стало решение Grayscale снизить годовую комиссию за свой спотовый ETF на Solana с 0,35% до 0,19%. Этот шаг, вероятно, является реакцией на усиление конкуренции, в частности на планы Morgan Stanley запустить ETF (MSOL) с комиссией всего 0,14%. Эти действия указывают на сохраняющийся институциональный интерес к SOL, несмотря на слабую общую рыночную конъюнктуру и технический риск снижения цены к отметке $60. Фундаментальная картина для Solana выглядит устойчивой. Экосистема токенизированных реальных активов (RWA) достигла рекордного объема в $3,1 млрд при более чем 290 000 держателей. Дополнительный импульс создает листинг ETF на Solana (SOLZ) на Казахстанской фондовой бирже (KASE), что расширяет глобальный институциональный доступ. Таким образом, настройки на третий квартал для Solana формируются под влиянием двух факторов: растущей конкуренции среди ETF, снижающей барьеры для инвесторов, и сильной базовой активности в экосистеме. Это создает предпосылки для потенциального роста, когда институциональные потоки капитала догонят фундаментальные показатели сети.

ambcrypto1 ч. назад

Grayscale снижает комиссии перед запуском MSOL — Зададут ли институциональные инвесторы следующий рост Solana?

ambcrypto1 ч. назад

Артур Хейес продаёт NEAR, Worldcoin и Zcash, перекладываясь в акции энергетических компаний

Артур Хейес, бывший CEO BitMEX, изложил более оборонительную позицию в своем портфеле. В своём эссе «Проверка реальности» он утверждает, что долговой бум в сфере искусственного интеллекта (ИИ) искажает условия ликвидности на рынках и откладывает следующую крупную экспансию в криптоиндустрии. В связи с этим Хейес сообщил о выходе из позиций по нескольким альткоинам, включая NEAR, Worldcoin и Zcash. При этом он сохраняет структурный бычий настрой в отношении Биткоина и Эфира, рассматривая их как основные долгосрочные активы. Биткоин остаётся для него предпочтительным хеджем против долговой экспансии, а Эфир — ключевым активом смарт-контрактов. Часть высвободившегося капитала он направляет в казначейские облигации (Treasuries) и акции энергетического сектора. Хейес подчёркивает, что его сдвиг — не отход от криптовалют в целом, а более избирательная стратегия. В текущих условиях, когда ликвидность поглощается финансированием инфраструктуры ИИ, высоковолатильные альткоины могут испытывать трудности. Ключевой вывод для рынка — важность отслеживания глобальной ликвидности, кредитных условий и потоков капитала, которые в ближайшей перспективе могут быть важнее отдельных нарративов внутри криптоиндустрии. Долгосрочная цель Хейеса по Биткоину в $1 миллион остаётся в силе, но путь к ней может оказаться более сложным.

bitcoinist1 ч. назад

Артур Хейес продаёт NEAR, Worldcoin и Zcash, перекладываясь в акции энергетических компаний

bitcoinist1 ч. назад

Торговля

Спот
活动图片