En la última década, el cómputo digital centrado en GPU ha dominado el campo de la IA. Clústeres más grandes, mayor ancho de banda, GPUs más potentes y centros de datos más densos parecían ser el camino principal hacia la siguiente generación de IA.
Pero a medida que los parámetros de los modelos se acercan al billón, la industria comienza a mencionar con frecuencia la palabra "energía", e incluso surge una cuestión más fundamental: si la IA continúa expandiéndose al ritmo actual, ¿de dónde vendrá la electricidad?
Sin duda, la "factura eléctrica" y el consumo energético de la IA han evolucionado gradualmente desde un coste operativo hasta un "cuello de botella estructural" que restringe el desarrollo de toda la industria.
Ante esta inminente crisis energética, Naveen Rao, exdirector de IA de Databricks y legendario emprendedor de Silicon Valley, con su nueva startup de hardtech, Unconventional AI, se sitúa en el centro de atención.
Hoy, Unconventional AI anunció oficialmente su primer modelo, Un-0, un modelo generativo de imágenes impulsado por un "sistema de osciladores acoplados analógicos", que puede considerarse un ejemplo de una nueva infraestructura de computación física. En ImageNet 64×64, Un-0 alcanzó un FID de 6.74, una calidad ya cercana al nivel de algunos métodos tradicionales de generación de imágenes cuando se lanzaron inicialmente.
Naveen Rao lo ha calificado como el "primer modelo generativo a gran escala construido con la física como primitiva computacional".
"Esto marca un momento 'Hello World' para los modelos basados en la física. Utilizamos el comportamiento natural de un sistema físico que evoluciona en el tiempo para que realice la computación por nosotros. El resultado final es una nueva forma de construir computadoras, con la promesa de una mejora sustancial en eficiencia energética."

Incluso, en una entrevista con los medios, Naveen Rao planteó un objetivo aún más ambicioso: en el futuro, potencialmente reducir el consumo energético de la inferencia de IA a una milésima parte de los sistemas actuales.

Trayectorias de muestra de la evolución temporal del proceso de generación de Un-0. El color de cada línea corresponde a un cuadro de color similar, que anota una categoría y muestra el proceso de generación gradual de imágenes de esa categoría a lo largo del tiempo.
La compañía publicó una entrada de blog para presentar Un-0. Vamos a conocerlo en detalle.
El punto de partida de Un-0: Rehacer la computación de IA con sistemas físicos
Unconventional AI declara que su objetivo es construir un nuevo tipo de computadora que utilice las leyes físicas para realizar cálculos, con la esperanza de que la IA moderna del futuro pueda funcionar con un consumo energético muy inferior al actual, con un objetivo de reducción de aproximadamente 1000 veces.
Por lo tanto, plantean una pregunta: ¿Se puede entrenar un sistema dinámico físico para que genere imágenes en tareas a gran escala?
Hoy en día, los modelos de IA más potentes son básicamente redes neuronales tradicionales, especialmente los modelos basados en Transformers. Pero fuera de la corriente principal, durante mucho tiempo ha habido investigaciones que intentan aprovechar el comportamiento dinámico de los sistemas físicos para mejorar la eficiencia energética, como el ruido, las variaciones temporales, el voltaje y la corriente en circuitos analógicos. Estos métodos no usan valores numéricos digitales tradicionales para computar, sino que aprovechan el propio proceso de evolución del sistema físico.
Por ejemplo, la computación neuromórfica, las redes de Hopfield y la Reservoir Computing, así como desarrollos más recientes como Hamiltonian Networks, Liquid Networks, Neural Wave Machines, Thermodynamic Computing y Kuramoto Oscillators.
Un-0 es un nuevo intento en este camino de computación no convencional. Pero la dificultad central es: para aprovechar estos métodos computacionales alternativos, las tareas de IA deben mapearse efectivamente al proceso dinámico del sistema físico. Lo que Un-0 quiere verificar es si las cargas de trabajo modernas de IA pueden ejecutarse sobre una infraestructura física y, en última instancia, ser más eficientes que el hardware actual.
Cómo funciona Un-0
La compañía explica que podemos imaginar dos metrónomos haciendo tic-tac uno al lado del otro, como en la siguiente imagen.

Cada metrónomo tiene en cualquier momento una "fase", es decir, la posición actual de su brazo oscilante dentro de su ciclo de oscilación. Si ambos metrónomos se colocan en la misma mesa, se influyen mutuamente a través de la superficie de la mesa. Dependiendo de la fuerza de esta interacción, o intensidad de acoplamiento, pueden sincronizarse gradualmente o entrar en un estado de sincronización en fases opuestas.
Este es el concepto básico de un oscilador: cada oscilador tiene su propia fase y tiende a rotar a su frecuencia natural, pero al mismo tiempo está influenciado por osciladores vecinos.
Si extendemos esto de dos osciladores a miles, el sistema se vuelve más interesante. Un gran número de osciladores con diferentes intensidades de acoplamiento entre ellos se auto-organizan en algún patrón a través de su interacción mutua, como se muestra a continuación.

El motor computacional de Un-0 es precisamente un gran conjunto de tales osciladores, siendo la intensidad de acoplamiento entre ellos el parámetro principal que el modelo puede aprender.
Estos osciladores acoplados suelen modelarse como "osciladores de Kuramoto".
Concretamente, el movimiento de cada oscilador sigue una regla simple, y esta regla se aplica continuamente en el tiempo: por un lado, rota según su frecuencia natural; por otro, es desplazado por la atracción de todos los demás osciladores.
La siguiente ecuación diferencial ordinaria (ODE) describe cómo evolucionan estos osciladores en el tiempo:

Cada oscilador i tiene una fase

∈[0,2π), donde

representa su frecuencia natural. La matriz

especifica la intensidad de acoplamiento, determinando con qué fuerza el oscilador j tira (o empuja) al oscilador i hacia (o lejos de) un estado sincronizado.
Lo que Un-0 necesita aprender es precisamente la matriz de acoplamiento K y las frecuencias naturales ω, parámetros que juntos definen el sistema físico mismo.
Unconventional AI da dos razones para elegir osciladores:
- La primera razón proviene del cerebro: La actividad rítmica y la sincronización están ampliamente presentes en el cerebro. Durante mucho tiempo, se ha pensado que estos fenómenos podrían participar en procesos computacionales, como vincular características dispersas en una percepción coherente, controlar el intercambio de información entre regiones cerebrales o organizar la estructura temporal de los impulsos nerviosos. Los osciladores acoplados son uno de los modelos matemáticos más simples para describir este tipo de comportamiento, por lo que son naturalmente adecuados como unidad básica para modelos de computación inspirados en la neurociencia.
- La segunda razón es más ingenieril: Los osciladores pueden implementarse como una primitiva de circuito físico. Unconventional AI cree que es posible implementar directamente sistemas de osciladores acoplados en CMOS u otra infraestructura física, permitiendo que el comportamiento físico del sistema realice por sí mismo la evolución dinámica de la computación.
La apuesta detrás de Un-0 es: si las leyes físicas pueden computar directamente las cargas de trabajo de IA, entonces la infraestructura de ejecución futura podría ser muy diferente de las GPU actuales.
La arquitectura del modelo Un-0
La generación de una imagen por Un-0 se divide aproximadamente en cinco pasos:
- Inicialización aleatoria: Establecer las fases de todos los osciladores en ángulos aleatorios (similar al ruido aleatorio en modelos de difusión);
- Guiado por categoría de entrada: Utilizar un conjunto más pequeño de "osciladores condicionados" para introducir una etiqueta de categoría (como "volcán", "margarita"), guiando al grupo principal de osciladores hacia una dirección específica;
- Dejar que la física actúe naturalmente: Liberar el sistema, permitiendo que los osciladores evolucionen bajo la dinámica física, tirando unos de otros hasta estabilizarse;
- Capturar una instantánea: Registrar la fase de todos los osciladores en un tiempo específico T, formando una cuadrícula digital en el espacio latente (Latent);
- Renderizar píxeles: A través de un decodificador tradicional que representa menos del 13% de los parámetros del modelo, transformar la cuadrícula de fases en los píxeles finales de la imagen.

Los osciladores acoplados evolucionan en el tiempo bajo la influencia de las relaciones de acoplamiento aprendidas durante el entrenamiento. Existe una matriz de condición de categoría unidireccional y de bajo rango entre los osciladores condicionados y el grupo principal, utilizada para inyectar información de categoría. En el punto de tiempo T, el sistema lee el estado de los osciladores a través de un decodificador y genera una imagen. Muestreando diferentes condiciones iniciales múltiples veces, se puede generar la distribución de imágenes correspondiente.
Durante el entrenamiento, el modelo aprende principalmente tres tipos de parámetros: cómo se acoplan los osciladores entre sí (matriz K); la frecuencia natural de cada oscilador

; y los pesos del decodificador. En general, el sistema de osciladores asume la computación que tradicionalmente podrían realizar capas de redes neuronales.
Unconventional AI explica que eligieron esta arquitectura para dar al sistema dinámico la máxima libertad para realizar la computación.
En la propagación hacia adelante del entrenamiento, el modelo solo necesita establecer la matriz de acoplamiento, las frecuencias de los osciladores y las fases iniciales, luego dejar que el sistema dinámico evolucione y finalmente leer la variable latente de la imagen.
Esto difiere de métodos generativos dinámicos como los modelos de difusión o Flow Matching, que suelen guiar explícitamente la evolución del sistema dinámico durante el entrenamiento. El enfoque de Un-0 es más como observar solo la muestra generada final y luego optimizar todo el sistema dinámico a través de la función de pérdida.
El costo es que necesita una función de pérdida más compleja, ya que la señal de entrenamiento proviene principalmente de las propias muestras generadas.
¿Cómo se entrena Un-0?
Unconventional AI entrenó modelos de tres escalas diferentes en CIFAR-10 e ImageNet 64×64, con los siguientes resultados:

Resultados del entrenamiento en CIFAR-10

Resultados del entrenamiento en ImageNet 64×64
Según los resultados, a medida que aumenta el número de osciladores, la puntuación FID del modelo mejora continuamente. El modelo más grande de ImageNet 64×64 utiliza 16384 osciladores, con unos 322 millones de parámetros totales, y alcanza un FID de 6.74.
En cuanto al método de entrenamiento, utilizaron una nueva función de pérdida propuesta llamada "Drifting Loss" (Pérdida por Deriva), junto con el extractor de características DINOv2 y el optimizador AdamW para el entrenamiento de extremo a extremo.
Para la evaluación, en CIFAR-10 usaron 50,000 muestras generadas y las compararon con las estadísticas de referencia de CIFAR-10 utilizando el paquete y flujo de evaluación estándar. Para ImageNet 64×64, también usaron 50,000 muestras generadas y calcularon el FID mediante ADM evaluation suite.
En cuanto a potencia computacional, todos los modelos CIFAR-10 se entrenaron en 1 GPU B200, mientras que todos los modelos ImageNet 64×64 se entrenaron en 8 GPUs B200. El entrenamiento del modelo CIFAR-10 más grande consumió 20 horas-B200, y el del modelo ImageNet 64×64 más grande consumió 640 horas-B200.
La compañía señala que el principal cuello de botella del entrenamiento proviene del cálculo de la función de "Drifting Loss", ya que requiere el uso de un extractor de características de imágenes tradicional y cálculos en múltiples vistas de características.
¿Qué posición ocupa Un-0 en el campo de la generación de imágenes?
Para mostrar mejor el rendimiento de Un-0, Unconventional AI colocó a Un-0 en una curva de "calidad generativa vs. número de parámetros", comparándolo con modelos tradicionales y no tradicionales.

Relación entre el número de parámetros y el valor FID en el conjunto de datos CIFAR-10

Relación entre el número de parámetros y el valor FID en imágenes de 64×64 píxeles
La conclusión es: la calidad de Un-0 ya es comparable e incluso mejor en algunas comparaciones que la de algunos generadores tradicionales tempranos, como NCSN, DCGAN-TTUR, WGAN-GP, BigGAN, iDDPM, Consistency Models, TRACT, etc. Pero todavía se queda atrás de modelos tradicionales de alto rendimiento posteriores, como EDM y GDD.
En otras palabras, Un-0 no es el modelo generativo de imágenes más fuerte actualmente; es más bien un punto de partida para un nuevo camino: su rendimiento ya se acerca al nivel de muchos modelos generativos clásicos cuando se propusieron por primera vez, pero para alcanzar la vanguardia más reciente de la ruta tradicional, todavía se necesita optimización continua en algoritmos, arquitectura y primitivas físicas.
En general, Un-0 demuestra la viabilidad de utilizar sistemas de dinámica física para la generación de imágenes a gran escala en IA moderna. Aunque su rendimiento actual en simulación de software aún no alcanza la cima de la IA convencional, abre un camino prometedor para futuros "hardwares de IA no convencional" con una eficiencia energética potencialmente mil veces mayor...
Y Naveen Rao también enfatiza que la aparición de Un-0 muestra que "la computación no es una invención exclusivamente humana." Existe en todos los rincones de la naturaleza y el mundo físico. Todos los procesos físicos de las entidades físicas contienen una dimensión temporal, pero los sistemas computacionales actuales no aprovechan realmente esto.
"Lo que estamos desarrollando es precisamente esta dimensión temporal."

Y la relación con la eficiencia energética radica en que, en las máquinas actuales de arquitectura Von Neumann, la mayor parte de la energía se consume en el movimiento de información entre la memoria y las unidades de cómputo. Los sistemas dinámicos, en cambio, fusionan la computación y la memoria en la misma entidad. Más importante aún, los sistemas dinámicos pueden tolerar ruido, lo que abre aún más oportunidades para ahorrar energía en la comunicación.
Un-0 representa un importante primer paso en la transformación del paradigma computacional hacia los sistemas dinámicos. "Con el lanzamiento de este modelo, estamos conectando la inteligencia con la dinámica." Para la computación de IA, la dinámica es un marco de expresión natural; las redes neuronales también pueden verse esencialmente como sistemas dinámicos, por lo que el mapeo entre ambos es más directo.
"En el cerebro no existe la abstracción del álgebra lineal, así que, en cierto sentido, estamos sorteando pasos intermedios."
Y debajo de la publicación, muchos usuarios también expresaron su expectativa.
"En realidad, esta mejora en eficiencia de rendimiento es enorme. Si esta tecnología pudiera adoptarse ampliamente, muchas aplicaciones que se ejecutan localmente podrían volverse factibles."

"Si esta tecnología llegara al mercado, sería realmente una neurotecnología extremadamente avanzada."

Enlaces de referencia:
https://x.com/NaveenGRao/status/2070184079199494583
https://unconv.ai/blog/introducing-un-0-generating-images-with-coupled-oscillators/
https://techcrunch.com/2026/06/25/databricks-former-ai-chief-thinks-he-can-cut-ais-power-bill-by-1000x/
Este artículo proviene de la cuenta oficial de WeChat "机器之心" (ID:almosthuman2014), autor: 关注AI的





