a16z: El futuro de la IA visual no son las imágenes, sino el código
El futuro de la IA visual no son las imágenes, sino el código, según a16z. Mientras que los modelos de difusión actuales se centran en generar píxeles realistas (imágenes, videos), el siguiente paso crucial es la generación nativa de código: crear artefactos estructurados como HTML/CSS, SVG, scripts de Blender o escenas USD. Estos "programas visuales" permiten editar, iterar, probar e integrar los resultados en flujos de producción reales, a diferencia de las salidas de píxeles estáticas.
La generación visual basada en código sigue un ciclo "código → renderizado → revisión → modificación", donde el modelo mejora el artefacto fuente, no solo genera una nueva muestra. Esto es especialmente relevante en diseño UI, animación (formato Lottie) y, sobre todo, en 3D, donde un activo necesita geometría coherente, jerarquías, materiales y restricciones funcionales (ej: una puerta que se abre) para ser usable en motores de juego o simuladores.
El mercado se organizará en torno a "entornos de ejecución" como navegadores, Blender o motores de juego, que sirven como entornos de retroalimentación. Aunque los modelos nativos de píxeles seguirán siendo ideales para realismo y exploración, los sistemas basados en código transformarán la producción visual al priorizar activos editables, verificables y listos para producción.
marsbitHace 6 min(s)