Nota del editor: Este artículo es una retrospectiva de ocho años de un emprendedor pionero en IA generativa. En 2018, antes de que existiera GPT, fundó Rosebud AI con el objetivo de "hacer que la creación sea tan fácil como jugar", lanzando sucesivamente múltiples herramientas de creatividad con IA, incluida TokkingHeads. En una etapa en la que las capacidades de los modelos aún no estaban maduras, estos productos amplificaron la experiencia de "aceptable pero útil" mediante el diseño de flujos e interacciones, logrando el crecimiento inicial de usuarios y la validación del producto.
Esta experiencia cubre casi todo el ciclo de evolución de la IA generativa, desde los "medios sintéticos" hasta la infraestructura de capacidades generales: desde la exploración experimental con CycleGAN y StyleGAN, hasta cómo GPT-4 amplió los límites de la generación de código y la creación interactiva. El avance tecnológico reescribe constantemente la lógica de los productos y el ritmo del emprendimiento. El camino del autor también refleja un cambio estructural más claro: cuando el modelo se convierte en una variable, la verdadera divisoria ya no es solo la tecnología en sí, sino cómo construir productos, distribución y comercialización alrededor de ella.
Después de dejar el cargo de CEO y unirse a a16z, el autor se dedicará a invertir en la pila de modelos de vanguardia y la infraestructura relacionada. Pero más importante que su camino individual es que la experiencia de estos ocho años apunta a una tendencia que está tomando forma: la primera fase de la IA generativa (demostrar lo que puede hacer) está llegando a su fin, y lo que sigue es una competencia de ciclo más largo centrada en cómo se organizan y productivizan las capacidades, y cómo finalmente llegan al mundo real.
A continuación, el texto original:
Me he unido a a16z como socio, centrándome en inversiones en infraestructura e IA. Al mismo tiempo, después de ocho años al frente de Rosebud AI, dejaré mi cargo como CEO.
A continuación, comparto algunas reflexiones sobre estos ocho años. Tengo un enorme respeto por quienes siguen construyendo en primera línea. El lanzamiento de un modelo puede borrar tu hoja de ruta original o adelantarla varios años. El diseño, el producto, la ingeniería: la forma de estas funciones ha cambiado en comparación con hace tres meses, y mucho menos con hace ocho años. La velocidad del progreso tecnológico hace de esta era el momento más emocionante para emprender, pero también el más desafiante.
En a16z, me centraré en la pila de modelos de vanguardia (frontier model stack): incluyendo los modelos en sí, y la infraestructura y herramientas de desarrollo construidas a su alrededor. Me entusiasma la rápida evolución de las capacidades de los modelos: cada vez más avances son impulsados por la IA misma. También soy optimista sobre los avances que la IA traerá en matemáticas y ciencias. Además, tras ocho años construyendo herramientas de creatividad con IA, siempre he tenido un interés especial en esta dirección.
Antes de esto, también participé como inversor ángel en algunas rondas iniciales, incluyendo @fal, @periodiclabs, @SakanaAILabs y @ExaAILabs. A partir de ahora, espero poder dedicar toda mi energía a apoyar a los fundadores que están construyendo esta pila tecnológica.
2018: Apostando por la IA generativa antes de que existiera GPT.
Ocho años es un tiempo muy largo para una startup en el campo de la IA generativa.
Empecé a finales de 2018, casi en una "era antigua", cuando este campo aún se llamaba "medios sintéticos". Estaba experimentando con CycleGAN y StyleGAN, que generaban contenidos extraños y fascinantes, lo que me hizo creer que algún día, crear sería tan ligero y natural como el modo construcción en los videojuegos (el nombre "rosebud" viene precisamente de Los Sims).
La creación, en su estado ideal, debería ser un juego. Y los primeros destellos de la IA generativa me hicieron creer que esta "experiencia de creación como juego" podría extenderse a más formas de creación. Empecé a imaginar cómo la IA generativa remodelaría los videojuegos (como ese video de CycleGAN que entrené basado en imágenes de "Myst" en 2018).
En un abrir y cerrar de ojos, ocho años después, ahora podemos generar videos, juegos e incluso música con una simple indicación. Ese futuro que una vez imaginamos, finalmente ha llegado, y esto es solo el comienzo.
Mirando atrás, quizás pude formar una creencia tan fuerte en una etapa tan temprana porque mi vida siempre ha estado en la intersección entre la tecnología y el arte: por un lado, una formación doctoral en matemáticas y aprendizaje profundo; por el otro, una pasión por la danza y la música. El emprendimiento en IA generativa requiere ambas: mi background técnico me permitió ver lo que se avecinaba, y mi inclinación artística me hizo querer construirlo con impaciencia.
El viaje emprendedor siempre es más largo y difícil de lo imaginado. Encontrar algo en lo que crees casi irracionalmente maximiza la probabilidad de persistir.
2018—2023: Conquistar usuarios con lo "aceptablemente útil"
Captura de pantalla de la interfaz de la tercera aplicación iOS, Tokkingheads. El núcleo de la IA generativa temprana era diseñar flujos simples y abrazar activamente la tosquedad del producto.
En este camino, lanzamos una gran cantidad de productos con el objetivo de afinar nuestra intuición sobre las capacidades de los modelos de vanguardia y aprender a empaquetarlas en experiencias mágicas que oculten sus defectos iniciales. En esa etapa aprendí: cuando la salida del modelo está lejos de ser perfecta, puedes diseñar experiencias de consumo que permitan a los usuarios iterar y recibir retroalimentación rápidamente. Los usuarios son exigentes, pero no frágiles: con conquistarlos con lo "aceptablemente útil" era suficiente.
Para la tercera aplicación móvil, habíamos acumulado suficiente conocimiento como para que Tokkingheads lograra una propagación viral de crecimiento orgánico, superando los 2 millones de usuarios en semanas. Surgió entonces la siguiente lección clave: como fundador, debes tener claro qué forma de producto te mantendrá motivado a largo plazo. Tokkingheads podría haber tomado el camino del éxito viral, pero no estaba seguro de que ese fuera el terreno adecuado para desarrollar esta magia creativa en un producto más completo, y ese producto más completo era lo que realmente quería.
Así que seguimos iterando. Hicimos fotos de stock generadas por IA, arte IA para NFT (sí... ingenuamente pensé que la calidad del trabajo era la clave, pero resultó que la habilidad realmente importante era la especulación y el hype), y herramientas de generación de assets para juegos con IA. Cada producto me enseñó algo concreto: por qué están dispuestos a pagar los usuarios, y a qué velocidad mejoran los modelos. Entre estos proyectos, también hubo una pandemia global y las crisis de los bancos Silicon Valley Bank y First Republic Bank, que me recordaron estar agradecido. Poder seguir construyendo es en sí mismo un privilegio.
2023: La generación de código alcanza la madurez
La generación de código finalmente era lo suficientemente buena, el momento estaba maduro para crear herramientas de juego para creadores no técnicos. Después del lanzamiento de GPT-4, ese futuro se volvió tangible. En marzo de 2023, compartí un memorándum con el equipo y armé la versión inicial de la función de texto a juego de Rosebud con el prototipo a continuación.
Captura de un tuit del 23 de marzo de 2023. Usé GPT-4 para aprender Three.js, combinado con la IA generativa de Rosebud para generar skyboxes, demostrando un prototipo temprano de invocar escenas 3D mediante texto.
Principios de 2023, memorándum interno del autor para el equipo, registrando el juicio sobre el producto tras el avance en la capacidad de generación de código. El juicio central de esta carta interna era: la IA está en una ventana crítica que definirá las próximas décadas, y los próximos dos años serán una fase de competencia intensamente feroz, con un ritmo rápido, alta intensidad y eliminación clara. La empresa se dedicará por completo a esta "carrera", adecuada solo para aquellos con una fuerte motivación intrínseca, dispuestos a soportar alta presión y a comprometerse a largo plazo, porque esto no es solo una experiencia laboral, sino una oportunidad histórica que podría cambiar la trayectoria profesional personal.
2026 y más allá: ¿Qué puedes construir que los laboratorios no quieran hacer?
Figura: Video demostrativo: el autor construye un juego de simulación de ciudad 3D en el navegador mediante prompts.
Hacer juegos requiere movilizar simultáneamente la intuición creativa y la capacidad técnica. La IA generativa es la clave para que la creación de juegos se convierta en un juego en sí mismo: cualquier avance en modelos, ya sea en imágenes, video, modelos mundiales o código, es inmediatamente absorbido y transformado. El modelo de negocio de los juegos también tiene más probabilidades de permanecer fuera del radar de los laboratorios de vanguardia: la ruta central de monetización sigue siendo el pago de los jugadores, y establecer un sistema de distribución del lado del jugador parece una tarea secundaria demasiado indirecta para los laboratorios que corren a toda velocidad hacia la AGI. Para los fundadores, elegir qué construir es siempre un juego continuo de buscar espacio fuera del camino crítico de los laboratorios.
Rosebud tiene un gran impulso. Hemos acumulado orgánicamente una comunidad grande y muy activa de creadores. Extrañaré las charlas informales con los creadores en Discord y los días de gestionar correos de soporte al usuario (un usuario que se queja es un usuario al que realmente le importa tu producto). La siguiente fase se centra en ampliar la escala de distribución hacia los jugadores, por lo que ahora es un buen momento para pasar el testigo a mis compañeros que han luchado codo a codo conmigo.
¡Felicidades a @glazworks por asumir el cargo de nuevo CEO de Rosebud! Posee la rara combinación de talento en aprendizaje automático y sensibilidad de producto.
Martin Casado y el equipo de a16z acompañaron el crecimiento de Rosebud en todo momento. Tuve una conversación clave con Martin sobre si JavaScript era la pila tecnológica correcta para los juegos de Rosebud: Unity o Roblox podrían ser más populares, pero la velocidad de mejora en la generación de código de JavaScript era mucho mayor debido a la mayor accesibilidad de los datos de entrenamiento. Este equipo busca la verdad y está dispuesto a apostar por las apuestas que traerán más constructores. Este es el camino hacia el futuro ideal: debemos construir, debemos innovar.
Espero seguir trabajando con todos ustedes desde el otro lado de la mesa. Los mensajes privados están siempre abiertos.













