Note de la rédaction : Cet article est une rétrospective de huit ans par un entrepreneur pionnier de l'IA générative. En 2018, avant même l'émergence de GPT, il a fondé Rosebud AI, avec pour objectif de « rendre la création aussi simple que de jouer à un jeu », et a successivement lancé plusieurs outils de création IA, dont TokkingHeads. À une époque où les capacités des modèles étaient encore immatures, ces produits ont amplifié l'expérience « imparfaite mais utilisable » grâce à la conception de processus et d'interactions, réalisant ainsi une croissance initiale d'utilisateurs et une validation du produit.
Cette expérience couvre presque le cycle complet d'évolution de l'IA générative, des médias synthétiques à une infrastructure de capacités générales : des explorations expérimentales avec CycleGAN et StyleGAN, jusqu'à l'ouverture des frontières de la génération de code et de la création interactive par GPT-4. Les progrès technologiques n'ont cessé de réécrire la logique des produits et le rythme de l'entrepreneuriat. Le parcours de l'auteur reflète également un changement structurel plus net — lorsque le modèle devient une variable, le véritable point de basculement n'est plus seulement la technologie elle-même, mais la manière de construire des produits, une distribution et une commercialisation autour de celle-ci.
Après avoir quitté son poste de PDG et rejoint a16z, l'auteur se tournera vers l'investissement dans la pile de modèles de pointe et les infrastructures associées. Mais plus important que son parcours individuel, l'expérience de ces huit années pointe vers une tendance en formation : la première phase de l'IA générative (prouver ce qui est possible) touche à sa fin. La prochaine étape, une compétition de plus longue haleine, se concentrera sur la manière dont les capacités sont organisées, transformées en produits et finalement déployées dans le monde réel.
Voici le texte original :
J'ai rejoint a16z en tant que partenaire, me concentrant sur les investissements en infrastructure et en IA. Parallèlement, après avoir dirigé Rosebud AI pendant 8 ans, je quitterai également mon poste de PDG.
Voici quelques réflexions et retours sur ces 8 années. J'ai un immense respect pour ceux qui sont encore en première ligne à construire aujourd'hui. La sortie d'un seul modèle peut anéantir votre feuille de route produit initiale ou l'avancer de plusieurs années. Le design, le produit, l'ingénierie — la forme de ces fonctions a changé par rapport à il y a 3 mois, sans parler d'il y a 8 ans. La vitesse du progrès technologique fait de cette époque le moment le plus excitant pour entreprendre, mais aussi le plus challengeant.
Chez a16z, je me concentrerai sur la pile de modèles de pointe (frontier model stack) : incluant les modèles eux-mêmes, ainsi que l'infrastructure et les outils de développement construits autour d'eux. L'évolution rapide des capacités des modèles m'enthousiasme — de plus en plus de progrès sont désormais pilotés par l'IA elle-même. Je suis également optimiste quant aux percées que l'IA apportera dans les domaines des mathématiques et des sciences. De plus, après avoir passé les 8 dernières années à créer des outils de création IA, je conserve un intérêt particulier pour cette direction.
Auparavant, j'ai également participé en tant qu'investisseur business angel à certains tours de table seed, notamment @fal, @periodiclabs, @SakanaAILabs et @ExaAILabs. Par la suite, j'ai hâte de pouvoir consacrer toute mon énergie à soutenir les fondateurs qui construisent cette stack technologique.
2018 : Parier sur l'IA générative avant l'arrivée de GPT.
Huit ans, c'est un temps considérable pour une startup dans le domaine de l'IA générative.
J'ai commencé fin 2018, ce qui remonte presque à « l'âge de pierre », à une époque où ce domaine était encore appelé « médias synthétiques (synthetic media) ». Je bidouillais avec CycleGAN et StyleGAN, dont les générations étaient à la fois étranges et fascinantes, me convaincre qu'un jour, créer serait aussi léger et facile que le mode construction dans un jeu vidéo (le nom « rosebud» vient d'ailleurs des Sims).
La création, dans son état idéal, devrait être une forme de jeu. Et les premières lueurs de l'IA générative m'ont fait croire que cette « expérience de création ludique » pourrait s'étendre à davantage de formes de création. J'ai commencé à imaginer comment l'IA générative allait remodeler les jeux vidéo (comme cette vidéo CycleGAN que j'avais entraînée sur des images de « Myst » en 2018).
Huit ans plus tard, nous pouvons désormais générer des vidéos, des jeux ou même de la musique avec une simple invite textuelle. Ce futur autrefois imaginé est enfin arrivé — et ce n'est que le début.
En y regardant de plus près, la raison pour laquelle j'ai pu développer une conviction si forte à un stade aussi précoce tient peut-être au fait que ma vie a toujours été à l'intersection de la technologie et de l'art : d'un côté une formation doctorale en mathématiques et apprentissage profond, de l'autre une passion pour la danse et la musique. L'entrepreneuriat en IA générative nécessite justement les deux : ma formation technique m'a permis de voir ce qui arrivait, et mon inclination artistique m'a donné une envie irrésistible de le construire.
Le parcours entrepreneurial est toujours plus long et plus difficile que prévu. Trouvez quelque chose en quoi vous croyez de manière presque irrationnelle pour maximiser vos chances de tenir bon.
2018—2023 : Séduire les utilisateurs avec du « assez bon pour être utilisé »
Capture d'écran de l'interface de la troisième application iOS, Tokkingheads. Le cœur de l'IA générative précoce résidait dans la conception de processus simples et l'acceptation active de la rugosité du produit.
En chemin, nous avons publié une multitude de produits, dans le but d'aiguiser notre intuition des capacités des modèles de pointe et d'apprendre à les emballer dans une expérience magique qui masque leurs défauts initiaux. À ce stade, j'ai compris : lorsque la sortie du modèle est loin d'être parfaite, vous pouvez concevoir une expérience grand public qui permet aux utilisateurs d'itérer et d'obtenir des retours rapidement. Les utilisateurs sont exigeants, mais pas fragiles — les séduire avec du « assez bon pour être utilisé » suffit.
Au moment de la troisième application mobile, nous avions accumulé suffisamment de connaissances pour que Tokkingheads réalise une propagation virale par croissance organique, atteignant plus de 2 millions d'utilisateurs en quelques semaines. La leçon suivante est alors arrivée : en tant que fondateur, vous devez savoir clairement quel type de produit vous motive sur le long terme. Tokkingheads aurait pu devenir un phénomène viral, mais je n'étais pas certain que ce soit le terrain idéal pour développer cette magie créative en un produit plus complet, et c'est ce produit plus complet que je voulais vraiment.
Nous avons donc continué à itérer. Nous avons créé des photos de banque d'images générées par IA, de l'art IA pour les NFT (oui... j'ai naïvement cru que la qualité de l'œuvre était la clé, pour découvrir que la compétence réellement importante était la spéculation et le battage médiatique), ainsi que des outils de génération d'assets de jeu IA. Chaque produit m'a appris quelque chose de concret : ce pour quoi les utilisateurs sont prêts à payer, et à quelle vitesse les modèles s'améliorent. Entre ces projets, il y a eu une pandémie mondiale, et les ruées sur Silicon Valley Bank et First Republic Bank — des rappels d'être reconnaissant. Pouvoir continuer à construire est en soi un privilège.
2023 : La génération de code arrive à maturité
La génération de code est enfin suffisamment bonne pour qu'il soit temps de créer des outils de jeu pour les créateurs non techniques. Après la sortie de GPT-4, ce futur est devenu tangible. En mars 2023, j'ai partagé un memorandum avec l'équipe et j'ai assemblé la version initiale de la fonctionnalité texte-vers-jeu de Rosebud avec le prototype ci-dessous.
Capture d'écran d'un tweet du 23 mars 2023. J'ai utilisé GPT-4 pour apprendre Three.js, combiné à l'IA générative de Rosebud pour générer un skybox, démontrant un prototype précoce d'invocation de scènes 3D par texte.
Début 2023, memorandum interne de l'auteur à son équipe, notant le jugement produit après la percée des capacités de génération de code. Le jugement central de cette note interne est : l'IA est à une fenêtre critique qui déterminera les décennies à venir, et les deux prochaines années seront une phase de compétition intense, au rythme rapide, à haute intensité, avec une élimination claire. La société s'engagera pleinement dans ce « course de vitesse », qui ne conviendra qu'à ceux qui ont une forte motivation intrinsèque, sont prêts à supporter une haute pression et à s'investir sur le long terme — car il ne s'agit pas seulement d'une expérience professionnelle, mais d'une opportunité historique susceptible de changer la trajectoire professionnelle personnelle.
2026 et au-delà : Que pouvez-vous construire que les labos ne veulent pas faire ?
Image : Vidéo de démonstration — L'auteur construit un jeu de simulation de ville 3D côté navigateur via des invites textuelles.
Créer des jeux nécessite de mobiliser simultanément l'intuition créative et les capacités techniques. L'IA générative est la clé pour faire de la création de jeux elle-même une forme de jeu — tout progrès de modèle, que ce soit en image, vidéo, modélisation du monde ou code, est immédiatement absorbé et transformé. Le modèle économique des jeux est aussi celui qui a le plus de chances de rester en dehors du champ de vision des labos de pointe : le chemin de monétisation central reste le paiement par les joueurs, et construire un système de distribution côté joueur semble être une tâche secondaire trop détournée pour les labos qui foncent vers l'AGI. Pour les fondateurs, choisir quoi construire est toujours un jeu continu de recherche d'espace en dehors du chemin critique des laboratoires.
Rosebud a le vent en poupe. Nous avons accumulé organiquement une communauté de créateurs large et très active. Les discussions informelles avec les créateurs sur Discord me manqueront, tout comme le traitement quotidien des emails de support utilisateur (un utilisateur qui se plaint est un utilisateur qui tient vraiment à votre produit). La prochaine phase se concentre sur l'augmentation de l'échelle de distribution côté joueur, c'est donc le bon moment pour passer le relai à mes coéquipiers qui ont été à mes côtés durant ce combat.
Félicitations à @glazworks pour sa nomination en tant que nouveau PDG de Rosebud ! Il combine rarement un talent pour le machine learning et une sensibilité produit.
Martin Casado et l'équipe d'a16z ont accompagné la croissance de Rosebud tout du long. J'ai eu une conversation clé avec Martin pour discuter si JavaScript était la bonne stack technique pour les jeux Rosebud — choisir Unity ou Roblox serait peut-être plus populaire, mais les améliorations de génération de code JavaScript sont beaucoup plus rapides en raison de l'accessibilité plus grande des données d'entraînement. Cette équipe recherche la vérité et est prête à parier sur les paris qui amèneront plus de constructeurs. C'est le chemin vers un futur idéal : nous devons construire, nous devons innover.
J'ai hâte de continuer à travailler avec vous tous de l'autre côté de la table. Mes messages privés sont toujours ouverts.













