Примечание редактора: Эта статья представляет собой восьмилетний анализ одного из первых предпринимателей в области генеративного ИИ. В 2018 году, до появления GPT, он основал Rosebud AI, стремясь к цели «сделать творчество таким же простым, как игра», и последовательно выпустил несколько инструментов для творчества на основе ИИ, включая TokkingHeads. На этапе, когда возможности моделей были еще незрелыми, эти продукты, благодаря продуманным процессам и взаимодействию, усиливали опыт «приемлемого, но полезного», что позволило добиться раннего роста пользовательской базы и проверки продукта.
Этот опыт охватил почти полный цикл эволюции генеративного ИИ — от «синтетических медиа» до универсальной инфраструктуры возможностей: от экспериментальных исследований CycleGAN, StyleGAN до того, как GPT-4 раздвинул границы генерации кода и интерактивного творчества. Технический прогресс постоянно переписывал логику продуктов и ритмы предпринимательства. Путь автора также отражает более четкие структурные изменения — когда модель становится переменной, настоящий водораздел заключается не только в самой технологии, но и в том, как вокруг нее строятся продукт, дистрибуция и монетизация.
После ухода с поста CEO и присоединения к a16z автор переключится на инвестиции в передовой стек моделей и связанную с ним инфраструктуру. Но важнее индивидуального пути то, что этот восьмилетний опыт указывает на формирующийся тренд: первая фаза генеративного ИИ (доказательство возможностей) подходит к концу, впереди — более длительный цикл конкуренции, который будет разворачиваться вокруг того, как возможности организуются, продуктивизируются и, в конечном итоге, войдут в реальный мир.
Далее следует оригинальный текст:
Я присоединился к a16z в качестве партнера, специализируясь на инвестициях в инфраструктуру и искусственный интеллект. Одновременно с этим, после 8 лет руководства Rosebud AI, я покидаю пост генерального директора.
Ниже приведены некоторые мои воспоминания и размышления об этих 8 годах. Я испытываю огромное уважение к тем, кто до сих пор занимается разработкой на передовой. Один выпуск модели может уничтожить вашу дорожную карту продукта или, наоборот, перенести ее на годы вперед. Дизайн, продукт, инжиниринг — форма этих функций изменилась по сравнению с тем, что было 3 месяца назад, не говоря уже о 8 годах. Скорость технологического прогресса делает это время самым захватывающим для стартапов, но и самым сложным.
В a16z я буду уделять основное внимание передовому стеку моделей (frontier model stack): включая сами модели, а также инфраструктуру и инструменты разработки, построенные вокруг них. Меня восхищает быстрое развитие возможностей моделей — все больше достижений движется самим ИИ. Также я看好 прорывы, которые ИИ приносит в математику и науку. Кроме того, поскольку последние 8 лет я занимался созданием инструментов для творчества на основе ИИ, я всегда испытывал особый интерес к этому направлению.
До этого я также участвовал в качестве ангельского инвестора в некоторые посевные раунды, включая @fal, @periodiclabs, @SakanaAILabs и @ExaAILabs. В дальнейшем я с нетерпением жду возможности посвятить все свои силы поддержке тех основателей, которые строят этот технологический стек.
2018: Ставка на генеративный ИИ до появления GPT.
Быть стартапом в области генеративного ИИ в течение 8 лет — это довольно долгий срок.
Я начал в конце 2018 года, в почти «древние времена», когда эта область еще называлась «синтетические медиа». Я экспериментировал с CycleGAN и StyleGAN, их генерируемый контент был одновременно странным и fascinating, и я поверил, что однажды творчество станет таким же легким и свободным, как режим строительства в игре (имя «rosebud» как раз взято из The Sims — «Sims»).
Творчество в идеальном состоянии должно быть игрой. А первые проблески генеративного ИИ заставили меня поверить, что этот «игровой опыт творчества» можно расширить на большее количество форм творчества. Я начал fantasize о том, как генеративный ИИ изменит видеоигры (например, то видео на основе CycleGAN, обученное на кадрах из «Myst» в 2018 году).
Прошло 8 лет, и теперь мы можем генерировать видео, игры и даже музыку по одному промпту. То будущее, которое когда-то представлялось, наконец наступило — и это только начало.
Оглядываясь назад, я думаю, что смог сформировать如此 сильную веру на如此 ранней стадии, потому что моя жизнь всегда находилась на стыке технологий и искусства: с одной стороны — образование в области математики и глубокого обучения (PhD), с другой — passion к танцам и музыке. Предпринимательство в области генеративного ИИ как раз требует сочетания обоих: технический background позволил мне увидеть то, что надвигалось, а художественная склонность заставила с нетерпением захотеть это построить.
Путешествие стартапа всегда длиннее и сложнее, чем кажется. Найдите то, во что вы верите почти иррационально, чтобы максимизировать вероятность坚持下去.
2018—2023: Привлечение пользователей с помощью «приемлемой полезности»
Скриншот интерфейса третьего iOS-приложения Tokkingheads. Ключом к раннему генеративному ИИ был дизайн простых процессов и активное принятие шероховатости продукта.
На этом пути мы выпустили множество продуктов, чтобы отточить интуицию относительно возможностей передовых моделей и научиться упаковывать их в магический опыт, маскирующий ранние недостатки. На том этапе я понял: когда вывод далек от идеала, вы можете спроектировать потребительский опыт, который позволяет пользователям быстро итерировать и быстро получать обратную связь. Пользователи придирчивы, но не хрупки — их достаточно впечатлить «приемлемой полезностью».
К третьему мобильному приложению мы накопили достаточно знаний, чтобы Tokkingheads добился вирусного распространения за счет органического роста, набрав более 2 миллионов пользователей за несколько недель. Следующий ключевой урок: как основатель, вы должны четко понимать, какая форма продукта позволяет вам сохранять мотивацию в долгосрочной перспективе. Tokkingheads мог пойти по пути взрывного вирусного успеха, но я не был уверен, что это та почва, на которой можно развить эту магию творчества в более полноценный продукт, а именно этого я и хотел по-настоящему.
Поэтому мы продолжили итерации. Мы делали ИИ-генерацию стоковых фотографий, ИИ-арт для NFT (да... я наивно думал, что ключевым является качество работ, но оказалось, что настоящий важный навык — это спекулятивный хайп), а также инструменты для генерации игровых ассетов. Каждый продукт научил меня чему-то конкретному: за что пользователи готовы платить и как быстро улучшаются модели. Между этими проектами были и глобальная пандемия, и банковская паника вокруг Silicon Valley Bank и First Republic Bank — что напомнило мне быть благодарным. Возможность продолжать строить — уже привилегия.
2023: Генерация кода становится зрелой
Генерация кода наконец-то стала достаточно полезной,时机 созрел для создания игровых инструментов для нетехнических творцов. После выпуска GPT-4 это будущее стало осязаемым. В марте 2023 года я поделился с командой меморандумом и собрал最初ную версию функции Rosebud «текст в игру» с помощью приведенного ниже прототипа.
Скриншот твита от 23 марта 2023 года. Я использовал GPT-4 для изучения Three.js, combined с генеративным ИИ Rosebud для создания скайбокса, демонстрируя ранний прототип призыва 3D-сцен с помощью текста.
Внутреннее меморандум автора команде в начале 2023 года, фиксирующее продуктовые суждения после прорыва в генерации кода. Ключевое суждение этого письма: ИИ находится в ключевом окне, которое определит следующие десятилетия, и ближайшие два года станут фазой高度 интенсивной конкуренции, с быстрым ритмом, высокой напряженностью и четким отсевом. Компания fully погрузится в этот «спринт», который подходит только для тех, кто обладает сильной внутренней мотивацией, готов выдерживать высокое давление и долгосрочно投入 — потому что это не просто рабочий опыт, а историческая возможность, которая может изменить личную профессиональную траекторию.
2026 и далее: Что вы можете построить, что лаборатории не хотят делать?
Рис.: Демо-видео — автор создает 3D-городскую симуляцию в браузере с помощью промптов.
Создание игр требует одновременной мобилизации творческой интуиции и технических способностей. Генеративный ИИ — ключ к тому, чтобы само создание игр стало игрой — любое продвижение моделей, будь то в области изображений, видео, моделей мира или кода, немедленно поглощается и преобразуется. Бизнес-модель игр также, скорее всего, останется вне поля зрения передовых лабораторий: основной путь монетизации по-прежнему — оплата игроков, а создание системы дистрибуции на стороне игроков, для лабораторий, мчащихся на полной скорости к AGI, кажется слишком окольным побочным заданием. Для основателей выбор того, что строить, — это постоянная игра по поиску пространства за пределами критического пути лабораторий.
У Rosebud хорошие势头. Мы organicly накопили большое, highly активное сообщество создателей. Я буду скучать по непринужденным беседам с создателями в Discord и по дням обработки пользовательских support писем (пользователь, который готов жаловаться, действительно заботится о вашем продукте). Следующий этап focuses на масштабировании дистрибуции на стороне игроков, поэтому сейчас хорошее время передать эстафету товарищам по команде, которые сражались плечом к плечу.
Поздравляю @glazworks с назначением новым CEO Rosebud! В нем rare сочетается талант в машинном обучении и продуктовый вкус.
Мартин Касадо (Martin Casado) и команда a16z сопровождали рост Rosebud на всем пути. У меня с Martin был ключевой разговор о том, является ли JavaScript правильным технологическим стеком для игр Rosebud — выбор Unity или Roblox, возможно, более популярен, но улучшения в генерации кода на JavaScript происходят much быстрее, потому что доступность training данных выше. Эта команда ищет истину и готова делать ставки на то, что привлечет больше строителей. Это путь к идеальному будущему: мы должны строить, мы должны innovить.
С нетерпением жду продолжения сотрудничества с другой стороны стола. Личные сообщения всегда открыты.













