Catatan Editor: Artikel ini merupakan refleksi 8 tahun dari seorang pelopor startup generative AI. Pada tahun 2018, sebelum GPT muncul, ia mendirikan Rosebud AI, dengan tujuan "membuat proses kreatif semudah bermain game", dan secara berturut-turut meluncurkan berbagai alat kreatif AI termasuk TokkingHeads. Pada tahap kemampuan model yang masih belum matang, produk-produk ini memperkuat pengalaman "cukup baik dan dapat digunakan" melalui desain alur dan interaksi, menyelesaikan pertumbuhan pengguna awal dan validasi produk.
Pengalaman ini hampir mencakup siklus evolusi lengkap generative AI dari "media sintetis" hingga infrastruktur kemampuan umum: dari eksplorasi eksperimental CycleGAN, StyleGAN, hingga GPT-4 yang membuka batas pembuatan kode dan kreasi interaktif. Kemajuan teknologi terus menulis ulang logika produk dan ritme startup. Jalur penulis juga merefleksikan perubahan struktural yang lebih jelas—ketika model menjadi variabel, pembeda sejati bukan hanya teknologi itu sendiri, tetapi bagaimana membangun produk, distribusi, dan komersialisasi di sekitarnya.
Setelah mengundurkan diri sebagai CEO dan bergabung dengan a16z, penulis akan beralih ke investasi dalam stack model frontier dan infrastruktur terkait. Namun, yang lebih penting dari jalur individu adalah, pengalaman 8 tahun ini mengarah pada tren yang sedang terbentuk: tahap pertama generative AI (membuktikan apa yang dapat dilakukan) sedang berakhir, selanjutnya adalah kompetisi siklus yang lebih panjang, yang akan berpusat pada bagaimana kemampuan diorganisir, diprodukkan, dan akhirnya masuk ke dunia nyata.
Berikut adalah teks asli:
Saya telah bergabung dengan a16z sebagai partner, fokus pada investasi infrastruktur dan AI. Secara bersamaan, setelah memimpin Rosebud AI selama 8 tahun, saya juga akan mengundurkan diri dari posisi CEO.
Di bawah ini adalah beberapa kilas balik dan refleksi saya tentang 8 tahun ini. Bagi mereka yang masih membangun di garis depan, saya memiliki rasa hormat yang besar. Satu rilis model dapat menghabiskan peta jalan produk Anda yang asli, atau memajukannya beberapa tahun sekaligus. Desain, produk, teknik—bentuk fungsi-fungsi ini telah berubah dibandingkan 3 bulan yang lalu, apalagi dibandingkan 8 tahun yang lalu. Kecepatan kemajuan teknologi menjadikan era ini sebagai momen paling menarik untuk startup, sekaligus paling menantang.
Di a16z, saya akan fokus pada frontier model stack: termasuk model itu sendiri, serta infrastruktur dan alat pengembangan yang dibangun di sekitar model. Saya antusias dengan evolusi cepat kemampuan model—semakin banyak kemajuan yang didorong oleh AI itu sendiri. Saya juga optimis dengan terobosan yang dibawa AI dalam bidang matematika dan sains. Selain itu, karena selama 8 tahun terakhir membangun alat kreatif AI, saya selalu memiliki minat khusus pada arah ini.
Sebelumnya, saya juga telah berpartisipasi dalam beberapa investasi seed round sebagai investor angel, termasuk @fal, @periodiclabs, @SakanaAILabs, dan @ExaAILabs. Ke depan, saya sangat menantikan untuk mencurahkan seluruh energi saya untuk mendukung para pendiri yang sedang membangun stack teknologi ini.
2018: Bertaruh pada Generative AI Sebelum GPT Muncul.
Menjadi perusahaan startup di bidang generative AI, 8 tahun adalah waktu yang cukup lama.
Saya mulai dari akhir 2018, yang hampir merupakan "zaman kuno", ketika bidang ini masih disebut "media sintetis". Saya bermain-main dengan CycleGAN dan StyleGAN, konten yang dihasilkan mereka aneh dan memukau, membuat saya yakin: suatu hari nanti, mencipta akan semudah dan selincah mode bangun dalam game (nama "rosebud" sendiri memang berasal dari The Sims).
Kreasi dalam keadaan paling ideal seharusnya adalah sebuah permainan. Dan cahaya redup pertama generative AI membuat saya percaya bahwa "pengalaman berkreativitas seperti bermain" ini dapat diperluas ke lebih banyak bentuk kreasi. Saya mulai membayangkan, bagaimana generative AI akan membentuk ulang video game (seperti video CycleGAN yang saya latih berdasarkan gambar "Myst" pada 2018).
Kini, 8 tahun telah berlalu, kita sudah dapat menghasilkan video, game, bahkan musik dengan satu perintah. Masa depan yang pernah dibayangkan itu akhirnya tiba—dan ini baru permulaan.
Melihat ke belakang, alasan saya dapat memiliki keyakinan yang begitu kuat pada tahap sedini ini mungkin karena hidup saya selalu berada di persimpangan teknologi dan seni: di satu sisi latar belakang doktor matematika dan deep learning, di sisi lain gairah seni tari dan musik. Startup generative AI justru membutuhkan keduanya: latar belakang teknis membuat saya melihat hal yang akan datang, kecenderungan seni membuat saya tidak sabar untuk membangunnya.
Perjalanan startup selalu lebih panjang dan lebih sulit dari yang dibayangkan. Temukan sesuatu yang Anda percayai hampir secara tidak rasional, untuk memaksimalkan peluang bertahan.
2018—2023: Memukau Pengguna dengan "Cukup Baik dan Dapat Digunakan"
Tangkapan layar antarmuka aplikasi iOS ketiga, Tokkingheads. Inti generative AI awal adalah merancang alur sederhana dan secara aktif merangkul kekasaran produk
Sepanjang perjalanan ini, kami merilis banyak produk, dengan tujuan mempertajam intuisi tentang kemampuan model frontier dan belajar membungkusnya menjadi pengalaman magis yang dapat menutupi kekurangan awal. Pada tahap itu saya menyadari: ketika output model jauh dari sempurna, Anda dapat merancang pengalaman konsumen yang memungkinkan pengguna beriterasi cepat, umpan balik cepat. Pengguna kritis, tetapi tidak rapuh—cukup memukau mereka dengan yang cukup baik dan dapat digunakan.
Pada aplikasi mobile ketiga, kami telah mengumpulkan pemahaman yang cukup, membuat Tokkingheads mencapai penyebaran viral pertumbuhan organik, pengguna melampaui 2 juta dalam beberapa minggu. Pelajaran kunci berikutnya muncul: sebagai pendiri, Anda harus jelas bentuk produk seperti apa yang dapat membuat Anda tetap termotivasi dalam jangka panjang. Tokkingheads bisa saja mengambil jalan menjadi viral, tetapi saya tidak yakin apakah itu tanah yang tepat untuk mengembangkan magic kreasi ini menjadi produk yang lebih lengkap, dan produk yang lebih lengkap itulah yang benar-benar saya inginkan.
Jadi kami terus beriterasi. Kami pernah membuat foto stok yang dihasilkan AI, seni AI pendamping NFT (ya... saya naif mengira kualitas karya adalah kuncinya, ternyata skill yang benar-benar penting adalah spekulasi hype), serta alat pembuatan aset game AI. Setiap produk mengajarkan saya sesuatu yang spesifik: untuk apa pengguna mau membayar, dan seberapa cepat model meningkat. Disela-sela proyek ini, ada pandemi global, dan kepanikan bank Silicon Valley dan First Republic—ini mengingatkan saya untuk bersyukur. Dapat terus membangun,本身就是一种特权 (adalah sebuah hak istimewa).
2023: Pembuatan Kode Menjadi Matang
Pembuatan kode akhirnya cukup baik digunakan, waktunya matang untuk membuat alat game untuk kreator non-teknis. Setelah rilis GPT-4, masa depan itu menjadi terasa konkret. Pada Maret 2023, saya berbagi memo internal dengan tim, dan merakit versi paling awal fitur text-to-game Rosebud dengan prototipe di bawah.
Tangkapan layar tweet 23 Maret 2023. Saya menggunakan GPT-4 untuk mempelajari Three.js, menggabungkan generative AI Rosebud untuk menghasilkan skybox, mendemonstrasikan prototipe awal memanggil adegan 3D melalui teks
Awal 2023, memo internal penulis untuk tim, mencatat penilaian produk setelah terobosan kemampuan pembuatan kode. Inti dari surat internal ini adalah: AI sedang berada dalam jendela kunci yang akan menentukan puluhan tahun ke depan, dan dua tahun ke depan akan menjadi fase kompetisi yang sangat intens, ritme cepat, intensitas tinggi, eliminasi jelas. Perusahaan akan mengerahkan semua tenaga untuk "sprint" ini, hanya cocok untuk mereka yang memiliki dorongan internal yang kuat, bersedia menanggung tekanan tinggi dan berinvestasi jangka panjang—karena ini bukan hanya pengalaman kerja, tetapi lebih merupakan kesempatan bersejarah yang dapat mengubah lintasan karir individu.
2026 dan Seterusnya: Apa yang Dapat Anda Bangun yang Tidak Ingin Dilakukan Lab?
Gambar: Video demo—penulis membangun game simulasi kota 3D di sisi browser melalui perintah teks
Membuat game, perlu mengerahkan intuisi kreatif dan kemampuan teknis secara bersamaan. Generative AI adalah kunci untuk membuat kreasi game itu sendiri menjadi sebuah permainan—apakah kemajuan model dalam hal gambar, video, model dunia, atau kode, akan segera diserap dan diubah. Model bisnis game juga paling mungkin berada di luar blind spot lab frontier: jalur monetisasi inti masih tetap pembayaran pemain, dan membangun sistem distribusi sisi pemain, bagi lab yang mengejar AGI dengan kecepatan penuh,似乎是一条过于迂回的支线任务 (tampaknya merupakan tugas sampingan yang terlalu berbelit). Bagi pendiri, memilih membangun apa, selalu merupakan permainan berkelanjutan mencari ruang di luar jalur kunci lab.
Rosebud sedang dalam momentum bagus. Kami secara organik mengumpulkan komunitas kreator yang besar dan sangat aktif. Saya akan merindukan obrolan santai dengan kreator di Discord, dan hari-hari menangani email dukungan pengguna (seorang pengguna yang mau mengeluh, pasti benar-benar peduli dengan produk Anda). Fokus tahap berikutnya adalah memperluas skala distribusi sisi pemain, karena sekarang adalah saat yang tepat untuk menyerahkan tongkat estafet kepada rekan yang telah berjuang bersama.
Selamat kepada @glazworks yang mengambil alih sebagai CEO baru Rosebud! Dia memiliki kombinasi langka bakat machine learning dan estetika produk.
Martin Casado dan tim a16z mendampingi pertumbuhan Rosebud dari awal. Saya dan Martin pernah memiliki percakapan kunci, mendiskusikan apakah JavaScript adalah stack teknologi yang tepat untuk game Rosebud—memilih Unity atau Roblox mungkin lebih populer, tetapi peningkatan pembuatan kode JavaScript jauh lebih cepat, karena aksesibilitas data pelatihan lebih tinggi. Tim ini mengejar kebenaran, bersedia bertaruh pada taruhan yang dapat membawa lebih banyak pembangun. Ini adalah jalan menuju masa depan ideal: kita harus membangun, kita harus berinovasi.
Menantikan untuk terus bekerja sama dengan semua orang dari sisi lain meja. DM selalu terbuka.













