Penulis: a16z
Kompilasi: Deep Tide TechFlow
Panduan Deep Tide: MIT mengklaim 95% pilot AI generatif perusahaan gagal dikonversi, a16z membantah langsung pernyataan ini dengan data primer dari portofolio perusahaan. 29% dari Fortune 500 dan 19% dari Global 2000 sudah menjadi pelanggan berbayar dari startup AI terkemuka, alat pemrograman meningkatkan efisiensi insinyur terbaik hingga 10-20 kali lipat. Laporan 23.928 kata ini berdasarkan data internal, mengungkap skenario AI mana yang benar-benar menghasilkan nilai dan mana yang masih sekadar hype konsep.
Banyak spekulasi tentang sejauh mana AI telah membuat kemajuan di perusahaan besar, tetapi sebagian besar informasi yang ada hanya terdiri dari penggunaan AI yang dilaporkan sendiri atau survei yang menangkap sentimen pembeli kualitatif alih-alih data keras. Selain itu, sedikit penelitian yang ada menyatakan bahwa AI berkinerja buruk di perusahaan, yang paling mencolok adalah penelitian MIT yang mengklaim 95% pilot AI generatif gagal dikonversi.
Berdasarkan data internal kami dan percakapan dengan eksekutif perusahaan, kami menemukan statistik ini sulit dipercaya. Kami telah melacak dengan cermat di mana AI paling banyak diadopsi dan di mana ROI jelas, dan menyusun data keras tentang apa yang benar-benar efektif dalam AI perusahaan.
Tingkat Penetrasi AI di Perusahaan
Menurut analisis kami, 29% dari Fortune 500 dan sekitar 19% dari Global 2000 adalah pelanggan berbayar aktif dari startup AI terkemuka.
Untuk memenuhi statistik ini, perusahaan-perusahaan ini harus menandatangani kontrak top-down dengan startup AI, berhasil mengonversi pilot, dan meluncurkan produk di organisasi mereka.
Mencapai tingkat penetrasi seperti ini dalam waktu singkat sangat signifikan, karena perusahaan Fortune 500 tidak terkenal sebagai pengadopsi teknologi awal. Secara historis, banyak startup harus menjual ke startup lain terlebih dahulu untuk mendapatkan momentum awal, butuh beberapa tahun sebelum startup dapat menandatangani kontrak perusahaan pertama, dan lebih banyak pendapatan dan waktu sebelum akhirnya dapat menandatangani klien skala Fortune 500.
AI mengganggu norma ini. OpenAI meluncurkan ChatGPT pada November 2022, segera menunjukkan potensi AI kepada konsumen dan perusahaan. Hal ini melepaskan badai minat terhadap AI yang tidak pernah dipicu oleh generasi teknologi sebelumnya, perusahaan besar lebih bersedia daripada sebelumnya untuk bertaruh lebih awal pada produk baru. Hasilnya: hanya lebih dari 3 tahun kemudian, hampir sepertiga dari Fortune 500 dan seperlima dari Global 2000 memiliki penerapan AI perusahaan yang nyata di organisasi mereka.
Apa yang Efektif dalam AI Perusahaan
Di mana adopsi ini terjadi paling cepat, dan bagaimana hal itu memetakan pekerjaan yang pada dasarnya lebih baik dilakukan oleh model?
Kami menemukan bahwa pendekatan evaluasi yang paling indikatif adalah dengan menumpuk momentum pendapatan di berbagai use case ke kapabilitas teoretis model seperti yang didefinisikan oleh GDPval, tolok ukur terkenal OpenAI yang mengevaluasi kemampuan model pada tugas-tugas yang bernilai ekonomi di dunia nyata. Bagi kami, kedua faktor ini merangkum seberapa baik model dapat menjadi dan seberapa banyak nilai yang mereka buktikan berikan hari ini. Hal ini membuatnya sangat menunjukkan di mana adopsi AI hari ini, kemungkinan ke mana arahnya, dan di mana ada AI yang tertunda dalam hal adopsi meskipun kapabilitas model matang.
Di Mana AI Perusahaan Memberikan Nilai Terbanyak Hari Ini?
Dalam hal momentum pendapatan, adopsi AI oleh perusahaan dipimpin oleh sekumpulan use case dan industri yang jelas. Pemrograman, dukungan, dan pencarian sejauh ini mewakili sebagian besar use case (pemrograman bahkan merupakan outlier dengan urutan besaran dalam kelompok ini), sementara sektor teknologi, hukum, dan perawatan kesehatan adalah industri yang paling ingin mengadopsi AI.
Pemrograman: Pemrograman adalah use case dominan untuk AI, hampir mencapai satu urutan besaran. Ini terlihat dalam pertumbuhan eksplosif yang dilaporkan oleh perusahaan seperti Cursor dan pertumbuhan super cepat dari alat seperti Claude Code dan Codex. Tingkat pertumbuhan ini melampaui hampir semua prediksi paling optimis, dan sejauh ini sebagian besar adopsi alat AI oleh Fortune 500/Global 2000 adalah dalam kode.
Dalam banyak hal, pemrograman mewakili use case ideal untuk AI, baik dalam hal kapabilitas teknis maupun penerimaan pasar perusahaan. Kode padat data, yang berarti ada banyak kode berkualitas tinggi online untuk pelatihan model. Kode juga berbasis teks, membuat model mudah diurai. Kode tepat dan eksplisit, dengan sintaksis ketat dan hasil yang dapat diprediksi. Kuncinya, kode dapat diverifikasi: siapa pun dapat menjalankannya dan tahu apakah berfungsi, menciptakan loop umpan balik yang ketat untuk model belajar dan meningkatkan.
Dari perspektif bisnis, ini juga aplikasi yang bagus. Kami terus mendengar perusahaan portofolio mengatakan bahwa tingkat produktivitas insinyur terbaik mereka meningkat 10-20 kali lipat dengan alat pengkodean AI. Mempekerjakan insinyur selalu sulit dan mahal, jadi apa pun yang meningkatkan produktivitas mereka memiliki ROI yang jelas — peningkatan yang diberikan alat pengkodean AI menciptakan insentif besar untuk adopsi. Insinyur juga cenderung menjadi pengadopsi awal yang menuntut alat terbaik, karena pemrograman adalah tugas yang lebih individual dibandingkan dengan sebagian besar pekerjaan perusahaan, mereka lebih mudah hanya menemukan alat terbaik dan mengadopsinya, tanpa terhambat oleh koordinasi dan birokrasi yang menyusahkan banyak fungsi perusahaan lainnya.
Selain itu, alat pemrograman tidak perlu 100% menyelesaikan tugas end-to-end untuk memiliki nilai tambah, karena setiap akselerasi (misalnya, menemukan bug, menghasilkan kode boilerplate) masih menghemat waktu dan berguna. Karena pemrograman memiliki alur kerja manusia-in-the-loop yang ketat, pengembang masih mengawasi proses pengembangan hari ini, alat-alat ini mempercepat output sementara masih menyisakan ruang untuk penilaian manusia untuk meninjau, mengedit, dan mengulang. Ini meningkatkan kepercayaan perusahaan dan membuat jalur adopsi lebih lancar.
Kemampuan pemrograman meningkat secara eksponensial, dengan setiap lab secara eksplisit berfokus untuk memenangkan kode sebagai use case. Ini memiliki dampak besar. Kode adalah blok bangunan inti dari setiap aplikasi lain di hulu, karena itu adalah inti dari perangkat lunak apa pun, sehingga akselerasi AI terhadap kode seharusnya mempercepat setiap bidang lainnya. Ambang batas untuk membangun di bidang-bidang ini berkurang, membuka peluang baru untuk diselesaikan dengan AI, tetapi keterjangkauan yang sama membuatnya lebih penting daripada sebelumnya bagi startup untuk membangun keunggulan kompetitif yang bertahan lama.
Dukungan: Dukungan berada di ujung barbel yang lain, berlawanan dengan kode. Sementara rekayasa perangkat lunak biasanya mendapatkan investasi dan perhatian terbanyak dalam organisasi, dukungan sering diabaikan. Pekerjaan dalam organisasi dukungan adalah pekerjaan latar belakang, tingkat pemula, sering dialihdayakan ke perusahaan lepas pantai atau outsourcing proses bisnis (BPO) karena perusahaan menganggapnya terlalu merepotkan dan kompleks untuk dikelola sendiri.
AI telah terbukti unggul dalam mengelola pekerjaan ini karena beberapa alasan. Pertama, sifat sebagian besar interaksi dukungan adalah waktu terbatas, dengan niat terkendali (misalnya, mengeluarkan pengembalian dana), memberikan masalah yang jelas ditangani oleh agen. Dukungan juga merupakan satu-satunya fungsi di mana tugas-tugas yang terlibat dalam peran didefinisikan dengan jelas. Tim dukungan volume tinggi dan pergantian tinggi, sehingga perlu melatih perwakilan baru dengan cara yang cepat dan terstandarisasi. Untuk ini, mereka memiliki prosedur operasi standar (SOP) yang diartikulasikan dengan jelas untuk memandu pekerjaan setiap perwakilan. SOP ini menciptakan aturan dan pedoman eksplisit yang dapat ditiru oleh agen AI. Ini membedakannya dari sebagian besar pekerjaan perusahaan lainnya, yang biasanya lebih lama, kurang jelas definisinya, dan melibatkan lebih banyak pemangku kepentingan di luar pelanggan dan perwakilan layanan.
Dukungan juga merupakan salah satu fungsi perusahaan dengan ROI yang paling mudah diukur. Dukungan beroperasi berdasarkan metrik yang dapat diukur: jumlah tiket yang dijawab, skor CSAT (kepuasan) pelanggan, dan tingkat resolusi. Setiap pengujian A/B status quo dengan agen AI akan menghasilkan hasil yang menguntungkan untuk agen AI: itu akan menjawab lebih banyak tiket, meningkatkan tingkat resolusi, dan meningkatkan skor kepuasan konsumen — semua dengan biaya lebih rendah. Karena sebagian besar dukungan sudah dialihdayakan ke BPO, mengadopsi solusi AI membutuhkan manajemen perubahan yang terbatas, membuat jalur adopsi lebih mudah.
Dukungan juga tidak perlu 100% akurat untuk berguna, karena memiliki jalan keluar alami ke manusia (misalnya, "Saya meningkatkan Anda ke manajer"). Ini memungkinkan siklus penjualan bergerak lebih cepat, dan membuat pilot agen dukungan AI relatif berisiko rendah; dalam skenario terburuk, 100% kasus akan cukup ditingkatkan dan diselesaikan oleh manusia.
Terakhir, dukungan pada dasarnya bersifat transaksional. Pelanggan tidak peduli siapa sebenarnya di ujung lain, yang berarti dukungan tidak memerlukan hubungan interpersonal apa pun yang sulit direplikasi AI. Ciri-ciri ini menjelaskan mengapa perusahaan seperti Decagon dan Sierra tumbuh sangat cepat, dan lebih banyak peserta dukungan spesifik vertikal seperti Salient, HappyRobot, dll.
Pencarian: Kategori horizontal terakhir dengan tarikan pasar perusahaan yang jelas adalah pencarian. Use case utama ChatGPT sendiri adalah pencarian, sehingga dampak pencarian mungkin sangat tertanam dalam pendapatan dan penggunaan ChatGPT, dan mungkin sangat diremehkan di sini.
Pencarian AI sebagai kategori begitu luas sehingga memunculkan banyak startup besar independen. Salah satu titik sakit utama di dalam banyak perusahaan adalah memungkinkan karyawan untuk sekadar menemukan dan mengekstrak informasi relevan dalam koleksi sistem mereka yang berbeda. Glean berkembang sebagai pemasok startup utama untuk use case ini. Banyak industri besar juga beroperasi berdasarkan informasi industri yang sangat spesifik (internal dan eksternal), perusahaan seperti Harvey (dimulai dengan pencarian hukum) dan OpenEvidence (dimulai dengan pencarian medis) berkembang dengan membangun produk inti di sekitar ini.
Industri
Teknologi: Industri yang paling umum mengadopsi AI sejauh ini adalah industri teknologi. ChatGPT sendiri melaporkan bahwa 27% pengguna bisnis berasal dari teknologi, dan banyak pelanggan awal perusahaan seperti Cursor, Decagon, dan Glean adalah perusahaan teknologi. Mengingat teknologi hampir selalu pengadopsi awal, dan merupakan industri yang melahirkan gelombang AI, ini sama sekali tidak mengejutkan.
Yang lebih mengejutkan adalah bahwa pasar yang secara historis tidak dianggap sebagai pengadopsi awal kali ini terbukti antus.
Hukum: Hukum secara mengejutkan adalah salah satu industri perintis dalam AI. Hukum secara historis dianggap sebagai pasar perangkat lunak yang sulit, dengan timeline panjang dan pembeli yang kurang melek teknologi.
Ini karena perangkat lunak perusahaan tradisional menawarkan nilai terbatas untuk pengacara: alat alur kerja statis tidak mempercepat pekerjaan tidak terstruktur dan halus yang biasanya dilakukan pengacara. Tetapi AI membuat proposisi nilai teknologi lebih jelas untuk pengacara. AI pandai mengurai teks padat, menalar sejumlah besar teks, serta merangkum dan menyusun respons — semua ini adalah pekerjaan yang sering dilakukan pengacara. AI sekarang sering bertindak sebagai co-pilot untuk meningkatkan produktivitas pengacara individu, tetapi telah mulai meluas lebih dari itu: dalam beberapa kasus, itu sebenarnya dapat menghasilkan pendapatan dengan memungkinkan firma hukum menangani lebih banyak kasus (seperti dalam kasus Eve, yang berspesialisasi dalam hukum penggugat).
Hasilnya jelas. Harvey melaporkan sekitar $200 juta dalam Annual Recurring Revenue (ARR) dalam 3 tahun sejak didirikan, perusahaan seperti Eve memiliki lebih dari 450 klien dan mencapai valuasi $10 miliar musim gugur ini.
Perawatan Kesehatan: Perawatan kesehatan adalah pasar lain yang merespons AI dengan cara yang tidak pernah dilakukan oleh perangkat lunak tradisional. Perusahaan seperti Abridge, Ambience Healthcare, OpenEvidence, dan Tennr tumbuh dengan sangat cepat berdasarkan use case diskrit (seperti catatan medis, pencarian medis, atau otomatisasi backend aturan Bizantium tentang bagaimana perawatan kesehatan diberikan dan dibayar).
Perawatan kesehatan secara historis adalah pasar yang lebih lambat mengadopsi perangkat lunak karena 1) pekerjaan terampil tinggi dan kompleks tidak dipetakan dengan baik dengan masalah yang dapat dipecahkan oleh perangkat lunak alur kerja tradisional, 2) dominasi sistem catatan EHR seperti Epic memeras pemasok perangkat lunak baru. Namun, dengan AI, perusahaan dapat mengambil alih pekerjaan manual diskrit yang melewati sistem catatan dengan mengganti pekerjaan administratif (misalnya, pencatat medis) atau meningkatkan pekerjaan bernilai lebih tinggi yang dilakukan dokter. Pekerjaan ini cukup unik sehingga tidak perlu merobek dan mengganti EHR, memungkinkan perusahaan-perusahaan ini dengan cepat berkembang sementara tidak perlu mengganti pemasok perangkat lunak yang ada.
Beberapa Catatan tentang Analisis
Perkiraan ini adalah perkiraan terbaik. Ini mungkin meremehkan jumlah pendapatan yang dihasilkan di setiap kategori, dan melebih-lebihkan kemampuan model.
Kami mungkin meremehkan pendapatan karena:
Analisis pendapatan murni berdasarkan departemen dan use case mana yang berhasil cukup untuk menghasilkan bisnis AI perusahaan yang besar dan independen, dan mengecualikan ekor panjang use case yang ditangani startup lain.
Banyak dari pasar ini juga memiliki peserta non-startup yang cukup besar menghasilkan pendapatan signifikan (misalnya, Codex/Claude Code dalam kode, CoCounsel Thomson Reuters dalam hukum), tetapi kami memusatkan analisis pada peserta startup independen.
Banyak tugas pekerjaan yang diuraikan dalam analisis kami mungkin tertanam dalam produk inti perusahaan model (misalnya, pencarian ChatGPT dan OpenAI), tetapi tidak dipisahkan dan disertakan dalam analisis ini.
Analisis ini berfokus pada bisnis perusahaan daripada bisnis konsumen atau prosumer. Ada bisnis yang sukses (misalnya, Replit dan Gamma dalam pembuatan aplikasi dan desain) yang memiliki jumlah pengguna bisnis yang cukup, tetapi hari ini terutama berfokus pada konsumen atau prosumer. Mengingat analisis ini berfokus pada AI perusahaan dan dari mana perusahaan mendapatkan nilai, kami mengecualikan bisnis yang dipimpin konsumen.
Dalam hal kemampuan, sangat sulit untuk mengukur dampak AI pada berbagai sektor ekonomi, meskipun banyak ekonom mencoba. Pekerjaan pada dasarnya tidak terdefinisi dengan baik dan berekor panjang, membuatnya sangat sulit untuk mengotomatiskan sepenuhnya. Hari ini tidak jelas berapa banyak nilai yang dapat diperoleh perusahaan dari otomatisasi parsial — jika AI hanya melakukan 50% dari tugas manusia, pentingnya tugas yang tidak dapat diotomatisasi mungkin naik karena menjadi hambatan, meningkatkan nilai relatifnya. Jadi, kami mungkin melebih-lebihkan keadaan kemampuan hari ini, karena setiap kenaikan 1% kemampuan tidak diterjemahkan menjadi 1% nilai ekonomi, tetapi memperhatikan kemampuan relatif dan bagaimana mereka meningkat dengan setiap rilis model baru masih sangat menunjukkan.
AI Masuk ke Semua Pasar
Analisis ini mengukur tingkat kemenangan model evaluasi top terhadap ahli manusia berdasarkan tolok ukur GDPval. Berdasarkan ini, jelas bahwa sejak musim gugur 2025, model telah menjadi jauh lebih baik dalam pekerjaan yang bernilai ekonomi.
Jadi, mengapa kita tidak melihat jenis momentum pendapatan yang sama di industri yang mendapat peringkat tinggi dalam penilaian ini seperti di industri lain?
Industri yang telah antusias mengadopsi AI hingga saat ini memiliki beberapa kesamaan: mereka berbasis teks, melibatkan pekerjaan mekanis dan berulang, memiliki keterlibatan manusia-dalam-loop alami untuk menyuntikkan penilaian manusia, regulasi terbatas, dan memiliki output akhir yang jelas dapat diverifikasi (misalnya, kode yang berjalan, tiket dukungan terselesaikan). Banyak industri tidak memiliki atribut ini. Mereka要么 berurusan dengan dunia fisik, sangat bergantung pada hubungan interpersonal, memiliki biaya koordinasi yang jelas di antara banyak pemangku kepentingan, memberlakukan hambatan peraturan atau kepatuhan, atau kekurangan hasil yang dapat diverifikasi. Meskipun momentum pendapatan dan kemampuan model jelas terkait, di area di mana kemampuan model secara teoritis berada di bawah tingkat kemenangan 50% terhadap manusia (seperti dalam kasus hukum), perusahaan seperti Harvey masih dapat dengan cepat mendapatkan pangsa pasar dengan produk co-pilot untuk meningkatkan pekerjaan hukum individu, dan kemudian terus meningkatkan produk intinya seiring evolusi model.
Temuan paling signifikan di sini adalah bahwa kemampuan model meningkat dengan cepat. Ada beberapa area yang menunjukkan peningkatan besar dalam 4 bulan terakhir — akuntansi dan audit menunjukkan lompatan hampir 20% pada GDPval, bahkan area seperti pekerjaan polisi/detektif menunjukkan peningkatan hampir 30%. Kami berharap lompatan ini menghasilkan produk dan perusahaan baru yang menarik di bidang terkait mereka. Selain itu, perusahaan model telah secara jelas mengumumkan niat mereka untuk meningkatkan kapabilitas inti pekerjaan yang bernilai ekonomi, melakukan pekerjaan inti pada spreadsheet dan alur kerja keuangan, menggunakan komputer untuk menangani pekerjaan sulit pada sistem warisan dan industri, dan peningkatan bermakna dalam tugas panjang, yang membuka seluruh kelas baru pekerjaan yang tidak dapat dengan mudah dipotong menjadi segmen kecil dan mudah dicerna.
Implikasi bagi Pembangun
Memahami dari mana perusahaan mendapatkan nilai dan bagaimana mereka memikirkan ROI — serta departemen mana yang jelas melihat tarikan versus yang akan datang — memungkinkan kita untuk berpikir lebih jelas tentang di mana peluang bagi pembangun AI berada.
Melayani pembeli teknologi, hukum, dan perawatan kesehatan sekarang adalah tanah subur, tetapi kami tidak percaya akan ada satu "pemenang" di setiap kategori. Misalnya di bidang hukum, ada banyak jenis pengacara — penasihat hukum internal, firma hukum, pengacara paten, pengacara penggugat, dll. — mereka semua memiliki alur kerja dan kebutuhan berbeda, yang dapat diselesaikan perusahaan. Hal yang sama berlaku untuk perawatan kesehatan mengingat tambal sulam jenis dokter, fasilitas perawatan kesehatan, dll.
Selain departemen ini, cara lain yang produktif untuk berpikir adalah di mana kemampuan menjadi lebih kuat, tetapi belum ada perusahaan terobosan dalam hal pendapatan. Banyak bisnis saat ini dibangun sebelum kemampuan model benar-benar membuka kunci produk, tetapi mereka telah membangun infrastruktur teknis dan kesadaran pelanggan/pasar yang cukup sehingga mereka paling diuntungkan ketika pembukaan kunci model tiba.
Terakhir, penting untuk memperhatikan di mana lab memusatkan penelitian terbaru mereka pada aspek pekerjaan yang bernilai ekonomi. Dengan Agent jangka panjang yang meningkat dengan cepat, investasi serius dalam penggunaan komputer, dan penelitian tentang antarmuka yang andal di luar modalitas teks (misalnya, spreadsheet, presentasi), ada seluruh kelas baru perusahaan startup yang akan segera memiliki infrastruktur pengaktif yang diperlukan untuk menghasilkan nilai perusahaan yang bermakna.
Metode Data: Data ini dikumpulkan dari startup AI perusahaan terkemuka, termasuk data pribadi perusahaan yang dibagikan dengan kami untuk tujuan laporan ini, serta data yang tersedia untuk umum dan data anonim yang dianalisis dari ribuan percakapan kami di a16z dengan startup dan perusahaan besar.











