Penulis: Haseeb
Kompilasi: Jiahuan, ChainCatcher
@SemiAnalysis_ baru-baru ini menemukan fenomena yang luar biasa dalam ekonomi berlangganan pemrograman AI. Jika penggunaan dimaksimalkan, biaya yang kamu bayar sebenarnya 20 hingga 70 kali lebih murah daripada membeli token melalui API.
Banyak yang melihat ini dan berkata: Ya ampun, lihat berapa banyak yang disubsidi perusahaan model besar untuk token, pasti gelembungnya akan segera pecah.

Reaksi itu salah. Alasan perusahaan model besar bersedia menawarkan paket yang begitu dermawan, tentu saja karena sebagian besar pengguna jarang mencapai batas atas. Produk ini seperti kartu keanggotaan gym: kuotanya besar karena mayoritas orang hampir tidak menggunakannya.
Tapi saya menghabiskan waktu lama memikirkan hal ini, memang ada beberapa keanehan di sini.
Kita tidak tahu margin keuntungan aktual mereka pada langganan, tetapi menurut perkiraan SemiAnalysis, dengan tingkat pemanfaatan rata-rata 20%, paket Max 5x Anthropic baru bisa balik modal. Tingkat pemanfaatan 20% mungkin masih terlalu tinggi, terutama di organisasi di mana semua orang (termasuk non-programmer) memiliki akun berlangganan, tetapi hanya menggunakannya sesekali. Sebagian besar institusi yang saya kenal, termasuk Dragonfly, dengan murah hati membagikan langganan Claude Code dan mendorong staf non-pemrogram untuk mencoba.
Tetapi yang tidak dibahas mendalam oleh SemiAnalysis adalah bahwa ini sepenuhnya adalah fenomena perusahaan kecil. Perusahaan besar tidak bisa menggunakan model penetapan harga berlangganan seperti ini.

Alasannya sebagai berikut: Ketika jumlah pengguna mencapai lebih dari 150, kamu akan dipaksa keluar dari model berlangganan yang disebut versi "Team". Kamu harus beralih ke versi "Enterprise", dengan harga dasar $20 per seat, ditambah biaya API berdasarkan penggunaan token aktual. Perusahaan hanya bisa membayar secara linear sesuai biaya token, dan SemiAnalysis memperkirakan margin keuntungan kotor untuk token API sekitar 75%. Ini adalah kenaikan harga yang sangat besar, yang tiba-tiba berlaku ketika jumlah pengguna mencapai 150.
Jadi, jika kamu adalah perusahaan kecil atau startup (atau pengguna individu), persepsi kamu tentang pengeluaran AI terdistorsi. Harga token kamu sebenarnya sangat murah, bahkan Anthropic mungkin hanya mempertahankan margin keuntungan yang sangat rendah atau negatif darimu.
Kamu mungkin bertanya-tanya, mengapa Microsoft dan Uber heboh tentang pengeluaran token dan banyak membahas "token-minning". Inilah alasannya. Biaya struktural mereka untuk setiap token jauh lebih tinggi daripada startup atau individu.
Tapi Anthropic tidak peduli! Bagi perusahaan B2B, menarik nilai maksimal dari perusahaan kecil atau individu tidak terlalu berarti. Lihat perusahaan seperti Datadog atau Cloudflare, 80% hingga 90% pendapatan mereka berasal dari kontrak besar (Pendapatan Berulang Tahunan lebih dari $100k). Mendapatkan nol keuntungan dari pelanggan ekor panjang hanyalah biaya akuisisi pelanggan.
Ini adalah pemikiran penjualan B2B yang khas.
Tetapi ada cara lain untuk melihat situasi yang sama: dari perspektif kebijakan pajak.
Karena jika token menggantikan tenaga kerja, maka margin keuntungan yang dikenakan OpenAI dan Anthropic pada token, sebenarnya adalah pajak terhadap tenaga kerja AI.
Memandang penetapan harga token seperti ini menghasilkan dua konsekuensi utama.
Penetapan Harga Token sebagai Kebijakan Pajak
Asumsikan margin keuntungan dalam artikel SemiAnalysis berlaku: sistem berlangganan mencapai titik impas, margin keuntungan kotor API perusahaan besar 75%. Reaksi pertama adalah menyebutnya sebagai pajak tenaga kerja AI 75% untuk organisasi besar, dan 0% untuk startup.
Analisis pajak standar akan mengatakan, ini menghambat perusahaan besar menggunakan tenaga kerja AI secara internal, di margin mendorong perusahaan untuk mengurangi otomatisasi, dan mempertahankan lebih banyak tenaga kerja manusia. (Tentu, ini juga mendorong penggunaan model yang lebih kecil atau sumber terbuka, tetapi efek bersihnya adalah keduanya diinsentifkan. Ingat, kita berbicara tentang margin di sini.)
Namun, yang lebih kuat menggerakkan perilaku bukanlah tarif pajak rata-rata. Dalam kebijakan pajak, tidak pernah seperti itu. Yang benar-benar kita perhatikan adalah tarif pajak marginal.
Bagi startup yang menggunakan langganan flat-rate, harga marginal token berikutnya adalah nol sebelum mencapai batas atas. Dan harga marginal nol adalah distorsi terbesar yang dapat ditimbulkan oleh suatu kebijakan.
Bagi startup, model berlangganan pada dasarnya adalah subsidi inovasi. Dorongan yang paling luar biasa adalah memikirkan cara menghabiskan seluruh anggaran token seefisien mungkin. Itu berarti menjalankan loop Ralph, memenuhi layar dengan sesi Claude Code, menjadwalkan segerombolan agen untuk bekerja bersama.

Sebelum mencapai batas, eksplorasi gratis. Jadi startup pada dasarnya saling bersaing untuk memeras nilai terakhir dari langganan, mengalahkan pesaing dengan output. Anehnya, semakin banyak digunakan, harga rata-rata token justru semakin rendah. Setiap startup ingin menjadi orang yang membuat Anthropic merugi paling banyak pada langganan.
Insentif yang dihadapi perusahaan besar justru sebaliknya. Jika kamu melebihi 150 seat, setiap token dalam eksplorasi dikenakan biaya penuh (ditambah biaya tambahan 75%!), jadi setiap langkah mereka menjelajahi batas dihukum secara linear.
Perusahaan besar masih akan mengotomatisasi tugas-tugas volume besar yang jelas, tetapi otomatisasi marginal, eksperimental, dan berisiko tidak akan pernah ditemukan karena biaya penemuannya terlalu tinggi. Struktur pajak ini pada akhirnya mendorong mereka mempertahankan lebih banyak tenaga manusia, mempertahankan struktur organisasi keseluruhan yang ada.
Ini kebalikan dari Jepang. Karena penurunan populasi, Jepang menghadapi kekurangan tenaga kerja yang besar. Secara historis ini berarti Jepang mengejar otomatisasi tinggi karena biaya tenaga kerja yang mahal mendorong otomatisasi. Inilah sebabnya mengapa ada robot di restoran, pabrik, hotel, rumah sakit Jepang.
Tetapi yang anehnya, perusahaan besar menemukan diri mereka dalam dilema yang berlawanan dengan Jepang: Jika harus membayar pajak yang sangat tinggi untuk menggunakan AI, justru melemahkan motivasi otomatisasi dan memperkuat motivasi untuk mempertahankan karyawan yang ada (terutama jika upah stagnan selama periode ini).
Jadi ke mana arus substitusi tenaga kerja dalam model ini?
Semua orang menatap perusahaan besar, menunggu gelombang PHK AI tiba. Tetapi dengan tarif pajak 75%, mengganti karyawan sendiri dengan AI secara terlalu agresif mungkin tidak masuk akal secara finansial, anggaran token akan langsung meledak.
Tetapi ini bukan berarti substitusi tidak akan terjadi, hanya akan muncul dalam bentuk yang berbeda.
Ketika perusahaan besar kehilangan pangsa pasar ke startup AI-native yang memiliki biaya tenaga kerja gabungan yang sangat rendah, penurunan pendapatan dan harga saham perusahaan besar akan memicu PHK. Tetapi pekerjaan yang dihilangkan itu tidak akan pernah muncul kembali di startup pemenang. Efek pengurangan bersihnya sama, kesenjangan pengangguran ini hanya berpindah ke bagian lain dari ekonomi yang dikenakan pajak lebih rendah.
Ini juga mengapa "AI-washing" (menyebut PHK biasa sebagai efisiensi AI yang baru ditemukan) mungkin bukan fenomena sementara. Yang disebut AI-washing adalah ketika sebuah perusahaan mengaitkan PHK dengan efisiensi AI, padahal sebenarnya hanya menutupi kelemahan bisnis biasa.
Banyak yang mengira ini hanya angin sesaat dalam siklus hype AI saat ini. Tetapi, meskipun semua orang siap menyaksikan PHK AI nyata di perusahaan besar, "penggantian pekerjaan" dengan AI, hal seperti ini mungkin tidak akan pernah terjadi dalam skala besar.
Substitusi tenaga kerja mungkin akan terjadi dengan cara lain: startup mengalahkan perusahaan besar, perusahaan besar terus menyamarkan penurunan atas nama AI sampai bangkrut, dan startup tidak akan pernah membangun kembali pekerjaan lama itu. Penggantian pekerjaan masih akan terjadi, hanya tidak di tempat yang diperhatikan semua orang.
Ini adalah konsekuensi pertama dari model ini. Tetapi ada konsekuensi kedua yang lebih aneh.
Tebing 150 Orang
Yang dimaksud dengan Notch (titik patahan) regulasi adalah batasan regulasi yang mendorong terjadinya perubahan perilaku yang sangat besar. Misalnya: standar pekerjaan penuh waktu 30 jam per minggu, menghasilkan banyak pekerjaan yang tepat 29 jam per minggu.
Diketahui bahwa Perancis memiliki regulasi ketenagakerjaan yang sangat ketat, berlaku begitu perusahaan mencapai 50 karyawan (dewan pekerja, bagi hasil keuntungan wajib, perlindungan PHK), sementara perusahaan kecil dibebaskan. Ini memberi motivasi besar bagi pemberi kerja untuk mempertahankan ukuran di bawah 50 orang dengan segala cara.

Dikutip dari: Garicano, Luis, Claire Lelarge, dan John Van Reenen, 2016, 'Distorsi Ukuran Perusahaan dan Distribusi Produktivitas: Bukti dari Perancis'.
Analogi ini diperluas ke AI. Perusahaan model besar menetapkan ambang batas pajak, menghukum perusahaan yang melebihi 150 seat. Itu berarti kamu harus tetap kecil untuk mempertahankan harga berlangganan bersubsidi yang indah itu, di mana token dikenakan pajak sekitar 0% (atau bahkan negatif), bukan 75%.
Ini dapat melahirkan filosofi manajemen perusahaan yang sama sekali baru. Startup akan semakin terobsesi untuk menyelesaikan segala sesuatu dengan agen, tim lebih kecil, PHK lebih sering, lebih banyak outsourcing, menggunakan segala cara untuk meminimalkan kebutuhan akan orang.
Ini bukan karena itu adalah tingkat otomatisasi "optimal", tetapi karena insentif mendorong mereka ke sana. Jika angka ajaibnya adalah 149, maka setiap seat sangat penting, kamu tidak bisa membuang satu orang pun di luar inti perusahaan.
Patahan semacam ini mungkin akan dilihat oleh orang-orang seperti Harvard Business School sebagai "manajemen AI-first generasi baru". Tetapi jika dipahami dengan benar, itu hanyalah respons rasional terhadap skema penetapan harga perusahaan.
Ini mungkin terdengar agak berlebihan. Tetapi perbedaan perilaku antar organisasi sudah bisa kamu lihat sekarang. Bicaralah dengan pengembang di perusahaan besar, mereka dengan hati-hati menghitung token, semakin cemas dengan pemotongan anggaran token oleh pimpinan. Sementara pengembang startup sedang sibuk memaksimalkan penggunaan (tokenmaxxing), memulai gerombolan agen dalam semalam, dan melihat log di pagi hari. Saya memperkirakan tren ini akan semakin cepat.
Tidak ada yang sengaja mendesain semua ini. Tidak ada komite yang memutuskan untuk mensubsidi startup dan mengenakan pajak pada perusahaan lama. Semua ini berasal langsung dari strategi penetapan harga perusahaan tradisional yang teruji.
Tetapi hukum pajak selalu seperti ini: sekumpulan aturan tambahan yang akhirnya menentukan perusahaan mana yang dapat dibangun, dan bagaimana perusahaan-perusahaan itu mendistorsi diri untuk meminimalkan beban pajak.
Kamu mungkin membantah bahwa ini bersifat sementara, perusahaan model besar akhirnya akan mengenakan biaya berdasarkan penggunaan untuk semua orang. Github Copilot telah menyelesaikan transisi ini. Mungkin, atau mungkin tidak. Tetapi sebelum penetapan harga kembali normal, perusahaan dengan 149 orang dan manajemen AI-first gaya baru ini mungkin telah meledak, menelan banyak pangsa pasar, dan menulis skrip untuk generasi startup berikutnya.
Kebijakan pajak sangat penting. Seluruh konsep "ekonomi gig" ada karena batas hukum antara W-2 (karyawan tetap) dan 1099 (kontraktor independen). Karena semakin banyak tenaga kerja digerogoti oleh AI, penetapan harga token mungkin menjadi kebijakan pajak paling berpengaruh dalam dekade mendatang. Namun, tidak akan pernah ada yang memilihnya.
(Jangan kaget jika di siklus berikutnya, perusahaan dengan pertumbuhan tercepat semuanya terjebak di angka 149 seat.)





