Penulis: Haseeb
Kompilasi: Jiahuan, ChainCatcher
Baru-baru ini, @SemiAnalysis_ menemukan fenomena luar biasa dalam ekonomi langganan AI untuk pemrograman. Jika penggunaan dimaksimalkan, biaya yang Anda bayar sebenarnya 20 hingga 70 kali lebih murah dibandingkan membeli token melalui API.
Banyak yang melihat hal ini dan berkata: Wah, lihat berapa banyak uang yang disubsidi perusahaan model besar pada token, pasti gelembungnya akan segera pecah.

Reaksi ini salah. Alasan perusahaan model besar mau memberikan paket yang begitu murah hati, tentu saja karena mayoritas pengguna hampir tidak pernah mencapai batas atas. Produk ini seperti kartu keanggotaan gym: kuotanya longgar karena sebagian besar orang sama sekali tidak banyak menggunakannya.
Tapi saya merenungkan hal ini cukup lama, memang ada beberapa keanehan di sini.
Kita tidak tahu pasti apa margin keuntungan aktual mereka pada langganan, tapi menurut perkiraan SemiAnalysis, dengan tingkat pemanfaatan rata-rata 20%, rencana Max 5x Anthropic baru bisa balik modal. Tingkat pemanfaatan 20% mungkin masih terlalu tinggi, terutama di organisasi di mana semua orang (termasuk non-programmer) punya akun langganan tapi hanya sesekali pakai. Kebanyakan institusi yang saya kenal, termasuk Dragonfly, dengan murah hati membagikan langganan Claude Code dan mendorong staf non-pemrogram untuk mencoba.

Namun, yang tidak diselami SemiAnalysis adalah, ini sepenuhnya fenomena bisnis kecil. Perusahaan besar tidak bisa menggunakan model harga langganan ini.
Alasannya sebagai berikut: Ketika jumlah orang mencapai di atas 150, Anda dipaksa keluar dari model langganan yang disebut versi "Tim". Anda harus beralih ke versi "Enterprise", dengan harga dasar $20/kursi, ditambah biaya API yang dihitung berdasarkan penggunaan token aktual. Perusahaan hanya bisa membayar linear sesuai biaya token, dan SemiAnalysis memperkirakan margin kotor token API sekitar 75%. Ini adalah kenaikan harga besar yang tiba-tiba berlaku saat jumlah mencapai 150 orang.
Jadi, jika Anda adalah perusahaan kecil atau startup (atau pengguna individu), persepsi Anda tentang pengeluaran AI terdistorsi. Harga token Anda sebenarnya sangat disubsidi, Anthropic mungkin hanya mempertahankan margin keuntungan yang sangat rendah, bahkan negatif, pada Anda.
Anda mungkin penasaran, mengapa Microsoft dan Uber heboh soal pengeluaran token dan banyak bicara tentang "penambangan token". Inilah alasannya. Biaya struktural mereka untuk setiap token jauh lebih tinggi daripada startup dan individu.
Tapi Anthropic tidak peduli! Bagi perusahaan B2B, tidak banyak artinya memeras nilai maksimal dari perusahaan kecil atau individu. Lihat perusahaan seperti Datadog atau Cloudflare, 80% hingga 90% pendapatan mereka berasal dari kontrak besar (Pendapatan Berulang Tahunan di atas $100k). Mendapatkan keuntungan nol pada pelanggan ekor panjang hanyalah biaya akuisisi pelanggan.
Ini adalah pola pikir penjualan B2B yang klasik.
Tapi ada cara lain untuk melihat situasi yang sama: dari perspektif kebijakan pajak.
Karena jika token sedang menggantikan tenaga kerja, maka margin kotor yang dibebankan OpenAI dan Anthropic pada token, pada dasarnya adalah pajak atas tenaga kerja AI.
Melihat penetapan harga token seperti ini, membawa dua konsekuensi utama.
Penetapan Harga Token sebagai Kebijakan Pajak
Asumsikan margin keuntungan dalam artikel SemiAnalysis berlaku: model langganan impas, margin kotor API perusahaan besar 75%. Reaksi pertama adalah menyebutnya sebagai pajak tenaga kerja AI sebesar 75% untuk organisasi besar, dan 0% untuk startup.
Analisis pajak standar akan mengatakan, ini menghambat perusahaan besar menggunakan tenaga kerja AI secara internal, secara marginal mendorong perusahaan mengurangi otomatisasi, mempertahankan lebih banyak tenaga kerja manusia. (Tentu saja, ini juga mendorong penggunaan model yang lebih kecil atau open-source, tapi efek bersihnya keduanya didorong. Ingat, kita bicara tentang marginal di sini.)
Namun, yang lebih kuat menggerakkan perilaku bukanlah tarif pajak rata-rata. Dalam kebijakan pajak, tidak pernah. Yang benar-benar kita pedulikan adalah tarif pajak marginal.
Bagi startup yang menggunakan langganan harga tetap, sebelum mencapai batas atas, harga marginal untuk token berikutnya adalah nol. Dan harga marginal nol adalah distorsi terbesar yang mungkin dibuat oleh suatu kebijakan.
Bagi startup, model langganan pada dasarnya adalah subsidi inovasi. Motivasi yang paling mendesak adalah memikirkan cara menghabiskan seluruh anggaran token seefisien mungkin. Ini berarti menjalankan loop Ralph, memenuhi layar dengan sesi Claude Code, menjadwalkan sekelompok agen cerdas untuk bekerja bersama.

Sebelum mencapai batas atas, eksplorasi gratis. Jadi startup sebenarnya berlomba-lomba memeras nilai terakhir dari langganan, mengalahkan pesaing dengan volume produksi. Secara anomali, semakin banyak digunakan, harga rata-rata token justru semakin rendah. Setiap startup ingin menjadi orang yang membuat Anthropic paling rugi pada langganan.
Insentif yang dihadapi perusahaan besar justru sebaliknya. Jika Anda melebihi 150 kursi, setiap token dalam eksplorasi dikenakan biaya penuh dengan markup (ditambah biaya tambahan 75%!), jadi setiap langkah ekstra mereka menjelajahi batas, hukuman naik secara linear.
Perusahaan besar masih akan mengotomatisasi tugas-tugas besar yang jelas, tapi otomatisasi marginal, eksperimental, berisiko tidak akan pernah ditemukan karena biaya penemuannya terlalu mahal. Struktur pajak ini akhirnya mendorong mereka mempertahankan lebih banyak tenaga manusia, mempertahankan struktur organisasi keseluruhan yang lama.
Ini kebalikan dari Jepang. Karena penurunan populasi, Jepang menghadapi kekurangan tenaga kerja yang besar. Secara historis ini berarti Jepang mengejar otomatisasi tinggi karena biaya tenaga kerja yang mahal mendorong otomatisasi. Itulah mengapa ada robot di restoran, pabrik, hotel, rumah sakit di Jepang.
Tapi anehnya, perusahaan besar mendapati diri mereka dalam situasi yang berlawanan dengan Jepang: jika mereka harus membayar pajak yang sangat tinggi untuk menggunakan AI, justru melemahkan motivasi untuk mengotomatisasi, memperkuat motivasi mempertahankan karyawan yang ada (terutama jika upah stagnan selama periode ini).
Lalu, ke mana arus substitusi tenaga kerja mengalir dalam model ini?
Semua orang menatap perusahaan besar, menunggu gelombang PHK AI datang. Tapi dengan tarif pajak 75%, terlalu agresif mengganti karyawan sendiri dengan AI mungkin tidak masuk akal, anggaran token akan meledak begitu saja.
Tapi ini tidak berarti substitusi tidak akan terjadi, hanya saja substitusi akan muncul dalam bentuk lain.
Ketika perusahaan besar kehilangan pangsa pasar ke startup asli AI yang memiliki biaya tenaga kerja gabungan sangat rendah, penurunan pendapatan dan harga saham perusahaan besar akan memicu PHK. Tapi pekerjaan yang hilang itu tidak akan pernah muncul kembali di startup pemenang. Efek pengurangan bersihnya sama, celah pengangguran ini hanya dialihkan ke bagian lain ekonomi dengan tarif pajak lebih rendah.
Inilah juga mengapa "AI-washing" (menyebut PHK biasa sebagai efisiensi AI yang baru ditemukan) mungkin bukan fenomena sementara. Yang dimaksud AI-washing adalah perusahaan yang mengaitkan PHK dengan efisiensi AI, padahal hanya menyamarkan kelemahan bisnis biasa.
Banyak yang mengira ini hanya angin sesaat dalam siklus hype AI saat ini. Tapi, meski semua orang siap menyaksikan perusahaan besar melakukan PHK AI nyata, "mengganti pekerjaan" dengan AI, hal seperti itu mungkin tidak akan pernah terjadi dalam skala besar.
Substitusi tenaga kerja mungkin akan berlangsung dengan cara lain: startup mengalahkan perusahaan besar, perusahaan besar terus menyamarkan kemunduran atas nama AI sampai bangkrut, dan startup tidak akan pernah membangun kembali pekerjaan lama itu. Substitusi pekerjaan tetap akan terjadi, hanya bukan di tempat yang semua orang perhatikan.
Ini konsekuensi pertama dari model ini. Tapi ada konsekuensi kedua yang lebih aneh.
Tebing 150 Orang
Apa yang disebut Notch regulasi adalah batas regulasi yang memicu perubahan perilaku besar yang tiba-tiba. Contoh: Standar kerja penuh waktu 30 jam per minggu menciptakan banyak pekerjaan yang sengaja bekerja tepat 29 jam per minggu.
Seperti diketahui, Prancis memiliki peraturan ketenagakerjaan yang sangat ketat, berlaku saat perusahaan mencapai 50 karyawan (komite staf, pembagian keuntungan wajib, perlindungan PHK), sementara usaha kecil dibebaskan. Ini memberi motivasi besar bagi pemberi kerja untuk berjuang keras menjaga ukuran di bawah 50 orang.

Diambil dari: Garicano, Luis, Claire Lelarge, dan John Van Reenen, 2016, "Firm Size Distortions and the Productivity Distribution: Evidence from France."
Analogikan ini ke AI. Perusahaan model besar menetapkan ambang batas pajak, menghukum perusahaan yang melebihi 150 kursi. Itu berarti Anda harus tetap berukuran kecil untuk mempertahankan harga langganan bersubsidi yang indah itu, membuat token dikenakan pajak sekitar 0% (bahkan negatif), bukan 75%.
Ini mungkin melahirkan filosofi manajemen perusahaan yang sama sekali baru. Startup akan semakin terobsesi menyelesaikan segalanya dengan agen, tim lebih kecil, PHK lebih sering, lebih banyak outsourcing, melakukan segala cara untuk menjaga bagian yang membutuhkan manusia sesedikit mungkin.
Bukan karena itu tingkat otomatisasi "optimal", tapi karena insentif mendorong mereka ke sana. Jika angka ajaibnya adalah 149, maka setiap kursi sangat penting, Anda tidak bisa membuang satu orang pun di luar inti perusahaan.
Kesenjangan ini mungkin dilihat orang-orang seperti Harvard Business School sebagai "manajemen prioritas AI generasi baru". Tapi begitu dipahami, ini hanyalah respons rasional terhadap skema penetapan harga korporat.
Ini mungkin terdengar berlebihan. Tapi perbedaan perilaku antar organisasi, Anda sudah bisa lihat sekarang. Bicaralah dengan pengembang di perusahaan besar, mereka menghitung token dengan hati-hati, semakin cemas dengan pemotongan anggaran token oleh pimpinan. Sementara pengembang startup justru berusaha memaksimalkan penggunaan (tokenmaxxing), meluncurkan segerombolan agen dalam semalam, dan melihat log di pagi hari. Saya memperkirakan tren ini akan semakin cepat.
Tidak ada yang sengaja merancang semua ini. Tidak ada komite yang memutuskan untuk mensubsidi startup dan mengenakan pajak pada perusahaan mapan. Semua ini langsung berasal dari strategi penetapan harga korporat tradisional yang terbukti berulang kali.
Tapi undang-undang pajak selalu seperti ini: sekumpulan aturan sampingan yang akhirnya menentukan perusahaan mana yang bisa dibangun, dan bagaimana perusahaan-perusahaan ini mendistorsi diri untuk meminimalkan beban pajak.
Anda mungkin membantah bahwa ini sementara, perusahaan model besar pada akhirnya akan membebankan biaya berdasarkan pemakaian untuk semua orang. Github Copilot sudah menyelesaikan transisi ini. Mungkin ya, mungkin tidak. Tapi sebelum penetapan harga kembali normal, perusahaan 149 orang dan manajemen prioritas AI aliran baru ini mungkin telah meledak, menelan banyak pangsa pasar, dan menulis naskah untuk startup generasi berikutnya.
Kebijakan pajak sangat penting. Seluruh konsep "ekonomi gig" ada justru karena batasan hukum antara W-2 (karyawan formal) dan 1099 (kontraktor independen). Karena semakin banyak tenaga kerja dimakan AI, penetapan harga token mungkin menjadi kebijakan pajak paling berpengaruh dalam dekade mendatang. Namun, tidak akan pernah ada yang memilih untuk ini.
(Jangan heran jika dalam siklus berikutnya, perusahaan dengan pertumbuhan tercepat terlihat jelas terjebak di angka 149 kursi.)





