Berapa Banyak yang Didapat Perusahaan Modul Optik dari Biaya Berlangganan Claude yang Anda Bayar?

marsbitDipublikasikan tanggal 2026-06-17Terakhir diperbarui pada 2026-06-17

Abstrak

TL;DR Grafik yang memecah biaya berlangganan Claude Pro AS sekitar $20 per bulan untuk perusahaan model, komputasi awan, penyusutan GPU, listrik, dan rantai pasokan memicu diskusi ulang tentang cara menilai pendapatan aplikasi AI. Artikel ini membahas tantangan mendasar dalam menilai bisnis aplikasi AI dibandingkan SaaS tradisional. Berbeda dengan perangkat lunak konvensional yang memiliki margin tinggi karena biaya marjinal mendekati nol, setiap penggunaan model AI (inferensi) memerlukan komputasi GPU, listrik, dan sumber daya awan yang signifikan. Hal ini menciptakan ketegangan antara pendapatan langganan tetap dan biaya variabel yang bergantung pada intensitas penggunaan pengguna. Saat ini, pertumbuhan penggunaan AI lebih langsung mengalir ke infrastruktur (seperti pemasok GPU, HBM, dan pusat data) yang mendapat pendapatan lebih pasti. Perusahaan aplikasi/model perlu membuktikan bahwa mereka dapat meningkatkan efisiensi (melalui optimisasi model, caching, chip khusus) lebih cepat daripada peningkatan kompleksitas dan volume penggunaan, agar margin dapat membaik dan mendekati struktur keuntungan perusahaan perangkat lunak. Kesimpulannya, investor harus berhati-hati dalam mengasumsikan pendapatan AI setara dengan SaaS. Kunci penilaian terletak pada kemampuan perusahaan model menunjukkan peningkatan margin kotor setelah memperhitungkan semua biaya inferensi, bukan hanya pertumbuhan jumlah pelanggan berbayar.

TL;DR

Sebuah diagram perkiraan yang memecah biaya berlangganan Claude Pro AS sekitar $20 per bulan untuk perusahaan model, daya komputasi awan, depresiasi GPU, listrik, dan rantai pasokan, sedang membuat investor mendiskusikan kembali bagaimana pendapatan aplikasi AI seharusnya dinilai.

Diagram ini bukan data pembagian resmi dari Anthropic, Amazon Web Services, atau Nvidia, dan juga tidak bisa dianggap sebagai buku besar nyata dari perusahaan mana pun. Nilainya terletak pada pengajuan pertanyaan yang lebih mendasar: Dari biaya berlangganan yang dibayarkan pengguna untuk aplikasi AI, berapa banyak yang dapat mengendap menjadi margin keuntungan perangkat lunak seperti layanan SaaS tradisional?

Imajinasi valuasi untuk SaaS tradisional cukup jelas. Setelah perangkat lunak selesai dikembangkan, menjual satu akun tambahan biasanya memiliki biaya tambahan yang tidak tinggi. Perusahaan perangkat lunak murni yang matang umumnya memiliki margin kotor di atas 70% atau bahkan 80%. Investor bersedia memberikan kelipatan tinggi karena margin keuntungan berpeluang terus meningkat setelah skala pendapatan meluas.

Masalah aplikasi AI terletak pada fakta bahwa setiap kali pengguna mengajukan pertanyaan, menulis kode, menganalisis file, atau memanggil agen, di baliknya ada konsumsi waktu GPU, daya listrik, bandwidth memori, dan sumber daya awan. Permukaannya adalah biaya bulanan tetap, tetapi dasarnya adalah rantai biaya yang berubah sesuai dengan volume penggunaan. Pengguna ringan mungkin menghasilkan margin kotor yang tinggi, tetapi pengguna berat yang menjalankan tugas secara berkelanjutan dalam kuota atau paket alat terkait yang tersedia, biayanya bisa meningkat dengan cepat.

Jadi, diagram pemecahan $20 ini bukan ingin menantang berapa dolar yang diambil oleh perusahaan tertentu, melainkan "apakah pendapatan aplikasi AI secara alami sama dengan pendapatan SaaS". Perusahaan AI yang ingin membuktikan dirinya layak mendapat kelipatan tinggi, tidak hanya perlu membuktikan bahwa pengguna bersedia membayar, tetapi juga membuktikan bahwa margin kotor berbobot volume penggunaan dapat terus membaik.

Di Balik Biaya Berlangganan Ada Rantai Biaya Inferensi

Perbedaan terbesar antara langganan AI dan langganan perangkat lunak biasa adalah bahwa biaya marginal "menggunakan sekali" tidak lagi mendekati nol.

Dalam SaaS tradisional, saat sebuah tim membuka satu akun tambahan, penyedia layanan juga memiliki biaya server, layanan pelanggan, dan bandwidth, tetapi biaya ini biasanya tidak naik secara linear dengan setiap klik. Yang benar-benar mahal adalah penelitian dan pengembangan, penjualan, dan akuisisi pelanggan di tahap awal. Setelah produk diskalakan, sebagian besar dari pendapatan tambahan dapat dipertahankan.

Produk model besar berbeda. Pengguna memasukkan pertanyaan, model menghasilkan jawaban. Proses ini disebut inferensi, yaitu komputasi aktual saat model dipanggil oleh pengguna. Token adalah satuan dasar pengukuran untuk membaca dan menulis teks oleh model. Semakin banyak pengguna bertanya, semakin panjang konteksnya, dan semakin kompleks konten yang dihasilkan, maka token dan daya komputasi yang dikonsumsi semakin banyak.

Ini menciptakan kontradiksi antara langganan tetap dan biaya variabel. Biaya berlangganan Claude Pro AS sekitar $20 per bulan, harganya dapat dipengaruhi oleh wilayah, pajak, dan penyesuaian dari Anthropic. Yang dilihat pengguna adalah harga tetap, tetapi yang dihadapi perusahaan model adalah perilaku penggunaan yang sangat berbeda. Ada yang hanya menulis email dan mencari informasi, ada yang memproses dokumen panjang, menjalankan tugas kode, atau memanggil alur otomatisasi yang lebih kompleks.

Diagram pemecahan yang beredar di pasar mencoba menggambarkan hal ini secara konkret: Dari $20, sebagian disisakan untuk perusahaan model, sebagian dibayarkan ke penyedia awan dan daya komputasi. Biaya daya komputasi mencakup listrik, pemeliharaan, dan depresiasi GPU. Pembelian GPU kemudian mengalir ke atas ke Nvidia, TSMC, pemasok HBM (High Bandwidth Memory), produsen modul optik, ODM, dan perusahaan terkait listrik.

"Depresiasi GPU" di sini dapat dipahami bahwa GPU yang mahal tidak dihitung biayanya sekaligus, tetapi dialokasikan secara bertahap ke dalam layanan AI berdasarkan masa pakai, intensitas penggunaan, atau standar akuntansi. Alokasi nyata akan dipengaruhi oleh batasan paket, rasio pengguna ringan-berat, harga penyelesaian internal penyedia awan, diskon untuk kapasitas komputasi yang dipesan, tingkat pemanfaatan GPU, dan masa depresiasi. Biaya rata-rata juga tidak sama dengan biaya marginal.

Arah yang benar-benar perlu diwaspadai investor adalah: Perusahaan aplikasi AI tidak hanya perlu mengungkapkan pertumbuhan pendapatan, tetapi juga menjawab apakah biaya daya komputasi di balik pertumbuhan pendapatan tersebut juga tumbuh bersamaan. Jika ekspansi volume penggunaan lebih cepat daripada peningkatan efisiensi model, semakin tinggi pendapatan langganan, tekanan terhadap margin kotor mungkin semakin jelas. Hanya jika peningkatan efisiensi cukup cepat, perusahaan model baru memiliki peluang untuk mendekati kembali struktur keuntungan perusahaan perangkat lunak.

Infrastruktur Mendapatkan Pendapatan yang Lebih Pasti Terlebih Dahulu

Saat ini, pertumbuhan volume penggunaan AI lebih langsung mengalir ke infrastruktur, dan tidak semuanya mengendap di lapisan aplikasi.

Tidak peduli apakah pengguna menggunakan model di Claude, ChatGPT, Gemini, atau agen internal perusahaan, inferensi pada akhirnya harus mengandalkan daya komputasi, listrik, memori, dan jaringan. Mungkin ada pergantian produk di lapisan aplikasi, tetapi konsumsi sumber daya dasar lebih kaku. Selama volume penggunaan AI terus meningkat, pengeluaran modal awan, pembelian GPU, permintaan HBM, dan konsumsi listrik pusat data akan terdorong.

Ini juga alasan mengapa rantai infrastruktur seperti Nvidia, TSMC, SK Hynix terus dievaluasi ulang oleh pasar. Margin kotor keseluruhan Nvidia dalam beberapa tahun terakhir berada di level tinggi. Margin kotor GAAP dan non-GAAP untuk tahun fiskal 2026 sekitar 71,1% dan 71,3%, dan panduan untuk kuartal berikutnya juga tetap tinggi. Perlu diperhatikan, kuartal tertentu dapat terganggu oleh biaya tertentu, dan laporan keuangan publik tidak selalu dapat secara langsung memecah struktur margin kotor nyata pusat data AI. Namun, fakta bahwa infrastruktur langka memiliki kekuatan penentuan harga telah tercermin dalam kinerja.

HBM adalah mata rantai paling khas dalam rantai ini. Ini bukan memori biasa, tetapi komponen kunci dalam akselerator AI yang mendukung komputasi throughput tinggi. Setelah skala model, panjang konteks, dan kebutuhan inferensi bersamaan meningkat, ketergantungan chip AI pada memori bandwidth tinggi menjadi lebih kuat. Perkiraan rantai pasokan menunjukkan bahwa porsi HBM dalam biaya chip AI generasi baru meningkat. Ini juga alasan penting mengapa SK Hynix, Samsung, Micron diberi harga ulang dalam siklus AI.

Listrik dan pusat data juga berubah dari biaya latar belakang menjadi tema investasi utama. Konsumsi energi untuk satu kueri teks biasa mungkin tidak terlalu besar, tetapi agen kompleks, konteks panjang, pembuatan kode, dan tugas multi-ronde akan memperbesar volume komputasi. Bagi penyedia awan dan operator pusat data, kuncinya bukanlah berapa banyak listrik yang dikonsumsi oleh satu kueri tertentu, melainkan ketika sejumlah besar permintaan inferensi terjadi secara terus-menerus, pemanfaatan klaster, harga listrik, pendinginan, kapasitas ruang server, dan kemampuan akses jaringan listrik akan menjadi biaya dan hambatan.

Kelebihan di sisi infrastruktur adalah bahwa verifikasi kinerja lebih cepat. Pengeluaran modal AI penyedia awan telah terjadi, pendapatan dan margin kotor Nvidia tercermin dalam laporan keuangan, pesanan dan harga pemasok HBM juga akan lebih cepat masuk ke laporan laba rugi. Lapisan aplikasi model lebih banyak memperdagangkan ekspektasi masa depan: konversi langganan, penetrasi perusahaan, pendapatan API, dan pelepasan keuntungan setelah kurva biaya masa depan turun.

Peningkatan Efisiensi Masih Menjadi Argumen Inti Pendukung Bullish

Investor perangkat lunak dan pendukung bullish AI juga memiliki sanggahan. Inti pandangan dari pihak efisiensi adalah bahwa tingginya biaya inferensi saat ini hanyalah fenomena tahap awal. Optimisasi model, cache, model kecil, chip buatan sendiri, dan pemanfaatan klaster yang lebih tinggi akan terus menurunkan biaya per unit. Selama penurunan biaya cukup cepat, aplikasi AI masih mungkin kembali ke logika perangkat lunak margin kotor tinggi.

Sanggahan ini memiliki dasar realitas. Beberapa model utama telah menunjukkan penurunan harga per unit yang signifikan dengan kemampuan yang setara atau lebih tinggi. OpenAI pernah mengungkapkan bahwa biaya per token untuk GPT-4o mini turun 99% dibandingkan dengan text-davinci-003 tahap awal. Ritme antarperusahaan tidak sepenuhnya seragam. Anthropic baru-baru ini lebih banyak menunjukkan peningkatan dengan harga yang sama dan stratifikasi model, tetapi arah industri tetap menggunakan biaya yang lebih rendah untuk memberikan kemampuan yang lebih kuat.

Perusahaan model juga memiliki berbagai cara untuk meningkatkan ekonomi per unit. Tugas sederhana diserahkan ke model kecil, permintaan umum digunakan ulang melalui cache, konteks panjang dan tugas kompleks diserahkan ke model yang lebih kuat. Penyedia awan menurunkan biaya daya komputasi per unit melalui chip buatan sendiri dan penjadwalan klaster. Google memiliki TPU, Microsoft meluncurkan Maia untuk inferensi, dan Amazon juga mengembangkan Trainium dan Inferentia.

Jika hanya melihat kemajuan teknologi, margin keuntungan aplikasi AI memang memiliki ruang untuk perbaikan. Inferensi yang lebih murah, routing model yang lebih baik, dan kemampuan kompresi yang lebih kuat, semuanya dapat membuat langganan $20 yang sama menanggung volume penggunaan yang lebih banyak. Pengguna ringan, paket perusahaan berharga tinggi, penetapan harga berlapis API, dan batasan penggunaan yang lebih ketat juga dapat meningkatkan ekonomi per unit secara keseluruhan.

Kesulitannya adalah, penurunan biaya bukan satu-satunya variabel. Aplikasi AI sedang bergerak dari obrolan sederhana ke beban kerja yang lebih berat. Dulu pengguna mungkin hanya tanya jawab dan menulis ulang teks, sekarang semakin banyak kebutuhan berasal dari agen kode, pemrosesan dokumen panjang, pembuatan video dan multimodal, serta alur otomatisasi perusahaan. Skenario ini bernilai lebih tinggi, tetapi juga konsumsinya lebih tinggi. Semakin berguna modelnya, pengguna semakin mungkin mempercayakan tugas yang lebih kompleks dan lebih lama padanya.

Perbedaan pendapat menjadi lebih konkret: Apakah kecepatan penurunan biaya inferensi dapat melampaui pertumbuhan volume penggunaan dan kompleksitas tugas? Jika biaya per unit turun dengan cepat, tetapi konsumsi rata-rata pengguna tumbuh lebih cepat, margin kotor berbobot perusahaan model masih akan tertekan. Sebaliknya, jika routing model, cache, chip buatan sendiri, dan stratifikasi harga cukup efektif, langganan AI mungkin secara bertahap terbebas dari karakteristik biaya berat saat ini.

Jumlah Pengguna Berlangganan Bukanlah Margin Kotor

Diagram pemecahan $20 tidak boleh dipahami sebagai keadaan akhir. Ini lebih seperti pengingat valuasi di tahap saat ini: Ketika pasar belum dapat melihat data margin kotor perusahaan model yang cukup transparan, investor perlu memberikan diskon untuk asumsi "aplikasi AI secara alami sama dengan SaaS".

Bagi perusahaan model yang belum terdaftar seperti OpenAI dan Anthropic, investor eksternal sulit melihat buku besar lengkap. Materi pendanaan, pengungkapan mitra, struktur biaya awan, harga paket perusahaan, proporsi pendapatan API, dan batasan penggunaan akan menjadi petunjuk penilaian. Data yang benar-benar berharga bukanlah berapa banyak pengguna berbayar, melainkan berapa proporsi pengguna ringan dan berat, apakah klien perusahaan bersedia membayar harga lebih tinggi untuk penggunaan intensif, apakah biaya penyelesaian awan menurun, serta apakah penurunan biaya inferensi per unit dapat masuk ke margin kotor perusahaan.

Verifikasi dari rantai perusahaan yang sudah terdaftar akan lebih cepat muncul dalam laporan keuangan. Margin kotor keseluruhan dan kecepatan pertumbuhan pendapatan pusat data Nvidia, permintaan proses canggih dan pengemasan TSMC, harga dan margin keuntungan pemasok HBM, intensitas pengeluaran modal penyedia awan, semua ini akan terus mencerminkan apakah volume penggunaan AI masih mengalir ke ujung infrastruktur. Jika indikator-indikator ini tetap kuat, sementara lapisan aplikasi model kurang bukti perbaikan margin kotor, pasar akan terus memberikan premi valuasi yang lebih pasti kepada infrastruktur.

Pada akhirnya, agar perusahaan model mendapatkan jangkar valuasi yang lebih tinggi, yang perlu dibuktikan bukan hanya kesediaan pengguna membayar $20, tetapi juga bahwa biaya berlangganan ini, setelah digunakan secara berat, masih dapat menyisakan margin kotor yang cukup. Perbedaan pendapat penetapan harga berikutnya, kemungkinan besar tidak terletak pada angka headline ARR, tetapi pada apakah biaya inferensi, batasan paket, dan harga berbayar perusahaan dapat berjalan bersamaan.

Pertanyaan Terkait

QApa perbedaan utama antara pendapatan aplikasi AI dan pendapatan SaaS tradisional?

APerbedaan utamanya terletak pada biaya marginal. Dalam SaaS tradisional, biaya tambahan untuk setiap penggunaan pengguna hampir nol, sehingga perusahaan perangkat lunak dapat mencapai margin kotor tinggi (seringkali 70-80%). Sementara itu, aplikasi AI memiliki biaya variabel yang signifikan untuk setiap penggunaan (seperti inference, token, dan daya GPU), yang menekan margin kotor dan membuatnya kurang stabil dibandingkan dengan model bisnis perangkat lunak murni.

QMengapa biaya inference dianggap sebagai tantangan utama bagi model ekonomi aplikasi AI?

ABiaya inference adalah tantangan karena tidak tetap. Setiap permintaan pengguna (pertanyaan, analisis dokumen, penulisan kode) membutuhkan sumber daya komputasi GPU, daya listrik, dan bandwidth memori. Pengguna ringan mungkin menguntungkan, tetapi pengguna berat dengan tugas kompleks dapat meningkatkan biaya secara signifikan, sehingga menciptakan ketegangan antara biaya variabel dan model langganan tetap.

QPihak mana dalam rantai nilai AI yang saat ini menerima pendapatan yang lebih pasti, menurut artikel?

AMenurut artikel, infrastruktur (seperti penyedia GPU (Nvidia), pabrikan chip (TSMC), pemasok HBM (SK Hynix, Samsung), modul optik, dan penyedia daya/data center) menerima pendapatan yang lebih pasti. Karena peningkatan penggunaan AI langsung meningkatkan permintaan akan sumber daya komputasi dasar mereka, kinerja keuangan mereka lebih cepat terlihat dan diverifikasi dibandingkan dengan perusahaan aplikasi model yang masih membangun basis pelanggan.

QApa argumen utama dari para pendukung (AI bulls) mengenai potensi margin aplikasi AI di masa depan?

AArgumen utama para pendukung adalah bahwa peningkatan efisiensi akan menurunkan biaya unit secara signifikan. Optimasi model, cache, penggunaan model yang lebih kecil, chip buatan sendiri, dan peningkatan utilisasi kluster diprediksi akan mengurangi biaya inference per token. Jika penurunan biaya ini lebih cepat daripada peningkatan kompleksitas dan volume penggunaan, model bisnis aplikasi AI dapat mendekati margin kotor tinggi seperti perusahaan perangkat lunak tradisional.

QApa poin kunci yang perlu dibuktikan oleh perusahaan model AI untuk mendapatkan valuasi yang lebih tinggi di pasar?

APerusahaan model AI perlu membuktikan bahwa mereka tidak hanya dapat menarik pelanggan yang membayar, tetapi juga dapat mempertahankan dan meningkatkan margin kotor secara berkelanjutan di bawah penggunaan berat. Ini membutuhkan bukti peningkatan efisiensi (penurunan biaya inference), strategi penetapan harga yang efektif (seperti paket berlapis untuk pengguna perusahaan), manajemen penggunaan, dan kemampuan untuk mengubah pendapatan langganan menjadi keuntungan yang solid meskipun ada biaya komputasi variabel.

Bacaan Terkait

Jepang Naikkan Suku Bunga, Mengapa Seluruh Dunia Merasa Cemas?

Bank sentral Jepang menaikkan suku bunga kebijakan menjadi 1% pada Juni 2026, tingkat pertama kali dalam 1% sejak 1995. Meski angka ini masih rendah dibandingkan AS dan Eropa, kenaikan ini sangat diperhatikan pasar global karena menandai perubahan mendasar dari kebijakan suku bunga ultra-rendah yang berlangsung selama tiga dekade. Inti kekhawatiran global terletak pada peran Jepang sebagai "pusat pendanaan berbiaya terendah global." Selama lebih dari 20 tahun, investor internasional meminjam yen dengan biaya hampir nol untuk berinvestasi di aset berimbal hasil tinggi di seluruh dunia (saham AS, obligasi emerging market, dll.), menciptakan "carry trade" yen. Praktik ini menjadi sumber likuiditas murah penting yang mendorong kenaikan harga aset global. Kini, kenaikan suku bunga Jepang mengancam logika fundamental ini. Biaya pinjaman yen yang meningkat memaksa investor global mengevaluasi ulang dan berpotensi mengurangi posisi leverage mereka, yang dapat memicu kontraksi likuiditas dan volatilitas di pasar keuangan global. Pasar tidak terlalu khawatir dengan level bunga 1%, tetapi lebih pada perubahan tren dan runtuhnya konsensus bahwa "Jepang akan selamanya menyediakan uang murah." Faktor pendorong kenaikan suku bunga antara lain: inflasi yang bertahan di atas target 2%, kenaikan upah berkelanjutan ("siklus positif upah-inflasi"), dan tekanan pada yen yang melemah. Namun, arah akhir aliran modal global tetap akan sangat dipengaruhi oleh kebijakan The Fed AS. Jika AS mulai menurunkan suku bunga sementara Jepang menaikkan, penyempitan selisih suku bunga AS-Jepang dapat berdampak lebih besar pada pasar.

marsbit1j yang lalu

Jepang Naikkan Suku Bunga, Mengapa Seluruh Dunia Merasa Cemas?

marsbit1j yang lalu

Trading

Spot
Futures
活动图片