Dalam beberapa tahun terakhir, seiring dengan perkembangan pesat AI, berbagai raksasa internet di Tiongkok telah beramai-ramai mengembangkan model AI besar, terutama belakangan ini, popularitas Lobster membuat AI mereka menghasilkan keuntungan berlimpah. Namun, seperti yang diduga, gelombang kenaikan harga AI pun tiba tepat waktu. Dalam situasi di mana raksasa luar negeri seperti Amazon, Google, serta BAT di Tiongkok secara kolektif menaikkan harga, perusahaan model besar domestik seperti Zhipu juga mengikuti kenaikan harga. Hal ini membuat orang bertanya-tanya, apakah dengan datangnya gelombang kenaikan harga, karyawan Lobster pun tidak akan terjangkau lagi?
一、Raksasa Kolektif Menaikkan Harga
Menurut laporan Haibao News, baru-baru ini, saham konsep modul optik dan perangkat keras komputasi mengalami kenaikan tajam. Di balik ini adalah demam OpenClaw (sering disebut "Lobster" di Tiongkok) yang tahun ini menyebar dari luar negeri ke dalam negeri, volume panggilan Token melonjak drastis, secara langsung menarik permintaan komputasi, dan realisasi industri Token menjadi fokus perhatian baru.
Ali Cloud dan Baidu Intelligent Cloud secara berturut-turut mengumumkan kenaikan harga produk terkait komputasi AI. Pengumuman resmi Ali Cloud menyatakan, karena ledakan permintaan AI global dan kenaikan harga rantai pasok, komputasi AI, penyimpanan, dan produk lainnya di Ali Cloud mengalami kenaikan harga hingga 34%. Menurut sumber terpercaya, platform bisnis MaaS Ali Cloud, Bailian, mencatat pertumbuhan tertinggi dalam sejarah dari Januari hingga Maret tahun ini.
Baidu Intelligent Cloud menyatakan, dipengaruhi oleh perkembangan pesat aplikasi kecerdasan buatan global, permintaan komputasi terus meningkat, biaya perangkat keras inti dan infrastruktur terkait mengalami kenaikan signifikan, sehingga memutuskan untuk menaikkan harga layanan produk terkait komputasi AI sebesar 5% hingga 30%, dan penyimpanan file paralel dinaikkan sekitar 30%.
Awal tahun, Amazon AWS dan Google Cloud secara berturut-turut mengumumkan kenaikan harga sebagian layanan. Pada 22 Januari, AWS mengumumkan kenaikan harga 15% untuk EC2 yang digunakan untuk pelatihan model besar. Pada 27 Januari, Google Cloud melakukan penyesuaian besar-besaran terhadap harga layanan transmisi data seperti CDN Interconnect, Direct Peering, Carrier Peering, dengan kenaikan di wilayah Amerika Utara mencapai 100%.
Di sisi domestik, pada 11 Maret, Tencent Cloud mengumumkan kenaikan harga layanan model besar, menyesuaikan strategi penagihan untuk sebagian model. Sebagai contoh, model Tencent HY2.0 Instruct, harga inputnya naik drastis dari 0,0008 yuan/ribu Token menjadi 0,004505 yuan/ribu Token, kenaikan mencapai 463,13%.
Dan gelombang kenaikan harga belum berakhir. Pada 8 April, Zhipu mengumumkan rencana kenaikan harga ketiga tahun ini, meluncurkan model andalan baru GLM-5.1 sambil menaikkan harga 10%, padahal jarak dari penyesuaian harga terakhir yang dimulai dari 30% hanya satu bulan. Berbanding terbalik dengan penurunan harga dan uji coba gratis tahun 2025, sinyal yang jelas saat ini adalah, model AI besar domestik sedang memasuki era kenaikan harga kolektif.
二、Gelombang Kenaikan Harga AI Tiba, Apakah Karyawan Lobster Tidak Akan Terjangkau Lagi?
Baru-baru ini, berbagai raksasa model besar secara kolektif mengumumkan kenaikan harga sebagian layanan cloud dan produk terkait, membuat orang yang sebelumnya khawatir akan didistilasi似乎又看到了希望 (sepertinya melihat harapan lagi), dibandingkan dengan token kata yang mahal, kita似乎更便宜一些 (sepertinya lebih murah). Lalu, apa logika industri yang tersembunyi di balik gelombang kenaikan harga ini?
Pertama, ledakan agen cerdas AI memicu lonjakan permintaan komputasi. Dari sudut perubahan struktural sisi permintaan, ledakan agen cerdas AI generasi baru yang diwakili oleh OpenClaw telah sepenuhnya merekonstruksi logika dasar konsumsi komputasi. Pada awal penerapan model besar sebelumnya, perilaku pengguna大多 terbatas pada percakapan satu putaran atau generasi teks sederhana, di mana konsumsi Token dalam mode interaksi ini relatif terbatas dan dapat diprediksi. Namun, seiring dengan matangnya teknologi agen otonom, AI tidak lagi menjadi mesin tanya-jawab pasif, melainkan karyawan digital yang mampu merencanakan secara mandiri, memanggil alat, dan menjalankan tugas kompleks.
Konsumsi Token per orang per hari dari sebuah agen cerdas yang matang往往是 puluhan甚至 ratusan kali lipat dari pengguna chat tradisional. Lonjakan permintaan eksponensial ini bukanlah pertumbuhan bisnis linear, melainkan lompatan dimensi. Ketika sejumlah besar agen cerdas online secara bersamaan, melakukan penalaran logika dan pertukaran data frekuensi tinggi, infrastruktur komputasi yang dirancang untuk interaksi manusia瞬间 menghadapi tekanan吞吐 yang besar.
Lonjakan permintaan yang eksplosif ini secara langsung memecah keseimbangan penawaran dan permintaan lama, membuat sumber daya komputasi berubah dari "cukup tersedia" dengan cepat menjadi "sangat langka". Ketika utilitas marginal naik drastis dan elastisitas penawaran tidak mencukupi, kenaikan harga tidak hanya merupakan cerminan必然 dari hukum pasar, tetapi juga sarana必要 untuk menyaring场景 aplikasi bernilai tinggi dan menghentikan pemborosan komputasi tidak efisien.
Kedua, permintaan yang melebihi penawaran untuk perangkat keras inti menyebabkan ketatnya komputasi. Dari约束 keras sisi penawaran, permintaan yang melebihi penawaran untuk chip komputasi kinerja tinggi dan memori bandwidth tinggi HBM membentuk landasan fisik dari gelombang kenaikan harga ini. Meskipun vendor cloud domestik telah berinvestasi besar dalam pembangunan ekosistem komputasi domestik dalam beberapa tahun terakhir, hambatan kapasitas仍然严峻 di bidang chip pelatihan dan inferensi high-end secara global. Khususnya memori HBM yang merupakan "darah" model besar, hambatan teknologinya tinggi, siklus ekspansi produksinya panjang, menjadi短板 kunci yang membatasi pelepasan komputasi.
Saat ini, komputasi tidak lagi sekadar penumpukan server, melainkan sistem presisi yang terdiri dari chip制程 maju, jaringan interkoneksi berkecepatan tinggi, dan penyimpanan bandwidth tinggi. Kelangkaan perangkat keras inti menyebabkan biaya marginal penawaran komputasi naik signifikan, vendor cloud tidak dapat lagi mengencerkan biaya melalui efek skala sederhana.约束 kaku sisi penawaran ini memaksa industri untuk必须 mempertimbangkan kembali mekanisme penetapan harga komputasi. Ketika "komputasi adalah kekuasaan" menjadi konsensus, vendor dengan kemampuan penawaran komputasi stabil dan kinerja tinggi, secara alami memiliki kekuatan tawar yang lebih kuat. Kenaikan harga saat ini, sebenarnya adalah penilaian ulang yang合理 atas nilai sumber daya perangkat keras langka, merupakan hasil必然 dari tekanan biaya上游 rantai industri yang ditransmisikan ke下游.
Belakangan ini, banyak teman penulis dari perusahaan teknologi, terutama CTO,普遍 mengeluh, harga chip penyimpanan dan server saat ini benar-benar tidak terjangkau, berbagai perebutan komputasi感觉瞬间 menjadi perebutan biaya, inilah yang paling layak diperhatikan saat ini.
Ketiga, logika penetapan harga industri 'menukar volume dengan harga' telah mengalami perubahan mendasar. Melihat kembali perkembangan industri komputasi awan dalam sepuluh tahun terakhir, kita不难 menemukan lingkaran setan: perang harga yang merusak. Untuk merebut pangsa pasar, berbagai vendor besar纷纷 mengeluarkan "golok harga", tidak hanya memeras ruang hidup pesaing, tetapi juga sangat memampatkan batas keuntungan mereka自身. Pada某些时段, harga layanan cloud bahkan lebih rendah dari biaya operasinya, muncul fenomena "inner volume" yang khas. Mode "menukar volume dengan harga" ini mungkin efektif di era internet seluler, karena biaya marginal saat itu mendekati nol, dan jalur monetisasi流量 jelas.
Namun, kedatangan era AI sepenuhnya mematahkan logika ini. Komputasi saat ini不再是 barang umum yang murah, melainkan alat produksi khusus yang mahal. Jika terus mempertahankan strategi harga rendah, vendor cloud tidak akan dapat menutupi biaya pembelian GPU yang tinggi dan biaya operasi listrik, apalagi berinvestasi besar dalam dana研发 untuk iterasi model berkelanjutan. Pengembangan industri yang sehat必须 didasarkan pada keuntungan yang合理. Hanya ketika harga kembali ke nilai, perusahaan才有能力 melakukan reproduksi dan inovasi.
Kenaikan harga kolektif raksasa teknologi实际上是一种 "kembali理性 kolektif" industri. Ini menandakan bahwa pasar komputasi awan Tiongkok正在告别 era "subsidi bakar uang" yang liar, memasuki era kompetisi nilai yang berfokus pada kekuatan teknologi dan kualitas layanan. Ini sangat menguntungkan bagi pembangunan ekosistem良性 industri secara keseluruhan, membuat fokus kompetisi beralih dari "siapa yang lebih murah" menjadi "siapa yang lebih stabil, siapa yang lebih cerdas, siapa yang更能 memecahkan masalah", ini无疑是 sinyal positif peningkatan industri.
Keempat, ekonomi token muncul, penetapan harga berlapis将成为常态. Dahulu, pusat data dianggap sebagai "gudang" penyimpan data, nilainya terutama体现在 penyewaan ruang dan penyimpanan data. Di era AI, pusat data已 berkembang menjadi "pabrik" penghasil kecerdasan, hasil intinya adalah Token kata bernilai tinggi. Perubahan peran ini langsung melahirkan logika penetapan harga baru, layanan AI di masa depan tidak akan menggunakan mode包年包月 atau bayar sesuai pemakaian tradisional, melainkan melakukan penetapan harga berlapis berdasarkan吞吐量 Token, kecepatan respons, kompleksitas penalaran, dan其他维度.
Strategi penetapan harga yang精细 ini mampu更精准地 mencocokkan kebutuhan komputasi di不同场景, membuat tugas real-time tinggi, kompleksitas tinggi membayar溢价更高, sementara tugas pemrosesan批量 offline menikmati biaya lebih rendah. Ini不仅是 inovasi model bisnis, tetapi juga peningkatan极大 efisiensi alokasi sumber daya. Melalui tuas harga, industri akan mengarahkan sumber daya komputasi ke bidang yang menciptakan nilai sosial terbesar, menghindari kesalahan alokasi dan pemborosan sumber daya.
Dalam situasi seperti ini, banyak perusahaan bahkan langsung menggunakan jumlah penyediaan token sebagai tunjangan karyawan全新, tentu saja kita一直在 mendiskusikan apakah token adalah alat produksi atau tunjangan kesejahteraan karyawan, tetapi yang tidak diragukan lagi adalah era saat ini token telah menjadi hambatan komputasi penting yang membatasi perkembangan perusahaan AI. Bahkan, ada teman penulis yang mengeluh kepada penulis, awalnya tahun ini perusahaan raksasa teknologi tempat teman bekerja要求 semua karyawan menggunakan Lobster, menggunakan digital twin mereka自身, hasilnya belakangan ini dalam konsumsi大量 mengusulkan pembatasan流量.
Akhirnya, menghadapi sumber daya komputasi yang semakin mahal, bagaimana masa depan AI Lobster? Apakah kita masih mampu menggunakannya?
Artikel ini来自微信公众号 "Jianghan Shive Guancha", penulis: Jianghan Shive Guancha











