AI WeChat, akhirnya bergerak.
Di hari yang sama dengan WWDC Apple, WeChat melakukan sesuatu yang mungkin lebih penting dari Apple: merilis pengumuman sederhana berjudul "Panduan Pengembang untuk Bergabung dengan Ekosistem AI WeChat".
Mulai hari ini, pengembang Mini Program dapat memberikan otorisasi agar AI WeChat dapat membaca, mengoperasikan, dan memanggil fungsi-fungsi Mini Program.
WeChat memberikan dua cara bergabung. Pertama, "Mode Otomatis" dengan ambang batas hampir nol. Pengembang cukup menyalakan satu tombol, platform akan membaca kode sumber sendiri, menganalisis halaman, memahami apa yang dapat dilakukan Mini Program, lalu AI dapat langsung mengoperasikannya tanpa menulis satu baris kode pun.
Cara kedua disebut "Mode Pengembangan", di mana pengembang mengembangkan Skill yang disesuaikan sendiri. Setelah lolos review, Skill tersebut dapat dipanggil oleh AI. Kedua mode dapat diaktifkan bersamaan. Meituan telah mengumumkan bergabung.
Ini tidak bisa hanya dipahami sebagai peluncuran fitur baru lagi, tetapi harus dilihat bahwa WeChat sedang mengubah seluruh ekosistemnya—jutaan Mini Program, WeChat Pay, Notifikasi Layanan, Akun Resmi—menjadi lapisan eksekusi untuk AI.
Mengupas Dokumen Skill, Bagaimana AI WeChat Memanggil Mini Program
Dokumen terbuka WeChat mempublikasikan spesifikasi teknis Skill untuk menghubungkan Mini Program dengan AI. Jika dilihat lebih detail, banyak desain yang tersembunyi di dalamnya.
Panduan ke dokumen skill resmi👇🏻:
https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html
Dari sudut pandang arsitektur, orang yang pernah mengembangkan AI akan segera mengenalinya, pada dasarnya ini adalah MCP. mcp.json mendeklarasikan fungsi dan parameter setiap antarmuka atomik, SKILL.md menjelaskan alur proses bisnis berjalan. Ini hampir persis sama dengan arsitektur MCP+Skills di Claude, Cursor, VS Code. WeChat tidak membuat sistem baru dari awal, langsung mengadopsi standar yang sedang menyatu di industri.
Dalam panduan solusi, WeChat memberikan set "bobot perhatian" yang sangat jelas. Saat AI memutuskan antarmuka mana yang akan dipanggil dan parameter apa yang akan dihasilkan, prioritas tertinggi adalah melihat content yang dikembalikan oleh antarmuka (bintang lima), diikuti description antarmuka dalam mcp.json (bintang empat) dan description parameter (bintang empat). SKILL.md berada di peringkat terakhir (bintang tiga). Ini berarti di mana pengembang menulis lebih penting daripada apa yang ditulis—aturan yang sama, jika ditulis dalam respons antarmuka dan dalam SKILL.md, bobot yang diberikan AI akan sangat berbeda.
Di tingkat respons antarmuka, ada aturan inti: dua tahap "fakta + aksi". Pertama beri tahu AI "apa yang terjadi", lalu beri tahu "langkah selanjutnya apa". Jika hanya menulis aksi tanpa fakta, AI mungkin mengartikan "tampilkan kartu" sebagai "siap memanggil antarmuka berikutnya" dan melewatkan konfirmasi pengguna. Ini adalah aturan yang biasanya dirangkum setelah banyak mengalami masalah.
Keempat, prioritas transmisi parameter menggunakan ID daripada bahasa alami. Mengambil contoh skenario "Pesan Kopi" pada gambar, setelah pengguna mengajukan permintaan, AI memahami niat samar, pilihan, mengubah spesifikasi, menangani pembayaran—semua dalam dialog tanpa keluar.
Desain ini mengungkapkan sinyal: WeChat telah menjalankan cukup banyak kasus di lapangan, tahu di mana lubang masalah ketika AI memanggil layanan eksternal, dan membakukan pengalaman ini menjadi panduan pengembang.
Sebenarnya, jika membandingkan ekosistem Mini Program WeChat yang terkenal dengan aplikasi Apple, WeChat memiliki sudut pandang "Tuhan" terhadap ekosistemnya sendiri. Ini adalah prasyarat semua pencapaian.
Bagaimana Bisa Lebih Penting dari AI Apple
Apple merilis Siri AI versi baru pada WWDC tahun ini, meski di lapisan bawah terhubung ke Google Gemini, dan Shortcuts mendukung pembuatan bahasa alami, tapi tidak banyak menimbulkan diskusi.
Jika diperhatikan, perbedaannya jelas: Apple melakukan koordinasi beberapa fungsi asli AI dalam sistem iOS, namun begitu menyentuh aplikasi pihak ketiga—App yang terinstal di ponsel Anda—ia akan kesulitan.
Misalnya Ele.me, kodenya berjalan di server milik Ele.me sendiri, Apple tidak bisa membacanya. Jika Siri ingin memanggil Ele.me, engineer Ele.me harus aktif menghubungi dan mengintegrasikan ke set antarmuka App Intents ini, satu per satu diajak bicara, satu per satu dihubungkan, memakan banyak waktu dan tenaga.
Sedangkan yang dilakukan WeChat adalah membuat AI langsung mengoperasikan jutaan layanan pihak ketiga, karena Mini Program berbeda. Kode setiap Mini Program, mulai dari pengiriman oleh pengembang, review oleh WeChat, hingga akhirnya berjalan di ponsel pengguna, seluruh proses berada dalam sistem teknis WeChat. WeChat dapat memindai kode pada tahap review, secara otomatis menganalisis "halaman apa yang ada di Mini Program ini, apa yang bisa dilakukan, input dan outputnya apa".
Karena itulah "Mode Otomatis" bisa terbentuk—pengembang tidak perlu menulis satu baris kode, cukup nyalakan tombol, WeChat sendiri bisa menerjemahkan Mini Program Anda menjadi alat yang dapat dipanggil oleh AI. Arsitektur dasar WeChat secara alami mendukung hal ini, ia memiliki "sudut pandang Tuhan", mampu menjadwalkan berdasarkan sentralisasi.
Keunggulan arsitektur ini tidak dimiliki Apple, juga tidak dimiliki Google.
Perlu diperhatikan juga, kabar yang beredar beberapa waktu lalu bahwa WeChat sedang bekerja sama dengan Huawei, Honor, Xiaomi, OPPO, vivo untuk meluncurkan kemampuan asisten A2A (Agent-to-Agent). Pengguna dapat memulai panggilan suara/video atau mengirim pesan WeChat langsung melalui asisten suara ponsel.
Secara internal, AI WeChat dapat memanggil jutaan Mini Program; secara eksternal, asisten AI pabrikan ponsel dapat memanggil WeChat. WeChat sedang menjadi penghubung super di era AI, pusat layanan yang dapat diakses oleh semua AI.
Ramalan Lama "OS WeChat"
Saat Mini Program diluncurkan, banyak orang bercanda bahwa WeChat ingin membuat "OS WeChat". Saat itu ini lebih seperti kiasan—Mini Program menggantikan sebagian fungsi App, tetapi pada dasarnya tetap platform "aplikasi ringan".
Yang lebih tidak terduga, mekanisme review sentralisasi yang didesain saat itu, bertujuan untuk mengontrol kualitas dan keamanan. Namun sembilan tahun kemudian, desain yang dulu dikritik sebagai "terlalu terkendali" ini, secara tak terduga menjadi keunggulan infrastruktur di era AI. Ekosistem App terdistribusi (Apple/Android) yang saat itu tampak lebih "bebas", sekarang justru menjadi hambatan akses AI.
Ramalan lama, karena munculnya teknologi baru—AI—mengalami perubahan yang mengganggu.
Sebelumnya, saat menulis tentang OpenClaw dan Feishu, saya menyebutkan satu penilaian: IM adalah pintu masuk paling alami untuk AI Agent, karena percakapan itu sendiri adalah cara interaksi paling alami antara manusia dan AI, dan ekosistem layanan bawaan IM (bot, pembayaran, Mini Program) memungkinkan AI tidak hanya "mengobrol" tetapi juga "melakukan". Feishu sudah bergerak ke arah ini, meluncurkan Bot API yang diperkuat dan node AI Agent.
Namun, Feishu adalah alat kolaborasi perusahaan, mencakup skenario kerja. WeChat memiliki cakupan yang sangat berbeda—1,432 miliar pengguna aktif bulanan, ratusan Mini Program di bidang khusus, dari pesan makanan online hingga registrasi rumah sakit hingga beli tiket pesawat hingga bayar tagihan air listrik, hampir mencakup semua kebutuhan layanan kehidupan sehari-hari seseorang.
Jika AI WeChat benar-benar dapat memanggil Mini Program ini dengan lancar untuk menyelesaikan tugas, maka seperti yang diramalkan, ia menjadi sistem operasi yang dioperasikan dengan bahasa alami.
Pengguna mengatakan "bantu saya pesan kereta cepat dari Beijing ke Shanghai besok jam tiga sore", AI menguraikan niat, memanggil Mini Program 12306 untuk cari tiket, pilih kursi, WeChat Pay selesaikan pemesanan, semuanya tanpa keluar WeChat. Secara teori, jalur ini sudah bisa berjalan hari ini.
Tentu, ada jarak antara teori dan kenyataan. Pemanggilan AI yang melibatkan layanan dengan skenario pembayaran, toleransi kesalahan mendekati nol—salah pesan kopi adalah hal kecil, salah beli tiket pesawat adalah masalah besar. Persyaratan akurasi model dasar jauh lebih tinggi daripada skenario percakapan. Ini juga hambatan bersama yang dihadapi AI Agent global: dari "bisa mengobrol" ke "bisa mengerjakan", yang membatasi bukanlah indikator teknis, melainkan kepercayaan.
Tapi setidaknya WeChat melakukan satu hal dengan benar: ia tidak membangun jaringan layanan dari nol. Selama bertahun-tahun ini, yang dilakukan ChatGPT adalah memiliki otak pintar dulu, lalu satu per satu menghubungkan Shopify, DoorDash, Stripe, setiap koneksi dibangun dari nol, hingga hari ini proporsi kueri terkait transaksi masih kurang dari 3%.
Perubahan yang sebenarnya akan terjadi, bagi sebagian besar pengguna, mungkin diam-diam. Suatu hari Anda mengetik di WeChat "bantu saya pesan tiket malam ini jam sembilan ke Shanghai", lalu tiket sudah dipesan, Anda bahkan tidak tahu Mini Program mana yang dipanggil di belakang, proses pembayaran apa yang digunakan.
"Penyelesaian tanpa disadari" inilah tanda kematangan sebenarnya dari AI Agent. WeChat lebih dekat dengan langkah ini daripada siapa pun.
Artikel ini berasal dari akun resmi WeChat "APPSO", penulis: APPSO yang Menemukan Produk Masa Depan

















