Oleh Sleepy dan Siwaiguaiguai
Pada Desember 2025, ponsel "Doubao" yang sudah lama dikabarkan akhirnya hadir. Ponsel ini memasang pratinjau teknis asisten ponsel Doubao ke dalam ponsel prototipe Nubia M153, dengan harga jual awal 3499 yuan. Sekitar 30.000 unit pertama habis terjual pada hari peluncurannya.
Ingat beberapa hari setelah peluncuran, harganya di pasar sekunder sempat melambung berkali-kali lipat. Redaksi Dongcha Beating juga membeli dua unit.
Bukan karena itu ponsel yang sangat enak dipakai, justru sebaliknya. Sebagai "pratinjau teknis", pengalaman dengan Doubao Phone generasi pertama tidaklah terlalu bagus. Tapi yang membuat kami sangat bersemangat adalah, ini pertama kalinya AI ditarik keluar dari kotak obrolan, dari sekadar Chat bot menjadi sebuah AI Agent, dan mampu mengendalikan sebuah ponsel.
Di Doubao Phone, AI bisa melihat layar, memahami konten yang sedang kamu jelajahi, mendengar ucapanmu, berpindah antar berbagai App, dan langsung membantumu melakukan banyak hal, seperti memeriksa tiket kereta, membandingkan harga belanja, mengambil kupon, membuat pesanan, mengedit foto. Meskipun untuk tahap sensitif seperti pembayaran masih membutuhkan konfirmasi pengguna, tetapi AI ini memang sudah bisa menyelesaikan secara mandiri banyak operasi yang dulu harus kita lakukan sendiri dengan mengklik satu per satu.
Meskipun masih agak bodoh, terkadang responsnya lambat, terkadang macet, tidak lincah seperti orang yang baru belajar menggunakan smartphone, tetapi ini memang membuat kami merasakan untuk pertama kalinya betapa nyamannya AI dalam kehidupan sehari-hari.
Kemudian OpenClaw baru lahir dan booming di seluruh dunia, AI Agent menjadi momen iPhone lainnya di bidang AI setelah kelahiran ChatGPT, banyak vendor dan wirausahawan mulai menjual komputer dan ponsel yang sudah dipasang OpenClaw. Doubao Phone memimpin mereka setidaknya satu versi, bahkan bisa dikatakan Doubao Phone adalah pelopor dalam gelombang Agent ini.
Tapi sayangnya, Doubao Phone dengan cepat menghadapi pemboikotan oleh raksasa teknologi. Akses atau operasi dalam skenario seperti WeChat, Taobao, Alipay, aplikasi perbankan mulai terganggu. Ada yang menyebutnya "pemblokiran", ada juga yang bilang hanya memicu kontrol risiko, tapi bagi pengguna tidak ada bedanya, yaitu tidak bisa digunakan.
Kami sangat menyesal. Doubao Phone tentu bukan produk elektronik konsumen yang matang, tetapi ini membuat seluruh industri melihat wujud awal pintu masuk generasi berikutnya.
Jadi, meskipun popularitas gelombang Doubao Phone sudah berlalu, kami belum sepenuhnya melupakan hal ini. Sampai baru-baru ini, penangkapan informasi rutin kami menangkap ribuan lowongan pekerjaan, dan analisisnya menemukan bahwa ByteDance tampaknya akan memulai kembali pengembangan ponsel.
Tiga Asal, Satu Petunjuk
Kami menangkap informasi lowongan dari tiga asal halaman rekrutmen resmi ByteDance, yaitu AI dan Inovasi Bisnis, OS Seluler, dan Asisten Ponsel Doubao.
Setelah melakukan deduplikasi berdasarkan ID posisi, kami menangkap informasi halaman detail lebih lanjut, dan melakukan penyilangan data berdasarkan kata kunci dalam nama posisi, deskripsi posisi, dan persyaratan.
Berbeda dengan rekrutmen tim aplikasi AI biasa, dalam lowongan pekerjaan ini dari ByteDance juga muncul posisi seperti sistem ponsel, kamera, layar sentuh, konektivitas jaringan, daya tahan baterai, panas, adaptasi chip, desain struktur, proses perakitan, pengujian jalur produksi.
Kata-kata ini tidak umum di perusahaan internet, ini adalah hal-hal yang hanya ditangani setiap hari oleh pabrikan ponsel, perusahaan rantai pasokan, dan tim teknik.
ByteDance akan merekrut orang untuk masuk ke pabrik.
Tapi ini belum bisa memastikan ByteDance akan membuat merek ponselnya sendiri, setidaknya bisa dipastikan mereka sedang memulai kembali pekerjaan pengembangan perangkat terminal tingkat ponsel.
Mari kita lihat apa yang ditunjukkan oleh posisi-posisi ini sendiri.
Asisten Ponsel Doubao: Dari Menjawab Pertanyaan ke Menjalankan Tugas untuk Orang
Mari lihat Asisten Ponsel Doubao.
Kami melakukan penyaringan yang lebih fokus lagi, mencari posisi dengan nama, deskripsi, dan persyaratan yang menyebutkan "Asisten Ponsel Doubao" dalam data mentah, total 83 posisi, dan posisi-posisi ini bisa dibagi menjadi tiga kategori besar, yang kebetulan bisa membentuk wujud sistem AI Agent.
Kategori posisi pertama, bertanggung jawab membuat AI memiliki kemampuan sebagai Agent.
Misalnya, posisi "Engineer Pengembangan Agent - Asisten Ponsel Doubao" menulis, perlu membuat AI mampu melakukan pemecahan tugas, pengorganisasian konteks, pemanggilan alat, pencarian memori, manajemen status, validasi hasil, dan pemulihan dari kegagalan. Ini adalah kemampuan dasar semua AI Agent yang kita gunakan saat ini.
Kategori posisi kedua, bertanggung jawab membuat AI Agent memiliki ingatan yang baik.
Posisi muncul arah seperti "persepsi dan memori", "memori pengguna", "grafik pengetahuan pribadi", "preferensi jangka panjang". Jika ingin AI Agent benar-benar menyatu dalam kehidupan kita, jangan biarkan dia setiap hari seperti pertama kali mengenal kita, dia perlu memiliki memori jangka panjang yang andal dan stabil.
Tentu ini mudah menyentuh masalah privasi dan batasan, tetapi dari data rekrutmen, setidaknya ByteDance sudah mulai memperlakukan "memori" sebagai salah satu kemampuan terpenting Asisten Ponsel Doubao untuk dikembangkan.
Kategori posisi ketiga, bertanggung jawab membuat AI Agent dapat menggunakan kemampuan-kemampuan itu di dalam ponsel.
Jika Asisten Ponsel Doubao ingin beroperasi untuk pengguna, dia tidak boleh hanya hidup di cloud, apalagi hanya sebuah App. Dia memerlukan seperangkat kemampuan lengkap, termasuk model, memori, eksekusi tugas, penerapan sisi perangkat (edge), aplikasi sistem, audio-video, komunikasi, pengujian, dan jaminan kualitas, agar bisa mendengar ucapan pengguna, memahami lingkungan, berkolaborasi antarperangkat, selalu siaga, dan tidak menimbulkan masalah.
OS Seluler: Lapisan Dasar Ponsel Adalah Tantangan Sebenarnya untuk Agent
Sekarang lihat OS Seluler.
Posisi terkait OS Seluler ada 236, lokasi kantor utama terkonsentrasi di Beijing, Shanghai, dan Shenzhen. Dalam deskripsi posisi, kata-kata yang berulang muncul adalah kernel, chip, driver, kamera, tampilan, audio, jaringan, konsumsi daya, manajemen panas, pengiriman produksi massal. Ini hampir semua kata yang lebih dekat dengan perangkat keras dan sistem dasar ponsel.
Sebagai contoh. Tanggung jawab posisi "Kepala Tim Kernel - OS Seluler" menulis, harus memimpin tim memori dan penyimpanan untuk melakukan adaptasi dan pengembangan kernel untuk platform Qualcomm baru, agar sistem dapat bekerja sama dengan chip ponsel mainstream, dan mengelola memori dan penyimpanan di dalam ponsel. Kemampuan-kemampuan ini adalah kunci agar AI Agent dapat merespons secara real-time dan memproses tugas di latar belakang.
Selain itu, dalam posisi juga muncul kata-kata seperti SoC, BSP, RTOS. SoC bisa secara kasar dipahami sebagai chip inti ponsel, BSP adalah seperangkat perangkat lunak dasar yang membuat sistem dan perangkat keras saling mengenal dan bekerja sama, RTOS sering digunakan dalam skenario yang menuntut respons dan efisiensi daya tinggi.
Jadi sinyal yang dikeluarkan oleh posisi OS Seluler adalah, ByteDance sedang merekrut orang-orang yang memahami sistem terminal tingkat ponsel. Mereka setidaknya harus tahu, setelah AI Agent berjalan di ponsel, di mana dia akan terhambat oleh masalah izin, di mana oleh masalah konsumsi daya, di mana oleh masalah stabilitas sistem, masalah mana yang perlu diselesaikan bersama dengan chip, vendor, tim pengujian.
Dari persyaratan posisi-posisi yang sedang direkrut ini, ByteDance sudah masuk ke perairan dalam ponsel.
Koordinat Shenzhen: Sinyal Perangkat Keras dan Produksi Massal
Selain itu, perlu dipisahkan untuk dilihat adalah posisi-posisi yang berkoordinat di Shenzhen.
Jika posisi di Beijing lebih condong ke model, algoritma, dan platform, posisi di Shanghai lebih condong ke produk dan teknik, maka posisi di Shenzhen sering kali berkaitan dengan perangkat keras, rantai pasokan, pengujian, dan produksi massal.
Sebuah proyek jika hanya layanan cloud, Shenzhen tidak begitu penting; tetapi begitu menyentuh produk fisik, Shenzhen akan menjadi sangat penting.
Apa yang kami lihat dalam posisi terkait Shenzhen, memang hal-hal seperti ini.
Beberapa posisi menulis desain interaksi manusia-komputer, mencakup interaksi fisik perangkat keras, interaksi antarmuka perangkat lunak, pengalaman keterhubungan multiperangkat. Posisi ini tidak hanya mempertimbangkan bagaimana mendesain antarmuka di dalam layar, tetapi juga mempertimbangkan tekstur perangkat fisik, tombol, cara membangunkan, cara berinteraksi dengan perangkat lain.
Beberapa posisi lain lebih dekat ke lokasi teknik, seperti koneksi antar modul, konsumsi daya, komunikasi jarak dekat, baseband, proses perakitan perangkat, struktur, proses pengujian.
Kata-kata ini dibandingkan dengan "agen cerdas", "multimodal", "model dunia", tidak begitu enak didengar. Tapi elektronik konsumen pada akhirnya ditentukan oleh hal-hal ini.
Jika ByteDance hanya ingin membuat Doubao menjadi aplikasi ponsel yang lebih baik, dia tidak perlu melakukan banyak pekerjaan kotor ini. Begitu dia mulai merekrut posisi-posisi ini, artinya dia sudah siap naik kapal ini.
ByteDance Tidak Bisa Hanya Membuat App
Dulu, ponsel adalah wadah untuk App; di era AI, ponsel mungkin akan menjadi tubuh untuk Agent.
Jika ponsel hanya wadah untuk App, maka perusahaan seperti ByteDance dapat membangun kerajaannya sendiri melalui konten, algoritma, dan kekuatan produk, melalui satu per satu App. Tetapi jika ponsel menjadi tubuh Agent, pengguna mengeluarkan tugas terlebih dahulu, siapa yang bisa menerima tugas, dia punya kesempatan menentukan jalur selanjutnya.
Dalam jalur ini, App akan diturunkan pangkatnya menjadi alat yang dapat dipanggil. Ini akan membuat semua Super App tidak nyaman. Karena Agent secara alami akan melewati lapisan tengah.
Jadi, tempat yang benar-benar sulit, mungkin bukan pada apakah Doubao bisa membuka sebuah App, tapi pada apakah orang lain bersedia membiarkannya membuka. Dan sebuah AI yang bisa mengambil keputusan untuk pengguna, tidak mungkin diizinkan dengan mudah seperti App biasa.
Agent yang ingin bergerak dari kotak obrolan ke lapisan operasi, harus menangani banyak pekerjaan kotor dan melelahkan yang dulu bukan bagian dari tim AI. Mereka harus tahu kapan sistem akan menutup aplikasi di latar belakang, kapan operasi akan memicu kontrol risiko, mengapa ponsel menjadi panas, mengapa tingkat kelayakan pabrik tidak naik. Dulu hal-hal ini tidak dikelola oleh tim AI, tapi sekarang tidak bisa dihindari.
Jadi ByteDance perlu merekrut posisi-posisi ini. Dia mungkin belum tentu benar-benar meluncurkan sebuah ponsel, tetapi ByteDance pasti tidak bisa lagi hanya membuat App di ponsel orang lain.
Perusahaan model besar yang ingin menjadi pintu masuk pengguna generasi berikutnya, tidak bisa selamanya hidup sebagai parasit di sistem operasi orang lain.












