Article | Sleepy, Siwei Guaiguai
En décembre 2025, le « Doubao Phone », longtemps annoncé, a finalement vu le jour. Il intégrait la version d'aperçu technique de l'assistant téléphonique Doubao dans un prototype d'ingénierie du Nubia M153, lancé au prix de 3499 yuans. Les quelque 30 000 premières unités ont été épuisées le jour même de la mise en vente.
Peu après le lancement, son prix sur le marché de l'occasion ("seafood market") a atteint plusieurs fois le prix initial. La rédaction de Beating de Dongcha en a même acheté deux.
Non pas parce que c'était un téléphone formidablement performant, bien au contraire. En tant que « version d'aperçu technique », la première génération du Doubao Phone offrait une expérience loin d'être parfaite. Ce qui nous a particulièrement enthousiasmés, c'est qu'il a pour la première fois extrait l'IA de la boîte de chat, la transformant d'un simple chatbot en un véritable Agent IA, capable de contrôler un téléphone.
Sur le Doubao Phone, l'IA peut voir l'écran, comprendre le contenu que vous consultez, entendre vos paroles, naviguer entre différentes applications et vous aider directement à accomplir de nombreuses tâches, comme vérifier des horaires de train, comparer des prix, utiliser des coupons, passer des commandes ou retoucher des photos. Bien que des étapes sensibles comme les paiements nécessitent encore une confirmation de l'utilisateur, elle peut déjà accomplir de manière autonome de nombreuses opérations qui, auparavant, nécessitaient nos propres clics répétés.
Bien qu'elle reste parfois un peu lente à réagir, qu'elle puisse planter ou paraître maladroite comme quelqu'un qui découvre le smartphone, elle nous a permis de ressentir concrètement pour la première fois à quel point l'IA intégrée au quotidien peut être pratique.
Plus tard, Lobster (Longxia) est apparu et a conquis le monde, faisant des Agents IA un autre "iPhone moment" dans le domaine de l'IA après l'arrivée de ChatGPT. Une multitude d'acteurs et d'entrepreneurs se sont mis à vendre des ordinateurs et téléphones pré-équipés d'OpenClaw. Le Doubao Phone les avait devancés d'au moins une version, et on peut même dire qu'il fut un pionnier dans cette vague d'enthousiasme pour les Agents.
Malheureusement, le Doubao Phone s'est rapidement heurté à un mur érigé par les géants. Des scénarios comme WeChat, Taobao, Alipay ou les applications bancaires ont successivement rencontré des blocages d'accès ou d'opération. Certains ont parlé de « blocage », d'autres de déclenchement de contrôles de sécurité, mais pour l'utilisateur, la différence est minime : ça ne fonctionnait plus.
Nous le regrettons profondément. Le Doubao Phone n'était certes pas un produit électronique grand public abouti, mais il a permis à toute l'industrie d'entrevoir les prémices de la prochaine interface.
C'est pourquoi, même après que l'enthousiasme pour le Doubao Phone soit retombé, nous n'avons pas complètement abandonné cette piste. Jusqu'à récemment, notre collecte quotidienne d'informations a capturé des milliers d'offres d'emploi dont l'analyse révèle que ByteDance semble s'apprêter à relancer le développement de téléphones.
Trois axes, un indice
Nous avons collecté trois axes sur la page officielle de recrutement de ByteDance : les activités innovantes en IA, le système d'exploitation mobile et l'assistant téléphonique Doubao.
Après déduplication par ID de poste, nous avons approfondi en collectant les informations détaillées des pages, puis croisé et organisé les données en utilisant des mots-clés présents dans l'intitulé du poste, la description du poste et les exigences.
Contrairement aux recrutements classiques d'équipes d'applications IA, ces offres de ByteDance font également apparaître des postes liés au système téléphonique, à l'appareil photo, au tactile, à la connectivité, à l'autonomie, à l'échauffement, à l'adaptation aux puces, à la conception structurelle, aux procédés de fabrication des appareils complets et aux tests de ligne de production.
Ces termes sont peu courants dans les entreprises Internet ; ce sont des problématiques quotidiennes pour les fabricants de téléphones, les sociétés de la chaîne d'approvisionnement et les équipes d'ingénierie.
ByteDance va recruter pour aller en usine.
Cela ne confirme pas que ByteDance créera sa propre marque de téléphone, mais cela indique au moins qu'ils relancent les travaux de R&D pour des terminaux de niveau téléphonique.
Voyons maintenant ce que ces postes eux-mêmes révèlent.
Assistant téléphonique Doubao : de la réponse à l'exécution
Commençons par l'assistant téléphonique Doubao.
Nous avons effectué un tri plus ciblé, recherchant dans les données brutes les postes dont le nom, la description ou les exigences mentionnaient « Assistant téléphonique Doubao ». Nous en avons trouvé 83, répartis en trois grandes catégories qui, ensemble, dessinent la forme d'un Agent IA de niveau système.
La première catégorie vise à doter l'IA des capacités d'Agent.
Par exemple, le poste « Ingénieur de développement Agent - Assistant téléphonique Doubao » indique qu'il faut permettre à l'IA de décomposer les tâches, organiser le contexte, appeler des outils, récupérer des souvenirs, gérer les états, valider les résultats et récupérer des anomalies. Ce sont les capacités de base de tous les Agents IA actuels.
La deuxième catégorie vise à doter l'Agent IA d'une bonne mémoire.
Les postes mentionnent des orientations comme « perception et mémoire », « mémoire utilisateur », « graphe de connaissances personnel », « préférences à long terme ». Pour qu'un Agent IA s'intègre réellement à notre vie, il ne peut pas faire comme s'il nous rencontrait pour la première fois chaque jour ; il a besoin d'une mémoire à long terme fiable et stable.
Bien sûr, cela soulève facilement des questions de vie privée et de limites, mais d'après les offres, ByteDance a au moins commencé à développer la « mémoire » comme l'une des capacités les plus importantes de l'assistant Doubao.
La troisième catégorie vise à permettre à l'Agent IA d'exploiter ces capacités dans le téléphone.
Pour opérer à la place de l'utilisateur, l'assistant Doubao ne peut pas vivre uniquement dans le cloud, ni être une simple application. Il a besoin d'un ensemble complet de capacités, incluant le modèle, la mémoire, l'exécution des tâches, le déploiement côté terminal, les applications système, l'audio/vidéo, les communications, les tests et l'assurance qualité, afin d'entendre l'utilisateur, comprendre l'environnement, coordonner les appareils, être toujours prêt et éviter les problèmes.
Système d'exploitation mobile : la couche basse, véritable obstacle pour l'Agent
Passons au système d'exploitation mobile.
Il y a 236 postes liés au système d'exploitation mobile, principalement localisés à Pékin, Shanghai et Shenzhen. Dans les descriptions, les mots récurrents sont : noyau, puce, pilote, appareil photo, affichage, audio, réseau, consommation, gestion thermique, livraison en production. Ce sont presque tous des termes proches du matériel et des couches basses du système téléphonique.
Prenons des exemples. La responsabilité du poste « Responsable Noyau - Système d'exploitation mobile » indique qu'il faut diriger l'équipe mémoire et stockage pour l'adaptation et le développement du noyau sur les nouvelles plateformes Qualcomm, permettre au système de fonctionner avec les puces téléphoniques principales et bien gérer la mémoire et le stockage du téléphone. Ces capacités sont essentielles pour qu'un Agent IA réponde en temps réel et traite les tâches en arrière-plan.
De plus, des termes comme SoC, BSP, RTOS apparaissent. Le SoC peut être grossièrement compris comme le cœur du processeur du téléphone, le BSP est un ensemble de logiciels bas niveau permettant au système et au matériel de se reconnaître et de coopérer, et le RTOS est souvent utilisé dans des scénarios exigeant une grande réactivité et une faible consommation.
Ainsi, les postes liés au système d'exploitation mobile envoient le signal que ByteDance recrute des personnes compétentes sur les systèmes de terminaux de niveau téléphone. Ils doivent au moins savoir où un Agent IA, une fois exécuté sur un téléphone, sera bloqué par des problèmes de permissions, de consommation ou de stabilité du système, et quels problèmes nécessitent une résolution conjointe avec les fabricants de puces, les partenaires et les équipes de test.
D'après les exigences de ces postes en cours de recrutement, ByteDance est déjà entré dans les eaux profondes du téléphone.
Localisation à Shenzhen : le signal du matériel et de la production
Il est également nécessaire d'examiner séparément les postes localisés à Shenzhen.
Si les postes à Pékin sont plus orientés modèle, algorithme et plateforme, et ceux de Shanghai plus orientés produit et ingénierie, les postes de Shenzhen concernent souvent le matériel, la chaîne d'approvisionnement, les tests et la production en série.
Si un projet n'est qu'un service cloud, Shenzhen est moins crucial ; dès qu'il s'agit de toucher à un produit physique, Shenzhen devient très important.
Et c'est précisément ce que nous voyons dans les postes liés à Shenzhen.
Certains postes concernent la conception de l'interaction homme-machine, couvrant l'interaction physique avec le matériel, l'interaction avec l'interface logicielle, l'expérience de liaison multi-terminaux. Ces postes ne considèrent pas seulement la conception des interfaces à l'écran, mais aussi le toucher du dispositif physique, les boutons, comment le réveiller, comment le faire interagir avec d'autres appareils.
D'autres postes sont plus proches du terrain industriel, comme l'interconnexion, la consommation, les communications courte portée, la bande de base, les procédés de fabrication des appareils complets, la structure, les procédés de test.
Ces termes sont moins glamour que « agent intelligent », « multimodal » ou « modèle du monde ». Mais dans l'électronique grand public, ce sont ces éléments qui décident de la vie ou de la mort.
Si ByteDance voulait simplement faire de Doubao une meilleure application mobile, elle n'aurait pas besoin de s'embarrasser de toutes ces corvées. Le fait qu'elle commence à recruter pour ces postes signifie qu'elle est prête à monter à bord de ce navire.
ByteDance ne peut plus se contenter de faire des applications
Autrefois, le téléphone était le contenant des applications ; à l'ère de l'IA, le téléphone pourrait devenir le corps de l'Agent.
Si le téléphone n'est qu'un contenant d'applications, une entreprise comme ByteDance peut, par le contenu, les algorithmes et la force de ses produits, bâtir son royaume à travers une série d'applications. Mais si le téléphone devient le corps de l'Agent, l'utilisateur émet d'abord une tâche, et celui qui peut prendre en charge cette tâche a la possibilité de déterminer le chemin à suivre.
Dans ce chemin, les applications seront rétrogradées au rang d'outils appelables. Cela ne plaira à aucune super-application. Car l'Agent est intrinsèquement conçu pour contourner les couches intermédiaires.
Ainsi, la véritable difficulté ne réside probablement pas dans la capacité de Doubao à ouvrir une application, mais dans la volonté des autres de la laisser l'ouvrir. Et une IA capable de prendre des décisions pour l'utilisateur ne peut pas être autorisée aussi facilement qu'une application ordinaire.
Pour passer de la boîte de chat à la couche d'opération, l'Agent doit s'occuper d'une multitude de tâches ingrates qui n'étaient pas du ressort des équipes IA auparavant. Ils doivent savoir quand le système va tuer une tâche en arrière-plan, quand une opération déclenchera des contrôles de sécurité, pourquoi le téléphone chauffe, pourquoi le taux de conformité en usine n'augmente pas. Autrefois, ces choses ne concernaient pas les équipes IA, mais désormais, elles sont incontournables.
C'est pourquoi ByteDance recrute pour ces postes. Elle ne lancera peut-être pas réellement un téléphone, mais ByteDance ne peut définitivement plus se contenter de n'être qu'une application dans le téléphone des autres.
Une entreprise de grands modèles de langage qui aspire à devenir l'interface utilisateur de demain ne peut pas éternellement vivre en parasite dans le système d'exploitation d'autrui.












