Nous avons collecté des milliers d'offres d'emploi et découvert que ByteDance s'apprête à relancer la R&D téléphonique

marsbitPublié le 2026-05-25Dernière mise à jour le 2026-05-25

Résumé

Basé sur l'analyse de milliers d'offres d'emploi, des indices montrent que ByteDance relance potentiellement ses activités de R&D dans le domaine des téléphones. Les recrutements visent des postes liés à "l'assistant téléphonique Doubao", au "système d'exploitation mobile" et aux "activités d'innovation IA". Ils couvrent non seulement le développement d'agents IA capables d'exécuter des tâches, de gérer la mémoire utilisateur et d'interagir avec le système, mais aussi des compétences matérielles approfondies : adaptation des puces, gestion de l'alimentation, design structurel, tests de production et livraison. Une concentration notable de postes à Shenzhen, hub de la chaîne d'approvisionnement matérielle, renforce cette hypothèse. L'article rappelle le lancement en 2025 du "Doubao Phone", un pionnier des agents IA intégrés qui pouvait contrôler le téléphone et exécuter des tâches dans diverses applications. Bien que prometteur, il a rencontré des obstacles d'accès avec des applications majeures. Cette expérience souligne un défi central : pour qu'un agent IA devienne l'interface principale de l'utilisateur et aille au-delà d'un simple chatbot, il doit opérer au niveau du système, au plus près du matériel. Les recrutements actuels suggèrent que ByteDance s'attaque à ces "corvées" techniques et logistiques, reconnaissant que pour contrôler l'expérience de l'agent IA de demain, il ne peut plus se contenter de développer des applications pour les systèmes d'exploitation d'autres...

Article | Sleepy, Siwei Guaiguai

En décembre 2025, le « Doubao Phone », longtemps annoncé, a finalement vu le jour. Il intégrait la version d'aperçu technique de l'assistant téléphonique Doubao dans un prototype d'ingénierie du Nubia M153, lancé au prix de 3499 yuans. Les quelque 30 000 premières unités ont été épuisées le jour même de la mise en vente.

Peu après le lancement, son prix sur le marché de l'occasion ("seafood market") a atteint plusieurs fois le prix initial. La rédaction de Beating de Dongcha en a même acheté deux.

Non pas parce que c'était un téléphone formidablement performant, bien au contraire. En tant que « version d'aperçu technique », la première génération du Doubao Phone offrait une expérience loin d'être parfaite. Ce qui nous a particulièrement enthousiasmés, c'est qu'il a pour la première fois extrait l'IA de la boîte de chat, la transformant d'un simple chatbot en un véritable Agent IA, capable de contrôler un téléphone.

Sur le Doubao Phone, l'IA peut voir l'écran, comprendre le contenu que vous consultez, entendre vos paroles, naviguer entre différentes applications et vous aider directement à accomplir de nombreuses tâches, comme vérifier des horaires de train, comparer des prix, utiliser des coupons, passer des commandes ou retoucher des photos. Bien que des étapes sensibles comme les paiements nécessitent encore une confirmation de l'utilisateur, elle peut déjà accomplir de manière autonome de nombreuses opérations qui, auparavant, nécessitaient nos propres clics répétés.

Bien qu'elle reste parfois un peu lente à réagir, qu'elle puisse planter ou paraître maladroite comme quelqu'un qui découvre le smartphone, elle nous a permis de ressentir concrètement pour la première fois à quel point l'IA intégrée au quotidien peut être pratique.

Plus tard, Lobster (Longxia) est apparu et a conquis le monde, faisant des Agents IA un autre "iPhone moment" dans le domaine de l'IA après l'arrivée de ChatGPT. Une multitude d'acteurs et d'entrepreneurs se sont mis à vendre des ordinateurs et téléphones pré-équipés d'OpenClaw. Le Doubao Phone les avait devancés d'au moins une version, et on peut même dire qu'il fut un pionnier dans cette vague d'enthousiasme pour les Agents.

Malheureusement, le Doubao Phone s'est rapidement heurté à un mur érigé par les géants. Des scénarios comme WeChat, Taobao, Alipay ou les applications bancaires ont successivement rencontré des blocages d'accès ou d'opération. Certains ont parlé de « blocage », d'autres de déclenchement de contrôles de sécurité, mais pour l'utilisateur, la différence est minime : ça ne fonctionnait plus.

Nous le regrettons profondément. Le Doubao Phone n'était certes pas un produit électronique grand public abouti, mais il a permis à toute l'industrie d'entrevoir les prémices de la prochaine interface.

C'est pourquoi, même après que l'enthousiasme pour le Doubao Phone soit retombé, nous n'avons pas complètement abandonné cette piste. Jusqu'à récemment, notre collecte quotidienne d'informations a capturé des milliers d'offres d'emploi dont l'analyse révèle que ByteDance semble s'apprêter à relancer le développement de téléphones.

Trois axes, un indice

Nous avons collecté trois axes sur la page officielle de recrutement de ByteDance : les activités innovantes en IA, le système d'exploitation mobile et l'assistant téléphonique Doubao.

Après déduplication par ID de poste, nous avons approfondi en collectant les informations détaillées des pages, puis croisé et organisé les données en utilisant des mots-clés présents dans l'intitulé du poste, la description du poste et les exigences.

Contrairement aux recrutements classiques d'équipes d'applications IA, ces offres de ByteDance font également apparaître des postes liés au système téléphonique, à l'appareil photo, au tactile, à la connectivité, à l'autonomie, à l'échauffement, à l'adaptation aux puces, à la conception structurelle, aux procédés de fabrication des appareils complets et aux tests de ligne de production.

Ces termes sont peu courants dans les entreprises Internet ; ce sont des problématiques quotidiennes pour les fabricants de téléphones, les sociétés de la chaîne d'approvisionnement et les équipes d'ingénierie.

ByteDance va recruter pour aller en usine.

Cela ne confirme pas que ByteDance créera sa propre marque de téléphone, mais cela indique au moins qu'ils relancent les travaux de R&D pour des terminaux de niveau téléphonique.

Voyons maintenant ce que ces postes eux-mêmes révèlent.

Assistant téléphonique Doubao : de la réponse à l'exécution

Commençons par l'assistant téléphonique Doubao.

Nous avons effectué un tri plus ciblé, recherchant dans les données brutes les postes dont le nom, la description ou les exigences mentionnaient « Assistant téléphonique Doubao ». Nous en avons trouvé 83, répartis en trois grandes catégories qui, ensemble, dessinent la forme d'un Agent IA de niveau système.

La première catégorie vise à doter l'IA des capacités d'Agent.

Par exemple, le poste « Ingénieur de développement Agent - Assistant téléphonique Doubao » indique qu'il faut permettre à l'IA de décomposer les tâches, organiser le contexte, appeler des outils, récupérer des souvenirs, gérer les états, valider les résultats et récupérer des anomalies. Ce sont les capacités de base de tous les Agents IA actuels.

La deuxième catégorie vise à doter l'Agent IA d'une bonne mémoire.

Les postes mentionnent des orientations comme « perception et mémoire », « mémoire utilisateur », « graphe de connaissances personnel », « préférences à long terme ». Pour qu'un Agent IA s'intègre réellement à notre vie, il ne peut pas faire comme s'il nous rencontrait pour la première fois chaque jour ; il a besoin d'une mémoire à long terme fiable et stable.

Bien sûr, cela soulève facilement des questions de vie privée et de limites, mais d'après les offres, ByteDance a au moins commencé à développer la « mémoire » comme l'une des capacités les plus importantes de l'assistant Doubao.

La troisième catégorie vise à permettre à l'Agent IA d'exploiter ces capacités dans le téléphone.

Pour opérer à la place de l'utilisateur, l'assistant Doubao ne peut pas vivre uniquement dans le cloud, ni être une simple application. Il a besoin d'un ensemble complet de capacités, incluant le modèle, la mémoire, l'exécution des tâches, le déploiement côté terminal, les applications système, l'audio/vidéo, les communications, les tests et l'assurance qualité, afin d'entendre l'utilisateur, comprendre l'environnement, coordonner les appareils, être toujours prêt et éviter les problèmes.

Système d'exploitation mobile : la couche basse, véritable obstacle pour l'Agent

Passons au système d'exploitation mobile.

Il y a 236 postes liés au système d'exploitation mobile, principalement localisés à Pékin, Shanghai et Shenzhen. Dans les descriptions, les mots récurrents sont : noyau, puce, pilote, appareil photo, affichage, audio, réseau, consommation, gestion thermique, livraison en production. Ce sont presque tous des termes proches du matériel et des couches basses du système téléphonique.

Prenons des exemples. La responsabilité du poste « Responsable Noyau - Système d'exploitation mobile » indique qu'il faut diriger l'équipe mémoire et stockage pour l'adaptation et le développement du noyau sur les nouvelles plateformes Qualcomm, permettre au système de fonctionner avec les puces téléphoniques principales et bien gérer la mémoire et le stockage du téléphone. Ces capacités sont essentielles pour qu'un Agent IA réponde en temps réel et traite les tâches en arrière-plan.

De plus, des termes comme SoC, BSP, RTOS apparaissent. Le SoC peut être grossièrement compris comme le cœur du processeur du téléphone, le BSP est un ensemble de logiciels bas niveau permettant au système et au matériel de se reconnaître et de coopérer, et le RTOS est souvent utilisé dans des scénarios exigeant une grande réactivité et une faible consommation.

Ainsi, les postes liés au système d'exploitation mobile envoient le signal que ByteDance recrute des personnes compétentes sur les systèmes de terminaux de niveau téléphone. Ils doivent au moins savoir où un Agent IA, une fois exécuté sur un téléphone, sera bloqué par des problèmes de permissions, de consommation ou de stabilité du système, et quels problèmes nécessitent une résolution conjointe avec les fabricants de puces, les partenaires et les équipes de test.

D'après les exigences de ces postes en cours de recrutement, ByteDance est déjà entré dans les eaux profondes du téléphone.

Localisation à Shenzhen : le signal du matériel et de la production

Il est également nécessaire d'examiner séparément les postes localisés à Shenzhen.

Si les postes à Pékin sont plus orientés modèle, algorithme et plateforme, et ceux de Shanghai plus orientés produit et ingénierie, les postes de Shenzhen concernent souvent le matériel, la chaîne d'approvisionnement, les tests et la production en série.

Si un projet n'est qu'un service cloud, Shenzhen est moins crucial ; dès qu'il s'agit de toucher à un produit physique, Shenzhen devient très important.

Et c'est précisément ce que nous voyons dans les postes liés à Shenzhen.

Certains postes concernent la conception de l'interaction homme-machine, couvrant l'interaction physique avec le matériel, l'interaction avec l'interface logicielle, l'expérience de liaison multi-terminaux. Ces postes ne considèrent pas seulement la conception des interfaces à l'écran, mais aussi le toucher du dispositif physique, les boutons, comment le réveiller, comment le faire interagir avec d'autres appareils.

D'autres postes sont plus proches du terrain industriel, comme l'interconnexion, la consommation, les communications courte portée, la bande de base, les procédés de fabrication des appareils complets, la structure, les procédés de test.

Ces termes sont moins glamour que « agent intelligent », « multimodal » ou « modèle du monde ». Mais dans l'électronique grand public, ce sont ces éléments qui décident de la vie ou de la mort.

Si ByteDance voulait simplement faire de Doubao une meilleure application mobile, elle n'aurait pas besoin de s'embarrasser de toutes ces corvées. Le fait qu'elle commence à recruter pour ces postes signifie qu'elle est prête à monter à bord de ce navire.

ByteDance ne peut plus se contenter de faire des applications

Autrefois, le téléphone était le contenant des applications ; à l'ère de l'IA, le téléphone pourrait devenir le corps de l'Agent.

Si le téléphone n'est qu'un contenant d'applications, une entreprise comme ByteDance peut, par le contenu, les algorithmes et la force de ses produits, bâtir son royaume à travers une série d'applications. Mais si le téléphone devient le corps de l'Agent, l'utilisateur émet d'abord une tâche, et celui qui peut prendre en charge cette tâche a la possibilité de déterminer le chemin à suivre.

Dans ce chemin, les applications seront rétrogradées au rang d'outils appelables. Cela ne plaira à aucune super-application. Car l'Agent est intrinsèquement conçu pour contourner les couches intermédiaires.

Ainsi, la véritable difficulté ne réside probablement pas dans la capacité de Doubao à ouvrir une application, mais dans la volonté des autres de la laisser l'ouvrir. Et une IA capable de prendre des décisions pour l'utilisateur ne peut pas être autorisée aussi facilement qu'une application ordinaire.

Pour passer de la boîte de chat à la couche d'opération, l'Agent doit s'occuper d'une multitude de tâches ingrates qui n'étaient pas du ressort des équipes IA auparavant. Ils doivent savoir quand le système va tuer une tâche en arrière-plan, quand une opération déclenchera des contrôles de sécurité, pourquoi le téléphone chauffe, pourquoi le taux de conformité en usine n'augmente pas. Autrefois, ces choses ne concernaient pas les équipes IA, mais désormais, elles sont incontournables.

C'est pourquoi ByteDance recrute pour ces postes. Elle ne lancera peut-être pas réellement un téléphone, mais ByteDance ne peut définitivement plus se contenter de n'être qu'une application dans le téléphone des autres.

Une entreprise de grands modèles de langage qui aspire à devenir l'interface utilisateur de demain ne peut pas éternellement vivre en parasite dans le système d'exploitation d'autrui.

Questions liées

QQuel est l'élément clé qui a poussé l'équipe de rédaction à continuer de s'intéresser au projet 'Bateau Téléphone' après son retrait du marché ?

AL'élément clé était la capture récente de milliers d'offres d'emploi par leur système de surveillance quotidien de l'information. L'analyse de ces offres suggère que ByteDance semble relancer le développement de téléphones.

QQuelles sont les trois grandes catégories de postes liés à 'l'assistant téléphonique Bateau' identifiées dans les offres d'emploi, et que représentent-elles ?

ALes trois catégories sont : 1) Les postes responsables de doter l'IA des capacités d'Agent (tâches de décomposition, appel d'outils, etc.). 2) Les postes responsables de la mémoire et de la persistance de l'Agent (mémoire utilisateur, graphe de connaissances). 3) Les postes responsables de l'intégration et du fonctionnement de l'Agent dans le téléphone (déploiement sur l'appareil, applications système, tests). Elles représentent ensemble la forme d'un Agent IA de niveau système.

QSelon l'article, pourquoi la localisation des postes à Shenzhen est-elle un signal important ?

AParce que les postes localisés à Shenzhen sont souvent liés au matériel, à la chaîne d'approvisionnement, aux tests et à la production de masse. Cela indique que le projet dépasse le stade du logiciel pur et s'engage dans le développement concret de produits électroniques grand public, ce qui est crucial pour la réussite d'un appareil physique.

QQuel défi majeur l'article identifie-t-il pour qu'un Agent IA comme l'assistant Bateau puisse fonctionner pleinement sur un téléphone ?

ALe défi majeur n'est pas technique (comme ouvrir une application), mais d'acceptation et d'intégration. Les super-applications (comme WeChat, Alipay) peuvent voir l'Agent comme une menace car il contourne leur couche intermédiaire, entraînant des blocages ou des déclenchements de contrôle des risques. L'Agent doit donc gérer ces 'corvées' liées au système et aux écosystèmes applicatifs.

QQuelle conclusion fondamentale l'article tire-t-il sur la stratégie de ByteDance face à l'ère de l'IA Agent ?

ALa conclusion est que ByteDance (et par extension les entreprises de grands modèles linguistiques) ne peut plus se contenter de n'être qu'une application dans le téléphone des autres. Pour prétendre devenir la prochaine interface utilisateur principale, elle doit contrôler une couche plus profonde, potentiellement le système d'exploitation ou le terminal matériel lui-même, et ne pas rester 'parasite' dans le système d'exploitation d'autrui.

Lectures associées

Alibaba « met en rayon », ByteDance « s’entraîne »

Durant la dernière semaine de mai, deux événements consécutifs dans l'industrie de l'IA ont révélé les stratégies divergentes des géants chinois Alibaba et ByteDance. Alibaba adopte une approche d'application immédiate et de monétisation. Son modèle Qwen est intégré à Taobao pour des fonctionnalités comme l'essayage virtuel et la comparaison de prix, visant à transformer l'expérience d'achat. L'entreprise se positionne comme l'infrastructure ("eau, électricité, gaz") et la "caisse enregistreuse" de l'ère IA, avec ses services cloud alimentant de nombreux modèles locaux. Cette stratégie, soutenue par des réorganisations internes et l'initiative "AI Credit", génère déjà des revenus, comme en témoigne la croissance de 40% des revenus cloud externes. Cependant, elle suppose que les capacités des modèles de base n'évolueront pas assez vite pour rendre ses applications obsolètes. ByteDance, via son département Seed, privilégie la recherche fondamentale à long terme. Son objectif est "d'explorer les limites de l'intelligence". Son modèle de génération vidéo Seedance 2.0, salué comme le plus performant au monde, et des publications académiques ambitieuses sur les "modèles du monde" illustrent cette voie. La société, qui n'est pas cotée en bourse, peut se permettre d'engager des dépenses d'investissement massives (jusqu'à 470 milliards de yuans en 2026 selon des rapports) et d'accorder à ses chercheurs le temps de publier sans pression commerciale immédiate. Mais cette approche "laboratoire Nobel" commence à être questionnée par des signes de commercialisation sur des produits comme Doubao. L'article suggère que cette divergence stratégique tient moins à une philosophie qu'à un statut : Alibaba, société cotée, est soumis à la pression des marchés pour montrer des retours rapides, tandis que ByteDance, privée, peut investir sur le très long terme. Le jour où ByteDance envisagera une introduction en bourse, la pérennité de sa stratégie de recherche pure sera véritablement mise à l'épreuve.

marsbitIl y a 5 mins

Alibaba « met en rayon », ByteDance « s’entraîne »

marsbitIl y a 5 mins

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

Trois ans après ses prédictions sur ChatGPT en mars 2023, Wang Jianshuo revient sur ses vingt affirmations initiales, évaluées en mai 2026 par des agents IA. Sur les vingt points, la majorité des tendances de fond étaient correctes : l'essor du RAG comme architecture dominante pour l'injection de connaissances, le rôle central de l'interface utilisateur en langage naturel (LUI), l'émergence de protocoles pour un "réseau d'agents", et le rattrapage technologique rapide des modèles chinois. Des erreurs notables portent sur des chiffres précis, comme les 100 billions de paramètres supposés de GPT-4 (en réalité environ 1,8 billion) ou une estimation trop basse des coûts de formation des grands modèles. Certaines prévisions se sont révélées trop absolues ("l'IA ne fera jamais de mathématiques pures") ou ont négligé les disparités (aucune vague de chômage massif, mais un impact sévère sur les jeunes diplômés). L'analyse révèle que les intuitions sur les mécanismes et les directions se sont avérées bien plus fiables que les prédictions numériques ou temporelles, souvent trop optimistes à court terme. La prudence dans les formulations et la reconnaissance des incertitudes se sont montrées précieuses avec le recul. Ce bilan offre des leçons pour les futurs pronostics : privilégier les tendances aux chiffres, anticiper les effets distributifs et accepter que certaines questions demandent plus de trois ans pour être tranchées.

marsbitIl y a 8 h

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

marsbitIl y a 8 h

Trois ans plus tard : un retour sur mes prédictions de 2023 concernant ChatGPT

Trois ans après ses prédictions sur le ChatGPT en mars 2023, Wang Jianshuo revient sur ses 20 affirmations initiales. Évaluées en mai 2026 par des agents IA, la plupart de ses intuitions sur les grandes tendances se sont révélées justes : le RAG est devenu l'architecture standard pour intégrer des connaissances, l'Interface Utilisateur en Langage Naturel (LUI) a créé un nouvel écosystème, et les modèles chinois ont presque rattrapé les leaders mondiaux. Des concepts comme les réseaux d'agents et la nature limitée du test de Turing se sont également matérialisés. Cependant, les prévisions quantitatives et les affirmations trop absolues ont souvent échoué. Le paramétrage supposé du GPT-4 (100T) était inexact, et les coûts de développement des modèles ont dépassé les estimations. Il a sous-estimé la vitesse de personnalisation des IA et l'impact distribué sur l'emploi des jeunes. La capture de valeur a surtout bénéficié à la couche matérielle (comme Nvidia), et non aux seules applications. Les leçons clés sont que les mécanismes et les directions sont plus fiables que les chiffres précis, que l'optimisme à court terme doit être tempéré, et que les nuances ("peut-être", "pour l'instant") rendent les prédictions plus robustes. Cette rétrospective souligne l'importance de distinguer les tendances confirmées des questions toujours ouvertes.

链捕手Il y a 10 h

Trois ans plus tard : un retour sur mes prédictions de 2023 concernant ChatGPT

链捕手Il y a 10 h

Du Token à la main-d'œuvre machine : l'IA passe d'outil à « travailleur »

Alors que l'IA écrit du code, traite des tickets clients et révise des documents juridiques, elle ne se contente plus d'être un outil mais devient une source directe de travail. La commercialisation de l'IA évolue ainsi d'un marché de « jetons » (tokens) ou d'heures de GPU vers un nouveau marché : celui de la « main-d'œuvre machine ». Dans ce marché, le jeton n'est qu'une unité de mesure, le GPU un intrant, et le modèle un outil de production. L'objet véritablement tarifé et échangé est le travail économique accompli directement par le logiciel. Le mécanisme de prix de l'IA devrait évoluer des jetons bruts vers des capacités de modèles standardisées, puis vers une main-d'œuvre sectorielle, et enfin vers un marché de résultats programmables. À l'avenir, les entreprises pourraient ne plus se soucier du modèle ou du GPU spécifique utilisé, mais uniquement du fait que la tâche soit livrée dans des délais, avec un taux de précision, une fiabilité et un coût conformes aux standards. Ce changement ne signifie pas un simple remplacement du travail humain. Alors que la machine assume des tâches standardisées et vérifiables, le rôle humain pourrait se déplacer vers la supervision, la responsabilité finale, la gestion du contexte et les jugements critiques. Dans certains cas, les 1% de jugement humain final pourraient gagner en valeur, car ils permettent de débloquer les 99% d'automatisation à grande échelle. Le marché évolue donc vers une couche où le « travail » lui-même devient l'unité stable, standardisée, vérifiable et négociable. La prochaine phase de concurrence ne portera pas seulement sur la puissance des modèles ou le prix du calcul, mais sur la capacité à standardiser, vérifier et tarifer le « travail » accompli, faisant de la main-d'œuvre machine une nouvelle ressource productive que l'on peut acheter, facturer et échanger.

marsbitIl y a 11 h

Du Token à la main-d'œuvre machine : l'IA passe d'outil à « travailleur »

marsbitIl y a 11 h

Trading

Spot
Futures
活动图片