Por Sleepy y Siweiguai
En diciembre de 2025, el tan esperado "Doubao Phone" finalmente vio la luz. Tomó la versión preliminar técnica del Asistente Doubao y la instaló en un prototipo de ingeniería del Nubia M153. Su precio de lanzamiento fue de 3499 yuanes, y las primeras 30,000 unidades aproximadamente se agotaron el mismo día de su venta.
Recuerdo que durante los primeros días tras su lanzamiento, su precio en el mercado secundario llegó a multiplicarse varias veces. La redacción de "Beating" incluso compró dos unidades.
No es que fuera un teléfono especialmente bueno, todo lo contrario. Como "versión preliminar técnica", la experiencia del primer Doubao Phone no era óptima. Pero lo que nos emocionó especialmente fue que por primera vez sacó la IA del cuadro de chat, transformándola de un simple Chat bot en un Agente de IA capaz de controlar un teléfono móvil.
En el Doubao Phone, la IA podía ver la pantalla, entender el contenido que estabas viendo, escucharte, saltar entre diferentes aplicaciones y hacer muchas cosas por ti directamente, como buscar billetes de tren, comparar precios al comprar, usar cupones o realizar pedidos y retocar fotos. Aunque acciones más sensibles, como los pagos, aún requerían confirmación del usuario, ya podía completar de forma independiente muchas tareas que antes requerían que hiciéramos clic manualmente.
Aunque todavía era un poco torpe, a veces lenta, a veces se bloqueaba, como alguien que acaba de aprender a usar un teléfono inteligente, realmente nos permitió sentir por primera vez de forma intuitiva lo conveniente que puede ser la IA en la vida diaria.
Luego, Lobster nació y se hizo mundialmente famoso, convirtiéndose el Agente de IA en otro momento "iPhone" del campo de la IA tras la llegada de ChatGPT. Numerosos fabricantes y emprendedores comenzaron a vender ordenadores y teléfonos con OpenClaw preinstalado. El Doubao Phone les llevaba al menos una versión de ventaja, e incluso podría decirse que fue pionero en esta ola de agentes.
Pero, lamentablemente, el Doubao Phone pronto se topó con la competencia feroz de las grandes empresas. Escenarios como WeChat, Taobao, Alipay o las aplicaciones bancarias experimentaron interrupciones de acceso o funcionamiento. Algunos lo llamaron "bloqueo", otros dijeron que simplemente activaron controles de riesgo, pero para los usuarios no había diferencia: dejaba de funcionar.
Lo lamentamos mucho. El Doubao Phone, por supuesto, no era un producto electrónico de consumo maduro, pero mostró a toda la industria el germen de la próxima generación de puerta de entrada.
Así que, incluso cuando el revuelo del Doubao Phone ya había pasado, no dejamos el asunto del todo atrás. Hasta hace poco, nuestro rastreo diario de información captó miles de ofertas de empleo que, analizadas, sugieren que ByteDance parece estar planeando reactivar el desarrollo de teléfonos móviles.
Tres enfoques, una pista
Recopilamos tres enfoques diferentes de la página oficial de empleo de ByteDance: negocio innovador de IA, sistema operativo móvil (OS) y Asistente Doubao Phone.
Tras eliminar duplicados por ID de puesto, recopilamos más información de las páginas de detalles y realizamos un análisis cruzado basándonos en palabras clave del nombre del puesto, descripción y requisitos.
A diferencia de las contrataciones de equipos de aplicaciones de IA comunes, entre estos puestos de ByteDance también aparecieron roles relacionados con el sistema del teléfono, cámara, pantalla táctil, conectividad, autonomía, calentamiento, adaptación de chips, diseño estructural, proceso del equipo completo y pruebas de línea de producción.
Estas palabras no son comunes en empresas de internet; son aspectos que manejan a diario los fabricantes de teléfonos, empresas de la cadena de suministro y equipos de ingeniería.
ByteDance va a contratar gente para las fábricas.
Sin embargo, esto no confirma que ByteDance vaya a crear su propia marca de teléfonos, pero al menos indica que están reiniciando el trabajo de desarrollo de terminales a nivel de teléfono móvil.
Veamos ahora qué revelan estos puestos en sí mismos.
Asistente Doubao Phone: de responder preguntas a actuar por el usuario
Primero, el Asistente Doubao Phone.
Realizamos una búsqueda más enfocada en los datos originales, buscando puestos cuyo nombre, descripción o requisitos mencionaran "Asistente Doubao Phone". Encontramos 83, que se pueden dividir en tres grandes categorías, las cuales, juntas, forman la imagen de un Agente de IA a nivel de sistema.
La primera categoría de puestos se encarga de dotar a la IA de capacidades como Agente.
Por ejemplo, el puesto "Ingeniero de Desarrollo de Agent - Asistente Doubao Phone" menciona que la IA debe realizar descomposición de tareas, organización de contexto, llamadas a herramientas, recuperación de memoria, gestión de estado, verificación de resultados y recuperación ante fallos. Son las capacidades básicas de cualquier Agente de IA que usamos hoy en día.
La segunda categoría de puestos se encarga de dar una buena memoria al Agente de IA.
Estos puestos mencionan direcciones como "Percepción y memoria", "Memoria del usuario", "Gráfico de conocimiento personal", "Preferencias a largo plazo". Si el Agente de IA quiere integrarse realmente en nuestras vidas, no puede actuar como si nos conociera por primera vez cada día; necesita tener una memoria confiable y estable a largo plazo.
Por supuesto, esto toca fácilmente problemas de privacidad y límites. Pero, según la información de contratación, ByteDance al menos ha empezado a considerar la "memoria" como una de las capacidades más importantes del Asistente Doubao Phone para su desarrollo.
La tercera categoría de puestos se encarga de que el Agente de IA pueda ejercer esas capacidades dentro del teléfono.
Para que el Asistente Doubao Phone actúe en lugar del usuario, no puede vivir solo en la nube, ni ser solo una aplicación. Necesita un conjunto completo de capacidades que incluyan modelo, memoria, ejecución de tareas, implementación en el dispositivo (edge), aplicaciones del sistema, audio/vídeo, comunicación, pruebas y garantía de calidad, para poder escuchar al usuario, entender el entorno, coordinar entre dispositivos, estar siempre listo y no causar problemas.
OS móvil: el nivel profundo del teléfono es el obstáculo para el Agent
Ahora, el sistema operativo móvil (OS).
Hay 236 puestos relacionados con el OS móvil, concentrados principalmente en Pekín, Shanghái y Shenzhen. En sus descripciones, aparecen repetidamente palabras como kernel, chip, controladores (drivers), cámara, pantalla, audio, red, consumo energético, gestión térmica, entrega para producción en masa. Estas son palabras muy cercanas al hardware y al sistema profundo del teléfono.
Pongamos ejemplos. La responsabilidad del puesto "Líder de Kernel - OS móvil" dice que debe liderar al equipo de memoria y almacenamiento en la adaptación y desarrollo del kernel para la nueva plataforma Qualcomm, para que el sistema funcione con los principales chips de teléfono y gestione bien la memoria y el almacenamiento del dispositivo. Estas capacidades son clave para que un Agente de IA responda en tiempo real y procese tareas en segundo plano.
Además, en los puestos aparecen palabras como SoC, BSP, RTOS. SoC se puede entender aproximadamente como el chip principal del teléfono, BSP es el software de bajo nivel que hace que el sistema y el hardware se reconozcan y funcionen juntos, y RTOS se usa a menudo en escenarios con altos requisitos de respuesta y consumo energético.
Así que la señal que emiten los puestos de OS móvil es que ByteDance está contratando a personas que entienden los sistemas de terminales a nivel de teléfono. Deben saber al menos dónde se encontrará con problemas de permisos, de consumo energético o de estabilidad del sistema al ejecutar un Agente de IA en el teléfono, y qué problemas requieren soluciones conjuntas con fabricantes de chips, proveedores y equipos de pruebas.
Por los requisitos de estos puestos, ByteDance ya está entrando en aguas profundas de la telefonía móvil.
Ubicación Shenzhen: señal de hardware y producción en masa
Vale la pena examinar por separado los puestos ubicados en Shenzhen.
Si los puestos en Pekín se centran más en modelos, algoritmos y plataformas, y los de Shanghái en producto e ingeniería, los de Shenzhen suelen estar más relacionados con hardware, cadena de suministro, pruebas y producción en masa.
Si un proyecto es solo un servicio en la nube, Shenzhen no es tan importante; pero en cuanto toca productos físicos, Shenzhen se vuelve crucial.
Y eso es precisamente lo que vemos en los puestos relacionados con Shenzhen.
Algunos puestos mencionan diseño de interacción persona-máquina, cubriendo interacción física con hardware, interacción con interfaz de software, experiencia de conexión multi-dispositivo. Estos puestos no solo consideran cómo diseñar las interfaces en la pantalla, sino también la sensación al tacto del dispositivo físico, los botones, cómo activarlo, cómo conectarlo con otros dispositivos.
Otros puestos están más cerca del trabajo de ingeniería in situ, como interconexión, consumo energético, comunicaciones de corto alcance, banda base (baseband), proceso del equipo completo, estructura, proceso de pruebas.
Comparadas con palabras como "agente inteligente", "multimodal" o "modelo del mundo", estas no suenan tan bien. Pero en la electrónica de consumo, es esto lo que finalmente decide el éxito o el fracaso.
Si ByteDance solo quisiera hacer de Doubao una mejor aplicación para el teléfono, no necesitaría hacer todo este trabajo pesado. Que empiece a contratar para estos puestos significa que ya se está preparando para subirse a este barco.
ByteDance no puede limitarse a hacer aplicaciones
Antes, el teléfono era el contenedor de las aplicaciones; en la era de la IA, el teléfono podría convertirse en el cuerpo del Agente.
Si el teléfono es solo un contenedor de aplicaciones, empresas como ByteDance pueden construir su reino a través de aplicaciones individuales, basándose en contenido, algoritmos y capacidad de producto. Pero si el teléfono se convierte en el cuerpo del Agente, el usuario emite primero la tarea, y quien pueda asumir esa tarea tiene la oportunidad de decidir el camino a seguir.
En este camino, las aplicaciones se degradarían a herramientas que pueden ser invocadas. Esto incomodaría a todas las superaplicaciones. Porque el Agente, por naturaleza, tiende a saltarse las capas intermedias.
Así que la verdadera dificultad quizás no esté en si Doubao puede abrir una aplicación, sino en si otros están dispuestos a permitírselo. Y una IA que puede tomar decisiones por el usuario no puede ser autorizada tan fácilmente como una aplicación normal.
Para pasar del cuadro de chat a la capa de operación, el Agente debe lidiar con un montón de trabajo sucio y pesado que antes no correspondía a los equipos de IA. Necesitan saber cuándo el sistema cerrará procesos en segundo plano, cuándo una operación activará controles de riesgo, por qué se calienta el teléfono, por qué la línea de producción no logra un buen rendimiento. Antes, estos asuntos no eran responsabilidad de los equipos de IA, pero ahora son inevitables.
Por eso ByteDance necesita contratar para estos puestos. Quizás no llegue a lanzar realmente un teléfono, pero ByteDance ya no puede limitarse a ser solo una aplicación en el teléfono de otro.
Las empresas de modelos de lenguaje grandes que quieran convertirse en la próxima puerta de entrada del usuario no pueden vivir para siempre en el sistema operativo de otros.












