Hemos recopilado miles de ofertas de empleo y descubierto que ByteDance planea reactivar el desarrollo de teléfonos móviles

marsbitPublicado a 2026-05-25Actualizado a 2026-05-25

Resumen

Investigando más de mil ofertas de empleo, encontramos evidencia de que ByteDance planea reiniciar el desarrollo de teléfonos móviles. El análisis de puestos en AI Innovación, Sistema Operativo Móvil y Asistente del Teléfono Doubao revela un esfuerzo significativo. Los puestos del Asistente del Teléfono Doubao (83 encontrados) se centran en desarrollar un Agente de IA de nivel de sistema, enfatizando capacidades de ejecución de tareas, memoria a largo plazo para el usuario e integración profunda con el hardware y sistema del dispositivo para una operación fluida. La categoría de Sistema Operativo Móvil (236 puestos) apunta al trabajo en el nivel más profundo del teléfono: adaptación de chips (como las nuevas plataformas Qualcomm), gestión de energía y calor, controladores, kernel y procesos de entrega para fabricación. Esto es crucial para que un Agente de IA funcione con estabilidad y eficiencia en un dispositivo real. Muchos puestos están ubicados en Shenzhen, epicentro de hardware y cadena de suministro, e incluyen roles en diseño de interacción humano-máquina, estructura mecánica, pruebas de producción y gestión de procesos de fabricación, señalando un paso hacia la creación de un producto físico. La motivación subyacente es estratégica. En la era de la IA, el teléfono puede pasar de ser un "contenedor de apps" a un "cuerpo" para Agentes de IA, que actúan como el principal intermediario del usuario. Para evitar limitaciones por parte de sistemas operativos o "super ap...

Por Sleepy y Siweiguai

En diciembre de 2025, el tan esperado "Doubao Phone" finalmente vio la luz. Tomó la versión preliminar técnica del Asistente Doubao y la instaló en un prototipo de ingeniería del Nubia M153. Su precio de lanzamiento fue de 3499 yuanes, y las primeras 30,000 unidades aproximadamente se agotaron el mismo día de su venta.

Recuerdo que durante los primeros días tras su lanzamiento, su precio en el mercado secundario llegó a multiplicarse varias veces. La redacción de "Beating" incluso compró dos unidades.

No es que fuera un teléfono especialmente bueno, todo lo contrario. Como "versión preliminar técnica", la experiencia del primer Doubao Phone no era óptima. Pero lo que nos emocionó especialmente fue que por primera vez sacó la IA del cuadro de chat, transformándola de un simple Chat bot en un Agente de IA capaz de controlar un teléfono móvil.

En el Doubao Phone, la IA podía ver la pantalla, entender el contenido que estabas viendo, escucharte, saltar entre diferentes aplicaciones y hacer muchas cosas por ti directamente, como buscar billetes de tren, comparar precios al comprar, usar cupones o realizar pedidos y retocar fotos. Aunque acciones más sensibles, como los pagos, aún requerían confirmación del usuario, ya podía completar de forma independiente muchas tareas que antes requerían que hiciéramos clic manualmente.

Aunque todavía era un poco torpe, a veces lenta, a veces se bloqueaba, como alguien que acaba de aprender a usar un teléfono inteligente, realmente nos permitió sentir por primera vez de forma intuitiva lo conveniente que puede ser la IA en la vida diaria.

Luego, Lobster nació y se hizo mundialmente famoso, convirtiéndose el Agente de IA en otro momento "iPhone" del campo de la IA tras la llegada de ChatGPT. Numerosos fabricantes y emprendedores comenzaron a vender ordenadores y teléfonos con OpenClaw preinstalado. El Doubao Phone les llevaba al menos una versión de ventaja, e incluso podría decirse que fue pionero en esta ola de agentes.

Pero, lamentablemente, el Doubao Phone pronto se topó con la competencia feroz de las grandes empresas. Escenarios como WeChat, Taobao, Alipay o las aplicaciones bancarias experimentaron interrupciones de acceso o funcionamiento. Algunos lo llamaron "bloqueo", otros dijeron que simplemente activaron controles de riesgo, pero para los usuarios no había diferencia: dejaba de funcionar.

Lo lamentamos mucho. El Doubao Phone, por supuesto, no era un producto electrónico de consumo maduro, pero mostró a toda la industria el germen de la próxima generación de puerta de entrada.

Así que, incluso cuando el revuelo del Doubao Phone ya había pasado, no dejamos el asunto del todo atrás. Hasta hace poco, nuestro rastreo diario de información captó miles de ofertas de empleo que, analizadas, sugieren que ByteDance parece estar planeando reactivar el desarrollo de teléfonos móviles.

Tres enfoques, una pista

Recopilamos tres enfoques diferentes de la página oficial de empleo de ByteDance: negocio innovador de IA, sistema operativo móvil (OS) y Asistente Doubao Phone.

Tras eliminar duplicados por ID de puesto, recopilamos más información de las páginas de detalles y realizamos un análisis cruzado basándonos en palabras clave del nombre del puesto, descripción y requisitos.

A diferencia de las contrataciones de equipos de aplicaciones de IA comunes, entre estos puestos de ByteDance también aparecieron roles relacionados con el sistema del teléfono, cámara, pantalla táctil, conectividad, autonomía, calentamiento, adaptación de chips, diseño estructural, proceso del equipo completo y pruebas de línea de producción.

Estas palabras no son comunes en empresas de internet; son aspectos que manejan a diario los fabricantes de teléfonos, empresas de la cadena de suministro y equipos de ingeniería.

ByteDance va a contratar gente para las fábricas.

Sin embargo, esto no confirma que ByteDance vaya a crear su propia marca de teléfonos, pero al menos indica que están reiniciando el trabajo de desarrollo de terminales a nivel de teléfono móvil.

Veamos ahora qué revelan estos puestos en sí mismos.

Asistente Doubao Phone: de responder preguntas a actuar por el usuario

Primero, el Asistente Doubao Phone.

Realizamos una búsqueda más enfocada en los datos originales, buscando puestos cuyo nombre, descripción o requisitos mencionaran "Asistente Doubao Phone". Encontramos 83, que se pueden dividir en tres grandes categorías, las cuales, juntas, forman la imagen de un Agente de IA a nivel de sistema.

La primera categoría de puestos se encarga de dotar a la IA de capacidades como Agente.

Por ejemplo, el puesto "Ingeniero de Desarrollo de Agent - Asistente Doubao Phone" menciona que la IA debe realizar descomposición de tareas, organización de contexto, llamadas a herramientas, recuperación de memoria, gestión de estado, verificación de resultados y recuperación ante fallos. Son las capacidades básicas de cualquier Agente de IA que usamos hoy en día.

La segunda categoría de puestos se encarga de dar una buena memoria al Agente de IA.

Estos puestos mencionan direcciones como "Percepción y memoria", "Memoria del usuario", "Gráfico de conocimiento personal", "Preferencias a largo plazo". Si el Agente de IA quiere integrarse realmente en nuestras vidas, no puede actuar como si nos conociera por primera vez cada día; necesita tener una memoria confiable y estable a largo plazo.

Por supuesto, esto toca fácilmente problemas de privacidad y límites. Pero, según la información de contratación, ByteDance al menos ha empezado a considerar la "memoria" como una de las capacidades más importantes del Asistente Doubao Phone para su desarrollo.

La tercera categoría de puestos se encarga de que el Agente de IA pueda ejercer esas capacidades dentro del teléfono.

Para que el Asistente Doubao Phone actúe en lugar del usuario, no puede vivir solo en la nube, ni ser solo una aplicación. Necesita un conjunto completo de capacidades que incluyan modelo, memoria, ejecución de tareas, implementación en el dispositivo (edge), aplicaciones del sistema, audio/vídeo, comunicación, pruebas y garantía de calidad, para poder escuchar al usuario, entender el entorno, coordinar entre dispositivos, estar siempre listo y no causar problemas.

OS móvil: el nivel profundo del teléfono es el obstáculo para el Agent

Ahora, el sistema operativo móvil (OS).

Hay 236 puestos relacionados con el OS móvil, concentrados principalmente en Pekín, Shanghái y Shenzhen. En sus descripciones, aparecen repetidamente palabras como kernel, chip, controladores (drivers), cámara, pantalla, audio, red, consumo energético, gestión térmica, entrega para producción en masa. Estas son palabras muy cercanas al hardware y al sistema profundo del teléfono.

Pongamos ejemplos. La responsabilidad del puesto "Líder de Kernel - OS móvil" dice que debe liderar al equipo de memoria y almacenamiento en la adaptación y desarrollo del kernel para la nueva plataforma Qualcomm, para que el sistema funcione con los principales chips de teléfono y gestione bien la memoria y el almacenamiento del dispositivo. Estas capacidades son clave para que un Agente de IA responda en tiempo real y procese tareas en segundo plano.

Además, en los puestos aparecen palabras como SoC, BSP, RTOS. SoC se puede entender aproximadamente como el chip principal del teléfono, BSP es el software de bajo nivel que hace que el sistema y el hardware se reconozcan y funcionen juntos, y RTOS se usa a menudo en escenarios con altos requisitos de respuesta y consumo energético.

Así que la señal que emiten los puestos de OS móvil es que ByteDance está contratando a personas que entienden los sistemas de terminales a nivel de teléfono. Deben saber al menos dónde se encontrará con problemas de permisos, de consumo energético o de estabilidad del sistema al ejecutar un Agente de IA en el teléfono, y qué problemas requieren soluciones conjuntas con fabricantes de chips, proveedores y equipos de pruebas.

Por los requisitos de estos puestos, ByteDance ya está entrando en aguas profundas de la telefonía móvil.

Ubicación Shenzhen: señal de hardware y producción en masa

Vale la pena examinar por separado los puestos ubicados en Shenzhen.

Si los puestos en Pekín se centran más en modelos, algoritmos y plataformas, y los de Shanghái en producto e ingeniería, los de Shenzhen suelen estar más relacionados con hardware, cadena de suministro, pruebas y producción en masa.

Si un proyecto es solo un servicio en la nube, Shenzhen no es tan importante; pero en cuanto toca productos físicos, Shenzhen se vuelve crucial.

Y eso es precisamente lo que vemos en los puestos relacionados con Shenzhen.

Algunos puestos mencionan diseño de interacción persona-máquina, cubriendo interacción física con hardware, interacción con interfaz de software, experiencia de conexión multi-dispositivo. Estos puestos no solo consideran cómo diseñar las interfaces en la pantalla, sino también la sensación al tacto del dispositivo físico, los botones, cómo activarlo, cómo conectarlo con otros dispositivos.

Otros puestos están más cerca del trabajo de ingeniería in situ, como interconexión, consumo energético, comunicaciones de corto alcance, banda base (baseband), proceso del equipo completo, estructura, proceso de pruebas.

Comparadas con palabras como "agente inteligente", "multimodal" o "modelo del mundo", estas no suenan tan bien. Pero en la electrónica de consumo, es esto lo que finalmente decide el éxito o el fracaso.

Si ByteDance solo quisiera hacer de Doubao una mejor aplicación para el teléfono, no necesitaría hacer todo este trabajo pesado. Que empiece a contratar para estos puestos significa que ya se está preparando para subirse a este barco.

ByteDance no puede limitarse a hacer aplicaciones

Antes, el teléfono era el contenedor de las aplicaciones; en la era de la IA, el teléfono podría convertirse en el cuerpo del Agente.

Si el teléfono es solo un contenedor de aplicaciones, empresas como ByteDance pueden construir su reino a través de aplicaciones individuales, basándose en contenido, algoritmos y capacidad de producto. Pero si el teléfono se convierte en el cuerpo del Agente, el usuario emite primero la tarea, y quien pueda asumir esa tarea tiene la oportunidad de decidir el camino a seguir.

En este camino, las aplicaciones se degradarían a herramientas que pueden ser invocadas. Esto incomodaría a todas las superaplicaciones. Porque el Agente, por naturaleza, tiende a saltarse las capas intermedias.

Así que la verdadera dificultad quizás no esté en si Doubao puede abrir una aplicación, sino en si otros están dispuestos a permitírselo. Y una IA que puede tomar decisiones por el usuario no puede ser autorizada tan fácilmente como una aplicación normal.

Para pasar del cuadro de chat a la capa de operación, el Agente debe lidiar con un montón de trabajo sucio y pesado que antes no correspondía a los equipos de IA. Necesitan saber cuándo el sistema cerrará procesos en segundo plano, cuándo una operación activará controles de riesgo, por qué se calienta el teléfono, por qué la línea de producción no logra un buen rendimiento. Antes, estos asuntos no eran responsabilidad de los equipos de IA, pero ahora son inevitables.

Por eso ByteDance necesita contratar para estos puestos. Quizás no llegue a lanzar realmente un teléfono, pero ByteDance ya no puede limitarse a ser solo una aplicación en el teléfono de otro.

Las empresas de modelos de lenguaje grandes que quieran convertirse en la próxima puerta de entrada del usuario no pueden vivir para siempre en el sistema operativo de otros.

Preguntas relacionadas

Q¿Qué evidencia encontró el autor para sugerir que ByteDance podría reiniciar el desarrollo de teléfonos?

AEl autor analizó más de mil ofertas de trabajo publicadas por ByteDance en sus sitios oficiales de reclutamiento. Estas ofertas, pertenecientes a áreas como 'Negocios de Innovación de IA', 'Sistema Operativo Móvil (OS)' y 'Asistente del Teléfono Doubao', incluyen términos específicos de fabricación de teléfonos como diseño estructural, adaptación de chips, gestión de energía y pruebas de línea de producción, lo que indica una reanudación del trabajo de desarrollo a nivel de hardware de teléfono.

QSegún el artículo, ¿cuál fue la innovación clave del primer 'Teléfono Doubao' lanzado en 2025?

ALa innovación clave del primer 'Teléfono Doubao' fue llevar la IA desde un simple chat (Chat bot) a un Agente de IA (AI Agent) capaz de controlar físicamente un teléfono. Podía ver la pantalla, entender el contenido, escuchar comandos, saltar entre aplicaciones y realizar tareas como buscar boletos de tren, comparar precios de compras o editar fotos, ofreciendo una primera visión tangible de cómo la IA podría integrarse en la vida diaria.

Q¿Qué tres categorías principales de puestos de trabajo relacionados con el 'Asistente del Teléfono Doubao' identificó el análisis y qué representan?

AEl análisis identificó tres categorías principales: 1) Puestos para desarrollar las capacidades fundamentales del Agente (descomposición de tareas, uso de herramientas, etc.). 2) Puestos enfocados en la 'memoria' del Agente (gestión de recuerdos del usuario, gráficos de conocimiento personal). 3) Puestos que permiten al Agente operar eficazmente *dentro* del teléfono (implementación en el dispositivo, aplicaciones del sistema, comunicación). Juntas, estas categorías forman la estructura de un Agente de IA integrado a nivel de sistema.

Q¿Por qué el autor considera que los puestos de trabajo en Shenzhen son una señal importante?

ALos puestos de trabajo ubicados en Shenzhen están fuertemente relacionados con hardware, cadena de suministro, pruebas y fabricación en masa (por ejemplo, diseño de interacción hombre-máquina, procesos de ensamblaje, pruebas de ingeniería). Shenzhen es el centro de la industria de hardware de China. Que ByteDance contrate allí para estos roles específicos y 'terrenales' sugiere que el proyecto ha avanzado más allá del software y está abordando los desafíos de la producción física de un dispositivo.

Q¿Cuál es, según el artículo, la razón fundamental por la que ByteDance no puede limitarse a ser solo una 'aplicación' en la era de la IA?

AEn la era de la IA, el teléfono podría convertirse en el 'cuerpo' de un Agente. Si un Agente de IA (como Doubao) está confinado a una aplicación dentro del sistema operativo de otro, se enfrenta a limitaciones como restricciones de permisos, controles de seguridad o 'bloqueos' por parte de otras super-apps. Para controlar verdaderamente la experiencia del usuario y la ejecución de tareas desde el inicio, una compañía de IA necesita un control más profundo sobre la capa del sistema operativo y el hardware, lo que hace esencial ir más allá de ser solo una aplicación.

Lecturas Relacionadas

Tres años después: Una revisión de mis predicciones sobre ChatGPT en 2023

Tres años después: Revisando mis predicciones sobre ChatGPT en 2023 En marzo de 2023, tras el lanzamiento de ChatGPT, Wang Jianshuo hizo 20 predicciones intuitivas sobre la IA. Ahora, en mayo de 2026, un sistema con 41 agentes de IA las ha reevaluado con datos actuales. **Resultados clave:** * **Aciertos (dirección general):** La arquitectura RAG se convirtió en estándar para integrar conocimiento. La Interfaz de Usuario de Lenguaje (LUI) creó una nueva capa de interacción (ej. protocolo MCP). Surgieron redes de agentes autónomos que se comunican. China desarrolló modelos grandes útiles (ej. DeepSeek), cerrando la brecha técnica. Los LLM no tienen conciencia; el Test de Turing solo mide la apariencia. * **Errores/Matices:** La predicción de que GPT-4 tendría 100 billones de parámetros fue incorrecta (≈1.8B). Los LLM **sí** pueden hacer matemáticas complejas sin herramientas externas (ej. medallas IMO 2025). El valor no migró solo a la capa de aplicación; NVIDIA (capa de hardware) capturó gran parte. El contenido generado por IA no evade automáticamente los derechos de autor (multas multimillonarias). La IA personalizada crea, no reduce, "cámaras de eco". Los costes de entrenamiento de modelos líderes superaron con creces la estimación de 5-10 mil millones de dólares. **Lecciones aprendidas:** 1. Predecir **mecanismos y direcciones** es más fiable que dar cifras o declaraciones absolutas. 2. Se tiende a **sobreestimar la velocidad** de cambio a corto plazo y **subestimar su magnitud** a largo plazo. 3. Los promedios generales (ej. "no habrá desempleo masivo") pueden ocultar **impactos distributivos** severos (ej. en jóvenes). 4. Las afirmaciones con **matices y limitaciones** envejecen mejor. 5. Tres años no son suficientes para resolver debates fundamentales (ej. valor final, consciencia de la IA). Este ejercicio subraya la dificultad de hacer predicciones precisas en un campo en rápida evolución y la importancia de la humildad al proyectar el futuro.

marsbitHace 3 hora(s)

Tres años después: Una revisión de mis predicciones sobre ChatGPT en 2023

marsbitHace 3 hora(s)

Tres años después: Volviendo a mis juicios sobre ChatGPT en 2023

En marzo de 2023, Wang Jianshuo hizo veinte predicciones sobre ChatGPT. Tres años después, en 2026, un análisis con múltiples agentes de IA evalúa su precisión. Aciertos clave: predijo correctamente el auge de RAG como arquitectura estándar para conocimiento y reducir alucinaciones, la LUI (interfaz de lenguaje natural) como nueva capa de interacción (aunque no reemplaza a la GUI), y la aparición de redes de agentes autónomos con nuevos protocolos de direccionamiento. También acertó en que China desarrollaría modelos de IA útiles (como DeepSeek) cerrando rápidamente la brecha, y en que ChatGPT carece de consciencia real, pasando el test de Turing por mera apariencia. Otras predicciones válidas fueron que no causaría desempleo masivo (aunque afectó a jóvenes), que 2023 sería un gran año para startups de IA, y que el momento fue similar al del navegador web en 1994. Errores notables: su estimación de que GPT-4 tendría 100 billones de parámetros fue incorrecta (tuvo ~1.8 billones). Se equivocó al declarar que era "imposible" que los LLM hicieran matemáticas complejas sin herramientas, ya que luego ganaron medallas en la Olimpiada Internacional de Matemáticas. También erró al sugerir que el valor se capturaría en la capa de aplicación y no en la base, subestimando el dominio de NVIDIA (capa de hardware), y al pensar que el contenido generado por IA "evitaría" problemas de copyright, cuando han surgido multas históricas. Además, la idea de que los LLM promoverían un "consenso mundial" al promediar opiniones se volvió incorrecta, ya que ahora priorizan la personalización y pueden crear nuevas cámaras de eco. Conclusiones: Sus predicciones sobre mecanismos y direcciones fueron mayormente acertadas, pero falló en números específicos (costes, parámetros) y en subestimar la complejidad de la distribución del impacto (ej. quién gana o pierde con la IA). Tendió a ser demasiado optimista a corto plazo pero conservador sobre los límites a largo plazo. El ejercicio subraya la importancia de predecir tendencias en lugar de cifras exactas y de dejar margen para la incertidumbre.

链捕手Hace 6 hora(s)

Tres años después: Volviendo a mis juicios sobre ChatGPT en 2023

链捕手Hace 6 hora(s)

La reducción del 99% en el precio del Xiaomi MiMo no es una estrategia de marketing. Luo Fuli publica en X respondiendo a los pesimistas.

**Resumen: El descenso del 99% de Xiaomi MiMo: Una victoria de la ingeniería, no del marketing** El anuncio de Xiaomi de reducir hasta un 99% el precio de las API de su modelo MiMo-V2.5 generó escepticismo, interpretado como una guerra de precios o una maniobra desesperada. Luo Fuli, responsable de MiMo, respondió con un blog técnico detallado, demostrando que la rebaja es el resultado de seis optimizaciones de ingeniería sistemáticas, no una táctica de marketing. La clave es el descuento del 99% aplicado específicamente a la entrada de tipo "Cache Hit" (contexto histórico re-leído). Para lograrlo, el equipo implementó: 1. **Arquitectura Híbrida SWA:** 60 de las 70 capas del modelo solo atienden a los 128 tokens más recientes, reduciendo el volumen de la "memoria" del modelo (KVCache) a 1/7. 2. **Gestión de Memoria en Dos Piscinas:** Asigna memoria por separado para las capas con atención completa y las de ventana deslizante (SWA), liberando realmente la capacidad ahorrada y quintuplicando los usuarios concurrentes por GPU. 3. **Cache de Prefijos Mejorado:** Un nuevo sistema garantiza que solo se reutilicen fragmentos de contexto completos y válidos, logrando una tasa de acierto en caché del 93-95% para peticiones de usuarios frecuentes. 4. **Almacenamiento en SSD Integrado (GCache):** La caché distribuida se aloja en los discos SSD de las propias máquinas con GPU, eliminando costes adicionales de almacenamiento. 5. **Sistema de Enrutamiento Inteligente (LLM-Router):** Dirige peticiones similares a la misma máquina y prioriza las que aciertan en caché, mejorando el rendimiento y la latencia. 6. **Predicción Multi-Token (MTP):** Acelera la generación de respuestas del modelo prediciendo varios tokens a la vez, reduciendo también el coste de la parte de "salida". En conjunto, estas innovaciones redujeron el tiempo de GPU por petición en más de un orden de magnitud, haciendo posible el descuento del 99% manteniendo márgenes positivos. Luo Fuli subraya que este es un logro de ingeniería sistémica, un modelo de reducción de costes verificable que trasciende la mera competencia por precios.

marsbitHace 9 hora(s)

La reducción del 99% en el precio del Xiaomi MiMo no es una estrategia de marketing. Luo Fuli publica en X respondiendo a los pesimistas.

marsbitHace 9 hora(s)

Trading

Spot
Futuros
活动图片