我们抓取了上千条招聘信息,发现字节要重启手机研发了

marsbit发布于2026-05-25更新于2026-05-25

文章摘要

2025年12月,字节跳动推出的“豆包手机”作为AI Agent技术预览版,首次让AI能“看见”屏幕、操作手机App,独立完成查车票、购物等任务,成为AI Agent热潮的先驱。但随后因微信、淘宝等主流App的访问限制,其发展遇阻。 近期,字节跳动官方社招页面释放出大量与手机研发相关的岗位信息,分析显示其可能正在重启手机级终端研发。招聘岗位主要涉及三个方向: 1. **豆包手机助手**:岗位聚焦于提升AI的Agent能力(任务拆解、工具调用等)、构建长期记忆系统,并确保其在手机端能稳定执行任务。 2. **移动操作系统(OS)**:大量岗位涉及内核、芯片适配、驱动、功耗、热管理等手机底层系统开发,表明字节正深入解决AI Agent在手机端实时响应与系统稳定的核心难题。 3. **硬件与量产**:坐标深圳的岗位涵盖人机交互设计、整机工艺、结构、测试等,指向硬件研发和量产准备,这远超单纯开发App的范畴。 文章分析认为,在AI时代,手机可能从“App的容器”转变为“Agent的身体”。AI Agent若想直接为用户操作服务,就必须跨越App的中间层,这会触及现有超级App的核心利益,面临权限与风控挑战。因此,字节跳动招聘这些软硬件结合的岗位,意味着它不再满足于只做手机里的应用,而是必须深入终端底层,以确保其AI Agent能成为下一代用户入口。此举不一定意味着一定会推出自有品牌手机,但标志着字节正为AI Agent落地实体终端进行实质性布局。

文|Sleepy、思维怪怪

2025 年 12 月,传了很久的「豆包手机」终于横空出世。它把豆包手机助手技术预览版装进了努比亚 M153 工程样机里,发售价 3499 元,首批大约 3 万台在发售当天就售罄了。

记得刚发售不久的那几天它在海鲜市场的价格一度溢价好几倍。动察 Beating 编辑部还买了两台。

倒不是因为它是一台多好用的手机,恰恰相反,第一代豆包手机作为「技术预览版」,体验不算好。但让我们特别兴奋的地方在于,它第一次把 AI 从聊天框里拽了出来,从一个 Chat bot 变成了一个 AI Agent,并且能够控制一台手机。

在豆包手机上,AI 可以看见屏幕,可以理解你正在浏览的内容,可以听见你说话,可以在不同的 App 之间跳转,可以直接帮你做很多事,比如查车票、购物比价、领券下单、修图。虽然像支付这种比较敏感的环节还需要用户自己做确认,但它确实已经能独立完成很多在过去必须由我们自己一下一下点击完成的操作了。

虽然它还是有点笨,有时候反应很慢,有时候会卡住,像刚学会用智能手机那样不利索,但它确实让我们第一次直观地感受到 AI 进入日常能有多便利。

后来龙虾才诞生并且火爆全球,AI Agent 成为了继 ChatGPT 问世之后 AI 领域的又一个 iPhone 时刻,一堆厂商、创业者开始兜售预装好 OpenClaw 的电脑、手机。豆包手机领先了他们至少一个版本,甚至可以说豆包手机是在这轮 Agent 热潮的先驱。

但很可惜的是豆包手机很快就撞上了大厂们的围剿。微信、淘宝、支付宝、银行 App 等场景陆续出现访问或操作受阻。有人说这是「封杀」,也有人说只是触发了风控,但对用户来说没什么区别,就是用不了了。

我们非常遗憾。豆包手机当然不是一台成熟的消费电子产品,但它让整个行业看见了下一代入口的雏形。

所以即便豆包手机的那波热度已经过去了,但我们还是没有把这件事完全放下。直到最近,我们的日常信息抓取捕捉到了上千条招聘信息,分析下来发现,字节似乎要重启手机研发了。

三个口径,一条线索

我们从字节跳动官方的社招页面抓取了三个口径,分别是 AI 创新业务、移动 OS 和豆包手机助手。

在按照职位 ID 进行去重后,我们进一步抓取了详情页信息,按照岗位名称、岗位描述、任职要求里面的关键词进行了交叉整理。

和普通 AI App 团队招聘不同的是,字节的这批社招岗位里,还出现了手机系统、相机、触控、联网、续航、发热、芯片适配、结构设计、整机工艺、产线测试等岗位。

这些词在互联网公司里不常见,它们是手机厂商、供应链公司、工程团队才会天天处理的东西。

字节要招人下工厂了。

不过这并不能肯定字节会做自己的手机品牌,但至少可以确定的是,他们正在重新启动手机级终端的研发工作。

下面让我们看看这些岗位本身说明了什么。

豆包手机助手:从回答问题到替人执行

先看豆包手机助手。

我们又做了一次更加聚焦的筛选工作,在原始数据中检索名称、描述和要求中出现了「豆包手机助手」的岗位,一共 83 个,并且这些岗位能够分成三大类,这三类又恰好能够拼出一个系统级 AI Agent 的形状。

第一类岗位,负责让 AI 具备作为 Agent 的能力。

比如「Agent 开发工程师-豆包手机助手」这个岗位写到,需要让 AI 做到任务拆解、上下文组织、工具调用、记忆检索、状态管理、结果校验和异常恢复。就是我们如今使用的所有的 AI Agent 的基础能力。

第二类岗位,负责让 AI Agent 有个好记性。

岗位出现了「感知和记忆」「用户记忆」「个人知识图谱」「长期偏好」这些方向。如果要让 AI Agent 真的融入到我们的生活中,就不能让它每天都像第一次认识我们,它需要有靠谱、稳定的长期记忆。

当然这很容易触碰到隐私和边界的问题,但从招聘资料来看,字节至少已经开始把「记忆」当作豆包手机助手最重要的能力之一来进行研发。

第三类岗位,负责的是让 AI Agent 在手机里能发挥出那些能力。

豆包手机助手如果要替用户操作手机,就不能只活在云端,更不能只是一个 App。它需要有一整套能力,包括模型、记忆、任务执行、端侧部署、系统应用、音视频、通信、测试和质量保障,才能听懂用户说话,理解环境,跨设备协同,随时待命,并且不出乱子。

移动 OS:手机底层才是 Agent 的难关

再看移动 OS。

移动 OS 相关岗位有 236 个,主要办公地点集中在北京、上海和深圳。在岗位描述中,反复出现的词是内核、芯片、驱动、相机、显示、音频、网络、功耗、热管理、量产交付。这几乎都是更靠近硬件和手机底层系统的词。

举例来看。「内核 Leader-移动 OS」这个岗位的职责写到,要带领内存和存储团队做新高通平台的内核适配与开发,让系统能和主流手机芯片配合起来,并且管好手机里的内存和存储。这些能力是一个 AI Agent 想要做到实时响应、能在后台处理任务的关键。

再比如,岗位里还出现了 SoC、BSP、RTOS 这些词。SoC 可以粗略理解成手机的核心芯片,BSP 是让系统和硬件互相认识、配合的一套底层软件,RTOS 则常用于一些对响应和功耗要求很高的场景。

所以移动 OS 岗位所释放出的信号是,字节正在招那些懂手机级终端系统的人,他们至少要知道,AI Agent 运行在手机上之后,在哪里会被权限问题卡住,在哪里会被功耗问题卡住,在哪里会被系统稳定性卡住,哪些问题需要和芯片、厂商、测试团队一起解决。

从正在招聘的这些岗位要求来看,字节已经进入到手机的深水区了。

坐标深圳:硬件和量产的信号

另外有必要单独拎出来看的是那些坐标在深圳的岗位。

如果说坐标北京的岗位更偏模型、算法和平台,坐标上海的岗位更偏产品和工程,那么坐标深圳的岗位往往会和硬件、供应链、测试和量产有关。

一个项目如果只是云端服务,深圳没那么重要;一旦要碰实体产品,深圳就会变得很重要。

我们在深圳相关岗位里看到的,也正是这些东西。

有些岗位写的是人机交互设计,覆盖硬件实体交互、软件界面交互、多端联动体验。这些岗位不只考虑屏幕里的那些界面怎么设计,还要考虑实体设备的手感、按键、如何唤醒、如何和其他设备联动。

还有一些岗位更靠近工程现场,比如互连、功耗、通信短距、基带、整机工艺、结构、测试工艺。

这些词和「智能体」「多模态」「世界模型」比起来,没那么好听。但消费电子最后就是这些东西决定生死。

如果字节只是想把豆包做成一个更好的手机 App,它不需要干这么多苦差事。它一旦开始招这些岗位,就说明已经准备好上这条船了。

字节不能只做 App

在以前,手机是 App 的容器;到了 AI 时代,手机可能会变成 Agent 的身体。

如果手机只是 App 的容器,那么字节这样的公司可以凭内容、算法和产品力,通过一个个 App 建立自己的王国。但如果手机变成 Agent 的身体,用户先发出任务,谁能接下任务,谁就有机会决定后面的路径。

这个路径里,App 会被降级成可调用的工具。这会让所有超级 App 都不舒服。因为 Agent 天生会越过中间层。

所以,真正难的地方,可能不在于豆包能不能打开一个 App,而在于别人愿不愿意让它打开。而一个能替用户做决定的 AI,不可能像普通 App 那样被轻松放行。

Agent 要从聊天框走向操作层,就必须处理一大堆过去不属于 AI 团队的脏活累活。他们要知道系统什么时候会杀后台,操作什么时候会触发风控,手机为什么发热,工厂为什么良率上不去。过去这些事不归 AI 团队管,可现在都绕不开了。

所以字节要招聘这些岗位。它可能不一定真的会推出一款手机,但字节一定不能再只做别人手机里的 App 了。

大模型公司想成为下一代用户入口,就不能永远寄居在别人的操作系统里。

相关问答

Q文章中提到,字节跳动正在大量招聘哪些类型的岗位,这可能预示着他们要做什么?

A文章提到,字节跳动正在大量招聘涉及手机系统、相机、触控、芯片适配、结构设计、整机工艺、产线测试等岗位。这些岗位通常与手机硬件、底层系统和量产相关,预示着字节跳动可能正在重新启动手机级终端的研发工作,而不只是开发手机应用。

Q豆包手机助手招聘的岗位主要聚焦在哪三大类能力上?

A豆包手机助手的招聘岗位主要聚焦在三大类能力上:第一类是让AI具备作为Agent的基础能力,如任务拆解、工具调用等;第二类是让AI Agent具备长期记忆和用户偏好理解能力;第三类是让AI Agent能在手机系统中有效运行,涉及端侧部署、系统应用和跨设备协同等。

Q移动OS相关的岗位招聘释放了什么信号?

A移动OS相关的岗位招聘(如内核开发、芯片驱动、功耗管理等)释放的信号是,字节跳动正在深入手机底层系统的研发。这表明他们不仅关注AI应用层,还致力于解决AI Agent在手机上运行时可能遇到的权限、功耗、系统稳定性等深层问题,意味着项目已进入硬件和系统集成的深水区。

Q为什么文章认为字节跳动不能只做手机App?

A文章认为,在AI时代,手机可能从“App的容器”转变为“Agent的身体”。如果AI Agent成为下一代用户入口,它将直接操作用户任务,而App则可能被降级为可调用的工具。为了避免受制于他人操作系统和生态限制,字节跳动需要掌握硬件和底层系统能力,不能只做寄居在别人手机里的App。

Q文章提到豆包手机曾遇到什么挑战?这对字节跳动的后续策略有何影响?

A豆包手机曾遇到微信、淘宝、支付宝等超级App的访问或操作受阻问题,这被视为“封杀”或触发了风控。这一挑战揭示了外部生态对系统级AI Agent的限制。受此影响,字节跳动可能意识到,要真正实现AI Agent的价值,必须掌控硬件和操作系统,避免依赖他人生态,从而推动了其重启手机研发的策略。

你可能也喜欢

阿里“上货”,字节“练功”

5月最后一周,阿里和字节的两项动作展现了中国大厂在AI领域的两种不同战略路径。 阿里正将AI快速“上货”落地。5月11日,千问App与淘宝全面打通,接入40亿商品库和20年购物场景数据。随后在阿里云峰会上,吴泳铭宣布升级全栈能力,并计划未来五年资本开支远超过去三年。阿里的核心策略是将AI深度融入现有商业场景,如蚂蚁的AI支付用户数破亿、淘宝的AI比价等,并推动“智能体商业信任协议”作为信任基础设施。其商业模式依赖AI服务变现,阿里云外部收入增长40%,服务器“几乎没有一张卡是空的”。然而,这种路径可能以基础模型能力的长期领先性为代价。 字节则选择在Seed部门潜心“练功”,聚焦探索AI智能上限。其视频生成模型Seedance 2.0在权威评测中登顶,获业界高度评价。部门内部目标纯粹,如设定“国际榜单进前三”的KPI,并投入8个月撰写纯学术论文。字节计划大幅增加资本开支,最高或达4700亿元,资金来源于其巨额利润,且因其未上市,无需承受短期业绩压力,得以专注于长期技术突破。但商业化压力已初现,豆包开始测试付费和广告。 文章指出,两种路径差异的根本原因在于公司是否上市。阿里作为上市公司,必须关注季度财报和股价,战略倾向于快速变现;字节作为非上市公司,则拥有更大的自由去进行长期、前沿的技术投资。这决定了当前中国AI领域“卖AI”与“做AI”的格局分野。未来若字节启动IPO,其长期研发投入或将面临资本市场的考验。

marsbit1小时前

阿里“上货”,字节“练功”

marsbit1小时前

Circle 将 Zama 协议地址列入黑名单,冻结价值 1260 万美元的用户资金 - 详情

稳定币发行商Circle已将一个与隐私协议Zama相关的智能合约列入黑名单,冻结了约1260万美元的用户资金。此次冻结首先由链上调查员ZachXBT发现,涉及Zama在以太坊上部署的保密USDC(cUSDC)合约。该合约地址在Zama的公开文档中可查,其冻结过程可被实时追踪和验证。 进一步分析显示,此次冻结可能与资产管理和收益协议Overnight Finance近期的争议及法律问题间接相关。数据显示,一个疑似与Overnight Finance相关的钱包于2026年5月11日向Zama合约存入约1240万美元USDC。Overnight Finance近期正面临治理纠纷和可能被团队“拉地毯”的指控,并因此进行了国库资产分配投票。此外,该公司还卷入一起民事诉讼,原告之一是DeFi领域以激进治理策略闻名的Patagon Management。尽管Circle的行动与这些事件之间尚无直接因果证据,但法律程序、资金流动与冻结事件的重叠,引发了人们对DeFi协议间风险传导的担忧。 Circle此次单方面行动再次引发对中心化发行商透明度的批评。据ZachXBT称,Zama团队在合约被列入黑名单前似乎未获任何通知。这加剧了人们对中心化实体在无预警情况下影响去中心化应用及其用户的担忧。此前在2026年3月,Circle曾冻结多个实体相关的热钱包而未公开说明理由。本次行动则更进一步,直接冻结了协议级别的资金池合约,而非独立钱包,这引发了人们对所谓去中心化系统中托管风险的质疑。截至目前,Circle尚未就冻结Zama合约的原因发布官方解释。

bitcoinist1小时前

Circle 将 Zama 协议地址列入黑名单,冻结价值 1260 万美元的用户资金 - 详情

bitcoinist1小时前

三年之后:回看 2023 年我对 ChatGPT 的判断

作者王健硕在2026年5月回看其于2023年3月对ChatGPT做出的二十条预测,并借助AI代理进行验证。整体看,其大方向判断多正确,但细节和程度常有偏差。 **看对的方面:** - **技术架构**:准确预测RAG(检索增强生成)将成为解决知识更新和幻觉的主流方法,以及LUI(自然语言用户界面)将催生巨大新产业。 - **发展趋势**:预见到“机器人网络”和新的agent寻址系统将出现,中国能快速做出可用大模型并缩小与顶尖差距。 - **本质认知**:正确指出ChatGPT没有意识,图灵测试仅测表象;判断其是巨大进步但非AGI,且短期内不会造成整体失业潮。 **看错或看偏的方面:** - **具体数据错误**:关于GPT-4有100T参数的传闻完全错误。 - **绝对化判断**:断言LLM“不可能”自己学好数学被后来模型在IMO夺金证伪;认为AI生成内容可“规避”版权,实则引发史上最大侵权赔偿。 - **价值与成本误判**:认为价值终落应用层,但最大赢家是算力层(如英伟达);模型成本“5-10亿封顶”的估算严重偏离实际。 - **社会影响误读**:认为ChatGPT的“加权平均”特性可能促进“世界大同”,但实际AI正走向个性化,并可能制造新信息茧房。 **总结规律:** 1. 预测机制和方向比具体数字更可靠。 2. 倾向于高估短期变化速度,低估长期影响程度。 3. 容易忽略问题内部的“分布”差异(如失业影响集中在年轻群体)。 4. 留有餘地、分层表述的判断更经得起时间检验。 5. 一些根本性争议,三年时间仍不足以给出定论。 这次复盘旨在为未来的判断立下更审慎的规矩。

marsbit9小时前

三年之后:回看 2023 年我对 ChatGPT 的判断

marsbit9小时前

交易

现货
合约
活动图片