Bài: Sleepy, Tư duy Quái quái
Tháng 12 năm 2025, "Đậu Bảo Phone" được đồn đại từ lâu cuối cùng cũng ra mắt. Họ đã tích hợp bản xem trước công nghệ Trợ lý điện thoại Đậu Bảo vào mẫu máy thử nghiệm nội bộ Nubia M153, giá mở bán là 3499 NDT, khoảng 30.000 chiếc đầu tiên đã bán hết ngay trong ngày ra mắt.
Nhớ những ngày đầu sau khi phát hành, giá của nó trên thị trường thiết bị cũ có lúc cao gấp nhiều lần giá gốc. Biên tập viên Beating của Động Sát cũng đã mua hai chiếc.
Không phải vì nó là một chiếc điện thoại dễ dùng, mà ngược lại, thế hệ đầu tiên Đậu Bảo Phone với tư cách là "Bản xem trước công nghệ", trải nghiệm không được tốt lắm. Nhưng điều khiến chúng tôi đặc biệt hào hứng là, lần đầu tiên nó đã kéo AI ra khỏi khung chat, từ một Chat bot biến thành một AI Agent, và có thể điều khiển một chiếc điện thoại.
Trên Đậu Bảo Phone, AI có thể nhìn thấy màn hình, có thể hiểu nội dung bạn đang xem, có thể nghe bạn nói, có thể chuyển đổi giữa các ứng dụng khác nhau, có thể trực tiếp giúp bạn làm nhiều việc như tra vé xe, so sánh giá khi mua sắm, nhận coupon đặt hàng, chỉnh sửa ảnh. Mặc dù những khâu nhạy cảm như thanh toán vẫn cần người dùng tự xác nhận, nhưng nó thực sự đã có thể hoàn thành độc lập nhiều thao tác mà trước đây chúng ta phải tự mình nhấn từng cái một.
Mặc dù vẫn còn hơi vụng về, đôi khi phản ứng chậm, đôi khi bị treo, giống như mới học dùng smartphone vậy, không được linh hoạt, nhưng nó thực sự đã cho chúng ta lần đầu tiên cảm nhận trực tiếp sự tiện lợi của AI khi bước vào đời sống hàng ngày.
Sau đó, OpenClaw mới ra đời và nổi tiếng toàn cầu, AI Agent trở thành khoảnh khắc iPhone tiếp theo trong lĩnh vực AI sau khi ChatGPT ra mắt, một loạt nhà sản xuất, nhà khởi nghiệp bắt đầu bán máy tính, điện thoại được cài sẵn OpenClaw. Đậu Bảo Phone đã đi trước họ ít nhất một phiên bản, thậm chí có thể nói Đậu Bảo Phone là tiên phong trong làn sóng Agent này.
Nhưng rất tiếc, Đậu Bảo Phone nhanh chóng vấp phải sự phong tỏa của các ông lớn. Các tình huống như WeChat, Taobao, Alipay, ứng dụng ngân hàng... lần lượt gặp trục trặc về truy cập hoặc thao tác. Có người gọi đây là "phong sát", cũng có người nói chỉ là kích hoạt kiểm soát rủi ro, nhưng với người dùng thì chẳng khác gì nhau, đều là không dùng được.
Chúng tôi cảm thấy rất tiếc. Đậu Bảo Phone dĩ nhiên không phải là một sản phẩm điện tử tiêu dùng chín muồi, nhưng nó đã cho toàn ngành công nghiệp thấy được hình hài của cửa ngõ thế hệ tiếp theo.
Vì vậy, mặc dù làn sóng nhiệt của Đậu Bảo Phone đã qua, nhưng chúng tôi vẫn chưa hoàn toàn buông bỏ việc này. Cho đến gần đây, việc thu thập thông tin hàng ngày của chúng tôi đã bắt được hàng nghìn tin tuyển dụng, phân tích cho thấy, ByteDance dường như muốn khởi động lại việc nghiên cứu phát triển điện thoại.
Ba hướng tiếp cận, một manh mối
Chúng tôi đã thu thập từ trang tuyển dụng chính thức của ByteDance ba hướng tiếp cận, lần lượt là: nghiệp vụ sáng tạo AI, hệ điều hành di động và Trợ lý điện thoại Đậu Bảo.
Sau khi loại bỏ trùng lặp theo ID vị trí, chúng tôi tiếp tục thu thập thông tin chi tiết trang, tổ chức chéo theo từ khóa trong tên vị trí, mô tả công việc, yêu cầu công việc.
Khác với việc tuyển dụng đội ngũ ứng dụng AI thông thường, trong đợt tuyển dụng xã hội này của ByteDance, còn xuất hiện các vị trí như hệ thống điện thoại, camera, cảm ứng, kết nối mạng, thời lượng pin, nhiệt, tương thích chip, thiết kế cấu trúc, công nghệ sản phẩm hoàn chỉnh, kiểm tra dây chuyền sản xuất.
Những từ này không phổ biến trong các công ty internet, chúng là những thứ mà nhà sản xuất điện thoại, công ty chuỗi cung ứng, đội ngũ kỹ thuật mới phải xử lý hàng ngày.
ByteDance muốn tuyển người xuống nhà máy rồi.
Tuy nhiên, điều này không khẳng định ByteDance sẽ làm thương hiệu điện thoại riêng, nhưng ít nhất có thể xác định là họ đang khởi động lại công việc nghiên cứu phát triển thiết bị đầu cuối cấp điện thoại.
Hãy cùng xem những vị trí này tự thân nó nói lên điều gì.
Trợ lý điện thoại Đậu Bảo: Từ trả lời câu hỏi đến thay người thực thi
Trước tiên xem Trợ lý điện thoại Đậu Bảo.
Chúng tôi lại thực hiện một lần sàng lọc tập trung hơn, trong dữ liệu gốc tìm kiếm các vị trí có xuất hiện "Trợ lý điện thoại Đậu Bảo" trong tên, mô tả và yêu cầu, tổng cộng 83 vị trí, và những vị trí này có thể chia thành ba loại lớn, ba loại này lại vừa vặn ghép thành hình dáng của một AI Agent cấp hệ thống.
Loại vị trí thứ nhất, chịu trách nhiệm để AI có năng lực làm Agent.
Ví dụ, vị trí "Kỹ sư phát triển Agent - Trợ lý điện thoại Đậu Bảo" này viết rằng, cần để AI làm được phân giải nhiệm vụ, tổ chức ngữ cảnh, gọi công cụ, truy xuất bộ nhớ, quản lý trạng thái, kiểm tra kết quả và khôi phục ngoại lệ. Đây chính là năng lực cơ bản của tất cả AI Agent chúng ta đang sử dụng hiện nay.
Loại vị trí thứ hai, chịu trách nhiệm để AI Agent có trí nhớ tốt.
Vị trí xuất hiện các hướng như "cảm nhận và trí nhớ", "trí nhớ người dùng", "sơ đồ tri thức cá nhân", "sở thích lâu dài". Nếu muốn AI Agent thực sự hòa nhập vào cuộc sống của chúng ta, thì không thể để nó mỗi ngày đều như lần đầu tiên quen biết chúng ta, nó cần có trí nhớ dài hạn đáng tin cậy, ổn định.
Tất nhiên điều này rất dễ chạm đến vấn đề riêng tư và ranh giới, nhưng từ tài liệu tuyển dụng, ít nhất ByteDance đã bắt đầu coi "trí nhớ" là một trong những năng lực quan trọng nhất của Trợ lý điện thoại Đậu Bảo để tiến hành nghiên cứu phát triển.
Loại vị trí thứ ba, chịu trách nhiệm để AI Agent trong điện thoại có thể phát huy những năng lực đó.
Trợ lý điện thoại Đậu Bảo nếu muốn thay người dùng thao tác điện thoại, thì không thể chỉ tồn tại trên đám mây, càng không thể chỉ là một ứng dụng. Nó cần có một bộ năng lực hoàn chỉnh, bao gồm mô hình, trí nhớ, thực thi nhiệm vụ, triển khai phía thiết bị, ứng dụng hệ thống, âm thanh hình ảnh, truyền thông, kiểm tra và đảm bảo chất lượng, mới có thể nghe hiểu lời nói của người dùng, hiểu môi trường, phối hợp liên thiết bị, luôn sẵn sàng, và không gây rối.
Hệ điều hành di động: Tầng đáy điện thoại mới là khó khăn của Agent
Tiếp theo xem hệ điều hành di động.
Các vị trí liên quan đến hệ điều hành di động có 236 vị trí, địa điểm làm việc chính tập trung ở Bắc Kinh, Thượng Hải và Thâm Quyến. Trong mô tả vị trí, các từ lặp đi lặp lại là kernel, chip, driver, camera, hiển thị, âm thanh, mạng, công suất, quản lý nhiệt, giao hàng sản xuất hàng loạt. Đây hầu như đều là những từ gần với phần cứng và hệ thống tầng đáy của điện thoại hơn.
Lấy ví dụ. Trách nhiệm của vị trí "Trưởng nhóm Kernel - Hệ điều hành di động" này viết rằng, phải dẫn dắt đội ngũ bộ nhớ và lưu trữ làm công việc tương thích và phát triển kernel cho nền tảng Qualcomm mới, để hệ thống có thể phối hợp với chip điện thoại chủ lưu, và quản lý tốt bộ nhớ và lưu trữ trong điện thoại. Những năng lực này là then chốt để một AI Agent muốn đạt được phản hồi thời gian thực, có thể xử lý nhiệm vụ ở chế độ nền.
Ví dụ khác, trong vị trí còn xuất hiện các từ như SoC, BSP, RTOS. SoC có thể hiểu nôm na là chip lõi của điện thoại, BSP là một bộ phần mềm tầng đáy để hệ thống và phần cứng nhận biết, phối hợp với nhau, RTOS thì thường dùng trong những tình huống yêu cầu cao về phản hồi và công suất.
Vì vậy, tín hiệu mà các vị trí hệ điều hành di động giải phóng ra là, ByteDance đang tuyển những người hiểu biết về hệ thống thiết bị đầu cuối cấp điện thoại, họ ít nhất phải biết, sau khi AI Agent chạy trên điện thoại, sẽ bị vấn đề quyền hạn chặn ở đâu, bị vấn đề công suất chặn ở đâu, bị vấn đề ổn định hệ thống chặn ở đâu, những vấn đề nào cần giải quyết cùng với chip, nhà sản xuất, đội ngũ kiểm tra.
Từ yêu cầu của các vị trí đang tuyển dụng này, ByteDance đã bước vào vùng nước sâu của điện thoại rồi.
Tọa độ Thâm Quyến: Tín hiệu phần cứng và sản xuất hàng loạt
Ngoài ra, cần thiết phải tách riêng ra xem những vị trí có tọa độ ở Thâm Quyến.
Nếu nói các vị trí tọa độ Bắc Kinh thiên về mô hình, thuật toán và nền tảng nhiều hơn, các vị trí tọa độ Thượng Hải thiên về sản phẩm và kỹ thuật nhiều hơn, thì các vị trí tọa độ Thâm Quyến thường liên quan đến phần cứng, chuỗi cung ứng, kiểm tra và sản xuất hàng loạt.
Một dự án nếu chỉ là dịch vụ đám mây, Thâm Quyến không quan trọng đến vậy; một khi chạm đến sản phẩm thực thể, Thâm Quyến sẽ trở nên rất quan trọng.
Những thứ chúng ta thấy trong các vị trí liên quan đến Thâm Quyến, cũng chính là những thứ này.
Một số vị trí viết về thiết kế tương tác người-máy, bao phủ tương tác thực thể phần cứng, tương tác giao diện phần mềm, trải nghiệm liên kết đa thiết bị. Những vị trí này không chỉ xem xét các giao diện trong màn hình được thiết kế thế nào, mà còn xem xét cảm giác cầm nắm của thiết bị thực thể, nút bấm, cách thức đánh thức, cách liên kết với thiết bị khác.
Một số vị trí khác gần với hiện trường kỹ thuật hơn, như kết nối, công suất, truyền thông cự ly ngắn, baseband, công nghệ sản phẩm hoàn chỉnh, cấu trúc, công nghệ kiểm tra.
Những từ này so với "thực thể thông minh", "đa phương thức", "mô hình thế giới" thì không hay ho bằng. Nhưng sản phẩm điện tử tiêu dùng cuối cùng chính là do những thứ này quyết định sống chết.
Nếu ByteDance chỉ muốn biến Đậu Bảo thành một ứng dụng điện thoại tốt hơn, họ không cần làm nhiều việc khổ sở như vậy. Một khi họ bắt đầu tuyển những vị trí này, tức là đã sẵn sàng lên con thuyền này rồi.
ByteDance không thể chỉ làm ứng dụng
Trước đây, điện thoại là container của ứng dụng; đến thời đại AI, điện thoại có thể biến thành cơ thể của Agent.
Nếu điện thoại chỉ là container của ứng dụng, thì công ty như ByteDance có thể dựa vào nội dung, thuật toán và sức mạnh sản phẩm, thông qua từng ứng dụng để xây dựng vương quốc của riêng mình. Nhưng nếu điện thoại biến thành cơ thể của Agent, người dùng phát ra nhiệm vụ trước, ai có thể tiếp nhận nhiệm vụ, người đó sẽ có cơ hội quyết định con đường phía sau.
Trong con đường này, ứng dụng sẽ bị giáng cấp thành công cụ có thể gọi. Điều này sẽ khiến tất cả các Siêu ứng dụng đều không thoải mái. Vì Agent vốn dĩ sẽ vượt qua tầng trung gian.
Vì vậy, chỗ khó thực sự, có lẽ không nằm ở việc Đậu Bảo có thể mở một ứng dụng hay không, mà nằm ở việc người khác có muốn cho nó mở hay không. Mà một AI có thể thay người dùng quyết định, không thể dễ dàng được thông qua như một ứng dụng thông thường.
Agent muốn từ khung chat bước vào tầng thao tác, thì phải xử lý một đống việc bẩn mệt trước đây không thuộc về đội ngũ AI. Họ phải biết hệ thống khi nào sẽ kill chế độ nền, thao tác khi nào sẽ kích hoạt kiểm soát rủi ro, điện thoại tại sao phát nhiệt, nhà máy tại sao tỷ lệ sản phẩm đạt chuẩn không lên được. Trước đây những việc này không thuộc phạm vi quản lý của đội AI, nhưng bây giờ đều không thể tránh được.
Vì vậy ByteDance muốn tuyển những vị trí này. Họ không nhất định sẽ thực sự cho ra mắt một chiếc điện thoại, nhưng ByteDance nhất định không thể chỉ làm ứng dụng trong điện thoại của người khác nữa.
Công ty mô hình lớn muốn trở thành cửa ngõ người dùng thế hệ tiếp theo, thì không thể mãi mãi ký sinh trong hệ điều hành của người khác.












