Chúng tôi đã thu thập hàng nghìn tin tuyển dụng và phát hiện ByteDance có vẻ như muốn khởi động lại việc nghiên cứu phát triển điện thoại

marsbitXuất bản vào 2026-05-25Cập nhật gần nhất vào 2026-05-25

Tóm tắt

Vào tháng 12/2025, chiếc "Đậu Bâu Phone" đầu tiên đã ra mắt như một phiên bản xem trước công nghệ, lắp đặt trợ lý AI Đậu Bâu vào một nguyên mẫu điện thoại. Mặc dù trải nghiệm chưa hoàn hảo, nó đã cho thấy tiềm năng của AI Agent có thể "nhìn" màn hình, điều hướng giữa các ứng dụng và thực hiện các tác vụ thay người dùng, trở thành tiên phong cho làn sóng AI Agent sau này. Gần đây, phân tích hơn một nghìn tin tuyển dụng từ ByteDance cho thấy công ty có thể đang khởi động lại việc nghiên cứu phát triển điện thoại. Các vị trí tuyển dụng được chia thành ba nhóm chính: 1. **Trợ lý Đậu Bâu Phone:** Tập trung vào phát triển khả năng cốt lõi của Agent như phân giải nhiệm vụ, gọi công cụ, quản lý bộ nhớ và triển khai trên thiết bị. 2. **Hệ điều hành di động (Mobile OS):** Liên quan đến phần cứng và lớp hệ thống sâu như tối ưu kernel, điều chỉnh chip, driver, camera, quản lý năng lượng và nhiệt, cho thấy sự tham gia vào lĩnh vực phần cứng điện thoại. 3. **Các vị trí tại Thâm Quyến:** Liên quan đến thiết kế tương tác vật lý, công nghệ máy, cấu trúc, sản xuất và kiểm thử, là những tín hiệu mạnh mẽ về khả năng sản xuất thiết bị vật lý. Bài viết kết luận rằng trong kỷ nguyên AI, điện thoại có thể trở thành "cơ thể" của Agent. Để AI Agent thực sự thay thế người dùng thao tác và vượt qua các rào cản về quyền ứng dụng hay kiểm soát của nền tảng, các công ty AI như ByteDance không thể chỉ phát triển ứng dụng mà cần phải kiểm soát sâu hơn đến tận lớp hệ điều hành và phần cứng. Việc tuyển dụ...

Bài: Sleepy, Tư duy Quái quái

Tháng 12 năm 2025, "Đậu Bảo Phone" được đồn đại từ lâu cuối cùng cũng ra mắt. Họ đã tích hợp bản xem trước công nghệ Trợ lý điện thoại Đậu Bảo vào mẫu máy thử nghiệm nội bộ Nubia M153, giá mở bán là 3499 NDT, khoảng 30.000 chiếc đầu tiên đã bán hết ngay trong ngày ra mắt.

Nhớ những ngày đầu sau khi phát hành, giá của nó trên thị trường thiết bị cũ có lúc cao gấp nhiều lần giá gốc. Biên tập viên Beating của Động Sát cũng đã mua hai chiếc.

Không phải vì nó là một chiếc điện thoại dễ dùng, mà ngược lại, thế hệ đầu tiên Đậu Bảo Phone với tư cách là "Bản xem trước công nghệ", trải nghiệm không được tốt lắm. Nhưng điều khiến chúng tôi đặc biệt hào hứng là, lần đầu tiên nó đã kéo AI ra khỏi khung chat, từ một Chat bot biến thành một AI Agent, và có thể điều khiển một chiếc điện thoại.

Trên Đậu Bảo Phone, AI có thể nhìn thấy màn hình, có thể hiểu nội dung bạn đang xem, có thể nghe bạn nói, có thể chuyển đổi giữa các ứng dụng khác nhau, có thể trực tiếp giúp bạn làm nhiều việc như tra vé xe, so sánh giá khi mua sắm, nhận coupon đặt hàng, chỉnh sửa ảnh. Mặc dù những khâu nhạy cảm như thanh toán vẫn cần người dùng tự xác nhận, nhưng nó thực sự đã có thể hoàn thành độc lập nhiều thao tác mà trước đây chúng ta phải tự mình nhấn từng cái một.

Mặc dù vẫn còn hơi vụng về, đôi khi phản ứng chậm, đôi khi bị treo, giống như mới học dùng smartphone vậy, không được linh hoạt, nhưng nó thực sự đã cho chúng ta lần đầu tiên cảm nhận trực tiếp sự tiện lợi của AI khi bước vào đời sống hàng ngày.

Sau đó, OpenClaw mới ra đời và nổi tiếng toàn cầu, AI Agent trở thành khoảnh khắc iPhone tiếp theo trong lĩnh vực AI sau khi ChatGPT ra mắt, một loạt nhà sản xuất, nhà khởi nghiệp bắt đầu bán máy tính, điện thoại được cài sẵn OpenClaw. Đậu Bảo Phone đã đi trước họ ít nhất một phiên bản, thậm chí có thể nói Đậu Bảo Phone là tiên phong trong làn sóng Agent này.

Nhưng rất tiếc, Đậu Bảo Phone nhanh chóng vấp phải sự phong tỏa của các ông lớn. Các tình huống như WeChat, Taobao, Alipay, ứng dụng ngân hàng... lần lượt gặp trục trặc về truy cập hoặc thao tác. Có người gọi đây là "phong sát", cũng có người nói chỉ là kích hoạt kiểm soát rủi ro, nhưng với người dùng thì chẳng khác gì nhau, đều là không dùng được.

Chúng tôi cảm thấy rất tiếc. Đậu Bảo Phone dĩ nhiên không phải là một sản phẩm điện tử tiêu dùng chín muồi, nhưng nó đã cho toàn ngành công nghiệp thấy được hình hài của cửa ngõ thế hệ tiếp theo.

Vì vậy, mặc dù làn sóng nhiệt của Đậu Bảo Phone đã qua, nhưng chúng tôi vẫn chưa hoàn toàn buông bỏ việc này. Cho đến gần đây, việc thu thập thông tin hàng ngày của chúng tôi đã bắt được hàng nghìn tin tuyển dụng, phân tích cho thấy, ByteDance dường như muốn khởi động lại việc nghiên cứu phát triển điện thoại.

Ba hướng tiếp cận, một manh mối

Chúng tôi đã thu thập từ trang tuyển dụng chính thức của ByteDance ba hướng tiếp cận, lần lượt là: nghiệp vụ sáng tạo AI, hệ điều hành di động và Trợ lý điện thoại Đậu Bảo.

Sau khi loại bỏ trùng lặp theo ID vị trí, chúng tôi tiếp tục thu thập thông tin chi tiết trang, tổ chức chéo theo từ khóa trong tên vị trí, mô tả công việc, yêu cầu công việc.

Khác với việc tuyển dụng đội ngũ ứng dụng AI thông thường, trong đợt tuyển dụng xã hội này của ByteDance, còn xuất hiện các vị trí như hệ thống điện thoại, camera, cảm ứng, kết nối mạng, thời lượng pin, nhiệt, tương thích chip, thiết kế cấu trúc, công nghệ sản phẩm hoàn chỉnh, kiểm tra dây chuyền sản xuất.

Những từ này không phổ biến trong các công ty internet, chúng là những thứ mà nhà sản xuất điện thoại, công ty chuỗi cung ứng, đội ngũ kỹ thuật mới phải xử lý hàng ngày.

ByteDance muốn tuyển người xuống nhà máy rồi.

Tuy nhiên, điều này không khẳng định ByteDance sẽ làm thương hiệu điện thoại riêng, nhưng ít nhất có thể xác định là họ đang khởi động lại công việc nghiên cứu phát triển thiết bị đầu cuối cấp điện thoại.

Hãy cùng xem những vị trí này tự thân nó nói lên điều gì.

Trợ lý điện thoại Đậu Bảo: Từ trả lời câu hỏi đến thay người thực thi

Trước tiên xem Trợ lý điện thoại Đậu Bảo.

Chúng tôi lại thực hiện một lần sàng lọc tập trung hơn, trong dữ liệu gốc tìm kiếm các vị trí có xuất hiện "Trợ lý điện thoại Đậu Bảo" trong tên, mô tả và yêu cầu, tổng cộng 83 vị trí, và những vị trí này có thể chia thành ba loại lớn, ba loại này lại vừa vặn ghép thành hình dáng của một AI Agent cấp hệ thống.

Loại vị trí thứ nhất, chịu trách nhiệm để AI có năng lực làm Agent.

Ví dụ, vị trí "Kỹ sư phát triển Agent - Trợ lý điện thoại Đậu Bảo" này viết rằng, cần để AI làm được phân giải nhiệm vụ, tổ chức ngữ cảnh, gọi công cụ, truy xuất bộ nhớ, quản lý trạng thái, kiểm tra kết quả và khôi phục ngoại lệ. Đây chính là năng lực cơ bản của tất cả AI Agent chúng ta đang sử dụng hiện nay.

Loại vị trí thứ hai, chịu trách nhiệm để AI Agent có trí nhớ tốt.

Vị trí xuất hiện các hướng như "cảm nhận và trí nhớ", "trí nhớ người dùng", "sơ đồ tri thức cá nhân", "sở thích lâu dài". Nếu muốn AI Agent thực sự hòa nhập vào cuộc sống của chúng ta, thì không thể để nó mỗi ngày đều như lần đầu tiên quen biết chúng ta, nó cần có trí nhớ dài hạn đáng tin cậy, ổn định.

Tất nhiên điều này rất dễ chạm đến vấn đề riêng tư và ranh giới, nhưng từ tài liệu tuyển dụng, ít nhất ByteDance đã bắt đầu coi "trí nhớ" là một trong những năng lực quan trọng nhất của Trợ lý điện thoại Đậu Bảo để tiến hành nghiên cứu phát triển.

Loại vị trí thứ ba, chịu trách nhiệm để AI Agent trong điện thoại có thể phát huy những năng lực đó.

Trợ lý điện thoại Đậu Bảo nếu muốn thay người dùng thao tác điện thoại, thì không thể chỉ tồn tại trên đám mây, càng không thể chỉ là một ứng dụng. Nó cần có một bộ năng lực hoàn chỉnh, bao gồm mô hình, trí nhớ, thực thi nhiệm vụ, triển khai phía thiết bị, ứng dụng hệ thống, âm thanh hình ảnh, truyền thông, kiểm tra và đảm bảo chất lượng, mới có thể nghe hiểu lời nói của người dùng, hiểu môi trường, phối hợp liên thiết bị, luôn sẵn sàng, và không gây rối.

Hệ điều hành di động: Tầng đáy điện thoại mới là khó khăn của Agent

Tiếp theo xem hệ điều hành di động.

Các vị trí liên quan đến hệ điều hành di động có 236 vị trí, địa điểm làm việc chính tập trung ở Bắc Kinh, Thượng Hải và Thâm Quyến. Trong mô tả vị trí, các từ lặp đi lặp lại là kernel, chip, driver, camera, hiển thị, âm thanh, mạng, công suất, quản lý nhiệt, giao hàng sản xuất hàng loạt. Đây hầu như đều là những từ gần với phần cứng và hệ thống tầng đáy của điện thoại hơn.

Lấy ví dụ. Trách nhiệm của vị trí "Trưởng nhóm Kernel - Hệ điều hành di động" này viết rằng, phải dẫn dắt đội ngũ bộ nhớ và lưu trữ làm công việc tương thích và phát triển kernel cho nền tảng Qualcomm mới, để hệ thống có thể phối hợp với chip điện thoại chủ lưu, và quản lý tốt bộ nhớ và lưu trữ trong điện thoại. Những năng lực này là then chốt để một AI Agent muốn đạt được phản hồi thời gian thực, có thể xử lý nhiệm vụ ở chế độ nền.

Ví dụ khác, trong vị trí còn xuất hiện các từ như SoC, BSP, RTOS. SoC có thể hiểu nôm na là chip lõi của điện thoại, BSP là một bộ phần mềm tầng đáy để hệ thống và phần cứng nhận biết, phối hợp với nhau, RTOS thì thường dùng trong những tình huống yêu cầu cao về phản hồi và công suất.

Vì vậy, tín hiệu mà các vị trí hệ điều hành di động giải phóng ra là, ByteDance đang tuyển những người hiểu biết về hệ thống thiết bị đầu cuối cấp điện thoại, họ ít nhất phải biết, sau khi AI Agent chạy trên điện thoại, sẽ bị vấn đề quyền hạn chặn ở đâu, bị vấn đề công suất chặn ở đâu, bị vấn đề ổn định hệ thống chặn ở đâu, những vấn đề nào cần giải quyết cùng với chip, nhà sản xuất, đội ngũ kiểm tra.

Từ yêu cầu của các vị trí đang tuyển dụng này, ByteDance đã bước vào vùng nước sâu của điện thoại rồi.

Tọa độ Thâm Quyến: Tín hiệu phần cứng và sản xuất hàng loạt

Ngoài ra, cần thiết phải tách riêng ra xem những vị trí có tọa độ ở Thâm Quyến.

Nếu nói các vị trí tọa độ Bắc Kinh thiên về mô hình, thuật toán và nền tảng nhiều hơn, các vị trí tọa độ Thượng Hải thiên về sản phẩm và kỹ thuật nhiều hơn, thì các vị trí tọa độ Thâm Quyến thường liên quan đến phần cứng, chuỗi cung ứng, kiểm tra và sản xuất hàng loạt.

Một dự án nếu chỉ là dịch vụ đám mây, Thâm Quyến không quan trọng đến vậy; một khi chạm đến sản phẩm thực thể, Thâm Quyến sẽ trở nên rất quan trọng.

Những thứ chúng ta thấy trong các vị trí liên quan đến Thâm Quyến, cũng chính là những thứ này.

Một số vị trí viết về thiết kế tương tác người-máy, bao phủ tương tác thực thể phần cứng, tương tác giao diện phần mềm, trải nghiệm liên kết đa thiết bị. Những vị trí này không chỉ xem xét các giao diện trong màn hình được thiết kế thế nào, mà còn xem xét cảm giác cầm nắm của thiết bị thực thể, nút bấm, cách thức đánh thức, cách liên kết với thiết bị khác.

Một số vị trí khác gần với hiện trường kỹ thuật hơn, như kết nối, công suất, truyền thông cự ly ngắn, baseband, công nghệ sản phẩm hoàn chỉnh, cấu trúc, công nghệ kiểm tra.

Những từ này so với "thực thể thông minh", "đa phương thức", "mô hình thế giới" thì không hay ho bằng. Nhưng sản phẩm điện tử tiêu dùng cuối cùng chính là do những thứ này quyết định sống chết.

Nếu ByteDance chỉ muốn biến Đậu Bảo thành một ứng dụng điện thoại tốt hơn, họ không cần làm nhiều việc khổ sở như vậy. Một khi họ bắt đầu tuyển những vị trí này, tức là đã sẵn sàng lên con thuyền này rồi.

ByteDance không thể chỉ làm ứng dụng

Trước đây, điện thoại là container của ứng dụng; đến thời đại AI, điện thoại có thể biến thành cơ thể của Agent.

Nếu điện thoại chỉ là container của ứng dụng, thì công ty như ByteDance có thể dựa vào nội dung, thuật toán và sức mạnh sản phẩm, thông qua từng ứng dụng để xây dựng vương quốc của riêng mình. Nhưng nếu điện thoại biến thành cơ thể của Agent, người dùng phát ra nhiệm vụ trước, ai có thể tiếp nhận nhiệm vụ, người đó sẽ có cơ hội quyết định con đường phía sau.

Trong con đường này, ứng dụng sẽ bị giáng cấp thành công cụ có thể gọi. Điều này sẽ khiến tất cả các Siêu ứng dụng đều không thoải mái. Vì Agent vốn dĩ sẽ vượt qua tầng trung gian.

Vì vậy, chỗ khó thực sự, có lẽ không nằm ở việc Đậu Bảo có thể mở một ứng dụng hay không, mà nằm ở việc người khác có muốn cho nó mở hay không. Mà một AI có thể thay người dùng quyết định, không thể dễ dàng được thông qua như một ứng dụng thông thường.

Agent muốn từ khung chat bước vào tầng thao tác, thì phải xử lý một đống việc bẩn mệt trước đây không thuộc về đội ngũ AI. Họ phải biết hệ thống khi nào sẽ kill chế độ nền, thao tác khi nào sẽ kích hoạt kiểm soát rủi ro, điện thoại tại sao phát nhiệt, nhà máy tại sao tỷ lệ sản phẩm đạt chuẩn không lên được. Trước đây những việc này không thuộc phạm vi quản lý của đội AI, nhưng bây giờ đều không thể tránh được.

Vì vậy ByteDance muốn tuyển những vị trí này. Họ không nhất định sẽ thực sự cho ra mắt một chiếc điện thoại, nhưng ByteDance nhất định không thể chỉ làm ứng dụng trong điện thoại của người khác nữa.

Công ty mô hình lớn muốn trở thành cửa ngõ người dùng thế hệ tiếp theo, thì không thể mãi mãi ký sinh trong hệ điều hành của người khác.

Câu hỏi Liên quan

QBài viết cung cấp bằng chứng gì cho thấy ByteDance có thể đang khởi động lại việc nghiên cứu và phát triển điện thoại?

ABài viết dựa trên việc phân tích hàng nghìn thông tin tuyển dụng mà nhóm tác giả thu thập được từ trang tuyển dụng chính thức của ByteDance. Các vị trí tuyển dụng được nhóm thành ba nhóm chính: Trợ lý Điện thoại Doubao, Hệ điều hành di động (Mobile OS) và các vị trí tại Thâm Quyến liên quan đến phần cứng, chuỗi cung ứng và sản xuất. Sự xuất hiện của các từ khóa như hệ thống điện thoại, camera, chip, thiết kế cấu trúc, thử nghiệm dây chuyền sản xuất... - những thuật ngữ đặc thù của các nhà sản xuất điện thoại và công ty chuỗi cung ứng - là bằng chứng quan trọng cho thấy ByteDance đang bước vào giai đoạn phát triển phần cứng cấp độ thiết bị cuối (điện thoại).

QBài viết mô tả thế hệ "Doubao Phone" đầu tiên như thế nào và tại sao nó lại quan trọng?

ADoubao Phone thế hệ đầu tiên (phát hành vào tháng 12/2025) được mô tả là một "bản xem trước kỹ thuật", trải nghiệm chưa thực sự hoàn thiện và đôi khi còn chậm, vụng về. Tuy nhiên, tầm quan trọng của nó nằm ở việc lần đầu tiên kéo AI ra khỏi khung trò chuyện, biến nó từ một chatbot thành một AI Agent có khả năng điều khiển một chiếc điện thoại. Nó có thể nhìn thấy màn hình, hiểu nội dung, nghe lệnh thoại và thực hiện các tác vụ như chuyển đổi giữa các ứng dụng, đặt vé, so sánh giá cả. Doubao Phone được coi là tiên phong trong làn sóng AI Agent, đi trước các đối thủ ít nhất một thế hệ và cho ngành công nghiệp thấy hình mẫu của cổng vào (entry point) thế hệ tiếp theo.

QTheo bài viết, lý do chính nào khiến "Doubao Phone" gặp khó khăn?

ALý do chính khiến Doubao Phone gặp khó khăn là sự "vây ráp" từ các ứng dụng siêu lớn (super app) và nền tảng lớn. Các ứng dụng như WeChat, Taobao, Alipay, ứng dụng ngân hàng... lần lượt xuất hiện tình trạng truy cập hoặc thao tác bị chặn. Dù được gọi là "phong sát" (封杀 - cấm cửa) hay chỉ là kích hoạt kiểm soát rủi ro, thì với người dùng, kết quả là không thể sử dụng được. Điều này cho thấy một AI Agent có khả năng vượt qua lớp trung gian và trực tiếp thao tác sẽ gặp phải sự phản kháng từ các nền tảng hiện có, vì nó có thể giáng cấp các ứng dụng thành công cụ có thể được gọi một cách thụ động.

QCác vị trí tuyển dụng liên quan đến "Mobile OS" (Hệ điều hành di động) của ByteDance tiết lộ điều gì về hướng đi của họ?

ACác vị trí tuyển dụng liên quan đến "Mobile OS" (khoảng 236 vị trí) tiết lộ rằng ByteDance đang tiến sâu vào lĩnh vực phát triển hệ thống cấp thấp dành cho thiết bị đầu cuối (điện thoại). Các từ khóa như kernel (lõi), chip, driver (trình điều khiển), camera, hiển thị, âm thanh, mạng, tiêu thụ điện năng, quản lý nhiệt và giao hàng sản xuất cho thấy họ đang tập trung vào những công việc "vất vả" gần với phần cứng và lớp hệ thống cơ bản của điện thoại. Điều này cho thấy ByteDance nhận thức được rằng để một AI Agent chạy mượt mà trên điện thoại, họ phải giải quyết các vấn đề về quyền hạn, hiệu suất, độ ổn định hệ thống và sự phối hợp với phần cứng chip, điều mà một ứng dụng thông thường không cần quan tâm.

QTại sao bài viết cho rằng trong thời đại AI, ByteDance không thể chỉ phát triển ứng dụng (App)?

ABài viết lập luận rằng trong thời đại AI, mô hình đang thay đổi: điện thoại có thể từ "vật chứa ứng dụng" (container for apps) trở thành "cơ thể của Agent" (body for Agent). Nếu điện thoại chỉ là vật chứa, các công ty như ByteDance có thể xây dựng vương quốc thông qua các ứng dụng. Nhưng nếu điện thoại là cơ thể của Agent, người dùng giao nhiệm vụ trước, và ai tiếp nhận nhiệm vụ đó sẽ có cơ hội quyết định các bước tiếp theo. Trong quy trình này, các ứng dụng có thể bị giáng cấp thành công cụ có thể được gọi (callable tools). Điều này đe dọa vị thế của các siêu ứng dụng (super app) hiện tại. Do đó, để trở thành cổng vào thế hệ tiếp theo, một công ty mô hình lớn như ByteDance không thể mãi là một ứng dụng "ở nhờ" trên hệ điều hành của người khác; họ phải chủ động hơn trong việc kiểm soát môi trường chạy của Agent, có thể bao gồm cả việc phát triển phần cứng và hệ điều hành của riêng mình.

Nội dung Liên quan

PA Hình ảnh | Một hình ảnh hiểu rõ các sự kiện Web3 đáng chú ý trong tháng 6

Bản tóm tắt sự kiện Web3 đáng chú ý tháng 6: Thị trường tiền mã hóa tháng 6 tập trung vào các yếu tố chính: dữ liệu kinh tế vĩ mô của Mỹ (như CPI, phi nông nghiệp), quyết định lãi suất từ Cục Dự trữ Liên bang Mỹ (FOMC), Ngân hàng Trung ương Châu Âu và Ngân hàng Nhật Bản, tiếp tục ảnh hưởng đến kỳ vọng thanh khoản và tâm lý thị trường. Một số dự án như SUI, ENA sẽ có đợt mở khóa token, cần lưu ý rủi ro tiềm ẩn. Về tin tức sản phẩm, Coinbase dự kiến ra mắt hợp đồng tương lai chỉ số chứng khoán, trong khi CME Group lên kế hoạch cho hợp đồng tương lai chỉ số tiền mã hóa Nasdaq. Tình trạng thanh lý dự án vẫn tiếp diễn, với các dịch vụ như trình duyệt Bitcoin Ordinals (Ord.io) ngừng hoạt động, người dùng cần chú ý đến việc rút và di chuyển tài sản. Các sự kiện công nghệ và truyền thống đáng chú ý khác bao gồm World Cup, Hội nghị Nhà phát triển Toàn cầu của Apple (WWDC26), SpaceX lên sàn chứng khoán, và thượng hội IPO của công ty robot Unitree. Tóm lại, tháng 6 hứa hẹn tiếp tục là giai đoạn thị trường tìm kiếm phương hướng mới dưới tác động của kỳ vọng thanh khoản, biến động chính sách và sự luân chuyển trong hệ sinh thái.

marsbit1 giờ trước

PA Hình ảnh | Một hình ảnh hiểu rõ các sự kiện Web3 đáng chú ý trong tháng 6

marsbit1 giờ trước

Alibaba 'Bán Hàng', ByteDance 'Luyện Công'

Tuần cuối tháng 5, hai sự kiện AI liền kề đã phơi bày hai cách tiếp cận khác biệt của các gã khổng lồ công nghệ Trung Quốc. Alibaba tập trung vào tích hợp và thương mại hóa AI. Họ kết nối ứng dụng Qwen với Taobao, cho phép mua sắm và sử dụng các tính năng AI như thử đồ, so giá. Tổ chức được tái cấu trúc để tập trung vào AI, với động lực rõ ràng từ thị trường vốn. Doanh thu bên ngoài của Alibaba Cloud tăng 40%, cho thấy chiến lược "lắp AI vào quầy thu ngân" đang tạo ra dòng tiền. Tuy nhiên, cách tiếp cận thực dụng này có thể đi kèm rủi ro nếu có sự chênh lệch lớn về năng lực mô hình nền trong tương lai. Ngược lại, ByteDance theo đuổi giới hạn công nghệ thông qua bộ phận Seed. Họ đạt được thành tích đỉnh cao với mô hình tạo video Seedance 2.0 và đầu tư mạnh vào nghiên cứu cơ bản, thu hút nhân tài với các mục tiêu thuần túy học thuật. Ngân sách vốn (capex) của ByteDance được báo cáo là tăng vọt, lên tới 4700 tỷ NDT vào năm 2026, được tài trợ chủ yếu từ lợi nhuận. Lợi thế lớn của họ là không bị áp lực thị trường công khai, cho phép tập trung vào nghiên cứu dài hạn. Bài viết chỉ ra rằng sự khác biệt chiến lược này không chỉ là triết lý, mà chủ yếu bị chi phối bởi việc công ty có niêm yết hay không. Các công ty đại chúng như Alibaba chịu áp lực phải thể hiện kết quả tài chính ngắn hạn, dẫn đến chiến lược "bán AI". Các công ty chưa niêm yết như ByteDance có "sự xa xỉ" để "làm AI" và tập trung vào đột phá công nghệ. Tương lai của con đường nghiên cứu dài hạn tại ByteDance có thể được kiểm chứng nếu công ty này tiến hành IPO.

marsbit1 giờ trước

Alibaba 'Bán Hàng', ByteDance 'Luyện Công'

marsbit1 giờ trước

Tại sao nhiều AI Agent hơn không đồng nghĩa với năng suất cao hơn?

Biên tập viên: Khi AI Agent ngày càng rẻ và dễ gọi, phát triển phần mềm đang bước vào giai đoạn mới. Vấn đề không còn là có thể chạy nhiều Agent hơn hay không, mà là liệu con người có đủ sự chú ý để quản lý, đánh giá và hợp nhất đầu ra của chúng hay không. Bài viết giới thiệu khái niệm "thuế điều phối". Chi phí khởi chạy Agent rất thấp, chỉ cần một Prompt hoặc một cú nhấp chuột. Nhưng các bước tiếp theo mới thực sự đắt đỏ: kiểm tra kết quả, hiểu tác động đến kiến trúc hệ thống, xử lý xung đột giữa các Agent, và quyết định mã nào được đưa vào nhánh chính. Những công việc này không thể song song hóa đơn giản, mà vẫn phải quay về một tài nguyên tuần tự duy nhất: khả năng phán đoán của con người. Tác giả ví nhà phát triển như "GIL" trong hệ thống AI Agent - khóa luồng đơn hạn chế thông lượng cuối cùng của hệ thống đồng thời. Nhiều Agent có thể chạy cùng lúc, nhưng một khi bước vào giai đoạn đánh giá kiến trúc, xem xét mã và hợp nhất xung đột, chúng phải đi qua bộ não của nhà phát triển. Do đó, càng nhiều Agent không nhất thiết có nghĩa là sản lượng cao hơn, mà có thể chỉ làm cho hàng đợi công việc chờ xem xét dài hơn, khiến nhà phát triển mệt mỏi vì chuyển đổi ngữ cảnh liên tục. Điều dễ bị bỏ qua trong cơn sốt công cụ lập trình AI hiện nay là cảm giác hiệu quả không phải lúc nào cũng đồng nghĩa với năng suất thực. Một bảng điều khiển đầy Agent đang chạy tạo ra ảo giác "năng suất cao", nhưng nếu nhà phát triển không thực sự hiểu, xem xét và tích hợp các thay đổi, hệ thống cuối cùng tích lũy có thể là nợ kỹ thuật và nợ nhận thức. Vì vậy, bài viết thảo luận về "cách thiết kế lại quy trình làm việc xoay quanh sự chú ý của con người". Trong thời đại Agent, năng lực then chốt không chỉ là biết đặt câu hỏi và phân công nhiệm vụ, mà là biết nhiệm vụ nào có thể giao cho máy móc xử lý song song, nhiệm vụ nào phải dành cho con người đánh giá; khi nào nên xem xét hàng loạt, khi nào nên dừng điều phối để tập trung lại vào một vấn đề cốt lõi. AI đang mở rộng khả năng xử lý đồng thời trong sản xuất phần mềm, nhưng sự chú ý của con người vẫn là tài nguyên khan hiếm và không thể nhân bản nhất trong hệ thống. Một quy trình làm việc với Agent thực sự trưởng thành không phải là ném mọi nhiệm vụ cho máy móc, mà là thiết kế kiến trúc sự chú ý của chính mình một cách cẩn thận, giống như thiết kế một hệ thống sản xuất.

marsbit2 giờ trước

Tại sao nhiều AI Agent hơn không đồng nghĩa với năng suất cao hơn?

marsbit2 giờ trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

**Tóm tắt tiếng Việt:** Năm 2026, tác giả Vương Kiến Thạc nhìn lại 20 dự đoán của mình về ChatGPT từ năm 2023, sử dụng AI (41 agent Opus 4.8) để đối chiếu với dữ liệu thực tế. **Kết quả chính:** Phần lớn các dự đoán về **cơ chế và xu hướng** là đúng: * **Đúng:** Kiến trúc RAG + tìm kiếm trở thành chuẩn để giảm ảo giác. LUI (Giao diện ngôn ngữ tự nhiên) tạo ra một "lục địa mới" cho tương tác máy tính. Mạng lưới agent với giao thức kết nối mới đang hình thành. Trung Quốc thu hẹp khoảng cách về mô hình lớn có thể sử dụng. ChatGPT không có ý thức, vượt qua bài kiểm tra Turing nhờ biểu diễn. Nó là bước tiến lớn nhưng chưa phải AGI, chưa gây ra làn sóng thất nghiệp hàng loạt. * **Sai/Sai một phần:** Dự đoán cụ thể **GPT-4 có 100 nghìn tỷ tham số** là sai hoàn toàn (thực tế ~1.8 nghìn tỷ). Nhận định **LLM không thể tự học toán** bị bác bỏ khi các mô hình giành huy chương IMO. **Giá trị sẽ thuộc về lớp ứng dụng** bị chứng minh ngược lại khi lợi nhuận khổng lồ thuộc về lớp nền tảng tính toán (như NVIDIA). **AI có thể né tránh vấn đề bản quyền** là sai, với các vụ kiện và khoản bồi thường lớn. Dự đoán **chi phí đào tạo mô hình lớn chỉ 5-10 tỷ USD** là quá thấp so với thực tế. **Bài học rút ra:** 1. **Dự đoán xu hướng và cơ chế đáng tin cậy hơn nhiều so với các con số cụ thể hay mức độ tuyệt đối.** 2. **Có xu hướng đánh giá quá cao tốc độ thay đổi trong ngắn hạn, nhưng lại đánh giá thấp mức độ thay đổi trong dài hạn.** 3. **Sai lầm tinh vi thường nằm ở "sự phân bố":** tổng thể đúng nhưng tác động không đồng đều (ví dụ: việc làm). 4. **Những phát biểu có giới hạn, thận trọng thường đứng vững theo thời gian.** 5. **Ba năm là chưa đủ để kết luận cho một số vấn đề sâu xa** (như ý thức máy móc, sự xuất hiện năng lực). Bài viết kết luận rằng việc nhìn đúng hướng đi lớn không quá khó, nhưng thừa nhận những sai lầm trong ước tính chi tiết, tốc độ và phân bố mới là điều đáng ghi nhớ cho những dự đoán trong tương lai.

marsbit9 giờ trước

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

marsbit9 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片