Mùa hè năm nay, Elon Musk sẽ làm một điều chưa từng xảy ra trong lịch sử. Đưa một công ty mô hình lớn, nhét vào một công ty chế tạo tên lửa, cùng nhau lên sàn.
Điều OpenAI không nên làm nhất hiện nay, có lẽ là chế tạo điện thoại. Nhưng Sam Altman dường như không nghĩ vậy.
Quý I năm nay, doanh thu và tăng trưởng người dùng của OpenAI đều không đạt kỳ vọng. Đối thủ Anthropic dựa vào Claude Code, đã cướp mất nhóm người sẵn sàng trả tiền nhất. Theo kịch bản này, OpenAI hiện tại nên thu hẹp, tập trung, trước tiên chứng minh được việc kiếm tiền, phục vụ cho IPO vào cuối năm nay hoặc đầu năm sau.
Nhưng tin tức từ chuỗi cung ứng lại trái ngược hoàn toàn. Nó muốn thách thức danh mục điện tử tiêu dùng trưởng thành nhất, khép kín nhất, và cũng sinh lời nhất thế giới: iPhone.
Theo tiết lộ, OpenAI đang tăng tốc với chiếc điện thoại AI Agent đầu tiên, nhanh nhất sẽ sản xuất hàng loạt vào nửa đầu năm 2027, mục tiêu xuất xưởng 30 triệu chiếc trong hai năm tới.
Nó điên rồi sao?
Có lẽ không. OpenAI có lẽ đã nhìn rõ một vấn đề nguy hiểm hơn: ChatGPT rất thông minh, nhưng nó không có tay.
Nó có thể trả lời bạn, nhưng rất khó thay bạn hoàn thành nhiệm vụ. Nó sống trong hệ thống của người khác - của Apple, của Microsoft, của hệ điều hành, của trình duyệt - vì vậy không lấy được quyền truy cập thực sự.
Dưới đây không muốn bàn về việc tại sao OpenAI muốn chế tạo một chiếc điện thoại. Mà là công ty này đã từng bước nhận ra như thế nào: không có thiết bị đầu cuối của riêng mình, ChatGPT không thể đổi đời.
Thành công của ChatGPT cũng là một sự phụ thuộc vào lộ trình
Tháng 4 năm 2026, SpaceX nhận được một quyền chọn: có thể vào cuối năm nay, mua lại Cursor với giá cao nhất 600 tỷ USD.
OpenAI ban đầu tin không phải vào điện thoại, không phải trình duyệt, cũng không phải một ứng dụng nào đó. Nó tin vào mô hình - chính xác hơn, là bản thân trí tuệ.
Trong thế giới quan của nó, chỉ cần mô hình đủ mạnh, lối vào, sản phẩm và mô hình kinh doanh, đều sẽ được trí tuệ đẩy tiến lên phía trước.
Đây không phải là lời nói suông. Năm 2020, OpenAI công bố bài báo Scaling Laws sau này bị dẫn đi dẫn lại nhiều lần, xác lập một niềm tin tương đối lạc quan: mô hình, dữ liệu, sức mạnh tính toán cùng nhau phóng đại, trí tuệ sẽ được nâng lên theo cách có thể dự đoán.
Nói cách khác, việc quan trọng nhất không phải là tranh giành lối vào trước, mà là tiếp tục làm mô hình mạnh hơn. Trí tuệ đủ mạnh, thế giới tự nhiên sẽ nhường đường.
Niềm tin này, đã được chứng minh vào ngày 30 tháng 11 năm 2022.
Ngày hôm đó ChatGPT ra mắt. Nó không có giao diện hào nhoáng, không có phần cứng, không được cài sẵn trên nền tảng, chỉ là một ô nhập liệu trong trang web. Nhưng nó mang lại cho người bình thường một trải nghiệm chưa từng có: bạn gửi một câu, nó trả lời bạn như người.
Điểm gây chấn động không chỉ ở chỗ AI biết nói, mà còn ở chỗ nó hầu như không dựa vào bất kỳ lối vào truyền thống nào. Không có nhà sản xuất điện thoại nào giúp nó đẩy thông báo, không có hệ điều hành nào đặt nó ở vị trí dễ thấy, người dùng tự tìm đến nó.
Hai tháng, hoạt động hàng tháng vượt 100 triệu, ứng dụng cấp người tiêu dùng tăng trưởng nhanh nhất trong lịch sử nhân loại.
OpenAI có vẻ đã đúng. Microsoft ngay lập tức đặt cược sâu hơn, nhúng khả năng của nó vào Copilot, Office và Bing; Apple cũng tại WWDC 2024, đưa ChatGPT vào Apple Intelligence.
Lúc này, OpenAI đứng ở trung tâm thời đại. Mô hình mạnh nhất, người dùng lớn nhất, hợp tác sâu nhất.
Nhưng vấn đề chính xác bắt đầu từ đây.
Thành công của ChatGPT quá chói lọi. Chói lọi đến mức nó dễ dàng khiến OpenAI tin rằng: bản thân mô hình chính là lối vào. Nó không cần sở hữu trước một chiếc điện thoại, cũng không cần kiểm soát trước một hệ điều hành - chỉ cần trí tuệ đủ gây chấn động, người dùng sẽ tự tìm đến.
Vết nứt thực sự sau này, cũng bắt đầu từ đây.
Claude Code viết lại quy tắc kiếm tiền
Vết nứt đầu tiên, đến từ Anthropic.
Tháng 5 năm 2025, họ ra mắt Claude Code. Không có demo hoa mỹ, cũng không có sự kiện ra mắt gây bão. Sản phẩm này chỉ đơn giản đi vào thiết bị đầu cuối của nhà phát triển, kho mã và quy trình làm việc Git, giúp kỹ sư hoàn thành công việc.
Sau nửa năm ra mắt, doanh thu hàng năm của Claude Code chạm 10 tỷ USD; chưa đầy một năm, vượt 25 tỷ USD. Đến tháng 4 năm 2026, doanh thu hàng năm tổng thể của Anthropic vượt qua 300 tỷ USD.
Còn OpenAI cùng kỳ, doanh thu hàng tháng 20 tỷ USD, hàng năm khoảng 240 tỷ.
Anthropic với ít người dùng hơn ChatGPT nhiều, lại chạy ra doanh thu cao hơn. Đây mới là điều OpenAI thực sự nên hoảng sợ.
Nguyên nhân rất đơn giản - nó đánh thủng một nhóm người sẵn sàng trả tiền nhất.
Vấn đề là, tại sao OpenAI lại chậm một bước?
Không phải vì nó không nhìn thấy Agent. Mà là thành công của ChatGPT quá chói lọi, chói lọi đến mức OpenAI tiếp tục đi theo quán tính cũ: làm mô hình mạnh hơn, mở rộng quy mô người dùng, tìm kiếm lối vào phổ dụng tiếp theo.
Vì vậy hai năm nay, bạn có thể thấy OpenAI đã tung ra nhiều thử nghiệm từ 0 đến 1 - GPT Store, Sora, Operator, Deep Research, đều là những sản phẩm mọc lên từ tư duy này. Chúng cùng chỉ đến một phán đoán: chỉ cần mô hình đủ mạnh, sản phẩm mới, lối vào mới, mô hình kinh doanh mới sẽ tự nhiên mọc ra.
Nhưng Anthropic chọn một con đường khác. Họ không làm trước một siêu lối vào phủ sóng mọi người, mà đóng đinh Claude Code vào quy trình làm việc của nhà phát triển, mài giũa lặp đi lặp lại một việc - để AI hoàn thành công việc.
Đây chính là chỗ chậm của OpenAI. Nó không phải không làm sản phẩm mới, mà là không ngay lập tức đưa một kịch bản trả tiền cao, từ 1 làm đến 100.
Sora là một ví dụ điển hình. Khi ra mắt gây chấn động toàn trường, nhưng việc tạo video tiêu hao sức mạnh tính toán khổng lồ, sự lưu giữ người dùng và mô hình kinh doanh đều không đủ rõ ràng. Sau này OpenAI đóng cửa Sora, ở một mức độ nào đó là một lần cắt tỉa - nó bắt đầu nhận ra, việc tạo ra một demo AI ấn tượng, và việc đánh thủng một quy trình làm việc trả tiền cao, là hai việc khác nhau.
Năng lực mô hình có thể tạo ra ánh sáng cao, nhưng hiệu quả thương mại đến từ việc liên tục giao kết quả.
Đến đây, OpenAI cuối cùng nhận ra: Agent không phải là một tính năng bổ sung, mà là cốt lõi của giai đoạn thương mại hóa AI tiếp theo. ChatGPT không chỉ chứng minh mình thông minh, nó phải chứng minh mình có thể thay người dùng hoàn thành công việc.
Nhưng khi nó thực sự bắt đầu tiếp quản nhiệm vụ, va phải không phải trần năng lực mô hình, mà là trần quyền truy cập.
900 triệu người dùng, làm sao biến thành tiền
OpenAI đương nhiên cũng đang đuổi theo. Tháng 5 năm 2025, họ tung ra Codex, phản hồi chính diện Claude Code. Đến tháng 4 năm 2026, Codex đạt 3 triệu hoạt động hàng tuần.
Nhưng trận coding này, OpenAI trong ngắn hạn khó có thể thắng lại - Anthropic đã chiếm trước tâm trí coding Agent, người đến sau chỉ có thể bổ sung bài học.
Đây cũng là lý do tại sao OpenAI bắt đầu phân bổ lại tài nguyên: chuyển sự chú ý từ những dự án dễ tạo ánh sáng cao nhưng khó đánh thủng vòng khép kín thương mại, sang Agent, thị trường doanh nghiệp và nghiên cứu tầng sâu hơn.
Nhưng điều nó thực sự cần nhìn, là lá bài lớn hơn trong tay - 900 triệu người dùng hoạt động hàng tuần.
Những người này không phải lập trình viên, sẽ không trả tiền cho mã code. Nhưng mỗi người họ đều có nhu cầu: viết email, làm phương án, tra tài liệu, đặt du lịch, mua đồ, sắp xếp tệp.
Nếu ChatGPT có thể từ một lối vào "biết nói", trở thành một lối vào "biết làm việc", đó mới là năng lực thương mại thực sự của OpenAI.
Hãy tưởng tượng một kịch bản như thế này: bạn muốn mua vé máy bay, nói với ChatGPT thời gian, ngân sách, sở thích, nó giúp bạn tra chuyến bay, so giá, xem khách sạn, cuối cùng đưa cho bạn một nút xác nhận.
Khoảnh khắc này, một phần giá trị của Ctrip bị bỏ qua. So sánh giá, vị trí quảng cáo, hoa hồng, ảnh hưởng quyết định của người dùng, tất cả sẽ được phân phối lại. Mua bảo hiểm, trả thẻ tín dụng, nộp tiền điện nước, cũng đều là logic tương tự. Chỉ cần Agent có thể thay bạn hoàn thành nhiệm vụ, mỗi khoản hoa hồng giao dịch bên trong, mỗi lần ảnh hưởng quảng cáo, OpenAI đều có cơ hội chia một phần.
Đây mới là chỗ đáng tiền thực sự của 900 triệu người dùng - ChatGPT không chỉ trả lời câu hỏi, mà bắt đầu tiếp quản lối vào nhiệm vụ và giao dịch.
Nhưng một khi AI bắt đầu làm việc, nó không còn chỉ là mô hình trong ô trò chuyện. Nó cần biết bạn ở đâu, cần nhìn thấy điều gì đang xảy ra trên màn hình của bạn, cần gọi tệp, lịch, email và thanh toán của bạn.
Vấn đề do đó từ "mô hình có đủ mạnh không", biến thành "ai có quyền truy cập".
Mà quyền truy cập, lại chính là thứ OpenAI thiếu.
ChatGPT sống trong nhà của người khác
OpenAI ban đầu cho rằng, hợp tác có thể giải quyết vấn đề lối vào. Apple cho nó iPhone, Microsoft cho nó Office, Windows và khách hàng doanh nghiệp. Xét ở thời điểm đó, đây là một chiến thắng của niềm tin mô hình OpenAI.
Nhưng khi thời đại Agent đến, vấn đề thay đổi.
Ở Apple, ChatGPT là một chuyên gia bên ngoài được gọi. Nó có thể trả lời câu hỏi, nhưng không thể thực sự tiếp quản màn hình, camera, thông báo, thanh toán và tệp - những quyền truy cập này Apple sẽ không giao ra. Nếu không "linh hồn" của iPhone sẽ không còn thuộc về Apple.
Bên Microsoft cũng vậy. Trước đây, OpenAI chịu trách nhiệm cung cấp mô hình, Microsoft chịu trách nhiệm đưa AI vào các lối vào như Office. Nhưng khi OpenAI tự mình bắt đầu làm Codex và Agent doanh nghiệp, nó đã bước vào lãnh thổ của Microsoft - Agent tự nhiên phải đi vào quy trình làm việc, phải viết mã, xử lý tệp, thay nhân viên hoàn thành nhiệm vụ, mà đây chính là phạm vi chủ quyền cốt lõi nhất của Microsoft.
Vì vậy, quan hệ giữa OpenAI và Microsoft không lập tức rạn nứt, nhưng ranh giới đã thay đổi. Tháng 4 năm 2026, hai bên điều chỉnh lại thỏa thuận, ủy quyền độc quyền của Microsoft trở thành không độc quyền, OpenAI có thể phục vụ khách hàng trên bất kỳ đám mây nào.
Ý nghĩa của việc này rất rõ ràng: OpenAI không muốn chỉ làm nhà cung cấp trong hệ thống của Microsoft. Nó muốn tự mình đối mặt khách hàng, tự mình giao Agent, tự mình lấy lối vào.
Đi đến bước này, quan hệ của nó với Apple, Microsoft trở nên tế nhị. Vì Agent muốn không phải một vị trí trưng bày, mà là lối vào mặc định, quyền truy cập hệ thống, và thiết bị đầu cuối thông minh mà người dùng tiếp xúc đầu tiên mỗi ngày.
Những thứ này, Apple sẽ không cho, Microsoft cũng sẽ không cho. Họ cũng không thể cho.
Suy cho cùng, ChatGPT rất mạnh, nhưng nó luôn sống trong nhà của người khác - nhà của Apple, nhà của Microsoft, nhà của trình duyệt, nhà của hệ điều hành. Nó có thể được gọi, có thể được kết nối, cũng có thể là một nhà cung cấp tốt, nhưng nó không thể quyết định khi nào mình xuất hiện, cũng không thể quyết định mình có thể lấy được quyền truy cập gì.
Mà điện thoại, là thứ gần nhất với nguồn lực vốn có của nó. 900 triệu người dùng hàng tuần đã sẵn sàng giao vấn đề cho ChatGPT - di chuyển tầng tâm trí này lên một thiết bị, ngắn hơn việc làm từ đầu một hệ điều hành, một trình duyệt.
Nó muốn chế tạo không phải một chiếc iPhone chứa đầy App, mà là một chiếc điện thoại chuyên dụng cho Agent - một cơ thể để ChatGPT có thể nhìn thấy, có thể gọi, có thể thực thi nhiệm vụ.
Đây cũng là lý do tại sao tháng 5 năm 2025, OpenAI đã chi khoảng 6.5 tỷ USD để mua lại công ty phần cứng của Jony Ive. Người này là nhà thiết kế công nghiệp của iPhone thế hệ đầu, là một trong những người quan trọng nhất bên cạnh Steve Jobs. OpenAI tìm anh ta, không chỉ để làm một phần cứng đẹp, mà là để định nghĩa lại thiết bị cá nhân trong thời đại AI.
Quay lại câu hỏi đầu tiên, một công ty mô hình lớn, tại sao phải chế tạo điện thoại?
OpenAI muốn không phải một chiếc điện thoại, mà là chủ quyền.
Nó muốn tìm cho ChatGPT một lối vào mặc định thuộc về chính mình. Nhưng việc điện thoại này, về bản chất sẽ đẩy OpenAI đối đầu với Apple. Trước đây, Apple có thể coi ChatGPT như một nhà cung cấp; nếu OpenAI thực sự muốn làm điện thoại của thời đại AI, nó sẽ không còn là nhà cung cấp, mà là đối thủ cạnh tranh của Apple ở lối vào cá nhân.
Nhìn lại vài năm qua, câu chuyện của OpenAI thực sự đã xảy ra một lần đảo ngược.
Nó từng tin rằng, chỉ cần mô hình đủ mạnh, thế giới sẽ tự động tổ chức lại xoay quanh trí tuệ. Sự bùng nổ của ChatGPT, cũng thực sự chứng minh điều này - nó không có phần cứng, không được cài sẵn, chỉ dựa vào một ô nhập liệu trang web, đã kéo hàng trăm triệu người dùng vào thời đại AI.
Nhưng khi thời đại Agent đến, OpenAI phát hiện, mình còn thiếu một thứ quan trọng nhất: chủ quyền.
Thành công của ChatGPT là một chiến thắng, cũng là một sự phụ thuộc vào lộ trình. Nó khiến OpenAI quá lâu tin rằng, bản thân mô hình chính là câu trả lời. Cho đến khi Claude Code chạy ra doanh thu hàng năm 25 tỷ USD, cho đến khi Apple, Microsoft đều không muốn giao quyền truy cập hệ thống - OpenAI mới nhận ra, mô hình dù mạnh đến đâu, cũng phải lấy được lối vào, quyền truy cập và nhiệm vụ.
Vì vậy OpenAI chế tạo điện thoại, thực sự muốn chế tạo không phải một chiếc điện thoại, mà là cơ thể đầu tiên của ChatGPT.
Bài viết này đến từ tài khoản công chúng WeChat "像素301", tác giả: 像素301










