OpenAI Completely Overhauls Codex, Grows Its Own Mouse, Schedules Itself to Outwork Humans

marsbitXuất bản vào 2026-04-17Cập nhật gần nhất vào 2026-04-17

Tóm tắt

OpenAI has fundamentally transformed Codex from a coding assistant into a versatile AI agent capable of autonomous computer control. The updated Codex can now operate in the background with its own independent cursor, allowing it to run applications like Xcode, test software, and fix bugs without interrupting the user’s workflow. It features a built-in browser for real-time visual editing of web pages, enabling developers to make changes through direct UI interactions. The release also introduces over 90 plugins for tools like JIRA, CircleCI, and SharePoint, integrating end-to-end development and productivity workflows. A new "heartbeat" feature allows Codex to self-schedule tasks, maintain context across sessions, and work autonomously over extended periods. Additional enhancements include memory capabilities, support for handling GitHub code reviews, multi-tab terminals, and built-in file generation for Excel, PDF, and PowerPoint. Currently, advanced computer control is available on macOS (excluding EU/UK users), with Windows support limited to data retrieval. This expansion positions Codex as a foundational step toward OpenAI’s planned "super-app," combining coding, automation, and multi-tool integration into a single platform.

Just now, OpenAI has turned Codex upside down!

Yesterday you were still using Codex to write code.

Today it can already view your screen, click your mouse, remember your preferences from last week, and schedule its own tasks.

Multiple AI Agents work for you in the background simultaneously, without affecting your mouse and keyboard at all.

Codex's "Secret Sauce": It can use apps directly in the background without taking over your entire computer.

From today, this tool used weekly by 3 million developers is no longer just a programming Agent.

You Do Your Work, It Runs Xcode in the Background

Now, Codex has its own cursor, which does not interfere with your mouse.

You write documents while it runs Xcode to test an App next to you, both happening at the same time.

This feature has significant origins; its lead, Ari Weinstein, is the co-creator of Apple Shortcuts, whose team was acquired by OpenAI last fall.

To understand what it can do, just watch a demo.

First, the user gives the command: "Run this Tic-Tac-Toe App in Xcode, play a game to test it yourself, and fix any bugs you find."

Then, Codex opens Xcode by itself, starts the iOS simulator, and begins playing with its own cursor.

During testing, it discovers a logic bug—after a human move, the computer draws two O's simultaneously.

After some thought, Codex decisively switches back to the code interface and locates the position of the bug.

After modifying the Swift code, it immediately recompiles and performs a second round of complete testing for verification.

In less than a minute. Run → Test → Find bug → Fix → Regression verification, the entire Debug closed loop, all in one go.

Currently, Computer Use only supports macOS; users in the EU and UK cannot use it for now.

The Windows version can pull information from other apps into Codex but does not yet support background cursor-level control.

In this update, Codex gains support for Intel Macs for the first time.

Click to Modify, No More Code Hunting for Front-End Debugging

The Codex client now has a built-in browser,底层 powered by OpenAI's own Atlas engine.

In practical terms,以前 front-end developers adjusting UI had to jump back and forth between code and the browser. Now you can operate on the rendered webpage.

Click the main title, leave a comment "Reduce font size and shorten the slogan"; click the top left corner, "Add a logo";发现 the chart's X-axis legend is out of bounds, click the error spot, write "Fix the out-of-bounds issue".

Codex understands visual and spatial context,修改 code in the background instantly, and the page refreshes in real-time.

OpenAI used a web application called Brickfolio, a Lego set tracker, for the demo.

Codex wrote the code from scratch, configured the environment, started the local server, and opened the rendered page in the built-in browser. The whole process took just seconds.

Then came the WYSIWYG (What You See Is What You Get) modification experience. It feels like reviewing a design mockup; you just annotate the problems, and all underlying iterations are handled by the AI.

In other words, the user只需 clicks and marks here and there on the page, and Codex changes the code in the background, producing results in real-time on the front end.

The built-in browser is currently limited to localhost preview. OpenAI stated that future expansions will include full browser control capabilities.

Over 90 Plugins Launched, The Entire Toolchain Welded into Codex

On the plugin front, OpenAI launched over 90 in one go.

Atlassian Rovo manages JIRA, CircleCI handles CI/CD, GitLab Issues tracks requirements, Microsoft Suite processes documents, Neon by Databricks operates databases—covering almost all tools a development team uses daily.

Usage is simple: just @ the plugin name in the input box.

For example, @SharePoint, ask Codex to read documents in the product catalog and generate an executive brief. It automatically searches the file tree, parses documents, and extracts core information, saving you from searching through various cloud drives.

Another example: @Superpowers, ask Codex to conceptualize a feature plan within the local code directory. It will traverse your file structure, read code and CSS, and provide a set of implementation suggestions that fit the current project architecture.

@CircleCI can help diagnose branch build failures; @Atlassian Rovo can read product specifications on Confluence, output summaries in format, and even convert feature points into standard JIRA tasks.

From upstream requirements to local coding, to CI/CD and task management, plugins串起来了 the entire chain.

AI Starts Scheduling Itself

Even more noteworthy is the new "Heartbeat" mechanism.

Now Codex can schedule future work for itself, automatically waking up at the set time to continue working, even across days or weeks. Moreover, it can reuse previous conversation threads, so the context accumulated last time is not lost.

For example, a user can ask Codex to check Slack, Gmail, Google Calendar, and Notion. It pulls relevant information from these four channels and throws out a prioritized to-do list.

The user adds, "Can you keep an eye on this for me?"

Codex immediately sets itself an hourly automatic patrol schedule, proactively reports on key points requiring decisions, and even asks, "Do you need me to draft a reply for you?"

This is no longer just a tool; it's a junior employee who doesn't sleep.

Coupled with the natively built-in image generation capability of gpt-image-1.5, product concept maps, front-end designs, and visual prototypes can all be completed in one go within the same workflow.

Daily Needs Filled in One Go

Besides these major features, there are also a batch of experience-level upgrades.

First, the memory function is available in preview; Codex can remember your preferences and corrected points, so you don't have to explain from scratch the next time you start a chat.

Second, GitHub code review comments can now also be processed in Codex.

Support for opening multiple terminal tabs simultaneously is here, and the ability to connect to remote development machines via SSH is also in internal testing. There's also a new summary panel to help you keep an eye on the Agent's work plans, information sources, and output files at any time.

In the demo, the user asked Codex to organize the recent open issues of the current project and generate a table grouped by theme.

Codex then pulled the code repository context in the background and, after a few minutes, threw out a core summary listing the project's current biggest pain points.

Click to generate an Excel file—no need to switch to external software; a complete spreadsheet preview can be opened right in the sidebar.

The same goes for PDFs and PPTs, all handled within the Codex window.

The First Piece of the Super App Puzzle

Looking back at the timeline, you can feel OpenAI's pace.

March 19: Foreign media reported that OpenAI plans to merge ChatGPT, Codex, and the Atlas browser into a desktop "Super App".

March 31: OpenAI secured $122 billion in funding, with a valuation of $852 billion, led by Amazon, NVIDIA, and SoftBank. The funding documents clearly stated that the capital would be used for the development and deployment of the Super App.

April 16: This wave of Codex updates landed.

Another telling data point: over 80% of OpenAI's internal employees are already using Codex, and not just engineers.

Writing weekly reports, organizing feedback, drafting product requirement documents, reviewing contracts, sending security training reminders—they use it for everything.

50% of Codex users are already using it for non-coding tasks.

This isn't a programming tool adding features. This is a Super App using the shell of a programming tool for a cold start.

If You Can't Beat Them, Infiltrate: Made an Official Plugin for Anthropic

Even more interestingly, OpenAI also made an official plugin for Claude Code, actively embedding Codex into the competitor's ecosystem.

It somewhat has the vibe of, rather than waiting for developers to switch camps, better to infiltrate their workflow first.

Currently, Codex emphasizes background execution, multi-Agent parallelism, and unattended operation; Claude Code's advantages lie in long-context reasoning and deep code understanding. More and more teams are choosing to use both.

However, what OpenAI wants is clearly not just a share of the pie.

$122 billion is bet on something far greater than a programming tool.

Reference: https://openai.com/index/codex-for-almost-everything/

This article is from the WeChat public account "新智元" (New Wisdom Yuan), edited: Hao Kun (Very Sleepy)

Câu hỏi Liên quan

QWhat is the key new feature of OpenAI's Codex that allows it to operate in the background without taking over the user's entire computer?

AThe key new feature is called 'Computer Use', which gives Codex its own independent cursor, allowing it to operate applications in the background (like running Xcode) while the user continues their work uninterrupted with their own mouse and keyboard.

QWhich operating system currently has the most comprehensive support for Codex's new background control capabilities, and which regions are temporarily excluded?

AmacOS currently has the most comprehensive support for the new background cursor-level control. Users in the European Union and the United Kingdom are temporarily unable to use this feature.

QHow does the new 'heartbeat' mechanism in Codex function?

AThe 'heartbeat' mechanism allows Codex to schedule future work for itself. It can wake up automatically at a set time (even across days or weeks) to continue tasks and can reuse previous conversation threads, maintaining all accumulated context from earlier interactions.

QWhat was the significant business move mentioned in the article that suggests OpenAI is building a 'super app'?

AThe significant business move was OpenAI securing $122 billion in funding at an $852 billion valuation, with investors including Amazon, Nvidia, and SoftBank. The funding documents explicitly stated the capital would be used for the development and deployment of a desktop 'super app' that merges ChatGPT, Codex, and the Atlas browser.

QWhat surprising strategic move did OpenAI make regarding its competitor Anthropic's Claude Code?

AOpenAI created and released an official plugin for Anthropic's Claude Code, effectively embedding its own Codex tool into the ecosystem of its direct competitor. This is a strategic move to integrate into developers' workflows rather than waiting for them to switch platforms entirely.

Nội dung Liên quan

DeepSeek Có Thể Giúp Trung Quốc Tiết Kiệm 1 Nghìn Tỷ Đô La Mỹ?

Vào nửa cuối năm 2026, Nvidia sẽ giao nền tảng AI mạnh nhất từ trước đến nay: Vera Rubin VR200 NVL72, với chi phí vật tư khoảng 7,8 triệu USD, trong đó bộ nhớ (HBM4 và LPDDR5X) chiếm tới 2 triệu USD. Bài viết phân tích cách DeepSeek, thông qua các công nghệ như nén bộ nhớ ngữ cảnh dài (MLA), mô hình hỗn hợp chuyên gia (MoE) và tái sử dụng bộ nhớ cache, có thể tăng hiệu suất xử lý token lên gấp 4 lần trên cùng phần cứng, giảm đáng kể sự phụ thuộc vào phần cứng đắt đỏ như GPU và HBM. Khi nhu cầu token AI của Trung Quốc dự kiến đạt hàng nghìn tỷ mỗi ngày, việc tăng hiệu quả này có khả năng tiết kiệm một lượng lớn đầu tư cơ sở hạ tầng. Ước tính, với mức tăng hiệu suất 4 lần, có thể tiết kiệm số tiền tương đương việc xây dựng ít đi hàng chục nghìn trung tâm điện toán AI, tổng giá trị lên tới khoảng 1 nghìn tỷ USD trong tương lai. Chiến lược của DeepSeek không phải là thay thế phần cứng tính toán mà là tối ưu hóa việc sử dụng nó, dịch chuyển giá trị sang các khâu như kiến trúc mô hình, hệ thống suy luận và quản lý bộ nhớ - những lĩnh vực mà chuỗi cung ứng trong nước có lợi thế hơn. Điều này làm giảm sự phụ thuộc vào các linh kiện công nghệ cao bị hạn chế và giúp phổ biến AI với chi phí thấp hơn cho các ngành công nghiệp Trung Quốc.

marsbit58 phút trước

DeepSeek Có Thể Giúp Trung Quốc Tiết Kiệm 1 Nghìn Tỷ Đô La Mỹ?

marsbit58 phút trước

Variant: Bitcoin, Ethereum và ZCash Có Khả Năng Cao Trở Thành Kho Lưu Trữ Giá Trị Chính

Tác giả Alana Levin từ Variant đề xuất một khung phân tích mới cho các blockchain lớp 1 (L1), xem chúng chủ yếu như tài sản lưu trữ giá trị (SOV). Bài viết nêu ra sáu tiêu chí cốt lõi để đánh giá một SOV tốt: độ bền công nghệ, sự khan hiếm, khả năng chống kiểm duyệt, năng suất kinh tế, sức mạnh "memetic" (ý niệm xã hội), và tính thanh khoản. Theo khung này, ba tài sản L1 nổi bật có tiềm năng trở thành phương tiện lưu trữ giá trị chính: * **Bitcoin (BTC):** Thống trị về mặt "memetic" với biệt danh "vàng kỹ thuật số", thu hút niềm tin rộng rãi từ cá nhân đến các quốc gia. * **Ethereum (ETH):** Có lợi thế về độ bền công nghệ nhờ khả năng nâng cấp linh hoạt và lộ trình phát triển minh bạch, giúp nó thích ứng với các thách thức tương lai. * **ZCash (ZEC):** Vượt trội về khả năng chống kiểm duyệt và bảo mật thông qua tính năng giao dịch riêng tư (shielding), cung cấp khả năng bảo vệ tài sản lâu dài trước các rủi ro tịch thu hoặc giám sát. Tác giả nhấn mạnh rằng thị trường lưu trữ giá trị truyền thống (như vàng với vốn hóa 31 nghìn tỷ USD) là rất lớn. Các tài sản kỹ thuật số với những ưu điểm vượt trội về chủ quyền và tự chủ hiện chỉ chiếm một phần nhỏ trong thị trường này, mở ra một cơ hội tăng trưởng đáng kể. Nhiều phương tiện lưu trữ giá trị có thể cùng tồn tại và phát triển.

marsbit1 giờ trước

Variant: Bitcoin, Ethereum và ZCash Có Khả Năng Cao Trở Thành Kho Lưu Trữ Giá Trị Chính

marsbit1 giờ trước

Lật đổ lối tư duy chính thống trong việc xử lý ảo giác: Siêu nhận thức mới chính là giải pháp đột phá giúp mô hình lớn phá vỡ ảo giác

Bài viết "Lật đổ lối tư duy chính thống trong việc xử lý ảo giác: Siêu nhận thức là giải pháp mới để đại mô hình ngôn ngữ đột phá ảo giác" trình bày nghiên cứu của Google, đề xuất một hướng tiếp cận mới để giải quyết vấn đề AI tạo ra thông tin sai lệch (ảo giác). Thay vì tập trung vào việc khiến AI biết mọi thứ hoặc im lặng khi không chắc chắn (gây ra "thuế khả dụng" - utility tax), nghiên cứu nhấn mạnh tầm quan trọng của **siêu nhận thức (metacognition)**. Cốt lõi là dạy AI nhận thức và **trung thực biểu đạt mức độ chắc chắn bên trong** của nó về từng câu trả lời (sự không chắc chắn trung thực - faithful uncertainty). Điều này có nghĩa là AI nên sử dụng ngôn ngữ thận trọng khi nội bộ không chắc chắn, và chỉ khẳng định chắc chắn khi nó thực sự tự tin. Cách tiếp cận này được cho là khả thi hơn việc loại bỏ mọi lỗi sai, vì nó chỉ yêu cầu sự căn chỉnh giữa trạng thái nội bộ và đầu ra ngôn ngữ, thay vì phải căn chỉnh hoàn hảo với thực tế bên ngoài. Bài viết cũng chỉ ra rằng trong kỷ nguyên AI Agent, siêu nhận thức là chìa khóa để ra quyết định thông minh về việc khi nào cần sử dụng công cụ bên ngoài (như tìm kiếm), tránh lạm dụng và tin tưởng mù quáng. Các thách thức chính bao gồm nghịch lý tự khởi động (bootstrap paradox), việc huấn luyện căn chỉnh (RLHF) có thể phá hỏng tín hiệu không chắc chắn nội bộ, và khó khăn trong việc đánh giá xem AI có thực sự sở hữu siêu nhận thức hay chỉ đang biểu diễn nó. Thông điệp cuối cùng: Thay vì theo đuổi một AI hoàn hảo không thể đạt được, hãy hướng tới một AI trung thực về những gì nó biết và không biết, từ đó xây dựng niềm tin thực sự với người dùng.

marsbit1 giờ trước

Lật đổ lối tư duy chính thống trong việc xử lý ảo giác: Siêu nhận thức mới chính là giải pháp đột phá giúp mô hình lớn phá vỡ ảo giác

marsbit1 giờ trước

Muốn phòng ngừa thì mua vàng-dầu, muốn bùng nổ thì mua AI, Bitcoin 'hết thời' bước vào thị trường gấu

Bitcoin gần đây liên tục giảm, có lúc xuống mức thấp nhất trong hai tháng, khoảng 66.123 USD. Nhiều lý do được đưa ra như dòng tiền ETF rút ra, căng thẳng địa chính trị, hay việc Strategy bán bớt cổ phần. Tuy nhiên, theo phân tích của Bloomberg, những điều này chỉ là bề nổi. Vấn đề cốt lõi sâu xa hơn: Bitcoin đang thua trong một cuộc cạnh tranh tài sản. Trước đây, khi lãi suất thấp, Bitcoin là lựa chọn cho nhà đầu tư bất mãn với lạm phát và các tài sản truyền thống. Hiện tại, thị trường đã thay đổi. Bitcoin bị mắc kẹt ở "vùng đất trung gian bất tiện", thua trên cả ba mặt trận: 1. **Phòng ngừa lạm phát:** Vàng và cổ phiếu năng lượng thắng thế vì có tài sản hữu hình và sức định giá rõ ràng. 2. **Tìm kiếm tăng trưởng:** Các công ty AI có doanh thu và lợi nhuận thực tế trở nên hấp dẫn hơn so với Bitcoin không tạo ra dòng tiền. 3. **Tiếp xúc với crypto:** Nhà đầu tư giờ có nhiều lựa chọn khác như sàn giao dịch, stablecoin, hạ tầng thanh toán - những tài sản gắn trực tiếp với tỷ lệ ứng dụng thực tế của ngành. Tóm lại, Bitcoin không còn là tài sản phòng ngừa tốt nhất, cũng không phải tài sản tăng trưởng tốt nhất, và cũng không còn là tài sản crypto duy nhất. Một minh chứng rõ ràng: cảnh báo gần đây về rủi ro lạm phát dai dẳng của Cục Dự trữ Liên bang Mỹ trước đây có thể là tín hiệu mua Bitcoin, nhưng giờ thị trường không phản ứng theo cách đó. Nhà đầu tư chuyển sang các tài sái có liên kết trực tiếp với năng lượng và hàng hóa. Các sự kiện như ETF rút vốn hay Strategy bán bớt cổ phần chỉ là "triệu chứng" phản ánh một thực tế cơ bản: vốn hiện có nhiều điểm đến hơn, và nhà đầu tư đang đòi hỏi cao hơn ở Bitcoin. Họ muốn biết lợi nhuận cụ thể và lý do chọn Bitcoin thay vì các tài sản khác. Logic thị trường gấu mới cho Bitcoin không còn là "nó là bong bóng" mà là: **tính khan hiếm tự thân giờ đây là chưa đủ.**

华尔街日报1 giờ trước

Muốn phòng ngừa thì mua vàng-dầu, muốn bùng nổ thì mua AI, Bitcoin 'hết thời' bước vào thị trường gấu

华尔街日报1 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片