¿Cómo usa Codex el ordenador? Tres puntos de entrada y límites de permisos
Este artículo explica las tres formas en que Codex interactúa con el entorno externo: Uso del Ordenador, la extensión de Chrome y el Navegador integrado en la aplicación. Cada una aborda la tarea de "usar el ordenador", pero se adapta a diferentes escenarios, niveles de permisos y confianza.
* **Uso del Ordenador (@Computer)**: Es el de mayor alcance, permitiendo operar aplicaciones nativas de macOS/Windows, configuraciones del sistema, el simulador de iOS, e incluso flujos de trabajo entre múltiples apps. Es ideal para procesos GUI sin API o herramientas estructuradas, pero es más lento y tiene los permisos más amplios. Se debe usar como último recurso cuando las herramientas estructuradas no cubren la tarea.
* **Extensión de Chrome (@Chrome)**: Permite acceder al estado ya iniciado de sesión en Chrome, incluyendo cookies, perfiles y pestañas abiertas. Es óptimo para tareas que dependen de identidad, como trabajar en Gmail, LinkedIn, Salesforce, paneles internos o investigación que requiera autenticación en múltiples sitios. Ofrece control multi-pestaña y un contexto nativo del navegador, pero acciones como enviar o publicar requieren supervisión.
* **Navegador integrado (@Browser)**: Es un navegador aislado dentro del hilo de Codex, sin el estado de inicio de sesión o cookies del navegador principal. Es ideal para desarrollo y depuración web, como trabajar con servidores locales, reproducir bugs visuales, verificar diseños responsivos o dar retroalimentación de diseño directa en la página. Su aislamiento lo hace seguro para tareas de desarrollo, pero no es apto para sitios que requieran identificación.
**Appshots** no es un método de control, sino una herramienta para proporcionar contexto visual (capturando la ventana frontal en macOS) y señalar a Codex qué elementos observar, sin otorgar permisos de control.
El principio central es elegir la interfaz de operación **más estricta, segura y estructurada** posible para cada tarea: priorizar plugins o MCP sobre control visual; usar el Navegador integrado para desarrollo web; cambiar a Chrome cuando se necesite identidad del navegador; y recurrir al Uso del Ordenador solo como "último kilómetro" para flujos GUI inevitables.
marsbitHace 1 hora(s)