Sam Altman 和 AWS CEO 罕见同框：聊了智能体、harness、和云的下一仗

marsbitPublicado a 2026-04-30Actualizado a 2026-04-30

Stratechery创始人Ben Thompson同时采访了OpenAI CEO Sam Altman和AWS CEO Matt Garman。当时外界还不知道,仅仅三天后,微软和OpenAI就会宣布修改长达数年的独家协议,Azure不再是OpenAI模型的唯一云服务商。但这场合作的逻辑矛盾已经摆在了台面上——两家公司的掌舵人为什么会坐到一起?

背后的逻辑并不复杂。当初微软用“Azure独占OpenAI模型”锁定了巨大的竞争优势,但也绑住了OpenAI的手脚——大量企业数据已经躺在AWS上,客户不想为换模型而搬家。而Anthropic今年增长迅猛,正是吃到了“客户在哪云就想要哪的模型”的红利。对微软来说,继续卡独家权反而在损害自己对OpenAI这笔最重要的投资。松绑是痛苦的——Azure失去了一个核心差异化武器——但不松绑更亏:如果OpenAI的增长被独家协议限制,微软作为大股东的损失远大于Azure的得利。

于是有了这次联合发布:Bedrock Managed Agents,由OpenAI驱动。可以把它理解为“AWS版的Codex”——一个运行在云端、带有完整身份、权限、日志、治理和部署能力的智能体运行环境。客户数据留在AWS内部,OpenAI不接触原始数据。目标是让那些数据已经在AWS上的企业,不用迁移就能直接用上最前沿的AI能力。

下文本次采访对话的核心内容提炼,原文链接:https://stratechery.com/2026/an-interview-with-openai-ceo-sam-altman-and-aws-ceo-matt-garman-about-bedrock-managed-agents/

1 AI的“AWS时刻”:让智能体从能跑变成能用

Sam Altman:每次我看到用户用我们的模型,我既高兴他们觉得这是魔法,又崩溃于他们经历了多少不必要的折磨。用户需要把东西从一个地方复制粘贴到另一个地方,搞一串复杂提示词,反复试错——这些痛苦我看在眼里。

Matt Garman:在这套联合产品出来之前,客户想用AI智能体,得自己拼凑所有环节——模型调用、身份管理、数据库认证、与内部系统的集成、对自己数据的理解。每一个客户都重新干一遍。所有这些集成工作全都留给了客户自己处理。

Matt Garman:AWS过去20年为全球银行、医疗机构、政府机构建立的安全框架——VPC(虚拟私有云)、角色权限、网关——恰好可以帮上忙。客户最担心的就是“我热爱这项技术,但怎么确保我不会一失误就搞出一个让公司完蛋的事件”。这些问题都是可解的,关键在于给客户一个可控的沙盒环境。

Sam Altman:模型和编排层(harness)正在变得越来越不可分。以前很多需要在系统提示词层面费心调教的事,模型变聪明之后自己就会处理了。比如工具调用——最初我们觉得工具调用不需要融入训练流程,后来发现融合得越深越好用。编排层和模型的边界会持续模糊,甚至预训练和后训练最终也会更紧密地走到一起。但整个行业还处在“家酿计算机俱乐部”的年代——也就是个人计算机刚刚萌芽、没人知道最终形态会是什么的阶段。

2 本地运行 vs 云端运行:两条路最终要汇合

Sam Altman:Codex从云端转向本地,是因为本地环境更简单——你的文件、配置都在那,不需要想数据在哪。但这不是终点。最终的形态是云端智能体——你合上电脑时它在云端继续工作,你有高强度任务时它能在云端并行处理,你可以扩展到一个单台笔记本根本做不到的规模。

Matt Garman:没有任何计算环境曾经真正消灭客户端。iPhone App也有本地组件,本地运行就是有低延迟、简单易用的天然优势。但一旦进入企业场景——两个人间共享、权限边界、安全边界——本地就捉襟见肘了。最终一定是本地和云端两条路结合在一起。

Sam Altman:当智能体以“虚拟同事”的身份进入工作队伍后,我们关于软件和权限的所有心智模型都要被重写。你作为员工应该有一个账户,然后让你的智能体也用这个账户?还是应该给智能体单独一个账户,让服务器能分清楚谁在操作?如果一个人有十个智能体呢?我设想了一种还没被发明出来的“原语”:当Ben的智能体登录时,它用的是Ben的账户,但系统能标注这是智能体而非Ben本人。我们还没搞清楚这些,但智能体加入工作队伍并变得越来越自主,这些问题很快就会被推到台面上。

3 “智能工厂”与定价革命

Sam Altman:我们本质上是一家“token工厂”——不对,应该说是“智能工厂”。客户不关心你用的是什么芯片、模型跑了多少token,只关心一件事:以最低价格获得最好的智能单元,要多少有多少。刚发布的5.5模型,单token价格比前代高很多,但完成同样任务需要的token数量大幅减少,整体算下来更便宜。你不该关心用了多少token,你只该关心花了多少钱、活儿干没干完。按token定价长期来看会过时,最终会演变成按“完成一件工作”来收费。

Sam Altman:水电煤有弹性边界——水便宜了你也不会一天洗两次澡。但智能可能不一样。我没有见过任何其他效用,让我只想说“只要价格足够低,我就无限制地继续用”。目前更多客户是在求我“不管多贵多给我算力”,而不是在砍价。但我有信心持续大幅压低智能的成本。

Matt Garman:这和计算能力的历史轨迹完全一致。今天一个计算周期的成本比30年前便宜了不知多少数量级,但今天卖出的计算量比任何时代都多。AI现在还处于极早期——大家抢前沿模型是因为只有它能完成真正有用的工作。未来一定会有模型结构的混合:小而快的做专项任务,前沿巨型模型去攻克癌症。

4 智能体的终局是什么?

Ben Thompson:企业内部可能需要两层智能体。底层智能体的工作是不断钻入各种数据库、SaaS应用、文件系统去检索、整理和关联信息——这是一层“数据整合智能体”。上层智能体负责与人类交互、呈现结果、执行决策——这是“用户界面智能体”。

Sam Altman:最近跟大企业客户交流时,他们的需求越来越一致:想要一个智能体运行时环境、一个能连接数据并控制token消耗的管理层、以及一个给员工用的工作空间。这套东西大家描述得越来越相似,但产品还没完全做出来。但可能在某个时刻你会发现,这套多层级架构只是我们抱着旧世界不放,模型足够强之后整个东西应该推倒重来。

Matt Garman:我们现在还不完全知道最终形态是什么,这也是做这件事的乐趣——让客户用起来,从他们的实践中学习,再反过来让产品变得更快更好。

Ben Thompson:Google在Next大会上刚讲完从芯片(TPU)到模型(Gemini)到应用的全栈垂直整合,而你和Sam——一个没有前沿模型,一个不是云厂商——却坐在一起宣布合作。AWS到底是因为没有自研前沿模型而落后了,还是有意选择了这条开放路线?

Matt Garman:从AWS第一天起,拥抱合作伙伴就是我们最核心的策略之一。我们衡量成功的标准不是“我是否拥有一切”,而是“合作伙伴是否成功——他们成功了,我们就成功了”。这跟“我必须拥有全栈”的哲学不同,但两种路线各有人信。我们相信客户应该有权选最好的东西。如果最好的东西是我们自己做的,很好。如果最好的东西是合作伙伴的但跑在我们的基础设施上,对我们同样是胜利。没有任何一家公司能拥有所有最好的应用。

Sam Altman:我真心认为开发者现在能构建一类全新的产品。模型能力未来一年会以非常陡峭的曲线进步,我们选在这个时候共同打造平台,时机正好。我希望一年后人们回头看,讨论的重点不是“终于能在AWS上用OpenAI了”,而是“我们当时完全低估了这个新产品的重要性”。

Ben Thompson:上次我们做产品采访是跟微软Kevin Scott聊New Bing,你当时对挑战Google非常自信。现在回头看呢?

Sam Altman:ChatGPT的表现超过了当时的预期——它可能是自Facebook以来第一个真正大规模的新消费产品。API和Codex也做得不错。但Google在很多方面仍然是一家被低估的公司——他们的广度和深度令人敬畏。这次跟AWS的合作,不仅是商业层面的双赢,更是技术层面的一个新起点。当模型能力和编排工具终于走到一个交汇点上,开发者能做的事会完全不同。

本文来自微信公众号“硅星GenAI”

Lecturas Relacionadas

Cuenta regresiva para GPT-5.6: Abandona la fantasía de la API única, incluso la iteración más rápida del poder de cómputo no puede competir con una sola regulación

A mediados de junio, tres eventos aparentemente inconexos —las restricciones regulatorias a Claude Fable 5, el lanzamiento en código abierto de GLM-5.2 y la filtración del lanzamiento inminente de GPT-5.6— marcan un punto de inflexión para la industria global de IA. Estos cambios reflejan una reconfiguración fundamental: la "disponibilidad" supera en importancia a la "vanguardia técnica", dando paso a un sistema dual de modelos cerrados controlados y de código abierto local. La retirada de Fable 72 horas después de su lanzamiento, por restricciones de exportación estadounidenses dirigidas a ciudadanos no estadounidenses, evidencia que el avance técnico ahora conlleva un riesgo regulatorio equivalente. Esto crea una vulnerabilidad para las empresas que dependen de APIs cerradas. Como contrapeso, el modelo de código abierto GLM-5.2 de Zhipu AI, compatible con plataformas de semiconductores locales y con un rendimiento cercano a los modelos cerrados líderes, ofrece una alternativa estable y de menor costo. Su despliegue local se convierte en una estrategia de redundancia crítica para la continuidad del negocio ante riesgos geopolíticos. Mientras tanto, OpenAI se prepara para lanzar GPT-5.6, desplazando su foco de la inteligencia lingüística a la "inteligencia espacial" o modelos mundiales, un campo que requiere una inmensa potencia de cálculo. Este movimiento busca establecer una nueva ventaja competitiva en simulaciones industriales, robótica y diseño 3D. En conclusión, la lógica de la cadena de suministro de modelos grandes ha cambiado. La evaluación crítica para las empresas ya no es solo el rendimiento, sino una combinación de capacidad técnica, cumplimiento normativo y estabilidad de acceso. Para los desarrolladores, depender exclusivamente de una API cerrada supone un riesgo inaceptable. Diseñar arquitecturas "agnósticas al modelo" que permitan cambiar rápidamente a alternativas locales y de código abierto se ha convertido en un requisito básico para garantizar la continuidad del negocio.

marsbitHace 1 hora(s)

Cuenta regresiva para GPT-5.6: Abandona la fantasía de la API única, incluso la iteración más rápida del poder de cómputo no puede competir con una sola regulación

marsbitHace 1 hora(s)

¿Está a punto de terminar la "Guerra de subsidios de tokens" de los gigantes de la IA?

La "batalla de subvención de tokens" entre los gigantes de la IA está llegando a su fin, pero no como en las guerras de precios de Internet, donde los ganadores subían los precios tras monopolizar el mercado. En cambio, los tokens de IA carecen de "efecto de bloqueo": los usuarios pueden cambiar fácilmente de proveedor. Actualmente, plataformas como OpenAI y Anthropic subsidian fuertemente sus suscripciones, perdiendo hasta 70 veces el costo real por token para retener a usuarios intensivos. Sin embargo, estas empresas, que dependen de financiación externa, enfrentan una presión inmensa frente a gigantes como Google, que podría recortar precios un 80% usando sus vastos ingresos publicitarios como "arma". Esto podría llevar a un futuro donde los tokens se conviertan en una utilidad estandarizada, como la electricidad, con márgenes de beneficio mínimos. Mientras continúe esta guerra de precios, los usuarios seguirán disfrutando de un acceso altamente subsidiado a la IA potente.

marsbitHace 1 hora(s)

¿Está a punto de terminar la "Guerra de subsidios de tokens" de los gigantes de la IA?

marsbitHace 1 hora(s)

Fuera del campo: el juego lucrativo que rodea la Copa del Mundo

Fuera del campo: El juego especulativo alrededor del Mundial La Copa del Mundo no es solo un festival para los aficionados, sino también una rara ventana global de especulación. Concentra atención, emoción e identidad en poco más de un mes, generando un ecosistema de apuestas que va más allá del fútbol. Los mercados de predicción, como Polymarket y Kalshi, han irrumpido con fuerza, atrayendo volúmenes de trading de miles de millones con contratos sobre el campeón o resultados. Aunque las casas de apuestas tradicionales siguen siendo el pilar principal, estimándose que las apuestas legales en EE.UU. superarán los 28.000 millones de dólares. En bolsa, aparecen "acciones temáticas". En Corea, empresas de pollo frito subieron antes de los partidos de su selección, mostrando cómo el mercado descuenta el consumo impulsado por los aficionados. El reventa de entradas se ha convertido en un mercado especulativo complejo. Los precios fluctúan salvajemente según los equipos y estrellas, y hay incluso ventas en corto en plataformas secundarias antes de poseer los tickets. Los artículos de colección, como las pegatinas Panini o camisetas limitadas, también ven sus precios dispararse por su escasez y valor emocional. El mundo de las criptomonedas no se queda atrás, con miles de memecoins no oficiales relacionados con el Mundial que experimentan bombas y desplomes extremos, a menudo siendo esquemas de "pump and dump". Por último, hay quien especula con la propia demanda de información, creando herramientas para rastrear entradas o vendiendo suscripciones con consejos de apuestas. El verdadero ganador no siempre es quien acierta el resultado, sino quien entiende cómo fluye la atención y la especulación alrededor del evento. Cuando termina el torneo, otro vasto red de transacciones ya ha hecho su propio结算.

marsbitHace 2 hora(s)

Fuera del campo: el juego lucrativo que rodea la Copa del Mundo

marsbitHace 2 hora(s)

La Afirmación sobre los ETF de Hyperliquid Atrae Atención Mientras la Narrativa HYPE Gana Fuerza en X

**TL;DR:** * AlphaOnChain afirma que tres ETF de Hyperliquid (HYPE) lanzados en mayo de 2026 ya tienen 158 millones de dólares en activos combinados. * El mayor sería el ETF Bitwise HYPE con 88 millones, seguido por el 21Shares HYPE ETF con 66 millones. * La afirmación, publicada en X, debe tratarse con cautela hasta que sea verificada con datos oficiales de los fondos. **Narrativa de los ETF Hyperliquid gana atención** La publicación de AlphaOnChain del 20 de junio ha centrado la atención en Hyperliquid. Captura un tema clave del mercado: HYPE se ha convertido en una de las narrativas *altcoin* más observadas, ya que los traders buscan oportunidades más allá de Bitcoin y Ethereum. Su enfoque en el trading perpetuo *on-chain* y la infraestructura de intercambio lo posiciona bien cuando el interés se desplaza hacia activos de mayor riesgo en sectores como DeFi y derivados. **La gran advertencia: Verificación** El aspecto crucial es la verificación. Las cifras deben tratarse como un indicador de atención social creciente, no como una confirmación de flujos. Para un movimiento sostenido, se necesitará una demanda, liquidez y crecimiento del ecosistema confirmados mediante datos oficiales de los emisores o registros bursátiles.

bitcoinistHace 3 hora(s)

La Afirmación sobre los ETF de Hyperliquid Atrae Atención Mientras la Narrativa HYPE Gana Fuerza en X

bitcoinistHace 3 hora(s)

¿Cómo usa Codex el ordenador? Tres puntos de entrada y límites de permisos

Este artículo explica las tres formas en que Codex interactúa con el entorno externo: Uso del Ordenador, la extensión de Chrome y el Navegador integrado en la aplicación. Cada una aborda la tarea de "usar el ordenador", pero se adapta a diferentes escenarios, niveles de permisos y confianza. * **Uso del Ordenador (@Computer)**: Es el de mayor alcance, permitiendo operar aplicaciones nativas de macOS/Windows, configuraciones del sistema, el simulador de iOS, e incluso flujos de trabajo entre múltiples apps. Es ideal para procesos GUI sin API o herramientas estructuradas, pero es más lento y tiene los permisos más amplios. Se debe usar como último recurso cuando las herramientas estructuradas no cubren la tarea. * **Extensión de Chrome (@Chrome)**: Permite acceder al estado ya iniciado de sesión en Chrome, incluyendo cookies, perfiles y pestañas abiertas. Es óptimo para tareas que dependen de identidad, como trabajar en Gmail, LinkedIn, Salesforce, paneles internos o investigación que requiera autenticación en múltiples sitios. Ofrece control multi-pestaña y un contexto nativo del navegador, pero acciones como enviar o publicar requieren supervisión. * **Navegador integrado (@Browser)**: Es un navegador aislado dentro del hilo de Codex, sin el estado de inicio de sesión o cookies del navegador principal. Es ideal para desarrollo y depuración web, como trabajar con servidores locales, reproducir bugs visuales, verificar diseños responsivos o dar retroalimentación de diseño directa en la página. Su aislamiento lo hace seguro para tareas de desarrollo, pero no es apto para sitios que requieran identificación. **Appshots** no es un método de control, sino una herramienta para proporcionar contexto visual (capturando la ventana frontal en macOS) y señalar a Codex qué elementos observar, sin otorgar permisos de control. El principio central es elegir la interfaz de operación **más estricta, segura y estructurada** posible para cada tarea: priorizar plugins o MCP sobre control visual; usar el Navegador integrado para desarrollo web; cambiar a Chrome cuando se necesite identidad del navegador; y recurrir al Uso del Ordenador solo como "último kilómetro" para flujos GUI inevitables.

marsbitHace 3 hora(s)