GPT设计GPT

marsbit發佈於 2026-06-25更新於 2026-06-25

文章摘要

OpenAI推出其首款自研芯片Jalapeño,这标志着公司不再满足于仅做一家模型公司,而是开始控制智能生产的全链条。当前,模型能力的领先窗口正在缩短,真正的长期壁垒已转向底层基础设施——算力、推理成本与能源效率。Jalapeño是一款面向大模型推理的芯片,旨在降低OpenAI自身产品的Token生成成本,尤其是日常的推理开销。 该芯片仅用九个月完成流片,其关键在于OpenAI将运行ChatGPT等产品的实际负载经验融入了芯片设计,甚至利用AI辅助优化设计流程,形成了“AI设计芯片,芯片运行下一代AI”的闭环。这不仅能提升系统效率、削减“推理税”,还可能加速迭代,形成强大的业务飞轮。 此举并非简单挑战英伟达,而是效仿苹果构建软硬一体闭环的战略。OpenAI正整合模型、产品、API、芯片与数据中心,目标是成为控制智能生产的“矿山”,直接出售智能本身,而非依赖外部算力平台。这预示着AI行业的竞争核心正从模型本身,转向拥有计算工厂与全栈控制力的少数玩家。

OpenAI终于做芯片了。

很多人看到这条新闻,第一反应是:英伟达麻烦了。

但我看到的恰恰相反。

首款芯片Jalapeño最重要的意义,并非直奔着英伟达而来。

这是OpenAI第一次公开承认,自己不满足于做一家模型公司了。

它想控制的,是生产智能的整个过程。

从模型,到芯片。从数据中心,到能源。从训练,到推理。从生产Token,到销售Token。

Jalapeño表面是一颗芯片,实际上更像一张路线图。

OpenAI终于把自己的野心摆到了桌面上。

一、模型差距在缩小,计算差距在扩大

自从大模型爆发以来,AI行业几乎所有注意力都在模型。

GPT-4出来行业被震一次,Claude追上来,Gemini追上来,DeepSeek把性价比打出来,Meta推开源。每次发布大家盯着同一组东西:参数、榜单、代码能力、数学能力、长上下文、多模态。

模型当然重要。但一个变化已经出现,模型领先的窗口正在变短。今天一个模型刚发布,几个月后开源社区、竞争对手、云厂商就会跟上。能力差距仍然存在,但越来越难独立构成长期壁垒。

真正拉开差距的东西,开始往更底层走。算力供应、推理成本、系统吞吐、网络能力、数据中心建设、能源获取。没有模型发布那么好看,也不会立刻刷屏。但它们决定一家AI公司能不能长期跑下去。

黄仁勋最近说了一句话:英伟达系统也许不是采购价格最低的,但能生成成本最低的Token、最高的Token吞吐量,最终带来最高收入。

老黄这段话很直接。行业一直抱怨英伟达贵,黄仁勋没在采购价上辩解,而是把问题换到另一个维度:别看买机器花多少钱,要看每个Token的生产成本。

这就是AI时代新的账本。服务器和GPU不是最终单位,Token才是。

OpenAI恰好站在这个问题最中心。

ChatGPT每天处理海量请求,Codex要消耗更多推理步骤,未来还有Agent、视频生成、机器人、长推理链。模型越有用,Token消耗越大。产品越成功,推理账单越厚。

残酷的地方在这里,OpenAI用户越多,英伟达越赚钱。OpenAI产品越强,底层算力税越重。

如果每一个Token都要经过外部硬件平台收一道税,OpenAI就很难拥有完整的护城河。它可以有最强模型,有超级入口,有开发者生态。但最核心的生产成本始终卡在别人手里。

Jalapeño的本质就在这里。OpenAI开始自己造Token工厂。

二、GPT开始设计GPT

Jalapeño这款芯片最容易被低估的细节,是九个月流片。

传统高性能ASIC项目,周期通常18个月到36个月。先进工艺更麻烦,架构、验证、物理实现、封装、软件栈、调试,任何一环出问题成本迅速放大。OpenAI和博通把周期压到了九个月。

这不能理解成芯片行业突然变简单。OpenAI没有凭空长出一条半导体产业链。博通在定制芯片和网络基础设施上经验深厚,Celestica负责板卡、机架和系统工程。

OpenAI真正贡献的是更稀缺的东西,它知道未来模型要怎么跑。

很多芯片公司做AI加速器,难点在于猜负载。模型结构会变,推理方式会变,服务模式会变。芯片一旦流片,物理世界没有软件世界那么好回滚。

OpenAI不用完全靠猜。每天运行ChatGPT、Codex和API,知道哪些内核最常用,哪些内存搬运最浪费,哪些网络瓶颈最影响集群效率,哪些延迟会直接伤害产品体验。它还知道未来Agent产品会怎么消耗推理资源。

这些经验以前只是后台工程知识,现在被写进芯片架构。

在OpenAI的官方新闻稿里有一句话很关键:OpenAI使用自己的模型加速了部分设计和优化流程。还说,提供给用户的模型也在帮助改进运行未来模型的基础设施。

GPT开始参与设计下一代GPT的机器。

过去几十年芯片的链条是,先设计芯片,芯片运行软件,软件运行AI。现在链条开始回头,AI帮助人类设计芯片,芯片再运行下一代AI。

一旦这个闭环成立,九个月可能只是开始。未来可能是六个月、三个月,甚至更密集的迭代。

芯片行业过去有自己的节奏,模型行业有自己的节奏。前者慢后者快。Jalapeño把两个节奏往一起拉。

这一步如果走通,OpenAI的飞轮会变得很吓人。更好的模型帮助设计更好的芯片,更好的芯片降低下一代模型运行成本,更低成本支撑更多用户和产品,更多用户和产品带来更多真实负载数据,这些数据再反过来定义下一代芯片。

这才是OpenAI真正想要的循环。

三、削减推理税,控制现金流

Jalapeño不是训练芯片,它面向的是大语言模型推理。这点很关键。

训练像造航母。一次投入巨大,需要极强的通用能力,需要不断适配新模型新架构新实验。训练市场仍然高度依赖英伟达,不只是GPU,而是CUDA、网络、系统、软件库、开发者生态整套平台。

推理更像出租车队。每天跑,每小时跑,每分钟跑。用户每提一个问题,API每响应一次,Agent每推进一步,都要发生推理。它更在意低延迟、低成本、高吞吐、高利用率。

训练烧阶段性大钱,推理烧日常现金流。

这也是AI公司走到商业化阶段后最头疼的问题。GPT训练一次很贵,但推理每天都在发生。Agent时代会继续放大这个问题,一次任务可能包含几十次甚至几百次模型调用。长上下文、链式推理、多模态生成、代码执行,都在继续推高Token消耗。

Jalapeño瞄准的就是这笔推理税。它更像OpenAI自己的TPU。Google、亚马逊、Meta、微软都走过类似路线,只要负载足够大,自研ASIC就有高性价比的经济意义。

OpenAI现在具备这个条件。有真实请求、有产品路线、有模型团队、有博通这样的产业伙伴,还有巨大的成本压力。

Jalapeño不需要对外出售也能证明价值。只要它让ChatGPT回答更便宜、让Codex跑得更快、让API毛利更高,它就有意义。

OpenAI还提到,Jalapeño会减少数据传输,平衡计算、内存和网络资源,让实际利用率更接近理论峰值。算力贵很多时候贵在没被充分用起来,GPU等待网络,内存搬运拖慢计算,调度不佳造成空转,所有浪费最后都变成电费和资本开支。

采购价只是第一层,系统效率才是最后的账。

四、OpenAI越来越像苹果

很多人会把Jalapeño理解成OpenAI挑战英伟达,但我觉得OpenAI并不想成为下一家英伟达,更像是在学苹果。

苹果最厉害的地方从来不是某一个单点。iPhone强,iOS强,A系列和M系列芯片强,App Store强。但苹果真正难打的地方,是这些东西被放在同一个闭环里。

芯片为系统优化,系统为应用优化,应用体验再反过来定义下一代芯片。这套闭环让苹果可以在同样电池、同样体积、同样散热约束下,做出别人很难复制的体验。

OpenAI正在搭类似的东西。模型是智能内核,ChatGPT是超级入口,Codex是开发工具,API是生态分发层,Jalapeño是自研芯片,数据中心是AI工厂。

OpenAI CEO Altman这两年反复谈芯片、能源、核聚变、数据中心,现在看可能压根不是在追概念,他已经不再用AI创业公司的方式规划OpenAI了。

如果说英伟达卖铲子,那么OpenAI想拥有矿山。

英伟达要做所有AI公司的工厂设备供应商,卖GPU、卖网络、卖系统、卖软件生态、卖AI工厂方案,理想客户是每一个需要生产Token的公司。

OpenAI想给自己建一套工厂,卖的不是设备,是最终生成出来的智能。

短期看,OpenAI离不开英伟达。训练和通用计算仍然需要GPU平台,Jalapeño也不可能很快覆盖全部负载。它大概率先进入OpenAI最确定、规模最大、优化收益最高的推理场景。

长期看,裂缝已经出现。当模型公司开始拥有自己的芯片路线图,英伟达的客户就不再只是客户。它们也会成为AI基础设施的另一类玩家。

版面之外的话

过去二十年,互联网最重要的资产是流量。谁掌握用户,谁掌握价值。

今天,AI时代正在出现新的规律。

模型越来越像流量,而计算越来越像土地。

模型会迭代,产品会变化,排行榜会不断刷新。但那些生产智能的工厂,芯片、网络、数据中心、能源,会越来越集中在少数玩家手里。

GPT开始设计GPT,看起来只是一次流片。

但它真正宣告的事情是:

OpenAI已经不满足于成为最聪明的公司,它想成为控制智能生产的公司。

本文来自微信公众号:版面之外,作者:画画

本文来自微信公众号:版面之外,作者:画画,题图来自:AI生成

熱門幣種推薦

相關問答

QOpenAI设计首款芯片Jalapeño最重要的意义是什么?

A最重要的意义并非直接挑战英伟达,而是标志着OpenAI不再满足于只做一家模型公司,它开始寻求控制生产智能的整个过程,从模型、芯片到数据中心和能源,构建完整的‘智能生产’闭环。

Q文章中提到AI行业的新账本是什么?它与传统视角有何不同?

A新的账本单位是‘Token’,而非服务器或GPU的采购价格。核心在于评估每个Token的生产成本、吞吐量和最终带来的收入,而不是仅仅关注硬件本身的购买成本。这反映了AI时代价值评估从硬件资产向智能产出的转变。

Q为什么说Jalapeño芯片的九个月流片周期非常关键?这背后体现了OpenAI什么优势?

A九个月的流片周期远快于传统高性能ASIC项目(通常18-36个月)。这体现了OpenAI的关键优势:它拥有运行海量真实AI负载(如ChatGPT)的经验,能精准预测未来模型的运行需求,从而高效指导芯片设计。它甚至用自身模型加速了部分芯片设计流程。

Q文章将OpenAI的自研芯片策略类比为哪家科技公司的模式?这种模式的核心是什么?

A文章将OpenAI的策略类比为苹果公司的模式。这种模式的核心在于构建软硬一体的闭环:芯片为系统和应用优化,极致的应用体验又反过来定义下一代芯片。OpenAI正试图整合模型(内核)、产品(入口)、API(生态)和自研芯片,形成类似的、难以复制的综合优势。

Q根据文章观点,在AI时代,‘模型’和‘计算’分别被比作什么?这预示着行业竞争焦点将如何演变?

A模型被比作会不断迭代变化的‘流量’,而计算(芯片、数据中心、能源等)被比作固定的‘土地’。这预示着行业竞争焦点将从单一的模型能力比拼,转向对底层智能生产基础设施(即‘土地’)的控制和拥有,后者将构成更长期、更稳固的壁垒。

你可能也喜歡

黄仁勋:Prompt正在过时,Loop才是新范式

黄仁勋等AI领域领军人物提出,传统的“Prompt Engineering”(提示词工程)正在被“Loop Engineering”(循环工程)取代。新范式的核心是从手动编写具体指令,转变为设计和管理能够自动运行、自我验证并持续优化的循环系统。 **Loop是什么?** Loop(循环)指一种系统设计:用户设定一个目标,AI Agent(智能体)会自动执行任务,完成后由独立的验证机制(如另一个模型)进行验收;若未通过,则带着反馈重新执行,直至成功或达到预设限制。人的角色从“逐句指挥”转变为“规则设计者”。这与单纯使用Agent的关键区别在于,Loop为其提供了自主持续工作的管理框架。 **当前落地情况** 目前,Claude Code和OpenAI Codex是Loop理念的主要实践者。两者都实现了将复杂任务拆分,由多个Agent并行处理并汇总结果。其核心设计原则是“执行与验证分离”,以避免自我评分时的宽松问题。例如,“Claude Code之父”Boris Cherny描述其工作流:数百个Agent在隔离环境中自动处理问题,仅疑难事项才需人工干预。 **如何构建有效的Loop?** 1. **前提测试**:任务需具备重复性、可自动化验收、成本可控且Agent拥有必要工具。 2. **从最小可行Loop开始**:包含触发器、技能定义、状态记录文件和自动化验证门禁。务必先手动跑通流程再自动化。 3. **执行与验收分离**:必须由独立的Agent或模型进行验收,确保评估客观。 4. **避开常见陷阱**:设置硬性停止条件(如token上限)、持久化状态、不让Loop处理需要主观判断的任务、坚持阅读代码变更以维持理解。 5. **核心衡量指标**:关注“每个被采纳改动的平均成本”,接受率低于50%意味着Loop可能效率低下。 **范式演进路径** Loop的兴起是AI应用控制粒度不断上移的结果:从**Prompt Engineering**(优化单次指令)到**Context Engineering**(组织背景信息),再到**Harness Engineering**(构建执行环境),最终演进至**Loop Engineering**(设计自主循环系统)。这一过程逐步将人类从具体操作中解放出来。 **渊源与反思** Loop的理念在学术界早有雏形,例如姚顺雨等人提出的ReAct框架,将“推理-行动-观察”构建为循环。业界火爆的背后也需冷思考,专家提醒需警惕token成本,并指出“AI可以外包思考,但无法外包人的理解”,强调在自动化中保持对问题的根本认知至关重要。

marsbit55 分鐘前

黄仁勋:Prompt正在过时,Loop才是新范式

marsbit55 分鐘前

以太坊基金会临时执行董事发声:我们的使命是什么?

以太坊基金会(EF)临时联合执行董事 Aerugo 发文明确了基金会的核心使命:确保以太坊始终是真正无需许可、保障用户自主权的基础设施,能够抵御审查、开源自由、私密安全,并支持大规模的自主协调。 文章首先明确了EF的“不为”:不追求自身重要性或商业吸引力,不服务短期投机者,也不推广所有应用。其核心作用是“消除弱点”,防御以太坊在协议、访问、用户和机构各层可能出现的榨取性、控制性或监视性风险。具体工作重点包括: 1. **自身实践**:将EF薪酬与财务转向以太坊原生资产,以身作则使用其力图改进的技术栈。 2. **对抗有害MEV**:将其视为核心威胁而非次要市场问题,致力于从系统层面降低MEV提取,防止交易流程被特权供应链把控,维护可信中立执行。 3. **强化隐私**:认为缺乏严格隐私默认设置的公链实为监控平台,必须优先实现强大的无条件隐私保护。 4. **保障质押去中心化**:视质押为协议安全基石,防止其集中在少数发行者或运营商手中。 5. **维护访问层自主性**:确保用户和机构能自主、抗胁迫地访问以太坊,而非通过削弱其核心价值的妥协方式。 同时,EF也致力于“抓住机遇”,推动以太坊发展为:抗量子攻击的全球基础设施;具备完全自主可验证、最小化有害MEV的协议栈;私密、尊重尊严的普通数字现金与协调平台;用户拥有完整主权的个人AI代理钱包;以及在机构场景中凭借其可信中立性胜出,而非沦为后端工具。 文章最后提及了近期的人员变动与“衍生公司”问题,强调离职原因多样,EF尊重所有贡献者但不会公开讨论个人事宜。对于从EF分离出去的项目,EF将谨慎评估资助,标准在于其是否对实现以太坊核心使命(无需许可、自主权等)至关重要,而非出于人情或延续旧项目。EF明确表示对以太坊的发展方向并非中立,将全力支持并优先推进那些保障其核心特性的工作。

链捕手2 小時前

以太坊基金会临时执行董事发声:我们的使命是什么?

链捕手2 小時前

读博最后一年转方向,拿到OpenAI offer:我的面试之路充满「意外」

布朗大学博士生Yong Zheng-Xin(中文名应为“永正新”)将在下个月以Astra Fellow身份加入OpenAI,专注于AI安全研究(AI Safety Research)。他在博士最后一年从多语言大模型研究方向转向AI安全领域,并分享了求职过程中的六个“意外”发现: 1. **论文数量并非关键**:获得面试和工作机会,真正起作用的往往只有一两篇高质量论文,甚至无需论文,更看重当场解决问题的能力。 2. **面试形式高度多样**:除了常规技术面试,还可能涉及系统设计、并行编程,甚至考察使用AI智能体的能力。 3. **工作试用期渐成常态**:尤其是在AI初创公司,候选者可能需要与团队合作完成一项有时长达一周的有偿任务,这会影响同时准备其他面试。 4. **时机至关重要**:就业市场的热点、职位需求窗口期、个人研究作品的走红时机,都会极大影响求职过程和结果。 5. **研究职位鲜有“留用”机会**:与软件工程岗位不同,研究类职位(如实习、奖学金结束后)通常仍需经历完整的面试流程才能转正。 6. **面试内容常与研究方向无关**:尽管他转向了AI安全领域,但许多面试环节并未专门考察该领域的知识,而是评估其作为AI研究员的综合基础能力。 他建议,在准备面试时要广泛学习,夯实基础,并可根据情况合理要求调整面试时间。最终,他对自己能获得满意的工作机会感到庆幸。

marsbit2 小時前

读博最后一年转方向,拿到OpenAI offer:我的面试之路充满「意外」

marsbit2 小時前

交易

現貨
合約

熱門文章

如何購買PEOPLE

歡迎來到HTX.com!在這裡,購買ConstitutionDAO (PEOPLE)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買ConstitutionDAO (PEOPLE)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的ConstitutionDAO (PEOPLE)購買ConstitutionDAO (PEOPLE)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易ConstitutionDAO (PEOPLE)在HTX的現貨市場輕鬆交易ConstitutionDAO (PEOPLE)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

816 人學過發佈於 2024.12.12更新於 2026.06.02

如何購買PEOPLE

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 PEOPLE (PEOPLE)幣價的意見。

活动图片