GPT设计GPT

marsbitDipublikasikan tanggal 2026-06-25Terakhir diperbarui pada 2026-06-25

Abstrak

OpenAI推出其首款自研芯片Jalapeño,这标志着公司不再满足于仅做一家模型公司,而是开始控制智能生产的全链条。当前,模型能力的领先窗口正在缩短,真正的长期壁垒已转向底层基础设施——算力、推理成本与能源效率。Jalapeño是一款面向大模型推理的芯片,旨在降低OpenAI自身产品的Token生成成本,尤其是日常的推理开销。 该芯片仅用九个月完成流片,其关键在于OpenAI将运行ChatGPT等产品的实际负载经验融入了芯片设计,甚至利用AI辅助优化设计流程,形成了“AI设计芯片,芯片运行下一代AI”的闭环。这不仅能提升系统效率、削减“推理税”,还可能加速迭代,形成强大的业务飞轮。 此举并非简单挑战英伟达,而是效仿苹果构建软硬一体闭环的战略。OpenAI正整合模型、产品、API、芯片与数据中心,目标是成为控制智能生产的“矿山”,直接出售智能本身,而非依赖外部算力平台。这预示着AI行业的竞争核心正从模型本身,转向拥有计算工厂与全栈控制力的少数玩家。

OpenAI终于做芯片了。

很多人看到这条新闻,第一反应是:英伟达麻烦了。

但我看到的恰恰相反。

首款芯片Jalapeño最重要的意义,并非直奔着英伟达而来。

这是OpenAI第一次公开承认,自己不满足于做一家模型公司了。

它想控制的,是生产智能的整个过程。

从模型,到芯片。从数据中心,到能源。从训练,到推理。从生产Token,到销售Token。

Jalapeño表面是一颗芯片,实际上更像一张路线图。

OpenAI终于把自己的野心摆到了桌面上。

一、模型差距在缩小,计算差距在扩大

自从大模型爆发以来,AI行业几乎所有注意力都在模型。

GPT-4出来行业被震一次,Claude追上来,Gemini追上来,DeepSeek把性价比打出来,Meta推开源。每次发布大家盯着同一组东西:参数、榜单、代码能力、数学能力、长上下文、多模态。

模型当然重要。但一个变化已经出现,模型领先的窗口正在变短。今天一个模型刚发布,几个月后开源社区、竞争对手、云厂商就会跟上。能力差距仍然存在,但越来越难独立构成长期壁垒。

真正拉开差距的东西,开始往更底层走。算力供应、推理成本、系统吞吐、网络能力、数据中心建设、能源获取。没有模型发布那么好看,也不会立刻刷屏。但它们决定一家AI公司能不能长期跑下去。

黄仁勋最近说了一句话:英伟达系统也许不是采购价格最低的,但能生成成本最低的Token、最高的Token吞吐量,最终带来最高收入。

老黄这段话很直接。行业一直抱怨英伟达贵,黄仁勋没在采购价上辩解,而是把问题换到另一个维度:别看买机器花多少钱,要看每个Token的生产成本。

这就是AI时代新的账本。服务器和GPU不是最终单位,Token才是。

OpenAI恰好站在这个问题最中心。

ChatGPT每天处理海量请求,Codex要消耗更多推理步骤,未来还有Agent、视频生成、机器人、长推理链。模型越有用,Token消耗越大。产品越成功,推理账单越厚。

残酷的地方在这里,OpenAI用户越多,英伟达越赚钱。OpenAI产品越强,底层算力税越重。

如果每一个Token都要经过外部硬件平台收一道税,OpenAI就很难拥有完整的护城河。它可以有最强模型,有超级入口,有开发者生态。但最核心的生产成本始终卡在别人手里。

Jalapeño的本质就在这里。OpenAI开始自己造Token工厂。

二、GPT开始设计GPT

Jalapeño这款芯片最容易被低估的细节,是九个月流片。

传统高性能ASIC项目,周期通常18个月到36个月。先进工艺更麻烦,架构、验证、物理实现、封装、软件栈、调试,任何一环出问题成本迅速放大。OpenAI和博通把周期压到了九个月。

这不能理解成芯片行业突然变简单。OpenAI没有凭空长出一条半导体产业链。博通在定制芯片和网络基础设施上经验深厚,Celestica负责板卡、机架和系统工程。

OpenAI真正贡献的是更稀缺的东西,它知道未来模型要怎么跑。

很多芯片公司做AI加速器,难点在于猜负载。模型结构会变,推理方式会变,服务模式会变。芯片一旦流片,物理世界没有软件世界那么好回滚。

OpenAI不用完全靠猜。每天运行ChatGPT、Codex和API,知道哪些内核最常用,哪些内存搬运最浪费,哪些网络瓶颈最影响集群效率,哪些延迟会直接伤害产品体验。它还知道未来Agent产品会怎么消耗推理资源。

这些经验以前只是后台工程知识,现在被写进芯片架构。

在OpenAI的官方新闻稿里有一句话很关键:OpenAI使用自己的模型加速了部分设计和优化流程。还说,提供给用户的模型也在帮助改进运行未来模型的基础设施。

GPT开始参与设计下一代GPT的机器。

过去几十年芯片的链条是,先设计芯片,芯片运行软件,软件运行AI。现在链条开始回头,AI帮助人类设计芯片,芯片再运行下一代AI。

一旦这个闭环成立,九个月可能只是开始。未来可能是六个月、三个月,甚至更密集的迭代。

芯片行业过去有自己的节奏,模型行业有自己的节奏。前者慢后者快。Jalapeño把两个节奏往一起拉。

这一步如果走通,OpenAI的飞轮会变得很吓人。更好的模型帮助设计更好的芯片,更好的芯片降低下一代模型运行成本,更低成本支撑更多用户和产品,更多用户和产品带来更多真实负载数据,这些数据再反过来定义下一代芯片。

这才是OpenAI真正想要的循环。

三、削减推理税,控制现金流

Jalapeño不是训练芯片,它面向的是大语言模型推理。这点很关键。

训练像造航母。一次投入巨大,需要极强的通用能力,需要不断适配新模型新架构新实验。训练市场仍然高度依赖英伟达,不只是GPU,而是CUDA、网络、系统、软件库、开发者生态整套平台。

推理更像出租车队。每天跑,每小时跑,每分钟跑。用户每提一个问题,API每响应一次,Agent每推进一步,都要发生推理。它更在意低延迟、低成本、高吞吐、高利用率。

训练烧阶段性大钱,推理烧日常现金流。

这也是AI公司走到商业化阶段后最头疼的问题。GPT训练一次很贵,但推理每天都在发生。Agent时代会继续放大这个问题,一次任务可能包含几十次甚至几百次模型调用。长上下文、链式推理、多模态生成、代码执行,都在继续推高Token消耗。

Jalapeño瞄准的就是这笔推理税。它更像OpenAI自己的TPU。Google、亚马逊、Meta、微软都走过类似路线,只要负载足够大,自研ASIC就有高性价比的经济意义。

OpenAI现在具备这个条件。有真实请求、有产品路线、有模型团队、有博通这样的产业伙伴,还有巨大的成本压力。

Jalapeño不需要对外出售也能证明价值。只要它让ChatGPT回答更便宜、让Codex跑得更快、让API毛利更高,它就有意义。

OpenAI还提到,Jalapeño会减少数据传输,平衡计算、内存和网络资源,让实际利用率更接近理论峰值。算力贵很多时候贵在没被充分用起来,GPU等待网络,内存搬运拖慢计算,调度不佳造成空转,所有浪费最后都变成电费和资本开支。

采购价只是第一层,系统效率才是最后的账。

四、OpenAI越来越像苹果

很多人会把Jalapeño理解成OpenAI挑战英伟达,但我觉得OpenAI并不想成为下一家英伟达,更像是在学苹果。

苹果最厉害的地方从来不是某一个单点。iPhone强,iOS强,A系列和M系列芯片强,App Store强。但苹果真正难打的地方,是这些东西被放在同一个闭环里。

芯片为系统优化,系统为应用优化,应用体验再反过来定义下一代芯片。这套闭环让苹果可以在同样电池、同样体积、同样散热约束下,做出别人很难复制的体验。

OpenAI正在搭类似的东西。模型是智能内核,ChatGPT是超级入口,Codex是开发工具,API是生态分发层,Jalapeño是自研芯片,数据中心是AI工厂。

OpenAI CEO Altman这两年反复谈芯片、能源、核聚变、数据中心,现在看可能压根不是在追概念,他已经不再用AI创业公司的方式规划OpenAI了。

如果说英伟达卖铲子,那么OpenAI想拥有矿山。

英伟达要做所有AI公司的工厂设备供应商,卖GPU、卖网络、卖系统、卖软件生态、卖AI工厂方案,理想客户是每一个需要生产Token的公司。

OpenAI想给自己建一套工厂,卖的不是设备,是最终生成出来的智能。

短期看,OpenAI离不开英伟达。训练和通用计算仍然需要GPU平台,Jalapeño也不可能很快覆盖全部负载。它大概率先进入OpenAI最确定、规模最大、优化收益最高的推理场景。

长期看,裂缝已经出现。当模型公司开始拥有自己的芯片路线图,英伟达的客户就不再只是客户。它们也会成为AI基础设施的另一类玩家。

版面之外的话

过去二十年,互联网最重要的资产是流量。谁掌握用户,谁掌握价值。

今天,AI时代正在出现新的规律。

模型越来越像流量,而计算越来越像土地。

模型会迭代,产品会变化,排行榜会不断刷新。但那些生产智能的工厂,芯片、网络、数据中心、能源,会越来越集中在少数玩家手里。

GPT开始设计GPT,看起来只是一次流片。

但它真正宣告的事情是:

OpenAI已经不满足于成为最聪明的公司,它想成为控制智能生产的公司。

本文来自微信公众号:版面之外,作者:画画

本文来自微信公众号:版面之外,作者:画画,题图来自:AI生成

Kripto yang Sedang Tren

Pertanyaan Terkait

QOpenAI设计首款芯片Jalapeño最重要的意义是什么?

A最重要的意义并非直接挑战英伟达,而是标志着OpenAI不再满足于只做一家模型公司,它开始寻求控制生产智能的整个过程,从模型、芯片到数据中心和能源,构建完整的‘智能生产’闭环。

Q文章中提到AI行业的新账本是什么?它与传统视角有何不同?

A新的账本单位是‘Token’,而非服务器或GPU的采购价格。核心在于评估每个Token的生产成本、吞吐量和最终带来的收入,而不是仅仅关注硬件本身的购买成本。这反映了AI时代价值评估从硬件资产向智能产出的转变。

Q为什么说Jalapeño芯片的九个月流片周期非常关键?这背后体现了OpenAI什么优势?

A九个月的流片周期远快于传统高性能ASIC项目(通常18-36个月)。这体现了OpenAI的关键优势:它拥有运行海量真实AI负载(如ChatGPT)的经验,能精准预测未来模型的运行需求,从而高效指导芯片设计。它甚至用自身模型加速了部分芯片设计流程。

Q文章将OpenAI的自研芯片策略类比为哪家科技公司的模式?这种模式的核心是什么?

A文章将OpenAI的策略类比为苹果公司的模式。这种模式的核心在于构建软硬一体的闭环:芯片为系统和应用优化,极致的应用体验又反过来定义下一代芯片。OpenAI正试图整合模型(内核)、产品(入口)、API(生态)和自研芯片,形成类似的、难以复制的综合优势。

Q根据文章观点,在AI时代,‘模型’和‘计算’分别被比作什么?这预示着行业竞争焦点将如何演变?

A模型被比作会不断迭代变化的‘流量’,而计算(芯片、数据中心、能源等)被比作固定的‘土地’。这预示着行业竞争焦点将从单一的模型能力比拼,转向对底层智能生产基础设施(即‘土地’)的控制和拥有,后者将构成更长期、更稳固的壁垒。

Bacaan Terkait

Label 'ghain hantu' Cardano terbantahkan? Mengapa 34 dApp ADA tidak menggambarkan keseluruhan cerita

Judul artikel membantah label "rantai hantu" yang dilekatkan pada Cardano, dengan menjelaskan mengapa hanya memiliki 34 dApps tidak menggambarkan situasi sebenarnya. Artikel ini mendefinisikan "rantai hantu" sebagai blockchain yang berjalan secara teknis namun memiliki aktivitas on-chain dan pengembangan yang sangat minimal. Sementara Cardano menunjukkan aktivitas pengembangan yang kuat (tertinggi kedua di antara Layer-1 utama), metrik seperti jumlah dApps, transaksi, dan pengguna aktifnya jauh di bawah pesaing seperti Ethereum, Solana, atau TRON. Penulis mengakui faktor-faktor yang dikritik, seperti penutupan explorer TapTools dan peringatan pendiri Charles Hoskinson mengenai tantangan proyek dApp. Namun, penjelasan utama untuk kesenjangan aktivitas ini terletak pada model Extended Unspent Transaction Output (EUTXO) Cardano. Model ini memungkinkan protokol "batcher" menggabungkan banyak pesanan menjadi satu transaksi teroptimasi sebelum dicatat di ledger, yang mengakibatkan perkiraan aktivitas on-chain yang lebih rendah secara statistik. Kesimpulannya, meskipun aktivitas jaringan Cardano lebih rendah, hal itu tidak serta-merta membuatnya menjadi "rantai hantu". Perbedaan arsitektur (EUTXO) dan fokusnya pada keamanan, keberlanjutan, serta metodologi pengembangan yang ketat menempatkannya dalam ceruk yang unik untuk kepatuhan institusional dan kebutuhan perusahaan, dibandingkan dengan blockchain lain yang mengutamakan throughput tinggi atau volume DeFi.

ambcrypto4m yang lalu

Label 'ghain hantu' Cardano terbantahkan? Mengapa 34 dApp ADA tidak menggambarkan keseluruhan cerita

ambcrypto4m yang lalu

Claude dan Codex yang Kamu Pakai Setiap Hari, Di Dalam Meta Dilarang Dipakai Sembarangan

Meta, perusahaan induk Facebook, telah memberlakukan pembatasan internal ketat terhadap penggunaan alat bantu pemrograman AI dari pihak ketiga, Claude Code (Anthropic) dan Codex (OpenAI), sejak Mei 2024. Meski merupakan salah satu klien terbesar dan sangat bergantung pada alat-alat ini, Meta khawatir output yang dihasilkan dapat menyusup ke dalam data pelatihan untuk pengembangan asisten pemrograman AI internal mereka sendiri, MetaCode (awalnya DevMate). Proses ini, yang dikenal sebagai "distilasi," dapat menyebabkan model internal mereka secara tidak sengaja mempelajari kemampuan dan standar penilaian dari model pesaing, sehingga mengaburkan asal-usul kemampuan mereka yang sebenarnya. Pembatasan internal Meta berfokus pada mencegah AI eksternal terlibat dalam penulisan kode inti, pembuatan soal uji, atau penilaian untuk proyek MetaCode. AI masih diizinkan untuk tugas-tugas pendukung seperti menyusun alur kerja atau mengatur kode, tetapi semua outputnya harus ditinjau oleh manusia. Langkah ini dimaksudkan untuk menjaga kemurnian data pelatihan dan menghindari potensi pelanggaran terhadap ketentuan layanan penyedia model, yang sering melarang penggunaan output mereka untuk membangun produk pesaing. Tindakan Meta menyoroti dilema yang dihadapi seluruh industri AI: bagaimana menyeimbangkan manfaat menggunakan model AI yang kuat dengan risiko ketergantungan dan distilasi yang tidak jelas. Ini juga mencerminkan tekanan finansial, karena Meta berupaya mengurangi tagihan AI internal yang mencapai miliaran dolar dengan beralih ke solusi internal. Pada akhirnya, kebijakan ini bagaikan "peta berjalan di atas tali" yang menunjukkan tantangan dalam membangun AI yang benar-benar orisinal di era di mana AI semakin sering digunakan untuk menciptakan AI lainnya.

marsbit1j yang lalu

Claude dan Codex yang Kamu Pakai Setiap Hari, Di Dalam Meta Dilarang Dipakai Sembarangan

marsbit1j yang lalu

Mengapa Hari Ini Kita Membutuhkan Pandangan Konten AI?

Terkait kontroversi etis di industri hiburan global terkait konten AI, seperti proyek animasi AI Amazon yang dibatalkan, dan kemunculan film panjang AI pertama yang lolos sensor di Tiongkok, AI telah mencapai tonggak sejarah baru dalam produksi konten. Namun, kemajuan ini juga memicu perdebatan sengit, terutama mengenai penggantian aktor manusia dan kualitas artistik. Industri menghadapi dilema "pertarungan internal": di satu sisi, AI tak terhindarkan dalam produksi film, menawarkan efisiensi biaya dan kemungkinan kreatif baru. Di sisi lain, kekhawatiran mendalam muncul karena AI mulai memasuki ranah "makanan budaya utama" seperti film dan drama panjang, yang secara tradisional membutuhkan kedalaman emosional dan partisipasi manusia. Artikel ini membedakan antara "makanan budaya cepat saji" (seperti video pendek dan drama mikro) yang cocok dengan logika produksi AI—narasifragmen, kebutuhan emosi dangkal, dan model bisnis gratis—dan "makanan budaya utama" (seperti film dan serial TV) yang membutuhkan keterlibatan manusia yang lebih dalam. AI saat ini lebih mampu dalam yang pertama, tetapi masuknya AI ke dalam yang terakhir menantang keunikan manusia dalam hal kreativitas, pengalaman hidup, dan pertukaran emosi. Nilai manusia dalam penciptaan konten dianggap tak tergantikan dalam tiga aspek: kapasitas inovasi (AI cenderung menghasilkan konten homogen, bukan terobosan), hasil kerja keras (proses pembuatan yang panjang menambah nilai persepsi), dan pengalaman hidup serta ekspresi pribadi. Namun, perkembangan konten AI menghadapi risiko "melampaui batas": keunggulan biaya dapat mempersempit ruang kreasi manusia dan menimbulkan masalah plagiarisme; ledakan produksi dapat menyebabkan banjir konten berkualitas rendah yang mendorong keluar karya bagus; dan peningkatan efisiensi memindahkan risiko ke depan dalam proses produksi, menyulitkan moderasi. Oleh karena itu, diperlukan "perspektif konten AI" baru yang menetapkan batasan jelas. Prinsip intinya adalah: memastikan ruang kreasi manusia diperluas, bukan dipersempit; hasil kreasi manusia dihormati, bukan dirampas; manusia mempertahankan peran kepemimpinan dan tanggung jawab dalam penciptaan; serta memastikan transparansi dan dapat dikenalnya konten AI. Kesimpulannya, manusia harus menjadi "juru mudi" teknologi. Masa depan konten AI harus menjadi perjalanan yang dikendalikan oleh manusia, di mana penilaian, filter, dan apresiasi estetika manusia di setiap tahap—produksi, distribusi, konsumsi—menjadi lebih penting dari sebelumnya untuk melindungi nilai inti budaya sebagai wahana pertukaran spiritual manusia.

marsbit2j yang lalu

Mengapa Hari Ini Kita Membutuhkan Pandangan Konten AI?

marsbit2j yang lalu

Trading

Spot

Artikel Populer

Cara Membeli PEOPLE

Selamat datang di HTX.com! Kami telah membuat pembelian ConstitutionDAO (PEOPLE) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli ConstitutionDAO (PEOPLE) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan ConstitutionDAO (PEOPLE) AndaSetelah melakukan pembelian, simpan ConstitutionDAO (PEOPLE) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading ConstitutionDAO (PEOPLE)Lakukan trading ConstitutionDAO (PEOPLE) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

663 Total TayanganDipublikasikan pada 2024.12.12Diperbarui pada 2026.06.02

Cara Membeli PEOPLE

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga PEOPLE (PEOPLE) disajikan di bawah ini.

活动图片