GPT diseña GPT

marsbitPublié le 2026-06-25Dernière mise à jour le 2026-06-25

Résumé

OpenAI ha presentado su primer chip, Jalapeño, un cambio estratégico que va más allá de competir con Nvidia. La empresa busca controlar todo el proceso de producción de inteligencia artificial, desde los modelos hasta el hardware, la energía y los centros de datos. La brecha entre modelos líderes se está reduciendo, mientras que la ventaja competitiva se desplaza a capas más profundas: suministro de computación, costes de inferencia y eficiencia de sistemas. Cada token generado implica un costo, y OpenAI, con productos de gran consumo como ChatGPT, necesita reducir esta "tasa de inferencia" para fortalecer su rentabilidad y defensa competitiva a largo plazo. Jalapeño, un chip ASIC optimizado para inferencia de modelos de lenguaje, fue desarrollado en solo nueve meses con Broadcom. Este plazo résubevela la ventaja clave de OpenAI: utiliza su propio conocimiento interno sobre cómo se ejecutan sus modelos masivos en producción para guiar el diseño del hardware. Esencialmente, GPT ayuda a diseñar las máquinas que ejecutarán la próxima generación de GPT, creando un ciclo de retroalimentación potente. El enfoque en la inferencia es crucial porque, a diferencia del entrenamiento (una inversión puntual enorme), la inferencia consume el flujo de caja diario. Al optimizarla, OpenAI reduce costes operativos fundamentales para su escalabilidad comercial, especialmente con futuros agentes de IA que realizarán cadenas largas de razonamiento. Este movimiento refleja una ambición mayor: ...

OpenAI finalmente fabrica chips.

Muchos, al ver esta noticia, reaccionan pensando: NVIDIA está en problemas.

Pero yo veo precisamente lo contrario.

La importancia más crucial del primer chip, Jalapeño, no es enfrentarse directamente a NVIDIA.

Esta es la primera vez que OpenAI admite públicamente que no se conforma con ser solo una empresa de modelos.

Lo que quiere controlar es todo el proceso de producción de inteligencia.

Desde el modelo, hasta el chip. Desde el centro de datos, hasta la energía. Desde el entrenamiento, hasta la inferencia. Desde la producción de Tokens, hasta su venta.

Jalapeño, superficialmente es un chip, pero en realidad se parece más a una hoja de ruta.

OpenAI finalmente ha puesto su ambición sobre la mesa.

I. La brecha en modelos se reduce, la brecha en computación se amplía

Desde que estallaron los grandes modelos, casi toda la atención de la industria de la IA ha estado en los modelos.

GPT-4 sorprendió a la industria una vez, luego Claude alcanzó, Gemini alcanzó, DeepSeek demostró su relación calidad-precio, Meta abrió el código. Cada lanzamiento, todos miran lo mismo: parámetros, rankings, capacidad de código, habilidad matemática, contexto largo, multimodalidad.

Los modelos son importantes, por supuesto. Pero está ocurriendo un cambio: la ventana de ventaja en modelos se está acortando. Hoy un modelo acaba de lanzarse y, en meses, la comunidad de código abierto, competidores y proveedores de la nube lo alcanzan. La brecha de capacidad aún existe, pero cada vez es más difícil que constituya una barrera a largo plazo por sí sola.

Lo que realmente abre la brecha empieza a desplazarse hacia capas más profundas. Suministro de potencia de cómputo, costo de inferencia, rendimiento del sistema, capacidad de red, construcción de centros de datos, acceso a energía. No son tan llamativos como un lanzamiento de modelo, ni acaparan titulares de inmediato. Pero son los que determinan si una empresa de IA puede mantenerse a largo plazo.

Jensen Huang dijo recientemente: "Es posible que los sistemas NVIDIA no sean los de menor precio de compra, pero pueden generar los Tokens con menor costo, el mayor rendimiento de Tokens y, en última instancia, los mayores ingresos".

Las palabras de Huang son directas. La industria se queja de que NVIDIA es cara. Huang no se defiende en el precio de compra, sino que cambia el problema a otra dimensión: "No mires cuánto cuesta comprar la máquina, mira cuánto cuesta producir cada Token".

Este es el nuevo libro de cuentas de la era de la IA. Los servidores y las GPU no son la unidad final, el Token lo es.

OpenAI está justo en el centro de este problema.

ChatGPT procesa una enorme cantidad de solicitudes diariamente, Codex consume más pasos de inferencia, y en el futuro habrá Agent, generación de video, robots, cadenas de razonamiento largas. Cuanto más útil es el modelo, mayor es el consumo de Tokens. Cuanto más exitoso es el producto, más gruesa es la factura de inferencia.

Lo cruel está aquí: cuantos más usuarios tenga OpenAI, más dinero ganará NVIDIA. Cuanto más fuertes sean los productos de OpenAI, más pesado será el impuesto en la potencia de cómputo subyacente.

Si cada Token tiene que pasar por una plataforma de hardware externa y pagar un impuesto, es difícil que OpenAI tenga una barrera de defensa completa. Puede tener el modelo más fuerte, la superpuerta de entrada, el ecosistema de desarrolladores. Pero el costo de producción más central siempre está en manos de otro.

La esencia de Jalapeño está justo aquí. OpenAI comienza a construir su propia fábrica de Tokens.

II. GPT comienza a diseñar GPT

El detalle más fácilmente subestimado del chip Jalapeño es su flujo de fabricación de nueve meses.

Los proyectos tradicionales de ASIC de alto rendimiento suelen tener ciclos de 18 a 36 meses. Con procesos avanzados es más complicado: arquitectura, verificación, implementación física, empaquetado, pila de software, depuración... cualquier problema en algún eslabón multiplica rápidamente los costos. OpenAI y Broadcom redujeron el ciclo a nueve meses.

Esto no se puede interpretar como que la industria de los chips de repente se volvió simple. OpenAI no generó de la nada una cadena de suministro de semiconductores. Broadcom tiene una profunda experiencia en chips personalizados e infraestructura de red, Celestica se encarga de las tarjetas, bastidores y sistemas de ingeniería.

Lo que realmente aporta OpenAI es algo más escaso: sabe cómo van a ejecutarse los modelos futuros.

Muchas empresas de chips que fabrican aceleradores de IA tienen dificultades para adivinar la carga de trabajo. La estructura del modelo cambiará, la forma de inferencia cambiará, el modo de servicio cambiará. Una vez que un chip sale a producción, en el mundo físico no es tan fácil revertir cambios como en el software.

OpenAI no tiene que adivinar completamente. Ejecuta ChatGPT, Codex y la API diariamente, sabe qué núcleos se usan más, qué transferencias de memoria son más desperdiciadas, qué cuellos de botella de red afectan más la eficiencia del clúster, qué latencia daña directamente la experiencia del producto. También sabe cómo consumirán recursos de inferencia los futuros productos de Agent.

Este conocimiento antes era solo información de ingeniería en segundo plano; ahora se escribe en la arquitectura del chip.

En el comunicado oficial de OpenAI hay una frase clave: "OpenAI utilizó sus propios modelos para acelerar parte del proceso de diseño y optimización". También dice: "Los modelos que proporcionamos a los usuarios también están ayudando a mejorar la infraestructura que ejecutará futuros modelos".

GPT comienza a participar en el diseño de las máquinas para la próxima generación de GPT.

La cadena de los chips en las últimas décadas era: primero diseñar el chip, luego el chip ejecuta el software, y el software ejecuta la IA. Ahora la cadena comienza a dar la vuelta: la IA ayuda a los humanos a diseñar chips, y los chips ejecutan la próxima generación de IA.

Una vez que este ciclo se establezca, nueve meses pueden ser solo el comienzo. En el futuro, podrían ser seis meses, tres meses, o iteraciones aún más frecuentes.

La industria de chips tenía su propio ritmo, la industria de modelos tenía su propio ritmo. El primero era lento, el segundo rápido. Jalapeño acerca ambos ritmos.

Si este paso tiene éxito, el volante de inercia de OpenAI se volverá aterrador. Mejores modelos ayudan a diseñar mejores chips, mejores chips reducen el costo de ejecución de la próxima generación de modelos, costos más bajos sustentan más usuarios y productos, más usuarios y productos generan más datos de carga de trabajo real, y esos datos a su vez definen la próxima generación de chips.

Este es el ciclo que OpenAI realmente desea.

III. Reducir el impuesto de inferencia, controlar el flujo de caja

Jalapeño no es un chip de entrenamiento; está orientado a la inferencia de grandes modelos de lenguaje. Esto es clave.

El entrenamiento es como construir un portaaviones. Requiere una enorme inversión única, una capacidad general extremadamente fuerte y una adaptación constante a nuevos modelos, arquitecturas y experimentos. El mercado del entrenamiento sigue dependiendo en gran medida de NVIDIA, no solo por las GPU, sino por toda la plataforma: CUDA, red, sistema, bibliotecas de software, ecosistema de desarrolladores.

La inferencia se parece más a una flota de taxis. Corre todos los días, cada hora, cada minuto. Cada vez que un usuario hace una pregunta, la API responde una vez, un Agent avanza un paso, se produce inferencia. Está más preocupada por la baja latencia, el bajo costo, el alto rendimiento y la alta utilización.

El entrenamiento quema grandes cantidades de dinero en etapas; la inferencia quema el flujo de caja diario.

Este es también el problema más doloroso para las empresas de IA que llegan a la etapa comercial. Entrenar GPT una vez es caro, pero la inferencia ocurre todos los días. La era de los Agent amplificará este problema: una tarea puede contener decenas o incluso cientos de llamadas al modelo. El contexto largo, el razonamiento en cadena, la generación multimodal, la ejecución de código, siguen aumentando el consumo de Tokens.

Jalapeño apunta precisamente a este impuesto de inferencia. Se parece más al TPU propio de OpenAI. Google, Amazon, Meta, Microsoft han seguido caminos similares: si la carga de trabajo es lo suficientemente grande, el ASIC autodiseñado tiene sentido económico por su alta relación costo-beneficio.

OpenAI ahora cumple con estas condiciones. Tiene solicitudes reales, una hoja de ruta de productos, un equipo de modelos, socios industriales como Broadcom y una enorme presión de costos.

Jalapeño no necesita venderse externamente para demostrar su valor. Mientras haga que las respuestas de ChatGPT sean más baratas, que Codex funcione más rápido, que el margen de la API sea mayor, tiene sentido.

OpenAI también menciona que Jalapeño reducirá la transferencia de datos, equilibrará los recursos de cómputo, memoria y red, y hará que la utilización real se acerque más al pico teórico. La potencia de cómputo a menudo es cara porque no se utiliza plenamente: la GPU espera por la red, la transferencia de memoria ralentiza el cómputo, una programación deficiente causa ralentización, y todo el desperdicio finalmente se convierte en facturas de electricidad y gastos de capital.

El precio de compra es solo la primera capa; la eficiencia del sistema es la cuenta final.

IV. OpenAI se parece cada vez más a Apple

Muchos interpretarán a Jalapeño como OpenAI desafiando a NVIDIA, pero yo creo que OpenAI no quiere convertirse en la próxima NVIDIA, sino que está aprendiendo de Apple.

El punto más fuerte de Apple nunca ha sido un solo aspecto. El iPhone es fuerte, iOS es fuerte, los chips de la serie A y M son fuertes, la App Store es fuerte. Pero lo realmente difícil de superar de Apple es que todas estas cosas están dentro del mismo ciclo cerrado.

Los chips se optimizan para el sistema, el sistema se optimiza para las aplicaciones, y la experiencia de la aplicación a su vez define la siguiente generación de chips. Este ciclo cerrado permite a Apple, bajo las mismas limitaciones de batería, volumen y disipación de calor, crear experiencias difíciles de replicar para otros.

OpenAI está construyendo algo similar. El modelo es el núcleo de inteligencia, ChatGPT es la superpuerta de entrada, Codex es la herramienta de desarrollo, la API es la capa de distribución del ecosistema, Jalapeño es el chip autodiseñado, y el centro de datos es la fábrica de IA.

El CEO de OpenAI, Altman, ha hablado repetidamente en los últimos dos años sobre chips, energía, fusión nuclear, centros de datos. Ahora parece que no estaba persiguiendo conceptos; ya no está planificando OpenAI como una startup de IA.

Si NVIDIA vende palas, entonces OpenAI quiere poseer la mina.

NVIDIA quiere ser el proveedor de equipos de fábrica para todas las empresas de IA, vendiendo GPU, red, sistemas, ecosistema de software, soluciones para fábricas de IA. El cliente ideal es cualquier empresa que necesite producir Tokens.

OpenAI quiere construir su propia fábrica, no vender equipos, sino la inteligencia generada finalmente.

A corto plazo, OpenAI no puede prescindir de NVIDIA. El entrenamiento y la computación general aún requieren la plataforma GPU, y Jalapeño difícilmente cubrirá rápidamente todas las cargas de trabajo. Probablemente entrará primero en los escenarios de inferencia más seguros, de mayor escala y con mayor beneficio de optimización para OpenAI.

A largo plazo, la grieta ya ha aparecido. Cuando las empresas de modelos comienzan a tener su propia hoja de ruta de chips, los clientes de NVIDIA dejan de ser solo clientes. También se convertirán en otro tipo de jugador en la infraestructura de IA.

Más allá de la superficie

En los últimos veinte años, el activo más importante de Internet era el tráfico. Quien controlaba a los usuarios, controlaba el valor.

Hoy, en la era de la IA, está surgiendo una nueva regla.

Los modelos se parecen cada vez más al tráfico, y la computación se parece cada vez más a la tierra.

Los modelos evolucionarán, los productos cambiarán, los rankings se actualizarán constantemente. Pero las fábricas que producen inteligencia —chips, red, centros de datos, energía— se concentrarán cada vez más en manos de unos pocos jugadores.

GPT comienza a diseñar GPT, parece ser solo una fabricación de chips.

Pero lo que realmente anuncia es:

OpenAI ya no se conforma con ser la empresa más inteligente, quiere ser la empresa que controla la producción de inteligencia.

Este artículo proviene del WeChat Official Account:Más allá de la superficie, autor: Huahua

Este artículo proviene del WeChat Official Account:Más allá de la superficie, autor: Huahua, imagen del tema generada por IA

Cryptos en tendance

Questions liées

Q¿Cuál es la principal razón por la que OpenAI ha desarrollado su propio chip, Jalapeño, según el artículo?

ALa principal razón no es competir directamente con Nvidia, sino reducir la 'tasa de inferencia' (costo por token) y controlar todo el proceso de producción de inteligencia, desde el modelo y el chip hasta el centro de datos y la energía, para construir una barrera defensiva más completa.

Q¿Por qué el artículo señala que el ciclo de diseño de solo nueve meses para Jalapeño es un detalle significativo?

APorque un ciclo de diseño de nueve meses es extremadamente rápido para un ASIC de alto rendimiento, lo que sugiere que OpenAI utilizó su profundo conocimiento de las cargas de trabajo reales de sus modelos (como ChatGPT) y posiblemente la ayuda de IA para optimizar el proceso, cerrando el ciclo de retroalimentación entre el diseño de chips y el desarrollo de modelos.

Q¿En qué se diferencia la importancia del entrenamiento y la inferencia en el contexto de los costos de una empresa de IA, según se explica en el texto?

AEl entrenamiento es una inversión grande y puntual (como construir un portaaviones), mientras que la inferencia es un gasto recurrente de flujo de caja (como una flota de taxis). Con productos como ChatGPT y la era de los agentes, el consumo diario de tokens en inferencia es masivo, por lo que reducir su costo es crucial para la rentabilidad a largo plazo.

QSegún la analogía del artículo, ¿en qué se parece la estrategia de OpenAI a la de Apple?

AOpenAI se parece a Apple en que está construyendo un ecosistema cerrado e integrado. Así como Apple combina hardware (chip), software (iOS) y servicios (App Store) para una experiencia óptima, OpenAI quiere integrar su modelo (cerebro), productos (ChatGPT), API, chips propios (Jalapeño) y centros de datos para controlar todo el proceso de producción y venta de inteligencia.

Q¿Qué cambio fundamental en los activos clave de la industria pronostica el artículo para la era de la IA?

APronostica que el activo clave está cambiando. En la era de Internet era el tráfico (usuarios). En la era de la IA, los modelos son como el nuevo 'tráfico' (cambian y compiten), pero la 'tierra' (la base de producción) serán las fábricas de inteligencia: chips, redes, centros de datos y energía, que tenderán a concentrarse en pocos jugadores.

Lectures associées

À l'ère de l'IA, que reste-t-il au Bitcoin ?

La chute récente du Bitcoin sous les 60 000 dollars relance la réflexion sur sa valeur à l'ère de l'IA. Alors que l'intelligence artificielle réduit à presque zéro le coût de production de l'information et génère des contenus (textes, images, vidéos) de plus en plus réalistes, un nouveau défi émerge : la crise de la véracité. Dans ce contexte de prolifération où le vrai et le faux sont indissociables, ce qui devient précieux n'est plus l'abondance de contenus, mais la capacité à vérifier leur authenticité, la "vérifiabilité". C'est ici que la perspective sur le Bitcoin se renverse. Souvent critiqué pour sa consommation énergétique élevée, il n'est peut-être pas simplement une machine à créer de la monnaie numérique. Son mécanisme de preuve de travail (minage) brûle de l'énergie non pas pour accélérer les calculs, mais pour rendre extrêmement coûteuse toute tentative de falsification de son registre historique, la blockchain. Ainsi, le Bitcoin produit de la "vérifiabilité". Il ne requiert pas la confiance en une institution centrale (banque, plateforme), mais permet à chacun de vérifier mathématiquement l'intégrité du grand livre des transactions. Une analogie historique éclaire cette complémentarité potentielle : à la Renaissance, l'imprimerie de Gutenberg a drastiquement réduit le coût de reproduction des connaissances, tandis que la comptabilité en partie double a structuré et fiabilisé les échanges commerciaux. Aujourd'hui, l'IA jouerait le rôle de la nouvelle presse à imprimer, inondant le monde de contenus. La blockchain, dont le Bitcoin est la première incarnation, pourrait être l'équivalent moderne de la comptabilité en partie double – un système fondamental pour l'enregistrement et la vérification indépendante dans l'univers numérique, notamment pour les actifs et leur historique. Par conséquent, l'IA et la blockchain ne seraient pas en compétition, mais plutôt les deux faces d'une même pièce : l'une abaisse le coût de la création et de la génération, l'autre le coût de la vérification et de la preuve. Dans un monde où l'IA peut tout générer, la rareté ultime pourrait bien résider non pas dans plus de contenus, mais dans plus de faits indépendamment vérifiables. Le Bitcoin, en tant que "machine à produire de la vérifiabilité", trouve peut-être ainsi une nouvelle raison d'être, au-delà des spéculations sur son prix.

链捕手Il y a 26 mins

À l'ère de l'IA, que reste-t-il au Bitcoin ?

链捕手Il y a 26 mins

Le label 'chaîne fantôme' de Cardano démystifié ? Pourquoi les 34 dApps d'ADA ne racontent pas toute l'histoire

L'article traite de l'étiquette de "chaîne fantôme" parfois attribuée à Cardano (ADA) en raison de son activité on-chain et de son nombre d'applications décentralisées (dApps) nettement inférieurs à ceux de ses principaux concurrents comme Ethereum et Solana. L'auteur définit d'abord une "chaîne fantôme" comme une blockchain techniquement opérationnelle mais avec très peu d'activité et de développement. Il passe ensuite en revue les forces des principales blockchains de couche 1 : Ethereum pour la DeFi, XRP pour les règlements transfrontaliers, Solana pour le débit, Tron pour les transferts USDT et Bitcoin comme réserve de valeur. Concernant Cardano, l'article reconnaît des signes de faiblesse : la fermeture de l'explorateur TapTools, des avertissements sur la possible disparition de projets et seulement 34 dApps. Cependant, il souligne que son activité de développement reste forte. L'explication principale avancée pour justifier le faible nombre de transactions et d'utilisateurs actifs est le modèle technique unique de Cardano, l'EUTXO (Extended Unspent Transaction Output), qui regroupe (batch) les transactions. Cette fonctionnalité, bien qu'avantageuse pour la sécurité et la détermination, sous-estime l'activité réelle sur la chaîne. La conclusion est que si Cardano affiche des métriques d'activité bien inférieures, son modèle technique spécifique et son approche méthodique axée sur la sécurité et la durabilité l'empêchent d'être simplement catalogué comme une "chaîne fantôme". Chaque blockchain sacrifie certains aspects du trilemme (décentralisation, sécurité, évolutivité) pour se spécialiser dans un créneau.

ambcryptoIl y a 1 h

Le label 'chaîne fantôme' de Cardano démystifié ? Pourquoi les 34 dApps d'ADA ne racontent pas toute l'histoire

ambcryptoIl y a 1 h

UK FCA dévoile son livre de règles pour les cryptomonnaies : Approche basée sur les risques débutant en octobre 2027

Le régulateur financier britannique (FCA) a dévoilé un nouveau cadre réglementaire pour le secteur de la cryptomonnaie, qui entrera en vigueur en octobre 2027. Plutôt qu’une approche uniforme, cette réglementation adopte une méthode basée sur les risques : les entreprises devront détenir des capitaux proportionnés à leur exposition au risque et réaliser leurs propres tests de résistance annuels. Les petites structures et celles présentant moins de risques bénéficieront d’obligations de déclaration allégées pour réduire leurs coûts de conformité. La FCA supervisera les évaluations des entreprises sans imposer de règles identiques à toutes, dans le but de renforcer la confiance sur le marché et d’attirer 3 à 4 millions d’utilisateurs supplémentaires au Royaume-Uni. Concernant les stablecoins, le cadre maintient des protections pour les consommateurs – comme la détention des réserves sous un trust légal – tout en assouplissant certaines exigences. Les émetteurs jugés systémiques pourraient toutefois faire face à une surveillance renforcée. Cette initiative vise à offrir une clarté réglementaire tout en tenant compte des spécificités du secteur, bien que certains acteurs alertent sur les risques d’appliquer des règles conçues pour la finance traditionnelle à des infrastructures décentralisées.

ambcryptoIl y a 2 h

UK FCA dévoile son livre de règles pour les cryptomonnaies : Approche basée sur les risques débutant en octobre 2027

ambcryptoIl y a 2 h

Trading

Spot

Articles tendance

Comment acheter PEOPLE

Bienvenue sur HTX.com ! Nous vous permettons d'acheter ConstitutionDAO (PEOPLE) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément ConstitutionDAO (PEOPLE).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos ConstitutionDAO (PEOPLE)Après avoir acheté vos ConstitutionDAO (PEOPLE), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des ConstitutionDAO (PEOPLE)Tradez facilement ConstitutionDAO (PEOPLE) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

574 vues totalesPublié le 2024.12.12Mis à jour le 2026.06.02

Comment acheter PEOPLE

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de PEOPLE (PEOPLE) sont présentées ci-dessous.

活动图片