De la infraestructura eléctrica a la economía de Token: el 'pastel de siete capas' de la cadena industrial de la IA

marsbitDipublikasikan tanggal 2026-05-26Terakhir diperbarui pada 2026-05-26

Abstrak

En los últimos dos años, la narrativa principal de la industria de la IA se centró en la "guerra de los modelos grandes" entre las grandes tecnológicas, midiendo avances en parámetros, costes de entrenamiento y clústeres de GPU. Sin embargo, hacia 2026, la lógica impulsora está cambiando. Según JP Morgan, la futura expansión de la infraestructura de IA ya no estará impulsada principalmente por el entrenamiento, sino por la enorme demanda de inferencia, generada por miles de millones de Agentes de IA en funcionamiento. Cada interacción consume tokens, lo que marca la transición de la industria de la "era del modelo" a la "era industrial del Token". La industria se está estructurando como un pastel de siete capas que gira en torno al Token: 1) Energía (la base), 2) Centros de Datos para IA (AIDC, las fábricas de Tokens), 3) GPU (el equipo de producción), 4) Modelos de Lenguaje Grandes (LLM, el motor de producción), 5) Distribución de Tokens (la "red eléctrica"), 6) Optimización y Orquestación Inteligente de Tokens (el "cerebro"), y 7) Agentes de IA (los consumidores finales). Actualmente, este ecosistema está fragmentado. Algunos tienen GPU avanzadas pero carecen de energía estable; otros tienen grandes AIDC pero carecen de sistemas de orquestación eficientes; los desarrolladores de agentes enfrentan altos costes y latencia; y los nodos periféricos operan de forma aislada. La verdadera adopción masiva de la IA solo llegará cuando estas siete capas estén plenamente integradas ...

En los dos últimos años, la lógica narrativa de la primera mitad de la industria de la IA se centró principalmente en la 'guerra de los modelos grandes' iniciada por los grandes fabricantes. Los parámetros pasaron de cientos de miles de millones a billones, los costes de entrenamiento aumentaron de decenas de millones a cientos de millones de dólares, y los clústeres de GPU se expandieron de miles a decenas de miles de tarjetas. Todo el mundo hablaba sobre qué modelo era más potente, quién estaba más cerca de la AGI, como si el final de la competencia en IA estuviera determinado únicamente por el rendimiento de los propios modelos grandes.

Al llegar al año 2026, la lógica impulsora de la industria de la IA ha cambiado. El último informe de JPMorgan considera que lo que realmente impulsará la expansión continua de la infraestructura de IA en el futuro ya no será el entrenamiento de modelos, sino la enorme demanda de inferencia de IA. En el futuro, lo que más consumirá potencia de cálculo ya no será solo entrenar modelos grandes, sino los numerosos Agentes de IA distribuidos por todo el mundo. Cada llamada, cada interacción, cada ejecución de tarea consume esencialmente Tokens. La industria de la IA está pasando de la 'era de los modelos' a la 'era de la industria del Token'.

Porque lo que realmente hará funcionar el mundo de la IA en el futuro no son solo los modelos en sí, sino el sistema de producción, distribución, programación y consumo que se forma alrededor del Token. Especialmente con la aparición a gran escala de los Agentes de IA, cómo se generan los Tokens en tiempo real, cómo se distribuyen entre regiones, cómo se programan dinámicamente y cómo se consumen de manera eficiente se convertirá en el nuevo problema central de toda la industria de la IA.

Como propuso recientemente Jensen Huang, la IA no es una simple industria de software, sino un sistema de infraestructura como la electricidad e internet. En su arquitectura de 'pastel de cinco capas', la industria de la IA se divide en cinco estructuras: energía, chips, infraestructura, modelos y aplicaciones. Y a medida que la industria de la IA pasa gradualmente de la 'era del entrenamiento' a la 'era de la inferencia', GoodVision AI tiende a entender toda la cadena económica industrial de la IA como una 'estructura de pastel de siete capas' que gira en torno al Token:

Primera capa: Electricidad - la base energética de la era de la IA
Segunda capa: AIDC - la fábrica de Tokens
Tercera capa: GPU - el equipo de producción de Tokens
Cuarta capa: LLM - el motor de producción de Tokens
Quinta capa: Distribución de Tokens - la 'red eléctrica' de la era de la IA
Sexta capa: Optimización y programación inteligente de Tokens - el cerebro de la era de la IA
Séptima capa: Agente de IA - el terminal consumidor de Tokens

Desde la energía, las GPU, hasta los AIDC, los nodos periféricos, y luego la inferencia de modelos y la programación inteligente, la industria de la IA está formando un sistema 'industrial de Tokens' sin precedentes.

Pero en esta etapa, este sistema aún está lejos de ser maduro.

Algunos tienen las GPU más avanzadas, pero están limitados por la energía; otros construyen enormes AIDC, pero carecen de programación eficiente; otros desarrollan potentes Agentes de IA, pero enfrentan altos costes de inferencia y latencia; otros controlan nodos periféricos, pero no pueden formar una red unificada y coordinada. Aunque toda la cadena industrial se está desarrollando rápidamente, todavía existen muchas divisiones, redundancias y cuellos de botella en la eficiencia entre las capas.

Y solo cuando estas siete capas de infraestructura estén realmente conectadas, coordinadas e integradas, la industria de la IA pasará de la actual 'era de las herramientas' a la verdadera 'era de la adopción masiva' que pertenece al mundo inteligente.

Primera capa del pastel: Electricidad - la energía de la era de la IA

La revolución industrial competía por el carbón y el petróleo, la era de internet por el tráfico y los servidores, y en la era de la IA, la guerra más fundamental está volviendo a la energía.

Porque la IA finalmente consume electricidad. El consumo eléctrico de un gran centro de datos de IA ya es comparable al de una ciudad mediana. Los nuevos AIDC (centros de datos de IA) en todo el mundo enfrentan el mismo problema: se pueden comprar GPU, se puede construir en terrenos, pero el suministro eléctrico no puede seguir el ritmo, y la gestión de la red eléctrica tampoco.

Esta es la razón por la que cada vez más empresas de IA están volviendo a centrarse en la infraestructura energética. En GTC 2026, Jensen Huang incluso definió los futuros centros de datos como 'fábricas de Tokens'. La parte más superior de esta fábrica dará lugar a una superindustria energética.

En el mercado chino, empresas como China Yangtze Power, China National Nuclear Power, China General Nuclear Power Group, Three Gorges Energy, Longyuan Power Group y Huadian New Energy representan respectivamente las direcciones centrales de energía hidroeléctrica, nuclear, eólica y fotovoltaica. Entre ellas, la energía nuclear e hidroeléctrica, gracias a su capacidad de suministro estable, se están convirtiendo en la fuente de energía base más importante para los AIDC; mientras que la energía eólica y fotovoltaica se benefician de la creciente demanda de electricidad verde y ESG por parte de la industria de la IA. Con el avance de 'Computación Oriental-Datos Occidentales' y la construcción de grandes centros de datos de IA, la relación de coordinación entre las bases de nuevas energías y los centros de computación se está fortaleciendo rápidamente.

En el mercado estadounidense, gigantes energéticos tradicionales como NextEra Energy, Dominion Energy, Duke Energy, Southern Co. y Exelon también se están beneficiando de la expansión de los centros de datos de IA. Entre ellos, NextEra es líder en electricidad verde en Norteamérica; Dominion controla los recursos centrales de transmisión eléctrica en el 'corredor de centros de datos' del norte de Virginia; y Exelon, con su capacidad de suministro estable de energía nuclear, se está convirtiendo en un importante beneficiario de la demanda de 'electricidad de alta estabilidad las 24 horas' en la era de la IA. En general, la industria eléctrica global está pasando gradualmente de un servicio público tradicional a una capa de recursos central en la era de la infraestructura de la IA.

En general, el patrón competitivo de esta capa está pasando de la 'competencia de precios de la electricidad' de las empresas energéticas tradicionales a la 'competencia por el derecho de bloqueo de la energía' entre los centros de datos de IA, los proveedores de nube y las empresas energéticas aguas abajo. Quien pueda asegurar energía a largo plazo, estable y de bajo coste, tendrá la primera 'esfera del dragón' para la producción de Tokens.

Segunda capa del pastel: AIDC - la fábrica de materia prima de Tokens

Una sola GPU no tiene sentido, lo realmente importante es el clúster a escala. Así es como aparecen los AIDC.

Se parecen a las acerías, centrales eléctricas y fábricas en línea de la era industrial, concentrando miles de GPU para formar una capacidad de producción estable de Tokens. Pero también empiezan a surgir los problemas de la fábrica: el ciclo de construcción de un AIDC tradicional suele durar de 18 a 36 meses, y la ampliación de la red eléctrica requiere incluso más tiempo. Cuando la demanda de IA crece exponencialmente, la velocidad de construcción de los IDC de la antigua era ya no puede satisfacer la nueva economía del Token.

En el mercado bursátil estadounidense, Equinix es uno de los operadores de centros de datos más importantes del mundo, con más de 240 centros de datos en más de 30 países. Su ventaja central no es solo el número de salas de servidores, sino su capacidad de interconexión global y recursos de red de baja latencia, lo que lo convierte en un nodo de infraestructura clave para el despliegue de computación de IA.

Digital Realty, por su parte, se adentra en la infraestructura de IA a través de su plataforma PlatformDIGITAL, sirviendo a grandes proveedores de servicios en la nube e instituciones financieras.

En el mercado chino, Runze Technology es uno de los operadores de AIDC más típicos en el mercado A. Su negocio principal ha ido evolucionando gradualmente desde los IDC tradicionales hacia los centros de computación de IA, con su ventaja competitiva central en las salas de servidores a gran escala, los recursos eléctricos y la capacidad de operación y mantenimiento de AIDC. Empresas como OFFSITE, 21Vianet y Sugon están expandiendo continuamente en direcciones como centros de datos regionales, infraestructura en la nube y alojamiento de computación de IA, respectivamente. Sugon, en su negocio de AIDC, tiende a colaborar en áreas gubernamentales, empresariales y de investigación.

Otro tipo de jugadores proviene de la 'transformación de las minas'. Empresas como CoreWeave, IREN, Applied Digital y Cipher Mining estaban originalmente relacionadas en gran medida con la minería de criptomonedas, pero con el explosivo aumento de la demanda de GPU para IA, rápidamente se redirigieron hacia la infraestructura de computación de IA. IREN promueve el modelo 'energía verde + computación de IA', construyendo centros de datos de GPU de alta densidad mediante energías renovables. Applied Digital y Cipher Mining también están transformándose de minas tradicionales a infraestructuras de computación de alto rendimiento para IA.

Además, las AI Factory periféricas, pequeñas y modulares están empezando a convertirse en una nueva tendencia. Al igual que en la era de internet se pasó de los mainframes a la computación en la nube, la potencia de cálculo de IA necesita expandirse gradualmente desde los nodos centrales supergrandes hacia los nodos periféricos regionales.

Por lo tanto, GoodVision AI ha elegido otro camino: construir AI Factory más ligeras, modulares y replicables rápidamente. En comparación con los AIDC tradicionales grandes, GoodVision AI enfatiza más la capacidad de despliegue regional, la eficiencia de los clústeres de GPU de alta densidad y la coordinación integral de energía y computación.

Su lógica central no es construir un único centro de datos supergrande, sino desplegar rápidamente nodos de AI Factory en regiones de alta densidad de población en todo el mundo, generalmente en salas de computación de inferencia pequeñas de 2-4 MW. Este modelo no solo permite un acceso más rápido a los recursos energéticos locales, sino que también se adapta mejor a la tendencia de difusión de la demanda de inferencia de IA hacia el lado periférico en el futuro.

Si los AIDC tradicionales se parecen más a las grandes acerías de la era industrial, lo que construye GoodVision AI se asemeja más a las 'fábricas de Tokens regionalizadas' de la era de la IA: más ligeras, más flexibles, más cercanas al usuario y más adecuadas para la dirección de desarrollo de la futura red distribuida global de inferencia.

Tercera capa del pastel: GPU - el equipo de producción de Tokens

Si la electricidad es la energía, entonces las GPU son el equipo de producción. En los primeros años del auge de la IA, las GPU servían principalmente para el entrenamiento; pero en el futuro, la mayor demanda provendrá de la inferencia. Porque el entrenamiento solo corresponde a unas pocas empresas líderes, mientras que la inferencia se infiltrará en cada aplicación, cada dispositivo, cada terminal. Los robots necesitan inferencia, la conducción autónoma necesita inferencia, las gafas de IA necesitan inferencia, e incluso la colaboración entre cada Agente de IA en el futuro también consume Tokens en tiempo real.

NVIDIA sigue siendo actualmente el núcleo absoluto de la industria global de chips para IA. Sus productos GPU como H100, B200, Blackwell casi definen los estándares actuales globales de entrenamiento e inferencia de IA. Más importante aún, NVIDIA no solo vende chips, sino que también ha construido un ecosistema completo a través de sistemas de software y hardware como CUDA, TensorRT, DGX y HGX, por lo que sus competidores no solo necesitan desafiar el rendimiento de las GPU, sino también todo el ecosistema de software de IA.

AMD es actualmente el principal retador en GPU, con productos centrales como MI300X para IA. En comparación con NVIDIA, AMD enfatiza más el ecosistema abierto y la plataforma de software ROCm, esperando atraer a desarrolladores y clientes empresariales de IA a través de un enfoque más abierto.

Broadcom y Marvell representan otra ruta: ASIC e interconexión de alta velocidad. A medida que los escenarios de inferencia de IA se vuelven cada vez más complejos, más empresas están empezando a probar chips ASIC personalizados para obtener una mayor eficiencia energética y un menor coste.

Intel, por su parte, ingresa al mercado de IA a través de CPU para servidores y la tarjeta aceleradora Gaudi AI, con la esperanza de utilizar su ecosistema de CPU para volver a participar en la competencia de infraestructura de IA.

En el mercado chino, Cambricon es una de las empresas más representativas de chips de IA nacionales, promoviendo principalmente la serie Siyuan de chips de IA y construyendo el framework de IA auto-desarrollado Neuware. Hygon tiene la licencia de la arquitectura AMD Zen, centrándose en el mercado de DCU e inferencia de IA.

Empresas chinas de GPU como Moore Threads, Tianshu Zhixin, MetaX y Biren Technology representan la dirección de 'sustitución de importaciones' en chips de IA chinos. Generalmente enfatizan la compatibilidad con el ecosistema CUDA e intentan construir clústeres de GPU nacionales.

Desde el ecosistema CUDA hasta la memoria HBM, pasando por los Tensor Core, el núcleo de toda la industria de la IA es en realidad mejorar continuamente la 'eficiencia de generación de Tokens por unidad de tiempo'. Al mismo tiempo, las GPU y la infraestructura detrás de ellas, como servidores, módulos ópticos, refrigeración líquida y conmutadores, también están estrechamente relacionadas con la eficiencia de producción de Tokens.

Estas cosas no son tan llamativas como NVIDIA, OpenAI o las empresas de aplicaciones de IA, pero determinan si el mundo de la IA puede funcionar realmente. Al igual que la revolución industrial necesitaba no solo la máquina de vapor, sino también ferrocarriles, redes eléctricas y puertos. La revolución de la IA tampoco será solo una revolución del software. Es una actualización de la cadena industrial global que cubre energía, chips, redes, computación en la nube e infraestructura.

Vertiv es líder mundial en SAI y gestión eléctrica para centros de datos, proporcionando sistemas de alimentación, distribución eléctrica en bastidores y aire acondicionado de precisión para centros de datos.

Envicool es líder en el mercado A chino en sistemas de refrigeración líquida y control de temperatura, con clientes que incluyen grandes empresas de internet como BAT. A medida que la potencia de las GPU aumenta, la refrigeración líquida se está convirtiendo en un estándar importante para los AIDC.

Empresas como Zhongheng Electric, Kehua Data y KSTAR también tienen una posición importante en las áreas de SAI, sistemas de alimentación y suministro eléctrico para IDC.

En la dirección de redes y módulos ópticos, empresas como Zhongji Innolight, Eoptolink y TFC Optical Communication se benefician del explosivo aumento de la demanda de comunicación interna de alta velocidad en los clústeres de IA.

Y en la dirección de servidores completos, empresas como Dell, HPE, Supermicro, Lenovo e Inspur se encargan del ensamblaje y entrega a gran escala de servidores de IA.

Aunque esta capa no enfrenta directamente al usuario final, determina si la infraestructura de IA puede funcionar de manera realmente estable. La refrigeración líquida, los SAI, los módulos ópticos, los conmutadores, el almacenamiento de energía y los servidores completos, al igual que los ferrocarriles, las redes eléctricas y los puertos de la era industrial, se están convirtiendo en el verdadero negocio de 'vender palas' del mundo de la IA.

Cuarta capa del pastel: LLM - el motor de producción de Tokens

Los LLM (modelos de lenguaje grandes) determinan cómo se entienden, generan y organizan los Tokens. En los últimos dos años, empresas como OpenAI, Anthropic, Google, Meta, xAI y DeepSeek han desencadenado una 'competencia global de modelos grandes'. Los parámetros han pasado de cientos de miles de millones a billones, y las capacidades de los modelos también se han expandido desde la generación de texto hasta la multimodalidad, el razonamiento, el código, la colaboración de agentes y la memoria a largo plazo.

Pero a medida que la industria se desarrolla gradualmente, el mercado también comienza a darse cuenta de que lo realmente importante en el futuro ya no será 'quién tiene el modelo más grande', sino quién puede hacer funcionar los modelos de manera continua con menor coste y mayor eficiencia. Porque el modelo en sí mismo no crea valor directamente, lo que realmente crea valor es el proceso de inferencia después de que el modelo es invocado repetidamente.

Esto también significa que los LLM están evolucionando gradualmente desde la antigua 'exhibición de la capacidad del modelo' hacia los 'motores de producción de Tokens' en el mundo de la IA.

Modelos de código cerrado y abierto como OpenAI, Anthropic, Google Gemini y Meta Llama están compitiendo por la entrada al futuro ecosistema de IA; mientras que jugadores emergentes como DeepSeek están comenzando a remodelar el panorama competitivo de la industria a través de métodos de menor coste y mayor eficiencia de inferencia. Ahora, la competencia en la capa LLM también está dejando de ser simplemente una competencia por la cantidad de parámetros, y los criterios de evaluación se están dirigiendo gradualmente hacia una comparación de múltiples dimensiones:


Coste del Token
Eficiencia de inferencia
Capacidad de contexto
Colaboración multi-agente
Memoria a largo plazo
Capacidad de coordinación entre modelo e infraestructura

Porque lo realmente importante en la era de la IA no es solo ver qué tan 'inteligente' es un modelo grande, sino si el modelo puede ejecutarse de manera continua, a gran escala y a bajo coste en todo el mundo. GoodVision AI también tiene su propia solución de optimización en esta capa: colaborando con fabricantes de modelos grandes, desplegar modelos grandes en salas de AI Factory, logrando pasar del negocio tradicional de alquiler de computación a proporcionar directamente servicios de Token; esto no solo puede aumentar el margen de beneficio del negocio, sino que también mejora la experiencia de uso para el usuario.

Quinta capa del pastel: Distribución de Tokens - la 'red eléctrica' de la era de la IA

Una vez construidos los AIDC, surge el siguiente problema: ¿cómo utilizan el mundo esta potencia de cálculo?

Así es como empezaron a aparecer las plataformas de alquiler de computación. Se parecen al 'sistema de red eléctrica' de la era de la IA, dividiendo y distribuyendo los recursos de GPU originalmente centralizados, y luego alquilándolos bajo demanda a desarrolladores, empresas y aplicaciones de IA.

AWS, Azure, Google Cloud, Alibaba Cloud y Tencent Cloud siguen siendo los jugadores más poderosos en esta capa. Poseen la mayor infraestructura global de computación en la nube y están incorporando gradualmente recursos de GPU para IA en su propio sistema IaaS.

Pero al mismo tiempo, un grupo de 'nubes nativas de IA' está surgiendo rápidamente. Empresas como CoreWeave, Nebius y Nscale construyen plataformas en la nube de GPU específicamente en torno a las necesidades de entrenamiento e inferencia de IA. En comparación con los proveedores de nube tradicionales, son más flexibles, están más enfocados en tareas de IA y son más expertos en la optimización de clústeres de GPU.

CoreWeave es actualmente una de las empresas más representativas de NeoCloud. Inicialmente se centró en la minería de Ethereum, luego se redirigió completamente hacia servicios en la nube de GPU para IA, y actualmente se ha convertido en una empresa de infraestructura de IA apoyada por NVIDIA.

Plataformas en la nube ligeras como DigitalOcean y Vultr, por otro lado, se dirigen a pequeños desarrolladores y empresas emergentes, enfatizando el despliegue rápido y los servicios de GPU de bajo coste.

En el mercado chino, además de los gigantes, empresas como UCloud, Kingsoft Cloud y 21Vianet son proveedores principales en el mercado de nube de GPU y alquiler de computación de IA. El patrón competitivo de esta capa se parece mucho a las primeras redes eléctricas: cómo distribuir eficientemente la potencia de cálculo dispersa.

Sexta capa del pastel: Optimización y programación inteligente de Tokens - el cerebro de la era de la IA

Esta es quizás la capa del 'pastel' más subestimada pero también la más crítica. Con el estallido en el uso de Agentes de IA, todos se dieron cuenta de que no todas las tareas merecen invocar el modelo grande más caro. Muchas tareas simples las puede completar un modelo local; muchas tareas en tiempo real son más adecuadas para la inferencia periférica; muchas tareas de privacidad ni siquiera pueden subirse a la nube. Después del problema de 'si hay o no potencia de cálculo', surgió otro problema: 'cómo usar la potencia de cálculo de manera más inteligente'.

Con el crecimiento exponencial de la demanda de Tokens, 'hacer que el modelo adecuado, en la potencia de cálculo adecuada, maneje la tarea adecuada' es la clave para un uso razonable y eficiente de los Tokens. Esta es precisamente una de las direcciones en las que GoodVision AI está trabajando, además de planificar fábricas de Tokens de IA.

Al igual que el sistema eléctrico actual: algunas demandas provienen de la red eléctrica grande; otras provienen de la energía solar en los tejados. Y lo realmente importante es esa capa intermedia del 'sistema de programación inteligente'.

La IA del futuro tendrá la misma estructura: las tareas simples las completarán modelos pequeños locales, las tareas complejas invocarán modelos grandes en la nube, las tasks de alta privacidad se procesarán en el lado periférico, y las tareas de alta concurrencia se programarán dinámicamente a través de la nube híbrida.

Además de GoodVision AI, empresas como QingCloud, Lambda, OpenRouter y Fireworks AI también son destacadas en la optimización y programación inteligente de Tokens.

Y esta capa del 'pastel' y las dos capas anteriores - AIDC y alquiler de computación - tienen jugadores altamente superpuestos. Cuando los recursos de GPU, los nodos regionales y la escala de las tareas de inferencia continúan expandiéndose, el simple 'tener potencia de cálculo' ya no es suficiente para establecer barreras a largo plazo. Cada vez más operadores de AIDC y plataformas en la nube de GPU se están dando cuenta de que lo que realmente determinará la eficiencia y la rentabilidad en el futuro no es solo la cantidad de GPU, sino cómo programar dinámicamente los modelos, la potencia de cálculo y el flujo de Tokens.

Por lo tanto, muchas plataformas que originalmente se centraban en AIDC y nube de GPU también están extendiéndose hacia la 'capa de programación inteligente'. Por ejemplo, empresas del mercado chino como UCloud, 21Vianet y Sugon están intentando combinar sus propias instalaciones de nube de GPU, recursos multi-nube y capacidades de programación de inferencia, pasando gradualmente de 'vender potencia de cálculo' a 'optimizar la potencia de cálculo'.

Séptima capa del pastel: Modelos y Agentes - los consumidores de Tokens

Aunque esta capa está más cerca del usuario y es más fácil de obtener tráfico, la competencia también es la más feroz. En GTC 2026, Jensen Huang propuso este punto de vista: en el futuro, cada empresa se convertirá en 'productora y consumidora de Tokens'.

Un Agente de IA podría invocar simultáneamente múltiples modelos, múltiples herramientas, múltiples API, y realizar continuamente inferencias, planificaciones y ejecuciones. Esto significa que la cantidad de Tokens que consumirá la IA en el futuro superará con creces la escala actual de diálogos entre humanos e IA. Algunos usuarios intensivos de IA actualmente, que construyen sus propios sistemas de concurrencia multi-agente y llamadas mutuas, pueden consumir fácilmente 1.000 millones de Tokens al día.

En el futuro no serán 1.000 millones de personas usando IA, sino 10.000 millones, o incluso 100.000 millones de Agentes de IA trabajando simultáneamente, invocándose unos a otros. Y el verdadero cuello de botella también pasará de la 'capacidad del modelo' a la 'eficiencia de programación de Tokens'.

Por supuesto, no hace falta mencionar a los gigantes tecnológicos; Microsoft, Google, Meta, Amazon, etc., están integrando gradualmente las capacidades de IA en todos sus productos a través de sistemas de oficina, búsqueda, redes sociales y servicios en la nube.

Empresas de software empresarial como Adobe, Salesforce, ServiceNow y Palantir están avanzando rápidamente en la dirección de Agentes de IA a nivel empresarial y flujos de trabajo automatizados. Al mismo tiempo, Hugging Face se está convirtiendo en el 'Github' de la era de la IA. No es solo una comunidad de modelos, sino una importante infraestructura para el ecosistema global de desarrollo de IA.

En el mercado chino, empresas como iFLYTEK, Kunlun Tech, 360, Kingsoft Office y SenseTime están desplegando estrategias en torno a asistentes de IA, oficina con IA y Agentes de IA.

Cuando el 'pastel de siete capas' esté realmente formado, el mundo de la IA realmente comenzará

La industria de la IA actual todavía se encuentra en un sistema de infraestructura no completamente maduro.

Algunos tienen las GPU más avanzadas, pero están limitados por la energía; otros construyen enormes AIDC, pero carecen de programación eficiente; otros desarrollan potentes modelos y Agentes, pero enfrentan altos costes de inferencia y latencia; otros controlan nodos periféricos, pero no pueden formar una red unificada y coordinada.

Desde la electricidad, AIDC, GPU, hasta LLM, distribución de Tokens, programación inteligente y Agentes de IA, aunque toda la cadena industrial de la IA se está desarrollando rápidamente, todavía existen muchas divisiones, redundancias y cuellos de botella en la eficiencia entre las capas.

Y solo cuando este 'pastel de siete capas' esté realmente construido de manera completa y comience a funcionar de manera coordinada y eficiente, la industria de la IA pasará de la actual 'era de las herramientas' a la verdadera 'era de la adopción masiva' que pertenece al mundo inteligente.

El futuro mundo de la IA ya no consistirá solo en unos pocos gigantes tecnológicos entrenando modelos grandes, sino en decenas de miles de millones de Agentes de IA en línea continuamente, colaborando continuamente, invocando continuamente potencia de cálculo y Tokens. Cada diálogo, cada inferencia, cada invocación de herramienta, cada ejecución automática de tarea, corresponde en el fondo a la operación coordinada de energía, GPU, redes, sistemas de programación y nodos de inferencia.

Y esto también significa que la industria de la IA está evolucionando gradualmente desde la antigua 'lógica del software' hacia un super sistema industrial que cubre energía, chips, computación en la nube, redes periféricas y programación inteligente.

Al igual que la revolución industrial necesitaba no solo la máquina de vapor, sino también ferrocarriles, redes eléctricas y puertos; la revolución de internet necesitaba no solo PC, sino también fibra óptica, centros de datos y computación en la nube. El signo de madurez real de la revolución de la IA no será solo una aplicación exitosa, sino la formación, a nivel global, de una 'red de infraestructura inteligente' capaz de producir, distribuir, programar y consumir Tokens de manera continua.

Y cuando estas siete capas de infraestructura finalmente estén verdaderamente conectadas, la lógica competitiva de la industria de la IA también será completamente reestructurada. Las empresas más importantes en el futuro quizás ya no sean solo las que tengan el modelo más grande, sino aquellas que puedan conectar energía, computación, redes, modelos y el flujo de Tokens.































Pertanyaan Terkait

Q¿Cuál es el cambio clave en la industria de la IA descrito en el artículo, desde 2026 en adelante?

AEl artículo describe que, a partir de 2026, la lógica impulsora de la industria de la IA ha cambiado. Ya no está centrada principalmente en el entrenamiento de modelos grandes, sino en la demanda masiva de inferencia de IA. El consumo de potencia de cálculo estará dominado por los miles de millones de Agent de IA desplegados globalmente, entrando en la llamada 'era industrial del Token'.

Q¿Qué significa el concepto de 'siete capas de la tarta' que propone GoodVision AI para la economía de la IA?

AEl concepto de 'siete capas de la tarta' propuesto por GoodVision AI representa la cadena de infraestructura económica de la IA centrada en el Token: 1) Energía eléctrica, 2) AIDC (fábricas de Token), 3) GPU (equipos de producción), 4) LLM (motores de producción), 5) Distribución de Tokens ('red eléctrica'), 6) Optimización y programación inteligente de Tokens ('cerebro'), 7) Agent de IA (terminales de consumo).

QSegún el artículo, ¿por qué la energía eléctrica se considera la primera capa fundamental en la era de la IA?

APorque la IA consume electricidad de manera masiva. Un gran centro de datos de IA puede consumir tanta energía como una ciudad mediana. La competencia por el suministro de energía estable, de largo plazo y de bajo costo es fundamental, ya que limita la capacidad de producción de Tokens. Empresas de energías renovables (nuclear, hidroeléctrica, eólica, solar) y las tradicionales se están reposicionando como proveedoras críticas de esta capa de recursos.

Q¿En qué se diferencia la estrategia de GoodVision AI para las AIDC (segunda capa) de los centros de datos tradicionales?

AGoodVision AI opta por una estrategia de 'AI Factory' más ligera, modular y replicable, en lugar de construir centros de datos gigantescos tradicionales (AIDC). Estas fábricas son nodos pequeños (2-4MW) y de alta densidad de GPU, desplegados rápidamente en regiones densamente pobladas. Esta aproximación es más ágil, se acerca más al usuario y está mejor adaptada a la futura red de inferencia distribuida y hacia el edge computing.

Q¿Cuál es la función principal de la sexta capa, 'Optimización y programación inteligente de Tokens', y por qué es crucial?

ASu función principal es la de un 'cerebro' que optimiza el uso de los recursos de cálculo y los Tokens. Consiste en dirigir inteligentemente cada tarea de IA al modelo y al recurso de cálculo más adecuados (local, edge, nube, diferentes modelos según complejidad), equilibrando coste, latencia, privacidad y eficiencia. Es crucial porque, con el crecimiento exponencial de los Agent de IA, usar los recursos de forma bruta (solo 'tener potencia de cálculo') ya no es sostenible ni rentable.

Bacaan Terkait

43 Menit Trump: Narasi Pemimpin Kuat Tak Terkendali, Perang Media Memanas

Presiden AS Donald Trump kembali muncul di depan publik setelah menghilang lebih dari seminggu, dalam konferensi pers selama 43 menit yang dimaksudkan untuk menunjukkan kendali. Namun, pidatonya justru menyimpang ke topik-topik seperti kolam refleksi, perbandingan jumlah massa dengan Martin Luther King, serta serangan terhadap jurnalis, lawan politik, dan sejumlah kota AS. Ia menandatangani perintah eksekutif yang menghapus perlindungan jabatan bagi ribuan pegawai federal senior, berpotensi memperkuat loyalitas pribadi di atas profesionalisme. Trump secara pribadi menyerang jurnalis CNN, Kaitlan Collins, menyebutnya "penuh kebencian". Artikel ini menyoroti tekanan pada media independen, mengutip pemecatan veteran CBS Scott Pelley yang menolak campur tangan editorial untuk menyenangkan pemerintahan. Penulis menekankan pentingnya mendukung jurnalis dan media independen sebagai penjaga fakta publik ketika media arus utama menghadapi tekanan politik dan komersial. Aktivitas tiba-tiba diakhiri secara mendadak oleh stafnya, meninggalkan kesan kepanikan. Sementara itu, di tengah kekhawatiran tentang kesehatannya dan perang di Iran, empat anggota Partai Republik di DPR mendukung resolusi yang menuntut penghentian perang, menunjukkan retakan dalam dukungan partainya. Artikel ini menggambarkan penampilan Trump sebagai pertunjukan politik yang penuh kecemasan, yang mencerminkan ketegangan institusional AS: perluasan kekuasaan pribadi, pelemahan birokrasi, erosi kepercayaan media, dan penyusutan ruang fakta publik.

marsbit13m yang lalu

43 Menit Trump: Narasi Pemimpin Kuat Tak Terkendali, Perang Media Memanas

marsbit13m yang lalu

Kalshi, MTS, dan Ambisi A16Z

**Ringkasan Artikel: Kalshi, MTS, dan Ambisi a16z** Pasar prediksi (prediction market) menjadi bidang yang menarik perhatian investor, komunitas kripto, dan media pada 2025. Meski memiliki daya tarik bisnis seperti arbitrase regulasi dan potensi fee transaksi tinggi, nilai mendasarnya terletak pada kemampuannya memberikan **"rasa keberadaan" (sense of presence)**. Artikel ini menelusuri evolusi ide pasar prediksi, dari konsep Friedrich Hayek tentang pasar sebagai pengumpul pengetahuan tersebar, hingga mekanisme insentif Robin Hanson (LMSR). Namun, diskusi filosofis ini menemukan relevansi baru ketika a16z (Andreessen Horowitz) berinvestasi pada **Kalshi**, sebuah platform pasar prediksi yang kini bernilai $220 miliar. Bagi a16z, Kalshi bukan sekadar platform taruhan. Ia adalah **media baru** yang memungkinkan orang terlibat secara aktif dalam peristiwa dunia. Dengan menggunakan uang sungguhan untuk "memprediksi" hasil suatu peristiwa (politik, cuaca, berita), pengguna merasa menjadi **pengamat super** yang berpartisipasi, bukan sekadar penonton pasif. Hal ini mengatasi rasa ketidakberdayaan di era modern. Kalshi, dengan volume dan data transaksi nyata, berpotensi memberikan otoritas final atas **kebenaran** dan **pentingnya** suatu peristiwa. Ini selaras dengan ambisi a16z membangun kekaisaran media baru, seperti yang terlihat pada **MTS (Monitoring The Situation)**, media yang melakukan siaran langsung 24/7 untuk "menguasai linimasa". Kombinasi antara narasi media yang intens (seperti MTS) dan legitimasi data nyata dari pasar prediksi (Kalshi) menciptakan **medan distorsi realitas** yang kuat. Kalshi bernilai tinggi karena kemampuannya mempengaruhi persepsi publik secara halus, misalnya melalui probabilitas hasil pemilu yang diperdagangkan, sesuatu yang jarang dimiliki perusahaan swasta. Inilah inti dari ambisi media baru a16z.

marsbit1j yang lalu

Kalshi, MTS, dan Ambisi A16Z

marsbit1j yang lalu

Terbaru: Veteran Chip OpenAI Bergabung dengan Anthropic

Pelaku industri OpenAI, Clive Chan, yang dikenal sebagai karyawan nomor dua di tim perangkat keras dan terlibat dalam proyek chip buatan OpenAI, mengumumkan telah bergabung dengan Anthropic. Ia menyebut tim chip OpenAI memiliki kepadatan bakat yang luar biasa, namun dorongan untuk "mendaki gunung baru dari dasar" membawanya ke Anthropic. Chan terkesan dengan bakat, nilai, dan ambisi tim Anthropic, serta merasakan intensitas kerja yang tinggi sejak hari pertama. Ketika ditanya tentang kemajuan chip buatan OpenAI, Chan merujuk pada blog kolaborasi antara OpenAI dan Broadcom yang dirilis Oktober 2025. Menurut blog tersebut, sistem akselerator AI buatan OpenAI dengan total skala 10GW ini menargetkan penyebaran dimulai pada paruh kedua 2026, dengan pengiriman rak pertama direncanakan pada waktu tersebut. Proyek diperkirakan berlanjut hingga akhir 2029. Chan, lulusan Universitas Waterloo tahun 2021, memiliki pengalaman kerja di Google, SpaceX, Tesla (tim infrastruktur Autopilot), dan QuEra sebelum bergabung dengan OpenAI pada Januari 2024. Kepindahannya ke Anthropic disambut oleh karyawan Anthropic lainnya dan menjadi bahan komentar netizen yang menyoroti tren perpindahan bakat antara kedua perusahaan AI terkemuka ini. Sebelumnya, pada Mei, salah satu pendiri OpenAI, Andrej Karpathy, juga bergabung dengan Anthropic. Anthropic baru-baru ini mengumumkan pendanaan H senilai $650 miliar, dengan valuasi pasca-pendanaan mencapai $9,65 triliun, mendekati klub bernilai triliunan dolar. Arus bakat antara OpenAI dan Anthropic terus berlanjut, menegaskan pentingnya talenta sebagai aset inti dalam persaingan AI mutakhir.

marsbit1j yang lalu

Terbaru: Veteran Chip OpenAI Bergabung dengan Anthropic

marsbit1j yang lalu

Ambisi Kalshi, MTS, dan a16z

Pasar prediksi menjadi bidang yang menarik pada tahun 2025, menghubungkan investor dolar, komunitas kripto, dan media. Artikel ini mengeksplorasi esensi pasar prediksi dan keselarasannya dengan visi "Media Baru" a16z. Pemikiran pasar prediksi berakar dari konsep Hayek tentang penggunaan pengetahuan tersebar dalam masyarakat, yang kemudian dikembangkan oleh Robin Hanson dengan mekanisme insentif LMSR-nya. Namun, diskusi filosofis ini menemukan relevansi barunya ketika a16z berinvestasi di Kalshi, sebuah platform pasar prediksi yang valuasinya melonjak. a16z melihat nilai inti Kalshi dan pasar prediksi terletak pada penyediaan "rasa kehadiran" atau keterlibatan. Dalam dunia di mana individu sering merasa terasing dari peristiwa, pasar prediksi menawarkan cara untuk terlibat secara aktif dengan "mempertaruhkan" pandangan seseorang tentang masa depan. Keterlibatan finansial ini mengubah peserta dari pengamat pasif menjadi "pengamat super" yang merasa terhubung dan memiliki agensi. Konsep "Media Baru" a16z adalah sistem komunikasi berkecepatan tinggi yang bertujuan mendominasi narasi secara instan. Contohnya adalah MTS, media yang menyiarkan berita penting secara real-time. Namun, kekuatan sebenarnya terletak pada otoritas yang dihasilkan pasar prediksi seperti Kalshi. Harga yang dibentuk oleh uang sungguhan memberikan klaim kebenaran dan kepentingan yang sulit disangkal, menciptakan semacam "medan distorsi realitas". Inilah yang menjelaskan valuasi tinggi Kalshi: kemampuannya yang langka untuk memengaruhi persepsi realitas sebagai sebuah perusahaan swasta, menjadikannya batu penjuru penting dalam ambisi kekaisaran media baru a16z.

链捕手2j yang lalu

Ambisi Kalshi, MTS, dan a16z

链捕手2j yang lalu

Trading

Spot
Futures

Artikel Populer

Cara Membeli LAYER

Selamat datang di HTX.com! Kami telah membuat pembelian Solayer (LAYER) menjadi mudah dan nyaman. Ikuti panduan langkah demi langkah kami untuk memulai perjalanan kripto Anda.Langkah 1: Buat Akun HTX AndaGunakan alamat email atau nomor ponsel Anda untuk mendaftar akun gratis di HTX. Rasakan perjalanan pendaftaran yang mudah dan buka semua fitur.Dapatkan Akun SayaLangkah 2: Buka Beli Kripto, lalu Pilih Metode Pembayaran AndaKartu Kredit/Debit: Gunakan Visa atau Mastercard Anda untuk membeli Solayer (LAYER) secara instan.Saldo: Gunakan dana dari saldo akun HTX Anda untuk melakukan trading dengan lancar.Pihak Ketiga: Kami telah menambahkan metode pembayaran populer seperti Google Pay dan Apple Pay untuk meningkatkan kenyamanan.P2P: Lakukan trading langsung dengan pengguna lain di HTX.Over-the-Counter (OTC): Kami menawarkan layanan yang dibuat khusus dan kurs yang kompetitif bagi para trader.Langkah 3: Simpan Solayer (LAYER) AndaSetelah melakukan pembelian, simpan Solayer (LAYER) di akun HTX Anda. Selain itu, Anda dapat mengirimkannya ke tempat lain melalui transfer blockchain atau menggunakannya untuk memperdagangkan mata uang kripto lainnya.Langkah 4: Lakukan trading Solayer (LAYER)Lakukan trading Solayer (LAYER) dengan mudah di pasar spot HTX. Cukup akses akun Anda, pilih pasangan perdagangan, jalankan trading, lalu pantau secara real-time. Kami menawarkan pengalaman yang ramah pengguna baik untuk pemula maupun trader berpengalaman.

805 Total TayanganDipublikasikan pada 2025.02.11Diperbarui pada 2026.06.02

Cara Membeli LAYER

Diskusi

Selamat datang di Komunitas HTX. Di sini, Anda bisa terus mendapatkan informasi terbaru tentang perkembangan platform terkini dan mendapatkan akses ke wawasan pasar profesional. Pendapat pengguna mengenai harga LAYER (LAYER) disajikan di bawah ini.

活动图片