Artículos Relacionados con Inferencia

El Centro de Noticias de HTX ofrece los artículos más recientes y un análisis profundo sobre "Inferencia", cubriendo tendencias del mercado, actualizaciones de proyectos, desarrollos tecnológicos y políticas regulatorias en la industria de cripto.

El desafío de la potencia de cálculo en el ajedrez de la IA entre China y Estados Unidos

La carrera por la inteligencia artificial entre China y EE.UU. enfrenta un desafío fundamental: la enorme brecha en capacidad de computación (computing power). Mientras empresas estadounidenses como Meta, Google y xAI despliegan cientos de miles de GPUs de alta gama (como las de Nvidia) para entrenar modelos con billones de parámetros, China depende en gran medida de chips de inferencia nacionales para tareas menos exigentes. El artículo destaca que la escasez de chips de entrenamiento de última generación, debido a las restricciones de exportación estadounidenses, es la raíz de la diferencia entre los modelos de IA de ambos países. Según estimaciones, EE.UU. posee el doble de capacidad de computación que China, y un solo gigante tecnológico estadounidense puede superar la suma de todas las empresas chinas. Esto permite a EE.UU. iterar modelos mucho más rápido y entrenar sistemas con parámetros significativamente mayores. Aunque líderes tecnológicos como Huang Jen-hsun (Nvidia) o Elon Musk elogian el progreso chino, la realidad muestra un rezago. El modelo chino más avanzado, DeepSeek V4 Pro, tiene 1.6 billones de parámetros, muy por detrás de los 10 billones de modelos estadounidenses como Mythos de Anthropic. Además, se estima que China está entre 8 y 15 meses atrás en la frontera de la IA. El ascenso de fabricantes nacionales chinos como Huawei (Ascend 910B), Moore Thread o Cambricon representa un camino esperanzador. Aunque su rendimiento absoluto y ecosistema de software (similar al CUDA de Nvidia) aún están en desarrollo, ya logran avances en inferencia y comienzan a adaptarse para entrenamiento básico. El éxito a largo plazo requerirá paciencia, inversión sostenida y un esfuerzo colectivo similar al que llevó a Corea del Sur a dominar la industria de chips de memoria. En este duelo geopolítico por la IA, China avanza con determinación, pero el camino por recorrer es extenso.

marsbitHace 1 hora(s)

El desafío de la potencia de cálculo en el ajedrez de la IA entre China y Estados Unidos

marsbitHace 1 hora(s)

¿Mac inactivas pueden generar dinero? Un análisis de Darkbloom, la red de inferencia de IA descentralizada lanzada por Eigen Labs

El proyecto Darkbloom, lanzado por Eigen Labs, es una red descentralizada de inferencia de IA que permite a los usuarios aprovechar la potencia de sus Mac con chips Apple Silicon en estado de reposo para realizar tareas de procesamiento de inteligencia artificial. La arquitectura se compone de tres elementos: usuarios que envían solicitudes, un coordinador que las dirige y proveedores (dueños de los Mac) que ejecutan los modelos sin poder ver el contenido de las peticiones, garantizando privacidad mediante verificación hardware. El sistema prioriza la privacidad y la seguridad, utilizando la arquitectura de seguridad de Apple para autenticación y aislamiento. Economicamente, se diferencia al no emitir tokens; los proveedores reciben el 100% de los ingresos por inferencia, con precios aproximadamente un 50% más bajos que los de los agregadores de API tradicionales. Sin embargo, en su fase alfa actual, las ganancias son modestas (el mejor proveedor obtiene menos de 6 dólares diarios), aunque se espera que aumenten con la adopción de modelos más grandes y mayor uso. Para participar, se necesita un Mac con Apple Silicon, macOS 14 o superior, instalar el software Darkbloom y mantener el equipo conectado a internet. El proyecto ya está disponible en OpenRouter con modelos como Gemma 4 de Google y GPT-OSS de OpenAI.

marsbitHace 4 hora(s)

¿Mac inactivas pueden generar dinero? Un análisis de Darkbloom, la red de inferencia de IA descentralizada lanzada por Eigen Labs

marsbitHace 4 hora(s)

La CPU regresa a la mesa: comienza un 'ascenso' de 170.000 millones de dólares

El 1 de junio, NVIDIA presentó su primera CPU independiente, Vera, en el GTC Taipei 2026, marcando su entrada directa en este mercado. Simultáneamente, AMD ha duplicado su previsión del tamaño del mercado de CPUs para servidores a más de 1,2 billones de dólares, reflejando el crecimiento explosivo impulsado por la IA. Según UBS, se espera que el mercado de CPUs para servidores alcance unos 170.000 millones de dólares en 2030. El motivo principal de este resurgimiento es la transición de la IA hacia la fase de inferencia y los Agentes Inteligentes (Agentic AI). En este contexto, las CPUs asumen un papel crucial, gestionando hasta el 90% de la latencia en tareas complejas que involucran razonamiento múltiple, llamadas a herramientas externas y gestión de datos. A diferencia del entrenamiento, dominado por las GPUs, los Agentes generan grandes volúmenes de datos intermedios (KV Cache) que superan la capacidad de memoria de las GPUs, trasladándose a la memoria masiva de las CPUs. Esto ha alterado la proporción típica entre GPU y CPU, acercándose a 1:1 en escenarios de Agentes, frente a la proporción anterior de 1:8. Esta mayor demanda ha provocado un aumento de precios del 10%-15% en CPUs de servidor, la primera subida significativa en más de una década, y ha generado escasez de suministro. Se prevé que el mercado se divida en CPUs de alto rendimiento para clústeres de IA (~700.000 millones dólares) y CPUs desplegadas de forma independiente para Agentes (~700.000 millones dólares), un segmento nuevo desde 2026. NVIDIA, con su CPU Vera basada en ARM, apunta a un ratio 1:1 con sus GPUs Rubin. AMD superó a Intel en ingresos por centro de datos en el primer trimestre de 2026. En China, fabricantes como Hygon (arquitectura x86) y Huawei (ARM) se benefician de esta tendencia global y de las políticas de sustitución de importaciones, enfrentándose a una ventana de oportunidad crítica antes de 2027. En resumen, la era de los Agentes de IA ha reposicionado a la CPU como un cuello de botella crítico y un motor de crecimiento clave, donde la capacidad de colaboración entre CPU y GPU será más decisiva que el rendimiento individual de cada chip.

marsbitHace 2 días 13:50

La CPU regresa a la mesa: comienza un 'ascenso' de 170.000 millones de dólares

marsbitHace 2 días 13:50

Informe de Bernstein: La IA Agente convertirá a las CPU de secundarias a protagonistas, visión optimista sobre Hygon Information

El informe de Bernstein titulado “CPU Renaissance?” (Renacimiento de las CPU) presenta una tesis central: la IA está evolucionando de la era del chatbot a la era de la IA agencial (Agentic AI). En esta nueva fase, las cargas de trabajo implican “ciclos de razonamiento” complejos, donde un agente recupera información, planifica, usa herramientas y ejecuta acciones. Este proceso requiere una coordinación intensiva, lo que aumenta drásticamente la importancia de las CPU en los centros de datos para orquestar flujos de trabajo, gestionar memoria y evitar que las costosas GPU permanezcan inactivas. El informe predice que para 2029, la proporción GPU:CPU en clústeres de inferencia se equilibrará de 8:1 a 1:1. En cargas de trabajo de IA agencial, la CPU representará hasta el 50% del cómputo. Esto impulsaría el mercado total direccionable (TAM) de CPU para servidores a 223.000 millones de dólares para 2030, un crecimiento de seis veces desde 2025. Bernstein señala que Arm será el mayor beneficiario estructural, gracias a su eficiencia energética y a su nueva estrategia de fabricar sus propios chips. La firma también es optimista sobre AMD (que mantiene liderazgo en x86), Intel (con una demanda más fuerte) y, en particular, Hygon (Hǎiguāng Xìnxī) en China, a la que otorga una calificación de “sobreponderar” y un precio objetivo de 450 yuanes, citando su creciente cuota en el mercado chino de servidores. La principal incertidumbre señalada en el informe es la capacidad de la cadena de suministro (fundamentalmente, las fundiciones) para soportar este crecimiento explosivo de la demanda de CPU. En resumen, si la IA agencial se adopta masivamente, la narrativa de inversión en semiconductores debería cambiar de un enfoque dominado por la GPU a uno más equilibrado entre CPU y GPU.

marsbit06/17 09:49

Informe de Bernstein: La IA Agente convertirá a las CPU de secundarias a protagonistas, visión optimista sobre Hygon Information

marsbit06/17 09:49

Mapa Panorámico de IA Descentralizada 2026: ¿Por qué blockchain es el 'antídoto' ineludible para la IA?

La IA descentralizada está surgiendo como solución a los cuellos de botella estructurales de la IA centralizada, como la escasez de recursos de computación, la concentración de poder, la falta de verificabilidad de los resultados y los desafíos para acceder a datos de entrenamiento. En este panorama de 2026, blockchain actúa como un antídoto crucial para hacer la inteligencia abierta, verificable y económicamente accesible. El ecosistema se estructura en capas. La capa de infraestructura ofrece recursos fundamentales como cómputo distribuido (Akash, Render), almacenamiento descentralizado (Filecoin) e inferencia verificable (OpenGradient). La capa de middleware, con proyectos como Bittensor, NEAR y Virtuals, se centra en la coordinación, identidad y mercados para agentes autónomos. Finalmente, la capa de aplicación despliega estos agentes en casos de uso como las finanzas agentivas (Giza, Infinit) y los pagos automatizados entre máquinas (protocolos como x402). Para 2026-2027, se espera que la IA descentralizada evolucione desde una narrativa especulativa hacia un nuevo modelo de coordinación, donde la economía de tokens, la computación como clase de activo y el crecimiento de los agentes autónomos serán los principales motores. Aunque el sector es aún incipiente y enfrenta desafíos de adopción, proyectos líderes están demostrando un camino viable para un futuro de la IA más abierto y descentralizado.

Foresight News06/11 10:08

Mapa Panorámico de IA Descentralizada 2026: ¿Por qué blockchain es el 'antídoto' ineludible para la IA?

Foresight News06/11 10:08

活动图片