Artículos Relacionados con Inferencia

El Centro de Noticias de HTX ofrece los artículos más recientes y un análisis profundo sobre "Inferencia", cubriendo tendencias del mercado, actualizaciones de proyectos, desarrollos tecnológicos y políticas regulatorias en la industria de cripto.

El DeepSeek que esperabas ya ha cambiado

DeepSeek, una vez pionera en IA en China, ha ralentizado significativamente su ritmo de actualización de modelos en los últimos 15 meses, con su esperada versión V4 sufriendo múltiples retrasos. Según informes, esto se debe en gran parte a la presión estratégica nacional para migrar del hardware de NVIDIA al ecosistema de chips domésticos, específicamente los procesadores Huawei Ascend. El gobierno chino alentó a DeepSeek a adoptar chips Huawei para entrenamiento e inferencia, en línea con los objetivos de autonomía tecnológica del país. Sin embargo, el proceso de adaptación ha sido complicado: en 2025, los intentos de usar Ascend 910C para entrenar el modelo enfrentaron problemas de estabilidad y comunicación entre chips. Aunque se volvió temporalmente a NVIDIA para el entrenamiento, DeepSeek continuó trabajando en la migración completa al framework Huawei CANN. Para 2026, se priorizó la adaptación de V4 con el nuevo Ascend 950PR y chips de Cambricon, aunque persisten desafíos técnicos, especialmente en la alineación de precisión entre diferentes hardware. Esta dedicación a la validación de chips nacionales ha consumido recursos y ralentizado el desarrollo, coincidiendo con la pérdida de talento clave y una creciente brecha en capacidades multmodales y de agentes frente a competidores globales como OpenAI y Claude. Si V4 tiene éxito, demostraría la viabilidad del ecosistema de hardware chino para IA avanzada, aunque es posible que no supere a los líderes globales en rendimiento bruto. DeepSeek equilibra así su papel como empresa con misión nacional y sus imperativos comerciales.

marsbitHace 2 días 10:36

El DeepSeek que esperabas ya ha cambiado

marsbitHace 2 días 10:36

Dejen de mirar las GPU, la CPU se está convirtiendo en el 'nuevo cuello de botella' de la era de la IA

En la era de la IA, la CPU se está convirtiendo en el nuevo cuello de botella, desplazando la atención tradicional en las GPU. Aunque las GPU siguen siendo cruciales para el cálculo, el rendimiento del sistema depende cada vez más de la capacidad de ejecución y planificación de las CPU. Intel y Google han firmado un acuerdo para implementar procesadores Xeon en centros de datos de IA, reflejando este cambio. La escasez de CPU se ha intensificado, con precios subiendo un 30% en el último trimestre de 2025 y plazos de entrega extendidos hasta seis meses. Esta crisis se debe en parte a que los fabricantes de semiconductores priorizan la producción de GPU más rentables. La demanda creciente de CPU se debe a la evolución de las cargas de trabajo de la IA, especialmente con el auge de los agentes de IA. Estos requieren múltiples tareas como razonamiento, llamadas a API y gestión de datos, que recaen principalmente en las CPU. Estudios muestran que entre el 50% y el 90.6% de la latencia en agentes de IA proviene del procesamiento en la CPU. Intel, AMD y Nvidia están adoptando estrategias diferentes. Intel se centra en sus procesadores Xeon y colaboraciones clave; AMD ha visto un crecimiento significativo impulsado por la demanda de CPU para agentes de IA; y Nvidia diseña CPUs como Grace, optimizadas para la colaboración eficiente con GPUs. Se proyecta que el mercado de CPUs impulsado por la IA crezca hasta los 60.000 millones de dólares para 2030. La expansión de infraestructuras de CPU para soportar agentes de IA se ha vuelto esencial, marcando un punto de inflexión en la competencia por la supremacía en IA.

marsbit04/13 01:02

Dejen de mirar las GPU, la CPU se está convirtiendo en el 'nuevo cuello de botella' de la era de la IA

marsbit04/13 01:02

El Agente de IA obtuvo su DNI y cartera el mismo día|Rewire Resumen de Noticias Matutinas

Resumen de las noticias: 1. La economía de los Agentes de IA acelera: En un mismo día, Worldcoin lanzó AgentKit, permitiendo a los agentes de IA portar credenciales criptográficas de verificación humana (17.9M de usuarios), y se integró con el protocolo de pago x402 de Coinbase y Cloudflare para realizar micropagos con stablecoins sin intervención humana. NVIDIA presentó el Retail Agentic Commerce Blueprint, implementando protocolos de comercio de OpenAI y Google. Se prevé que el mercado de comercio mediante agentes alcance los 3-5 billones de dólares para 2030. 2. La industria de la IA respalda a Anthropic: Cuatro asociaciones tecnológicas principales (con miembros como Google, Meta, Microsoft) presentaron un escrito judicial para desafiar la designación de "riesgo de cadena de suministro" que el Pentágono otorgó a Anthropic. El conflicto surge porque Anthropic pidió restricciones sobre el uso militar de su IA. La audiencia será el 24 de marzo. 3. La Fed se reúne en un contexto de tensión: Se espera que la FOMC mantenga las tasas de interés en 3.5%-3.75%. La atención se centra en las proyecciones (dot plot), ya que la guerra en Irán está elevando los precios de la energía y la inflación. Es una de las últimas apariciones de Powell como presidente de la Fed. 4. NVIDIA transforma las redes de telecomunicaciones: Presentó AI Grid, una arquitectura que convierte la infraestructura de telecomunicaciones (estaciones base, centros de datos) en una red de inferencia distribuida. Socios como Comcast, Nokia y T-Mobile reportan reducciones de costos del 76% y baja latencia. 5. El costo de la guerra en Irán se dispara: La operación Epic Fury tiene un costo diario estimado de 900 millones de dólares. El costo total militar podría alcanzar los 950 mil millones. El conflicto se ha expandido a 12 países, afectando el transporte marítimo y los precios globales de alimentos y fertilizantes. También destacan: NVIDIA anuncia DLSS 5 para 2026; Alemania planea duplicar su capacidad de centros de datos de IA para 2030; la fintech alemana Upvest recibe una inversión de 125M$; el proyecto de ley de cripto CLARITY Act está estancado en el Senado de EE.UU.; el 38% de las altcoins cotizan cerca de mínimos, con liquidez concentrada en Bitcoin.

marsbit03/18 04:58

El Agente de IA obtuvo su DNI y cartera el mismo día|Rewire Resumen de Noticias Matutinas

marsbit03/18 04:58

活动图片