Artículos Relacionados con Inferencia

El Centro de Noticias de HTX ofrece los artículos más recientes y un análisis profundo sobre "Inferencia", cubriendo tendencias del mercado, actualizaciones de proyectos, desarrollos tecnológicos y políticas regulatorias en la industria de cripto.

Fundador de a16z: En la era de los agentes, lo que realmente importa ha cambiado

En una entrevista, Marc Andreessen, fundador de a16z, analiza la revolución de la IA y su evolución desde sus inicios hace 80 años hasta el presente. Destaca que el actual auge no es repentino, sino el resultado de décadas de avances, con hitos como AlexNet, Transformer y ChatGPT. Andreessen enfatiza que lo que hace diferente esta vez es la combinación de cuatro capacidades: modelos de lenguaje grande (LLMs), razonamiento, codificación y agentes autónomos. Los agentes, descritos como "LLM + shell + sistema de archivos + markdown + cron/loop", representan un cambio profundo en la arquitectura del software, permitiendo que la IA ejecute tareas, guarde estados y even se modifique a sí misma. Andreessen predice que la interacción tradicional con software (como navegación web o interfaces de usuario) será reemplazada por agentes que operan de forma autónoma, reduciendo la necesidad de intervención humana. En cuanto a la inversión, compara el ciclo actual con la burbuja puntocom de 2000, pero señala diferencias clave: ahora los principales inversores son grandes empresas con liquidez, y la infraestructura de IA tiene demanda real y rápida monetización. También menciona que las limitaciones actuales (GPU, memoria, red) ralentizan el potencial completo de la IA. Andreessen valora el código abierto como crucial para la innovación y la accesibilidad, y destaca la importancia de la inferencia en dispositivos locales (edge) por razones de costo, privacidad y baja latencia. Finalmente, aborda desafíos como la seguridad cibernética, la identidad digital, la necesidad de sistemas de pago para agentes y la resistencia institucional a la adopción de la IA, subrayando que el cambio tecnológico no siempre se traduce en una aceptación social inmediata.

marsbit04/20 00:09

Fundador de a16z: En la era de los agentes, lo que realmente importa ha cambiado

marsbit04/20 00:09

El DeepSeek que esperabas ya ha cambiado

DeepSeek, una vez pionera en IA en China, ha ralentizado significativamente su ritmo de actualización de modelos en los últimos 15 meses, con su esperada versión V4 sufriendo múltiples retrasos. Según informes, esto se debe en gran parte a la presión estratégica nacional para migrar del hardware de NVIDIA al ecosistema de chips domésticos, específicamente los procesadores Huawei Ascend. El gobierno chino alentó a DeepSeek a adoptar chips Huawei para entrenamiento e inferencia, en línea con los objetivos de autonomía tecnológica del país. Sin embargo, el proceso de adaptación ha sido complicado: en 2025, los intentos de usar Ascend 910C para entrenar el modelo enfrentaron problemas de estabilidad y comunicación entre chips. Aunque se volvió temporalmente a NVIDIA para el entrenamiento, DeepSeek continuó trabajando en la migración completa al framework Huawei CANN. Para 2026, se priorizó la adaptación de V4 con el nuevo Ascend 950PR y chips de Cambricon, aunque persisten desafíos técnicos, especialmente en la alineación de precisión entre diferentes hardware. Esta dedicación a la validación de chips nacionales ha consumido recursos y ralentizado el desarrollo, coincidiendo con la pérdida de talento clave y una creciente brecha en capacidades multmodales y de agentes frente a competidores globales como OpenAI y Claude. Si V4 tiene éxito, demostraría la viabilidad del ecosistema de hardware chino para IA avanzada, aunque es posible que no supere a los líderes globales en rendimiento bruto. DeepSeek equilibra así su papel como empresa con misión nacional y sus imperativos comerciales.

marsbit04/15 10:36

El DeepSeek que esperabas ya ha cambiado

marsbit04/15 10:36

Dejen de mirar las GPU, la CPU se está convirtiendo en el 'nuevo cuello de botella' de la era de la IA

En la era de la IA, la CPU se está convirtiendo en el nuevo cuello de botella, desplazando la atención tradicional en las GPU. Aunque las GPU siguen siendo cruciales para el cálculo, el rendimiento del sistema depende cada vez más de la capacidad de ejecución y planificación de las CPU. Intel y Google han firmado un acuerdo para implementar procesadores Xeon en centros de datos de IA, reflejando este cambio. La escasez de CPU se ha intensificado, con precios subiendo un 30% en el último trimestre de 2025 y plazos de entrega extendidos hasta seis meses. Esta crisis se debe en parte a que los fabricantes de semiconductores priorizan la producción de GPU más rentables. La demanda creciente de CPU se debe a la evolución de las cargas de trabajo de la IA, especialmente con el auge de los agentes de IA. Estos requieren múltiples tareas como razonamiento, llamadas a API y gestión de datos, que recaen principalmente en las CPU. Estudios muestran que entre el 50% y el 90.6% de la latencia en agentes de IA proviene del procesamiento en la CPU. Intel, AMD y Nvidia están adoptando estrategias diferentes. Intel se centra en sus procesadores Xeon y colaboraciones clave; AMD ha visto un crecimiento significativo impulsado por la demanda de CPU para agentes de IA; y Nvidia diseña CPUs como Grace, optimizadas para la colaboración eficiente con GPUs. Se proyecta que el mercado de CPUs impulsado por la IA crezca hasta los 60.000 millones de dólares para 2030. La expansión de infraestructuras de CPU para soportar agentes de IA se ha vuelto esencial, marcando un punto de inflexión en la competencia por la supremacía en IA.

marsbit04/13 01:02

Dejen de mirar las GPU, la CPU se está convirtiendo en el 'nuevo cuello de botella' de la era de la IA

marsbit04/13 01:02

活动图片