Artículos Relacionados con LLM

El Centro de Noticias de HTX ofrece los artículos más recientes y un análisis profundo sobre "LLM", cubriendo tendencias del mercado, actualizaciones de proyectos, desarrollos tecnológicos y políticas regulatorias en la industria de cripto.

Diálogo con Mai-Lan de Amazon Web Services: El próximo campo de batalla de S3, cómo enfrentar la ola de consumo de datos en la era de los Agentes

Al comienzo del año, el éxito de OpenClaw en el mercado chino reveló el enorme potencial de los agentes de IA. Sin embargo, esto planteó una pregunta crucial para todos los proveedores de servicios en la nube: ¿está preparada la infraestructura subyacente, especialmente la capa de datos, para manejar la proliferación y el consumo masivo de datos por parte de estos agentes? Mai-Lan Tomsen Bukovec, Vicepresidenta de Tecnología de Amazon Web Services, destaca que los agentes consumen datos de manera "extremadamente activa y agresiva", con una frecuencia de consultas que supera en varios órdenes de magnitud a la de los humanos. Este modelo de trabajo paralelo y masivo convierte el costo-efectividad en un factor decisivo para la infraestructura de agentes. Para abordar esta demanda en la era de la IA, Amazon S3 ha evolucionado con tres innovaciones clave: S3 Table (con soporte nativo para Apache Iceberg, facilitando la interacción de los agentes mediante SQL), S3 Vector (introduciendo vectores como tipo de dato nativo para contextualizar datos y actuar como memoria compartida) y S3 Files (permitiendo a los agentes interactuar con datos en S3 a través de un sistema de archivos POSIX familiar). Estas capacidades, basadas en los principios de disponibilidad, durabilidad y resiliencia de S3, posicionan al servicio como un pilar fundamental para soportar las cargas de trabajo de IA y el consumo intensivo de datos por parte de los agentes en los próximos años.

marsbit05/08 04:21

Diálogo con Mai-Lan de Amazon Web Services: El próximo campo de batalla de S3, cómo enfrentar la ola de consumo de datos en la era de los Agentes

marsbit05/08 04:21

Tras el éxito de DeepSeek V4: Silicon Valley 'construye muros', China 'construye caminos'

El reciente lanzamiento de DeepSeek V4 y Kimi K2.6 destaca la creciente competencia en IA entre China y Silicon Valley. Mientras empresas estadounidenses como OpenAI y Anthropic se enfrascan en una lucha cerrada y competitiva por el dominio del mercado con modelos privativos, China está adoptando un enfoque colaborativo y de código abierto. DeepSeek V4, que encabeza la lista de modelos abiertos de Hugging Face, introduce avances significativos, como una capacidad de contexto ultra-larga y una optimización en el uso de memoria, además de una adaptación específica para chips chinos como los de Huawei y Cambricon. En lugar de competir agresivamente, empresas chinas como DeepSeek y Moonlight (creadora de Kimi) comparten abiertamente avances técnicos, como la arquitectura MLA y el optimizador Muon, lo que acelera la innovación y reduce costos. Este modelo colaborativo ha permitido a China desarrollar sistemas de IA avanzados con una fracción del costo de entrenamiento de sus contrapartes occidentales, al tiempo que impulsa la adopción de hardware local. Aunque los ingresos y valoraciones de las empresas chinas aún son inferiores a las de EE.UU., el crecimiento en el consumo de tokens y la eficiencia en costes sugieren un fuerte potencial a largo plazo. Mientras Silicon Valley levanta "muros" tecnológicos, China está "construyendo caminos" abiertos que podrían redefinir el futuro de la IA global.

marsbit04/26 07:08

Tras el éxito de DeepSeek V4: Silicon Valley 'construye muros', China 'construye caminos'

marsbit04/26 07:08

DeepSeek V4 en gráficos: Tras su lanzamiento, el mercado de capitales reacciona: Zhipu y MiniMax se desploman, NVIDIA se alarma

DeepSeek V4, un modelo de lenguaje de inteligencia artificial de 1 billón de parámetros, se lanzado como código abierto bajo la licencia Apache 2.0, lo que ha provocado reacciones inmediatas en los mercados financieros globales. En China, las acciones relacionadas con la capacidad de computación, como Cambricon y Hygon, experimentaron fuertes alzas, mientras que las empresas de modelos propietarios como Zhipu y MiniMax cayeron significativamente en Hong Kong. NVIDIA también registró una caída inicial, aunque se recuperó al cierre. El lanzamiento de V4 destaca por su adaptación nativa a chips chinos, como el Ascend 950PR de Huawei y el Siyuan 590 de Cambricon, lo que reduce la dependencia de las soluciones de NVIDIA y CUDA. Esto ha llevado a los inversores a reevaluar el ecosistema de IA, favoreciendo a los proveedores de infraestructura local y presionando a las empresas que dependen de modelos cerrados. El modelo no solo iguala el rendimiento de los principales competidores cerrados, sino que también ofrece total apertura comercial y técnica, marcando un punto de inflexión en la industria. La capacidad de China para desarrollar y implementar modelos de IA de clase mundial con hardware local está comenzando a desconectar su demanda de inferencia de la dependencia tecnológica de Occidente, redefiniendo las cadenas de suministro globales de silicio y software.

marsbit04/24 11:40

DeepSeek V4 en gráficos: Tras su lanzamiento, el mercado de capitales reacciona: Zhipu y MiniMax se desploman, NVIDIA se alarma

marsbit04/24 11:40

DeepSeek V4 finalmente se lanza, rompiendo el monopolio de los modelos cerrados más potentes y anunciando colaboración con los chips de Huawei

DeepSeek-V4 ya está aquí: la nueva generación de modelos de inteligencia artificial de DeepSeek se lanza en versión preliminar y de código abierto. Incluye dos variantes: **DeepSeek-V4-Pro**, con 1,6 billones de parámetros y 49.000 millones de activaciones, diseñado para competir con los mejores modelos cerrados; y **DeepSeek-V4-Flash**, una versión más económica con 284.000 millones de parámetros y 13.000 millones de activaciones, optimizada para velocidad y eficiencia. Ambos soportan un contexto de 1 millón de tokens. Según la evaluación interna, DeepSeek-V4 supera a Claude Sonnet 4.5 en tareas de codificación con agentes y se acerca al rendimiento de Opus 4.6 en modo no reflexivo, aunque aún existe una brecha con el modo reflexivo de Opus. El modelo también destaca en conocimientos generales y razonamiento, situándose a la par de los principales modelos cerrados. La gran novedad es la implementación de un nuevo mecanismo de atención que permite el contexto extenso de manera eficiente, combinando compresión de tokens y atención dispersa (DSA). Además, DeepSeek anuncia que **a partir del segundo semestre de 2026, sus servicios admitirán chips Huawei**, reforzando la independencia tecnológica. La API ya está disponible, compatible con las interfaces de OpenAI y Anthropic, y los modelos antiguos se retirarán en julio de 2026. DeepSeek reafirma su compromiso con el avance en IA de código abierto, priorizando la innovación técnica sobre el ruido mediático.

marsbit04/24 04:26

DeepSeek V4 finalmente se lanza, rompiendo el monopolio de los modelos cerrados más potentes y anunciando colaboración con los chips de Huawei

marsbit04/24 04:26

活动图片