¿Por qué la acción de Zhipu se disparó casi un 30% en un solo día?
La empresa de IA china Zhipu AI (02513.HK), conocida como "la primera acción de modelos grandes del mundo", experimentó un aumento del 26% en su cotización, alcanzando una capitalización de mercado de 571,5 mil millones de HKD. Este crecimiento se debe al lanzamiento de su API de alta velocidad GLM-5.1-highspeed, que logra una velocidad de generación récord de 400 tokens por segundo, aproximadamente 3-5 veces más rápido que las principales API actuales.
Este avance en velocidad es crucial en la era de los Agent de IA, donde las tareas complejas requieren múltiples llamadas al modelo, y una menor latencia mejora la eficiencia y la experiencia del usuario. La innovación técnica de Zhipu se basa en tres pilares:
1. **TileRT:** Un nuevo motor de inferencia que compila el modelo en una única tubería de ejecución continua, eliminando tiempos de espera y maximizando la utilización de la GPU mediante la especialización de Warps.
2. **Paralelización híbrida:** Optimización para el mecanismo de atención MLA (Multi-head Latent Attention), utilizando GPUs de forma heterogénea (una para indexación y otras para cálculo denso) para una colaboración eficiente.
3. **Arquitectura de red ZCube:** Reemplaza la topología de red estándar (ROFT) por un diseño plano y bipartito que elimina los cuellos de botella de comunicación entre GPUs, garantizando una única ruta óptima y evitando la congestión.
Los beneficios de esta arquitectura incluyen un aumento del 15% en el rendimiento del clúster, una reducción del 40,6% en la latencia de cola y un ahorro de un tercio en los costos de infraestructura de red. Este enfoque, implementado en software estándar, podría reducir la dependencia de soluciones de hardware propietarias como las de NVIDIA y potencialmente adaptarse a chips chinos, lo que representa un avance significativo en la eficiencia de la inferencia de IA.
marsbitHace 2 hora(s)