Artículos Relacionados con Arquitectura

El Centro de Noticias de HTX ofrece los artículos más recientes y un análisis profundo sobre "Arquitectura", cubriendo tendencias del mercado, actualizaciones de proyectos, desarrollos tecnológicos y políticas regulatorias en la industria de cripto.

¿Por qué la acción de Zhipu se disparó casi un 30% en un solo día?

La empresa de IA china Zhipu AI (02513.HK), conocida como "la primera acción de modelos grandes del mundo", experimentó un aumento del 26% en su cotización, alcanzando una capitalización de mercado de 571,5 mil millones de HKD. Este crecimiento se debe al lanzamiento de su API de alta velocidad GLM-5.1-highspeed, que logra una velocidad de generación récord de 400 tokens por segundo, aproximadamente 3-5 veces más rápido que las principales API actuales. Este avance en velocidad es crucial en la era de los Agent de IA, donde las tareas complejas requieren múltiples llamadas al modelo, y una menor latencia mejora la eficiencia y la experiencia del usuario. La innovación técnica de Zhipu se basa en tres pilares: 1. **TileRT:** Un nuevo motor de inferencia que compila el modelo en una única tubería de ejecución continua, eliminando tiempos de espera y maximizando la utilización de la GPU mediante la especialización de Warps. 2. **Paralelización híbrida:** Optimización para el mecanismo de atención MLA (Multi-head Latent Attention), utilizando GPUs de forma heterogénea (una para indexación y otras para cálculo denso) para una colaboración eficiente. 3. **Arquitectura de red ZCube:** Reemplaza la topología de red estándar (ROFT) por un diseño plano y bipartito que elimina los cuellos de botella de comunicación entre GPUs, garantizando una única ruta óptima y evitando la congestión. Los beneficios de esta arquitectura incluyen un aumento del 15% en el rendimiento del clúster, una reducción del 40,6% en la latencia de cola y un ahorro de un tercio en los costos de infraestructura de red. Este enfoque, implementado en software estándar, podría reducir la dependencia de soluciones de hardware propietarias como las de NVIDIA y potencialmente adaptarse a chips chinos, lo que representa un avance significativo en la eficiencia de la inferencia de IA.

marsbitAyer 01:27

¿Por qué la acción de Zhipu se disparó casi un 30% en un solo día?

marsbitAyer 01:27

Diez años apostando por Cerebras: cómo los chips de IA 'a escala de oblea' llegaron al Nasdaq

**Resumen: Una década de apuesta por Cerebras: cómo los "chips de IA a nivel de oblea" llegaron a cotizar en Nasdaq** El 14 de mayo, Cerebras salió a bolsa en Nasdaq. Su viaje, narrado por un inversor inicial, comenzó en 2016 con una hoja de términos entregada en persona en pleno Día de los Inocentes. Esta acción simbolizaba la profunda relación y confianza con el fundador Andrew Feldman, forjada desde 2007. En una época donde la IA era aún incierta y las GPU eran la arquitectura por defecto, Feldman y su cofundador Gary Lauterbach, junto a un equipo excepcional, imaginaron un ordenador completamente nuevo para la IA. Identificaron que el cuello de botella no era la potencia bruta, sino el ancho de banda de memoria. Su solución radical fue el chip de escala de oblea (Wafer-Scale Engine), 58 veces más grande que los chips más grandes de la época. Esto implicó reinventar prácticamente todo: semiconductores, sistemas, enfriamiento, alimentación y software. El camino estuvo plagado de desafíos de ingeniería, incluido un prototipo que literalmente "humo" en su primer encendido. La clave del éxito fue la disciplina, la persistencia y una cultura de confianza no transaccional. El equipo, muchos de los cuales habían trabajado juntos durante décadas, combinaba una ambición rebelde con una inteligencia colaborativa y una genuina bondad. El momento de la verdad llegó en agosto de 2019, cuando su ordenador único funcionó por primera vez. Hoy, la salida a bolsa de Cerebras no es solo el éxito de una empresa. Es un recordatorio de que la revolución de la potencia computacional para la IA puede venir de reimaginar la arquitectura misma, no solo de acumular más GPU, y es un testimonio del poder de los fundadores que eligen problemas que valen la pena resolver y persisten contra toda probabilidad.

marsbit05/15 04:00

Diez años apostando por Cerebras: cómo los chips de IA 'a escala de oblea' llegaron al Nasdaq

marsbit05/15 04:00

Ant Group Digital Technology propone por primera vez una nueva arquitectura para la economía de agentes inteligentes, cubriendo cuatro aspectos: identidad, pagos, gestión de riesgos y cumplimiento

En el Hong Kong Web3 Festival, Ant Digital Technologies presentó por primera vez su arquitectura "4R Full-Stack" para la economía de agentes inteligentes. La propuesta aborda cuatro niveles clave: 1. **Agentic Runtime**: Con DTClaw como producto central, incorpora el modelo de seguridad CARLI para garantizar que el comportamiento de los agentes sea controlable, auditable y recuperable, compatible con múltiples modelos y estándares financieros. 2. **Payment Rails**: Establece canales de pago nativos en cadena que combinan decisiones inteligentes con tecnología de verificación, asegurando transacciones seguras, transparentes e inmutables. Incluye soluciones para micropagos y soporta activos multicadena. 3. **Agent Registry**: Utiliza identidades descentralizadas (DID) y el estándar ERC-8004 para registrar agentes en la cadena de bloques, facilitando la trazabilidad en sus interacciones. 4. **Root Infrastructure**: Aprovecha Jovay Layer2 para confirmaciones ultrarrápidas y ZKVM para computación verificable, resolviendo problemas de confianza en la economía de IA. Según Yan Ying, CTO de la compañía, la arquitectura busca cerrar las brechas actuales en ejecución, identidad, pagos y colaboración entre agentes, permitiendo que la IA opere con autonomía económica en un entorno seguro y regulado.

marsbit04/20 09:26

Ant Group Digital Technology propone por primera vez una nueva arquitectura para la economía de agentes inteligentes, cubriendo cuatro aspectos: identidad, pagos, gestión de riesgos y cumplimiento

marsbit04/20 09:26

Fundador de a16z: En la era de los agentes, lo que realmente importa ha cambiado

En una entrevista, Marc Andreessen, fundador de a16z, analiza la revolución de la IA y su evolución desde sus inicios hace 80 años hasta el presente. Destaca que el actual auge no es repentino, sino el resultado de décadas de avances, con hitos como AlexNet, Transformer y ChatGPT. Andreessen enfatiza que lo que hace diferente esta vez es la combinación de cuatro capacidades: modelos de lenguaje grande (LLMs), razonamiento, codificación y agentes autónomos. Los agentes, descritos como "LLM + shell + sistema de archivos + markdown + cron/loop", representan un cambio profundo en la arquitectura del software, permitiendo que la IA ejecute tareas, guarde estados y even se modifique a sí misma. Andreessen predice que la interacción tradicional con software (como navegación web o interfaces de usuario) será reemplazada por agentes que operan de forma autónoma, reduciendo la necesidad de intervención humana. En cuanto a la inversión, compara el ciclo actual con la burbuja puntocom de 2000, pero señala diferencias clave: ahora los principales inversores son grandes empresas con liquidez, y la infraestructura de IA tiene demanda real y rápida monetización. También menciona que las limitaciones actuales (GPU, memoria, red) ralentizan el potencial completo de la IA. Andreessen valora el código abierto como crucial para la innovación y la accesibilidad, y destaca la importancia de la inferencia en dispositivos locales (edge) por razones de costo, privacidad y baja latencia. Finalmente, aborda desafíos como la seguridad cibernética, la identidad digital, la necesidad de sistemas de pago para agentes y la resistencia institucional a la adopción de la IA, subrayando que el cambio tecnológico no siempre se traduce en una aceptación social inmediata.

marsbit04/20 00:09

Fundador de a16z: En la era de los agentes, lo que realmente importa ha cambiado

marsbit04/20 00:09

活动图片