¿Por qué la acción de Zhipu se disparó casi un 30% en un solo día?

marsbitPublicado a 2026-05-23Actualizado a 2026-05-23

Resumen

La empresa de IA china Zhipu AI (02513.HK), conocida como "la primera acción de modelos grandes del mundo", experimentó un aumento del 26% en su cotización, alcanzando una capitalización de mercado de 571,5 mil millones de HKD. Este crecimiento se debe al lanzamiento de su API de alta velocidad GLM-5.1-highspeed, que logra una velocidad de generación récord de 400 tokens por segundo, aproximadamente 3-5 veces más rápido que las principales API actuales. Este avance en velocidad es crucial en la era de los Agent de IA, donde las tareas complejas requieren múltiples llamadas al modelo, y una menor latencia mejora la eficiencia y la experiencia del usuario. La innovación técnica de Zhipu se basa en tres pilares: 1. **TileRT:** Un nuevo motor de inferencia que compila el modelo en una única tubería de ejecución continua, eliminando tiempos de espera y maximizando la utilización de la GPU mediante la especialización de Warps. 2. **Paralelización híbrida:** Optimización para el mecanismo de atención MLA (Multi-head Latent Attention), utilizando GPUs de forma heterogénea (una para indexación y otras para cálculo denso) para una colaboración eficiente. 3. **Arquitectura de red ZCube:** Reemplaza la topología de red estándar (ROFT) por un diseño plano y bipartito que elimina los cuellos de botella de comunicación entre GPUs, garantizando una única ruta óptima y evitando la congestión. Los beneficios de esta arquitectura incluyen un aumento del 15% en el rendimiento del clúster, ...

Por | AIDeepDive

Hoy, la acción de Zhipu (02513.HK), conocida como "la primera acción del mundo en modelos de gran tamaño", volvió a dispararse.

Durante la sesión, el incremento llegó a superar el 30%. Cerró en 1282 dólares de Hong Kong, con una ganancia diaria superior al 26%, alcanzando una capitalización bursátil de 571.570 millones de dólares de Hong Kong, estableciendo un nuevo máximo histórico.

Lo que desencadenó este fuerte repunte fue un indicador técnico específico: 400 tokens/s.

El 22 de mayo, Zhipu abrió oficialmente su API de alta velocidad GLM-5.1 (GLM-5.1-highspeed) para clientes empresariales, con un parámetro clave: una velocidad de generación del modelo de 400 tokens por segundo, estableciendo un nuevo récord mundial para la velocidad de API de proveedores de modelos de gran tamaño.

Inicialmente pensé que era otro ejercicio de relaciones públicas de los modelos nacionales, pero tras examinar los detalles técnicos, finalmente comprendí la lógica detrás del movimiento del mercado de capitales.

¿Qué significa 400 tokens/s?

El modelo puede generar aproximadamente 200 caracteres chinos por segundo, equivalente a la producción intensa de un escritor profesional en un minuto, comprimida en solo un segundo.

La cantidad de texto que un creador tardaría días en escribir, la versión de alta velocidad de GLM-5.1 la puede completar en 1 minuto; una tarea de reestructuración de sistemas que a un ingeniero le tomaría 3 días, puede ejecutarse en el tiempo que se tarda en tomar un café.

01 La velocidad es más importante de lo que crees

La velocidad siempre ha sido la dimensión más fácil de pasar por alto en la competencia de modelos de IA.

En los últimos tres años, la carrera armamentística de modelos de gran tamaño se ha centrado en dos frentes: escala de parámetros (modelos más grandes e inteligentes) y guerra de precios (tokens más baratos y accesibles). "Rápido" nunca fue el protagonista.

Esto se debe a que, tradicionalmente, la "velocidad" se lograba reduciendo el tamaño del modelo. Para acelerar, se debía usar un modelo más pequeño y simplificado, a costa de una reducción de capacidades.

La importancia de la versión de alta velocidad de GLM-5.1 radica en que, manteniendo las capacidades completas de su modelo base insignia, lleva la velocidad a 400 tokens/s.

Tanto a nivel nacional como internacional, es la primera vez que se logran, sin compromisos, "capacidades insignia" y "latencia extremadamente baja".

¿Por qué es tan crucial la velocidad? Porque el campo de batalla principal de la IA está experimentando una migración fundamental.

Cuando la IA pasa de los ChatBots a la era de los Agentes (Agent), la conversación ya no es el escenario principal. Para que un Agente complete una tarea, a menudo necesita que el modelo se invoque a sí mismo decenas o incluso cientos de veces: escribir código, llamar a APIs, buscar información, usar herramientas...

En este modo de trabajo, la latencia entre cada invocación se acumula y amplifica inexorablemente. En una tarea que requiere 50 invocaciones, si se ahorra 1 segundo en cada una, toda la tarea es casi 1 minuto más rápida. Para asistentes de programación con IA, interacciones de voz o sistemas de decisión empresarial, esta diferencia puede ser decisiva.

En un nivel más profundo, con un presupuesto de tiempo fijo, un razonamiento más rápido significa que el modelo puede completar trayectorias de razonamiento más profundas y realizar más rondas de autoverificación. La velocidad está pasando de ser una métrica del sistema a convertirse en el límite mismo de la inteligencia.

02 ¿Qué tan difícil es lograr velocidad?

Entonces, ¿cuál es aproximadamente el nivel actual de la industria en cuanto a velocidad?

Entre los principales proveedores, GPT-4o de OpenAI ronda los 100–150 tokens/s, la serie Claude Sonnet de Anthropic está en 80–120 tokens/s, y la mayoría de las APIs de modelos insignia nacionales están en el rango de 50–100 tokens/s. 400 tokens/s es aproximadamente de 3 a 5 veces el promedio de la industria.

Lo más crítico es que esta brecha no se puede llenar simplemente asignando más capacidad de cómputo.

Un servidor con 8 tarjetas gráficas H200, en teoría, puede mover hasta 38 TB de datos por segundo. Para GLM-5.1, generar un solo token solo requiere leer unos 42 GB de parámetros activados. En teoría pura, debería acercarse a los 1000 tokens/s.

Pero los sistemas reales a menudo solo logran unas decenas de tokens/s.

Es un abismo de un orden de magnitud. Las GPU no son lo suficientemente lentas, sino que gran parte del tiempo se pierde en esperas, tiempos de inactividad y programación ineficiente.

Zhipu logró este avance en velocidad gracias a innovaciones simultáneas en tres niveles: el motor de inferencia, las estrategias de paralelización y la arquitectura de red.

03 Tres capas tecnológicas superpuestas, acercándose al límite físico del hardware

Originalmente, los modelos de gran tamaño funcionaban así: el modelo se descomponía en operadores independientes, cada uno iniciaba un núcleo de cálculo (kernel) por separado, se calculaba, se detenía, se sincronizaba y esperaba, y luego se iniciaba el siguiente.

En la fase de entrenamiento, donde cada cálculo tarda segundos o incluso minutos, estos costos de inicio y espera eran insignificantes. Pero durante la inferencia, al generar un solo token, un paso crítico puede requerir solo unas decenas de microsegundos, y los costos de inicio y espera se vuelven relativamente inaceptables.

La idea central de TileRT: compilar todo el modelo en un motor que se ejecute continuamente, iniciarlo una vez y que nunca se detenga.

TileRT despliega estáticamente toda la lógica de cálculo del modelo en una única línea de producción continua durante la fase de compilación del código. En tiempo de ejecución, la GPU mantiene un funcionamiento continuo a alta velocidad, el cálculo, el movimiento de datos y la comunicación avanzan en paralelo, y los resultados intermedios se mantienen en la memoria caché interna de alta velocidad de la GPU, sin necesidad de escribirlos repetidamente en la memoria de vídeo más lenta y volver a leerlos.

Aquí hay un detalle de diseño clave: Especialización de Warp.

Para entender Warp, primero hay que entender cómo funciona una GPU. La mayor diferencia entre una GPU y una CPU es que la GPU tiene miles de unidades de cálculo relativamente simples en su interior. Estas unidades se agrupan en conjuntos de 32, y este grupo se llama Warp.

Las 32 unidades dentro del mismo Warp siempre deben actuar de forma sincronizada y ejecutar la misma instrucción, como un pelotón en el ejército donde el sargento ordena a todos hacer el mismo movimiento simultáneamente.

En los marcos tradicionales, todos los Warps ejecutan la misma secuencia de instrucciones; TileRT asigna diferentes responsabilidades a diferentes grupos de Warps: algunos se encargan específicamente de mover los próximos lotes de datos de antemano, otros se encargan específicamente de los cálculos matemáticos, y otros se encargan específicamente de comunicarse con otras GPUs. Los tres grupos trabajan simultáneamente, coordinándose en una línea de producción sin esperarse unos a otros.

Es como pasar de "un trabajador que transporta ladrillos, levanta muros y realiza inspecciones en serie" a "grupos de transporte, grupos de construcción y grupos de inspección trabajando simultáneamente".

Una vez resuelta la eficiencia dentro de una sola tarjeta, surgen nuevos desafíos con la paralelización de múltiples tarjetas.

La práctica común de la industria es la paralelización de tensores (Tensor Parallel): Dividir la matriz de pesos del modelo en varias partes, cada GPU es responsable de una parte, calcula por separado y luego consolida los resultados a través de una interconexión de alta velocidad (NVLink).

Este esquema funciona muy bien para cálculos densos y estructurados como la multiplicación de matrices, y es la solución estándar de la industria para múltiples tarjetas en casi todos los marcos de inferencia de modelos grandes.

GLM-5.1 utiliza **MLA (Multi-head Latent Attention, Atención Latente de Múltiples Cabezas), un mecanismo de atención propuesto por DeepSeek.

Los mecanismos de atención tradicionales necesitan guardar una gran cantidad de datos intermedios (KV Cache) generados en cada paso para su uso posterior, lo que consume mucha memoria de vídeo; el enfoque de MLA es comprimir primero estos datos intermedios en un "vector latente" compacto para almacenarlos, y luego descomprimirlos cuando sea necesario, reduciendo significativamente los requisitos de memoria de vídeo y mejorando la eficiencia de la inferencia.

Pero en el flujo de cálculo de MLA hay un paso especial: necesita realizar indexación dispersa en una gran cantidad de información histórica: similar a buscar rápidamente los libros más relevantes en una enorme biblioteca y luego leer detenidamente esos libros.

El paso de "buscar libros" depende de información global y no es adecuado para distribuir entre múltiples tarjetas; "leer detenidamente" es el cálculo denso adecuado para la paralelización de múltiples tarjetas. Si se fuerza a las 8 GPUs a participar en la "búsqueda de libros", mucho tiempo se perderá en la comunicación de sincronización entre ellas.

La solución de TileRT es hacer que las GPU funcionen de manera heterogénea: la GPU 0 actúa específicamente como "bibliotecaria de referencia", responsable de la indexación dispersa y las decisiones de enrutamiento; las GPU 1–7 actúan como "analistas de lectura profunda", responsables del cálculo denso de atención y las operaciones matriciales. Ambos tipos de trabajadores colaboran para completar toda la capa de cálculo, utilizando las estrategias de paralelización más adecuadas para cada uno.

A continuación, TileRT integra directamente las operaciones de comunicación entre GPUs en la línea de ejecución, sin tratarlas como pasos independientes. Externamente, todo el sistema de 8 tarjetas completa una capa de cálculo de atención con solo una iniciación de kernel, y toda la comunicación y cálculo internos se completan sin problemas dentro de la línea de producción continua.

Las dos capas anteriores resuelven problemas dentro de una sola máquina. Cuando el clúster se amplía a cientos o incluso miles de GPUs, la transmisión de datos entre las GPUs se convierte en un nuevo cuello de botella.

La práctica común de la industria es ROFT (Rail-Optimized Fat-Tree), la solución oficial recomendada por NVIDIA y el estándar absoluto de la industria.

Su estructura es como un árbol: los servidores primero se conectan a los conmutadores de nivel inferior Leaf (capa de acceso, directamente frente a los servidores), los Leaf se conectan hacia arriba con los conmutadores Spine (capa troncal, responsable de la interconexión entre diferentes Leafs, como un nodo de autopista). Los datos que viajan entre dos GPUs deben "subir primero al Spine, luego bajar al Leaf de destino", pasando al menos por 3 saltos.

Para evitar que el tráfico se concentre en unas pocas rutas, esta arquitectura depende del algoritmo ECMP para distribuir los datos entre múltiples caminos, funcionando bien bajo la premisa de un tráfico de Internet "estadísticamente uniforme".

Pero el patrón de tráfico en escenarios de inferencia es completamente desigual. Las longitudes de contexto de diferentes solicitudes pueden variar decenas de veces, la dirección de transmisión del KV Cache entre GPUs es casi aleatoria, y algunos conmutadores Leaf se convierten periódicamente en puntos calientes, activando mecanismos de contrapresión que propagan la congestión desde lo local a toda la red. Esta congestión no se puede resolver ajustando parámetros de protocolo; es producto de la propia estructura de la topología.

El avance fundamental de ZCube: hacer que este tipo de congestión sea físicamente imposible desde el nivel arquitectónico.

El diseño central se divide en dos pasos:

Primer paso, eliminar la capa troncal Spine y aplanar toda la red. Dividir todos los conmutadores Leaf en dos grupos según numeración par/impar, e interconectarlos completamente. Cualquier conmutador impar está conectado a todos los conmutadores pares, y viceversa. Cualquier par de GPUs puede comunicarse pasando como máximo por dos conmutadores, reduciendo los saltos de 3 a 2.

Segundo paso, y el más ingenioso: Cada tarjeta de red de GPU se conecta a los dos grupos de conmutadores de dos maneras radicalmente diferentes. Esta topología especial produce una propiedad matemática clave: Entre cualquier par de GPUs en toda la red, hay una y solo una ruta óptima.

La "ruta única" elimina directamente la raíz de la congestión. Las arquitecturas tradicionales son propensas a puntos calientes precisamente porque hay múltiples rutas disponibles; si el algoritmo de equilibrio de carga elige mal, el tráfico se concentra. ZCube elimina la propia "elección" en el diseño: no necesita equilibrio porque literalmente no hay bifurcaciones.

04 Bajo las mismas condiciones de hardware, ¿cómo se traduce en números?

Después de actualizar el clúster de producción de GLM-5.1 de Zhipu del ROFT tradicional a ZCube, se obtuvieron tres cifras:

En resumen, Con la misma inversión en GPU, el clúster puede atender a más usuarios; con los mismos requisitos de experiencia de usuario, el clúster puede comprar un tercio menos de equipos de red. Mejora bidireccional en eficiencia y costos.

Específicamente, un aumento del 15% en el rendimiento, equivalente a obtener un 15% más de capacidad de cálculo gratis. Con el mismo número de GPUs, un 15% más de rendimiento equivale a una reducción de aproximadamente el 13% en el costo de hardware promedio por token, o la capacidad de atender a un 15% más de usuarios con el mismo costo.

Si un clúster tiene 1000 GPUs, esta actualización equivale a obtener gratuitamente la capacidad de 150 tarjetas adicionales. Según los precios actuales del mercado de tarjetas de inferencia de gama alta, esto representa un valor de capacidad de cálculo del orden de cientos de millones de yuanes.

Una reducción del 40.6% en la latencia de cola (tail latency), que resuelve la estabilidad, no la velocidad promedio. En una tarea de Agente que requiere 50 invocaciones, si la latencia de cola se reduce 1 segundo en cada una, el peor tiempo de finalización de toda la tarea se reduce casi 1 minuto.

Una reducción de un tercio en el costo es un ahorro directo a nivel de construcción. ZCube elimina la capa Spine, y para un clúster de la misma escala, la cantidad de conmutadores y módulos ópticos necesarios se reduce directamente en un tercio. Según cálculos de Zhipu, en un clúster de decenas de miles de tarjetas, solo este ítem puede ahorrar entre 210 y 640 millones de yuanes.

A largo plazo, a medida que la escala de los clústers aumenta exponencialmente, la complejidad de la comunicación entre GPUs se multiplica, y la probabilidad e impacto de la congestión también se amplifican. Esto significa que el valor de innovaciones arquitectónicas como ZCube se hará más evidente y acelerado con la expansión continua de los clústers de inferencia. Mañana, los beneficios para clústers de decenas de miles de tarjetas podrían superar el 15% de hoy.

05 Para finalizar

Después de leer el informe técnico de Zhipu, me pregunto si esto, como el surgimiento de DeepSeek, traerá una tormenta a la industria.

Pensándolo bien, el impacto de ambos parece estar en aspectos diferentes. Cuando apareció DeepSeek, demostró que la misma inteligencia se podía lograr con mucha menos capacidad de cálculo. El mercado temía que "se necesitarían menos GPUs", por lo que la capitalización bursátil de NVIDIA se redujo en casi 600.000 millones de dólares ese día.

Pero la tecnología de Zhipu hoy demuestra: con la misma capacidad de cálculo, se puede producir más. Está redefiniendo "cómo debería ser el resto de la infraestructura, además de las GPUs".

A corto plazo, NVIDIA no se verá afectada, pero a largo plazo, la ventaja competitiva de la combinación GPU + interconexión NVLink + red InfiniBand + ecosistema de software CUDA está siendo "socavada", especialmente la infraestructura InfiniBand que NVIDIA adquirió en 2019 con la compra de Mellanox por 6.900 millones de dólares. El margen premium de NVIDIA en el lado de red se erosionará significativamente.

Además, ZCube elimina la capa Spine, pero en cambio requiere una mayor densidad de puertos en los conmutadores Leaf. Se benefician los fabricantes capaces de producir conmutadores Leaf de alta densidad y gran número de puertos (como Ruijie, Arista, chips de conmutación de Broadcom), mientras que los perjudicados son aquellos que dependen principalmente de los conmutadores Spine de gama alta para obtener un margen premium.

En 2025, Celestica y NVIDIA en conjunto ocuparon aproximadamente el 50% de la cuota de mercado de conmutadores de red de backend para IA. Este panorama enfrentará una reestructuración si el paradigma ZCube se difunde.

Los módulos ópticos son la dirección más directamente beneficiada en esta cadena de suministro, con una lógica muy clara. Para los fabricantes nacionales de módulos ópticos (como InnoLight, TFC, etc.), esto es una ventaja estructural: no solo el volumen total aumenta, sino que la demanda de módulos ópticos de alta velocidad (800G, 1.6T) bajo el paradigma ZCube es más concentrada y urgente que en las arquitecturas tradicionales.

Tanto TileRT como la arquitectura ZCube son un motor de inferencia de software puro que se ejecuta en GPUs estándar, sin depender de características de hardware privativas de NVIDIA, y en teoría se pueden portar a chips nacionales como el Ascend de Huawei. Si esta dirección tiene éxito, reduciría significativamente la barrera de entrada del software para los chips nacionales de IA en escenarios de inferencia.

Este es quizás el significado más profundo detrás de esta innovación tecnológica.

Preguntas relacionadas

Q¿Cuál fue el motivo principal del aumento de casi el 30% en las acciones de Zhipu?

AEl principal detonante de la fuerte subida de las acciones de Zhipu fue el anuncio de su API de alta velocidad GLM-5.1-highspeed, que alcanza una velocidad de generación de 400 tokens por segundo, estableciendo un nuevo récord mundial para las API de modelos de lenguaje grande.

Q¿Por qué es tan importante la velocidad de generación de 400 tokens/s para los modelos de IA?

ALa velocidad es crucial porque el campo de batalla de la IA está migrando de asistentes de chat (ChatBot) a agentes autónomos (Agent). Un Agent para completar una tarea a menudo requiere decenas o incluso cientos de llamadas automáticas al modelo. En este modo, el retraso (latencia) de cada llamada se acumula. Una mayor velocidad significa que los agentes pueden completar tareas complejas, como programación o toma de decisiones, en mucho menos tiempo, lo que es una ventaja decisiva en aplicaciones en tiempo real.

Q¿Cuáles son las tres innovaciones técnicas clave detrás del logro de velocidad de Zhipu según el artículo?

ALas tres innovaciones técnicas clave son: 1) TileRT: Un motor de inferencia que compila todo el modelo en una sola tubería de ejecución continua para minimizar la sobrecarga de inicio y espera de la GPU. 2) Estrategia de paralelización heterogénea: Asigna diferentes roles a las GPUs (por ejemplo, una para indexación dispersa y otras para cómputo denso) para optimizar el trabajo en modelos con mecanismos de atención como MLA. 3) ZCube: Una nueva arquitectura de red plana que elimina la capa central (Spine), reduciendo los saltos de red y eliminando congestiones, acercándose al límite físico del hardware.

Q¿Qué impactos económicos y de eficiencia tuvo la adopción de la arquitectura de red ZCube según el artículo?

ALa adopción de ZCube generó tres impactos principales: 1) Un aumento del 15% en el rendimiento (throughput), equivalente a obtener un 15% más de potencia de cálculo sin costo adicional. 2) Una reducción del 40.6% en la latencia de cola (tail latency), mejorando significativamente la estabilidad y experiencia del usuario. 3) Una reducción de aproximadamente un tercio en los costos de construcción de la red, al eliminar la necesidad de conmutadores de la capa Spine (núcleo), ahorrando miles de millones de yuanes en clusters a gran escala.

QSegún el análisis final del artículo, ¿en qué se diferencian las implicaciones de la innovación de Zhipu de las causadas por el surgimiento de DeepSeek?

ALas implicaciones son diferentes: DeepSeek demostró que se podía lograr una inteligencia similar con mucha menos potencia de cálculo (menos GPUs), lo que generó preocupación en el mercado sobre la demanda futura de hardware. En cambio, la innovación de Zhipu demuestra que con la misma potencia de cálculo (las mismas GPUs) se puede producir mucho más, optimizando radicalmente la infraestructura circundante (software, redes). A largo plazo, esto podría erosionar la ventaja de ecosistemas cerrados como el de NVIDIA (CUDA, InfiniBand) y beneficiar a fabricantes de componentes de red alternativos, como ciertos conmutadores y módulos ópticos.

Lecturas Relacionadas

Con Ozak AI Superando los 7 Millones de Dólares Recaudados, los Analistas Advierten que la Asignación Restante de Preventa Podría Disminuir Rápidamente Mientras los Compradores Tardíos se Apresuran a Asegurar Posiciones.

A medida que el mercado de criptomonedas avanza hacia una nueva era de tokens basados en inteligencia artificial, Ozak AI emerge como uno de los principales proyectos. Su preventa ha superado los 7 millones de dólares recaudados, con más de 1.200 millones de tokens OZ vendidos. Actualmente en su séptima fase de venta anticipada, el token tiene un precio de 0,014 dólares, pero los analistas advierten que la asignación restante podría agotarse rápidamente debido a la alta demanda. La tecnología central de Ozak AI, que combina IA y blockchain para ofrecer herramientas predictivas y un sistema de agentes de IA especializados, está impulsando su adopción. Las asociaciones con redes como Mira y Mind AI fortalecen su ecosistema. Con un precio objetivo de listado de 1 dólar en los principales exchanges, los analistas señalan que el suministro limitado en las fases de preventa, más que la demanda, se está convirtiendo en la principal restricción. Instan a los inversores interesados a actuar con rapidez, ya que los retrasos podrían significar pagar precios más altos en fases posteriores o tras el listado público.

TheNewsCryptoHace 3 hora(s)

Con Ozak AI Superando los 7 Millones de Dólares Recaudados, los Analistas Advierten que la Asignación Restante de Preventa Podría Disminuir Rápidamente Mientras los Compradores Tardíos se Apresuran a Asegurar Posiciones.

TheNewsCryptoHace 3 hora(s)

Creé una aplicación de Android programando por vibración con Google

Autor de The Verge crea tres aplicaciones Android usando solo indicaciones de texto en Google AI Studio, incluyendo un juego de aventuras de texto, un contador de calorías y un juego tipo Mario. La herramienta Gemini genera código, diseña interfaces y corrige errores, permitiendo instalar las apps en un teléfono real en minutos. Aunque el proceso demuestra un avance significativo en la accesibilidad del desarrollo de software, las aplicaciones resultantes tienen problemas de calidad: narrativa básica, datos inexactos y errores de funcionamiento. La experiencia subraya que, si bien la IA puede acelerar la creación inicial, la precisión, usabilidad y calidad final aún dependen en gran medida de la intervención humana.

marsbitHace 5 hora(s)

Creé una aplicación de Android programando por vibración con Google

marsbitHace 5 hora(s)

El primer día de Warsh en el cargo, el mercado le da una "lección": anticipan alzas de tasas este año

El primer día de Warsh al frente de la Reserva Federal (Fed) recibió una “advertencia” del mercado: los precios de los futuros ya descuentan completamente una subida de tipos de 25 puntos básicos este año. La jornada del 22 de mayo, durante su juramento en la Casa Blanca, el gobernador de la Fed Christopher Waller emitió un discurso marcadamente "halcón", señalando que la inflación es ahora el "motor" de la política y que las probabilidades de subir o bajar tipos están equilibradas. Waller admitió que los datos recientes de inflación y empleo cambiaron su postura anterior, y no descartó futuras alzas si los precios no retroceden. Esta postura, junto con las presiones inflacionarias por los costes energéticos y de transporte derivados del conflicto en Irán, impulsó un repunte en los rendimientos de los bonos a 2 años. El economista Steven Blitz (TS Lombard) advirtió que si Warsh decide no subir los tipos en su primera reunión de política monetaria en junio, el mercado lo interpretaría como un relajamiento de facto, dada la amplia escalada de riesgos inflacionarios. La inflación preferida de la Fed ya se encuentra en máximos de tres años. Warsh, el 17º presidente de la Fed, asume en un momento de intensa presión sobre la independencia de la institución y con el mercado exigiendo acción inmediata contra la inflación, dejándole muy poco margen de maniobra.

marsbitHace 6 hora(s)

El primer día de Warsh en el cargo, el mercado le da una "lección": anticipan alzas de tasas este año

marsbitHace 6 hora(s)

¿Microsoft ha perdido el rumbo en la competencia de IA? ¿Puede Copilot devolverlo a la senda correcta?

**Resumen en español:** Microsoft, que inicialmente lideró la carrera de IA gracias a su asociación con OpenAI, enfrenta ahora una ventaja erosionada. Competidores como Claude y Gemini han reducido la exclusividad de GPT, mientras que la aparición de *AI Agents* amenaza su modelo de negocio SaaS tradicional. La baja tasa de adopción de pago de Copilot y la pérdida de cuota frente a herramientas como Cursor y Claude Code evidencian los desafíos. En respuesta, Microsoft está redefiniendo su estrategia: ya no apuesta todo a un solo modelo, sino que busca convertirse en una plataforma empresarial de IA "agnóstica de modelos". El objetivo es integrar diferentes modelos (OpenAI, Anthropic, futuros propios) en su ecosistema, reteniendo el valor central en las plataformas de trabajo, datos, seguridad y flujos de las empresas. El CEO Satya Nadella se ha involucrado directamente en el desarrollo de productos como Copilot Tasks y Copilot Cowork, impulsando una mayor velocidad interna. La compañía ha reestructurado equipos, invertido en Anthropic como respaldo, y relajado los términos con OpenAI. Su nueva apuesta es monetizar no solo el modelo, sino toda la infraestructura segura y conectada alrededor de él, incluso con nuevos modelos de precios híbridos. Sin embargo, el camino es costoso, con gastos de capital previstos de unos 190.000 millones de dólares para 2026. El verdadero reto no es ser el único ganador, sino mantener la entrada principal al software empresarial en un mundo donde los modelos se están convirtiendo en una commodity y los *Agents* siempre activos, como el proyecto OpenClaw, representan el siguiente cambio de paradigma. Para Nadella, esto no es solo un ajuste de producto, sino un "reinicio" de la compañía para la era de la IA.

marsbitHace 7 hora(s)

¿Microsoft ha perdido el rumbo en la competencia de IA? ¿Puede Copilot devolverlo a la senda correcta?

marsbitHace 7 hora(s)

¿Por qué los stablecoins de divisas nunca despegaron?

**Por qué los stablecoins de forex nunca despegaron** Los stablecoins digitales están avanzando más allá de los criptonativos, con un potencial de crecimiento masivo en banca minorista. Sin embargo, actualmente solo ofrecen cuentas en dólares, limitando su alcance global donde el 95-99% de las transacciones son en otras monedas. Los stablecoins de forex directos (como EURC) enfrentan obstáculos enormes: baja liquidez (solo ~$600M vs. $400B en dólares), problemas de paridad, baja adopción en exchanges y FinTechs, y complejidades regulatorias. Tether y Circle tienen una ventaja casi insuperable en efectos de red. La solución no es competir con nuevos stablecoins *spot*, sino adoptar un enfoque *sintético* inspirado en las finanzas tradicionales, donde el 69% del mercado de divisas son derivados. La respuesta son los **NDF (Non-Deliverable Forwards) ajustados a mercado**: * Los usuarios **mantienen sus fondos en USDT/USDC** (con su liquidez, canales on/off-ramp y oportunidades de yield). * Mediante un NDF sintético, obtienen exposición a una moneda extranjera (ej. EUR, CHF). * Su saldo se **cotiza y gana/pierde valor en la moneda objetivo**, pero la liquidación subyacente sigue siendo en dólares. Esto ofrece una paridad sólida (via oráculos), máxima liquidez, eficiencia de capital y escalabilidad a múltiples divisas sin infraestructura bancaria local. **Casos de uso clave:** 1. **Bancos digitales y carteras:** Pueden ofrecer cuentas multicurva a usuarios y empresas, aumentando depósitos y retención sin que los fondos abandonen la red estable del dólar. 2. **Carry Trade (arbitraje de tasas):** Permite ganar el diferencial de tasas de interés entre monedas (ej., JPY vs. BRL) de manera sintética y estable, con un mercado potencial mayor que productos como Ethena. 3. **Pagos globales para empresas:** Similar al modelo de Stripe, permite a comerciantes recibir pagos en stablecoins de dólar pero fijar precios y gestionar riesgos en su moneda local. En resumen, el futuro del forex en blockchain pasa por **exposición sintética sobre la red de stablecoins de dólar dominante**, no por crear nuevos stablecoins *spot* para cada divisa. Esta capa de infraestructura es crucial para que la banca digital con stablecoins alcance una escala global de billones de dólares.

链捕手Hace 7 hora(s)

¿Por qué los stablecoins de divisas nunca despegaron?

链捕手Hace 7 hora(s)

Trading

Spot

Futuros

Artículos destacados

Qué es $S$

Entendiendo SPERO: Una Visión General Completa Introducción a SPERO A medida que el panorama de la innovación sigue evolucionando, la aparición de tecnologías web3 y proyectos de criptomonedas juega un papel fundamental en la configuración del futuro digital. Un proyecto que ha llamado la atención en este campo dinámico es SPERO, denotado como SPERO,$$s$. Este artículo tiene como objetivo recopilar y presentar información detallada sobre SPERO, para ayudar a entusiastas e inversores a comprender sus fundamentos, objetivos e innovaciones dentro de los dominios web3 y cripto. ¿Qué es SPERO,$$s$? SPERO,$$s$ es un proyecto único dentro del espacio cripto que busca aprovechar los principios de descentralización y tecnología blockchain para crear un ecosistema que promueva la participación, la utilidad y la inclusión financiera. El proyecto está diseñado para facilitar interacciones entre pares de nuevas maneras, proporcionando a los usuarios soluciones y servicios financieros innovadores. En su esencia, SPERO,$$s$ tiene como objetivo empoderar a los individuos al proporcionar herramientas y plataformas que mejoren la experiencia del usuario en el espacio de las criptomonedas. Esto incluye habilitar métodos de transacción más flexibles, fomentar iniciativas impulsadas por la comunidad y crear caminos para oportunidades financieras a través de aplicaciones descentralizadas (dApps). La visión subyacente de SPERO,$$s$ gira en torno a la inclusividad, buscando cerrar brechas dentro de las finanzas tradicionales mientras aprovecha los beneficios de la tecnología blockchain. ¿Quién es el Creador de SPERO,$$s$? La identidad del creador de SPERO,$$s$ sigue siendo algo oscura, ya que hay recursos públicos limitados que proporcionan información de fondo detallada sobre su(s) fundador(es). Esta falta de transparencia puede derivarse del compromiso del proyecto con la descentralización, una ética que muchos proyectos web3 comparten, priorizando las contribuciones colectivas sobre el reconocimiento individual. Al centrar las discusiones en torno a la comunidad y sus objetivos colectivos, SPERO,$$s$ encarna la esencia del empoderamiento sin señalar a individuos específicos. Como tal, entender la ética y la misión de SPERO es más importante que identificar a un creador singular. ¿Quiénes son los Inversores de SPERO,$$s$? SPERO,$$s$ cuenta con el apoyo de una diversa gama de inversores que van desde capitalistas de riesgo hasta inversores ángeles dedicados a fomentar la innovación en el sector cripto. El enfoque de estos inversores generalmente se alinea con la misión de SPERO, priorizando proyectos que prometen avances tecnológicos sociales, inclusividad financiera y gobernanza descentralizada. Estas fundaciones de inversores suelen estar interesadas en proyectos que no solo ofrecen productos innovadores, sino que también contribuyen positivamente a la comunidad blockchain y sus ecosistemas. El respaldo de estos inversores refuerza a SPERO,$$s$ como un contendiente notable en el rápidamente evolutivo dominio de los proyectos cripto. ¿Cómo Funciona SPERO,$$s$? SPERO,$$s$ emplea un marco multifacético que lo distingue de los proyectos de criptomonedas convencionales. Aquí hay algunas de las características clave que subrayan su singularidad e innovación: Gobernanza Descentralizada: SPERO,$$s$ integra modelos de gobernanza descentralizada, empoderando a los usuarios para participar activamente en los procesos de toma de decisiones sobre el futuro del proyecto. Este enfoque fomenta un sentido de propiedad y responsabilidad entre los miembros de la comunidad. Utilidad del Token: SPERO,$$s$ utiliza su propio token de criptomoneda, diseñado para servir a diversas funciones dentro del ecosistema. Estos tokens permiten transacciones, recompensas y la facilitación de servicios ofrecidos en la plataforma, mejorando la participación y utilidad general. Arquitectura en Capas: La arquitectura técnica de SPERO,$$s$ soporta la modularidad y escalabilidad, permitiendo la integración fluida de características y aplicaciones adicionales a medida que el proyecto evoluciona. Esta adaptabilidad es fundamental para mantener la relevancia en el siempre cambiante paisaje cripto. Participación de la Comunidad: El proyecto enfatiza iniciativas impulsadas por la comunidad, empleando mecanismos que incentivan la colaboración y la retroalimentación. Al nutrir una comunidad sólida, SPERO,$$s$ puede abordar mejor las necesidades de los usuarios y adaptarse a las tendencias del mercado. Enfoque en la Inclusión: Al ofrecer tarifas de transacción bajas y interfaces amigables para el usuario, SPERO,$$s$ busca atraer a una base de usuarios diversa, incluyendo a individuos que anteriormente pueden no haber participado en el espacio cripto. Este compromiso con la inclusión se alinea con su misión general de empoderamiento a través de la accesibilidad. Cronología de SPERO,$$s$ Entender la historia de un proyecto proporciona información crucial sobre su trayectoria de desarrollo y hitos. A continuación, se presenta una cronología sugerida que mapea eventos significativos en la evolución de SPERO,$$s$: Fase de Conceptualización e Ideación: Las ideas iniciales que forman la base de SPERO,$$s$ fueron concebidas, alineándose estrechamente con los principios de descentralización y enfoque comunitario dentro de la industria blockchain. Lanzamiento del Whitepaper del Proyecto: Tras la fase conceptual, se publicó un whitepaper completo que detalla la visión, objetivos e infraestructura tecnológica de SPERO,$$s$ para generar interés y retroalimentación de la comunidad. Construcción de Comunidad y Primeras Interacciones: Se realizaron esfuerzos de divulgación activa para construir una comunidad de primeros adoptantes e inversores potenciales, facilitando discusiones en torno a los objetivos del proyecto y obteniendo apoyo. Evento de Generación de Tokens: SPERO,$$s$ llevó a cabo un evento de generación de tokens (TGE) para distribuir sus tokens nativos a los primeros seguidores y establecer liquidez inicial dentro del ecosistema. Lanzamiento de la dApp Inicial: La primera aplicación descentralizada (dApp) asociada con SPERO,$$s$ se puso en marcha, permitiendo a los usuarios interactuar con las funcionalidades centrales de la plataforma. Desarrollo Continuo y Alianzas: Actualizaciones y mejoras continuas en las ofertas del proyecto, incluyendo alianzas estratégicas con otros actores en el espacio blockchain, han moldeado a SPERO,$$s$ en un jugador competitivo y en evolución en el mercado cripto. Conclusión SPERO,$$s$ se erige como un testimonio del potencial de web3 y las criptomonedas para revolucionar los sistemas financieros y empoderar a los individuos. Con un compromiso con la gobernanza descentralizada, la participación comunitaria y funcionalidades diseñadas de manera innovadora, allana el camino hacia un paisaje financiero más inclusivo. Como con cualquier inversión en el rápidamente evolutivo espacio cripto, se anima a los potenciales inversores y usuarios a investigar a fondo y participar de manera reflexiva con los desarrollos en curso dentro de SPERO,$$s$. El proyecto muestra el espíritu innovador de la industria cripto, invitando a una exploración más profunda de sus innumerables posibilidades. Aunque el viaje de SPERO,$$s$ aún se está desarrollando, sus principios fundamentales pueden, de hecho, influir en el futuro de cómo interactuamos con la tecnología, las finanzas y entre nosotros en ecosistemas digitales interconectados.

74 Vistas totalesPublicado en 2024.12.17Actualizado en 2024.12.17

Qué es AGENT S

Agent S: El Futuro de la Interacción Autónoma en Web3 Introducción En el paisaje en constante evolución de Web3 y las criptomonedas, las innovaciones están redefiniendo continuamente cómo los individuos interactúan con las plataformas digitales. Uno de estos proyectos pioneros, Agent S, promete revolucionar la interacción humano-computadora a través de su marco agente abierto. Al allanar el camino para interacciones autónomas, Agent S tiene como objetivo simplificar tareas complejas, ofreciendo aplicaciones transformadoras en inteligencia artificial (IA). Esta exploración detallada se adentrará en las complejidades del proyecto, sus características únicas y las implicaciones para el dominio de las criptomonedas. ¿Qué es Agent S? Agent S se presenta como un marco agente abierto revolucionario, diseñado específicamente para abordar tres desafíos fundamentales en la automatización de tareas informáticas: Adquisición de Conocimiento Específico del Dominio: El marco aprende de manera inteligente a partir de diversas fuentes de conocimiento externas y experiencias internas. Este enfoque dual le permite construir un rico repositorio de conocimiento específico del dominio, mejorando su rendimiento en la ejecución de tareas. Planificación a Largo Plazo de Tareas: Agent S emplea planificación jerárquica aumentada por la experiencia, un enfoque estratégico que facilita la descomposición y ejecución eficiente de tareas intrincadas. Esta característica mejora significativamente su capacidad para gestionar múltiples subtareas de manera eficiente y efectiva. Manejo de Interfaces Dinámicas y No Uniformes: El proyecto introduce la Interfaz Agente-Computadora (ACI), una solución innovadora que mejora la interacción entre agentes y usuarios. Utilizando Modelos de Lenguaje Multimodal Grandes (MLLMs), Agent S puede navegar y manipular diversas interfaces gráficas de usuario sin problemas. A través de estas características pioneras, Agent S proporciona un marco robusto que aborda las complejidades involucradas en la automatización de la interacción humana con las máquinas, preparando el terreno para innumerables aplicaciones en IA y más allá. ¿Quién es el Creador de Agent S? Aunque el concepto de Agent S es fundamentalmente innovador, la información específica sobre su creador sigue siendo elusiva. El creador es actualmente desconocido, lo que resalta ya sea la etapa incipiente del proyecto o la elección estratégica de mantener a los miembros fundadores en el anonimato. Independientemente de la anonimidad, el enfoque sigue siendo las capacidades y el potencial del marco. ¿Quiénes son los Inversores de Agent S? Dado que Agent S es relativamente nuevo en el ecosistema criptográfico, la información detallada sobre sus inversores y patrocinadores financieros no está documentada explícitamente. La falta de información disponible públicamente sobre las bases de inversión u organizaciones que apoyan el proyecto plantea preguntas sobre su estructura de financiamiento y hoja de ruta de desarrollo. Comprender el respaldo es crucial para evaluar la sostenibilidad del proyecto y su posible impacto en el mercado. ¿Cómo Funciona Agent S? En el núcleo de Agent S se encuentra tecnología de vanguardia que le permite funcionar de manera efectiva en diversos entornos. Su modelo operativo se basa en varias características clave: Interacción Humano-Computadora: El marco ofrece planificación avanzada de IA, esforzándose por hacer que las interacciones con las computadoras sean más intuitivas. Al imitar el comportamiento humano en la ejecución de tareas, promete elevar las experiencias de los usuarios. Memoria Narrativa: Empleada para aprovechar experiencias de alto nivel, Agent S utiliza memoria narrativa para hacer un seguimiento de las historias de tareas, mejorando así sus procesos de toma de decisiones. Memoria Episódica: Esta característica proporciona a los usuarios orientación paso a paso, permitiendo que el marco ofrezca apoyo contextual a medida que se desarrollan las tareas. Soporte para OpenACI: Con la capacidad de funcionar localmente, Agent S permite a los usuarios mantener el control sobre sus interacciones y flujos de trabajo, alineándose con la ética descentralizada de Web3. Fácil Integración con APIs Externas: Su versatilidad y compatibilidad con diversas plataformas de IA aseguran que Agent S pueda integrarse sin problemas en ecosistemas tecnológicos existentes, convirtiéndolo en una opción atractiva para desarrolladores y organizaciones. Estas funcionalidades contribuyen colectivamente a la posición única de Agent S dentro del espacio cripto, ya que automatiza tareas complejas y de múltiples pasos con una intervención humana mínima. A medida que el proyecto evoluciona, sus aplicaciones potenciales en Web3 podrían redefinir cómo se desarrollan las interacciones digitales. Cronología de Agent S El desarrollo y los hitos de Agent S pueden encapsularse en una cronología que destaca sus eventos significativos: 27 de septiembre de 2024: Se lanzó el concepto de Agent S en un documento de investigación integral titulado “Un Marco Agente Abierto que Utiliza Computadoras como un Humano”, mostrando las bases del proyecto. 10 de octubre de 2024: El documento de investigación se hizo disponible públicamente en arXiv, ofreciendo una exploración en profundidad del marco y su evaluación de rendimiento basada en el benchmark OSWorld. 12 de octubre de 2024: Se publicó una presentación en video, proporcionando una visión visual de las capacidades y características de Agent S, involucrando aún más a posibles usuarios e inversores. Estos hitos en la cronología no solo ilustran el progreso de Agent S, sino que también indican su compromiso con la transparencia y el compromiso comunitario. Puntos Clave Sobre Agent S A medida que el marco Agent S continúa evolucionando, varios atributos clave destacan, subrayando su naturaleza innovadora y potencial: Marco Innovador: Diseñado para proporcionar un uso intuitivo de las computadoras similar a la interacción humana, Agent S aporta un enfoque novedoso a la automatización de tareas. Interacción Autónoma: La capacidad de interactuar de manera autónoma con las computadoras a través de GUI significa un avance hacia soluciones informáticas más inteligentes y eficientes. Automatización de Tareas Complejas: Con su metodología robusta, puede automatizar tareas complejas y de múltiples pasos, haciendo que los procesos sean más rápidos y menos propensos a errores. Mejora Continua: Los mecanismos de aprendizaje permiten a Agent S mejorar a partir de experiencias pasadas, mejorando continuamente su rendimiento y eficacia. Versatilidad: Su adaptabilidad en diferentes entornos operativos como OSWorld y WindowsAgentArena asegura que pueda servir a una amplia gama de aplicaciones. A medida que Agent S se posiciona en el paisaje de Web3 y criptomonedas, su potencial para mejorar las capacidades de interacción y automatizar procesos significa un avance significativo en las tecnologías de IA. A través de su marco innovador, Agent S ejemplifica el futuro de las interacciones digitales, prometiendo una experiencia más fluida y eficiente para los usuarios en diversas industrias. Conclusión Agent S representa un audaz avance en la unión de la IA y Web3, con la capacidad de redefinir cómo interactuamos con la tecnología. Aunque aún se encuentra en sus primeras etapas, las posibilidades para su aplicación son vastas y atractivas. A través de su marco integral que aborda desafíos críticos, Agent S tiene como objetivo llevar las interacciones autónomas al primer plano de la experiencia digital. A medida que nos adentramos más en los reinos de las criptomonedas y la descentralización, proyectos como Agent S sin duda desempeñarán un papel crucial en la configuración del futuro de la tecnología y la colaboración humano-computadora.

800 Vistas totalesPublicado en 2025.01.14Actualizado en 2025.01.14

Cómo comprar S

¡Bienvenido a HTX.com! Hemos hecho que comprar Sonic (S) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar Sonic (S) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu Sonic (S)Después de comprar tu Sonic (S), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear Sonic (S)Tradear fácilmente con Sonic (S) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

1.3k Vistas totalesPublicado en 2025.01.15Actualizado en 2025.03.21

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de S (S).