Artículos Relacionados con LLM

El Centro de Noticias de HTX ofrece los artículos más recientes y un análisis profundo sobre "LLM", cubriendo tendencias del mercado, actualizaciones de proyectos, desarrollos tecnológicos y políticas regulatorias en la industria de cripto.

De la infraestructura eléctrica a la economía de Token: el 'pastel de siete capas' de la cadena industrial de la IA

En los últimos dos años, la narrativa principal de la industria de la IA se centró en la "guerra de los modelos grandes" entre las grandes tecnológicas, midiendo avances en parámetros, costes de entrenamiento y clústeres de GPU. Sin embargo, hacia 2026, la lógica impulsora está cambiando. Según JP Morgan, la futura expansión de la infraestructura de IA ya no estará impulsada principalmente por el entrenamiento, sino por la enorme demanda de inferencia, generada por miles de millones de Agentes de IA en funcionamiento. Cada interacción consume tokens, lo que marca la transición de la industria de la "era del modelo" a la "era industrial del Token". La industria se está estructurando como un pastel de siete capas que gira en torno al Token: 1) Energía (la base), 2) Centros de Datos para IA (AIDC, las fábricas de Tokens), 3) GPU (el equipo de producción), 4) Modelos de Lenguaje Grandes (LLM, el motor de producción), 5) Distribución de Tokens (la "red eléctrica"), 6) Optimización y Orquestación Inteligente de Tokens (el "cerebro"), y 7) Agentes de IA (los consumidores finales). Actualmente, este ecosistema está fragmentado. Algunos tienen GPU avanzadas pero carecen de energía estable; otros tienen grandes AIDC pero carecen de sistemas de orquestación eficientes; los desarrolladores de agentes enfrentan altos costes y latencia; y los nodos periféricos operan de forma aislada. La verdadera adopción masiva de la IA solo llegará cuando estas siete capas estén plenamente integradas y funcionen de forma coordinada, formando una red de infraestructura inteligente global capaz de producir, distribuir, orquestar y consumir Tokens de manera eficiente y a escala.

marsbit05/26 05:49

De la infraestructura eléctrica a la economía de Token: el 'pastel de siete capas' de la cadena industrial de la IA

marsbit05/26 05:49

El exalumno post-00 de Tsinghua, Wang Guan, presenta otra innovación: revolucionando los modelos de preentrenamiento Transformer con 1/900 tokens y 1/432 de potencia computacional

El equipo de Wang Guan, egresado de la Universidad Tsinghua, ha presentado HRM-Text, un nuevo modelo de preentrenamiento que desafía el paradigma tradicional de los grandes modelos de lenguaje. Sustituyendo el Transformer estándar por un Modelo Recurrente Jerárquico (HRM) y utilizando un objetivo de entrenamiento directo en pares instrucción-respuesta, HRM-Text logra un rendimiento comparable a modelos de código abierto de 2B a 7B de parámetros, pero con una fracción mínima de los recursos. Concretamente, el modelo de 1B de parámetros se entrenó con solo 40B de tokens únicos, utilizando aproximadamente 100-900 veces menos tokens y 96-432 veces menos cómputo estimado que los modelos baseline estándar, a un costo cercano a los 1500 USD. Aún así, alcanzó puntuaciones destacadas en benchmarks clave: MMLU (60.7%), ARC-C (81.9%), DROP (82.2%), GSM8K (84.5%) y MATH (56.2%). La arquitectura HRM emplea módulos de actualización lenta (H) y rápida (L), permitiendo múltiples pasos recurrentes por token para aumentar la profundidad computacional sin agregar parámetros. Técnicas como MagicNorm y Warmup Deep Credit Assignment aseguraron la estabilidad del entrenamiento recurrente. Los experimentos muestran que HRM supera en eficiencia y estabilidad a Transformers de tamaño similar bajo un presupuesto computacional fijo. Las ablaciones confirman la contribución clave del objetivo de finalización de tareas y el enmascaramiento PrefixLM. El análisis sugiere que la estructura recurrente confiere una "profundidad efectiva" mayor. Las limitaciones incluyen una cobertura de conocimiento aún limitada por el corpus, la necesidad de mecanismos de tiempo de cómputo adaptativo, y desafíos de ingeniería para implementar PrefixLM en entornos de diálogo. El trabajo futuro explorará desacoplar el núcleo de razonamiento del almacenamiento de conocimientos y validar la escalabilidad a tamaños de modelo mayores.

marsbit05/26 03:19

El exalumno post-00 de Tsinghua, Wang Guan, presenta otra innovación: revolucionando los modelos de preentrenamiento Transformer con 1/900 tokens y 1/432 de potencia computacional

marsbit05/26 03:19

TechFlow 情报局: Huawei lanza la "Ley Tau" y el sector de semiconductores sube; Meta despidos del 10%

IA resuelve 9 problemas matemáticos complejos por solo cientos de dólares cada uno, mostrando su valor práctico en investigación pura. En IA, DeepSeek lanza un agente de programación, mientras un estudio revela que los modelos grandes pierden restricciones en tareas complejas. Qwen 3.6 logra alta velocidad en GPU antiguas, desatando debates sobre NVIDIA vs. alternativas. En cripto, Ethereum Foundation se reduce para vender menos ETH, y rumores falsos sobre CZ provocan una explosión de memecoins. Los préstamos respaldados por RWA ganan terreno. En chips, Huawei presenta la "Ley Tau", apuntando a rendimiento de 1.4 nm para 2031, lo que impulsa las acciones del sector. La memoria ya supone 2/3 del costo de los chips de IA, y ejecutivos chinos venden acciones en máximos. Meta despidió al 10% de su plantilla. El CEO de Google fue abucheado en Stanford, y la empresa publicó un exploit de Chromium antes de parchearlo masivamente. Xiaomi sanciona a técnicos por instalaciones falsas. En bolsa, AMD es vista como retador de NVIDIA. El 99% de los CEOs planea despidos impulsados por IA. Palantir gana un contrato para monitorear empleados federales, y BlackBerry resurge en ciberseguridad. El petróleo WTI cae un 6% tras avances en negociaciones con Irán. La plata sube, y las reservas globales de crudo caen a niveles críticos. En tendencias, se descubre un ataque que usa audio inaudible para hackear asistentes de voz. CBS deja de borrar grabaciones piratas antiguas de Stephen Colbert. La narrativa central conecta la carrera de IA y chips con despidos, geopolítica y quién define el futuro tecnológico.

marsbit05/25 10:53

TechFlow 情报局: Huawei lanza la "Ley Tau" y el sector de semiconductores sube; Meta despidos del 10%

marsbit05/25 10:53

Patrones de Diseño Agente: Un libro que me hizo replantearme 'qué es realmente un Agente'

El libro _Agentic Design Patterns_, escrito por Antonio Gullí, presenta una clasificación de cuatro niveles para los agentes de IA: * **Nivel 0**: LLM básico, sin herramientas ni capacidad de acción. No es considerado un agente real. * **Nivel 1**: Usa herramientas de forma autónoma, decidiendo cuándo y cómo utilizarlas para obtener información externa. * **Nivel 2**: Introduce la planificación y la "Context Engineering", que consiste en filtrar y preparar cuidadosamente la información del contexto para mejorar la precisión. Incluye la capacidad de autorreflexión (Reflection) mediante un patrón de dos agentes: un "Productor" y un "Crítico". * **Nivel 3**: Sistemas multiagente que colaboran, con diferentes topologías de comunicación según la complejidad de la tarea. El artículo destaca tres conceptos clave del libro: 1. **Context Engineering**: Va más allá del "Prompt Engineering", gestionando las capas de información (instrucciones del sistema, datos externos, estado implícito y retroalimentación) que el agente tiene a su disposición para tomar decisiones. 2. **Reflection**: Un patrón práctico donde un agente "Productor" genera un resultado y un agente "Crítico" distinto lo revisa, creando un ciclo de mejora iterativa. 3. **Memoria en tres capas**: Sesión (conversación actual), Estado (datos temporales de la tarea) y Memoria persistente (experiencia a largo plazo). La conclusión es que, en lugar de construir sistemas multiagente complejos, a menudo es más eficaz primero llevar un solo agente al Nivel 2, dotándolo de herramientas, reflexión y una gestión adecuada del contexto y la memoria. El libro proporciona un mapa de patrones de diseño que sistematizan soluciones a problemas comunes en el desarrollo de agentes.

链捕手05/25 04:50

Patrones de Diseño Agente: Un libro que me hizo replantearme 'qué es realmente un Agente'

链捕手05/25 04:50

DeepSeek anuncia una rebaja permanente, pero Liang Wenfeng no quiere ser el 'Bodhisattva cibernético'

DeepSeek ha anunciado la "permanencia" de un descuento del 75% en la API de su modelo V4-Pro, con precios base que caen drásticamente a 0.435 dólares por millón de tokens de entrada y 0.87 por millón de salida. Este movimiento contrasta fuertemente con la tendencia general de aumento de precios en la industria de la IA, donde gigantes como Anthropic, OpenAI y Google han subido tarifas entre un 20% y un 37% en los últimos meses. Aunque algunos califican a Liang Wenfeng, su fundador, como un "bodhisattva cibernético", el artículo argumenta que su estrategia de código abierto y precios ultrabajos es una elección de modelo de negocio consciente. La competitividad de DeepSeek no se basa solo en la generosidad, sino en ventajas estructurales: el uso de hardware nacional como el Ascend, el acceso a talento de IA relativamente más asequible y, sobre todo, una ventaja crucial en costos energéticos. China cuenta con precios de electricidad industrial significativamente más bajos y una infraestructura de energía verde en regiones occidentales, donde la compañía planea construir centros de datos. Mientras los presupuestos de tokens de grandes empresas como Microsoft o Uber se agotan rápidamente, la propuesta de DeepSeek gana relevancia. Para muchas aplicaciones empresariales prácticas (servicio al cliente, resúmenes, código), no se requiere el modelo más potente del mundo, sino uno "suficientemente bueno, estable y extremadamente barato". Al ofrecer costos que son una fracción mínima de los de sus competidores, DeepSeek permite a las empresas experimentar y escalar sus flujos de trabajo de IA de manera masiva. Por lo tanto, en un contexto de IA cada vez más cara, el modelo de bajo costo de DeepSeek no es un acto de caridad, sino una fuente de valor y una forma de ejercer una influencia competitiva en el mercado global.

marsbit05/24 12:22

DeepSeek anuncia una rebaja permanente, pero Liang Wenfeng no quiere ser el 'Bodhisattva cibernético'

marsbit05/24 12:22

¿Por qué la acción de Zhipu se disparó casi un 30% en un solo día?

La empresa de IA china Zhipu AI (02513.HK), conocida como "la primera acción de modelos grandes del mundo", experimentó un aumento del 26% en su cotización, alcanzando una capitalización de mercado de 571,5 mil millones de HKD. Este crecimiento se debe al lanzamiento de su API de alta velocidad GLM-5.1-highspeed, que logra una velocidad de generación récord de 400 tokens por segundo, aproximadamente 3-5 veces más rápido que las principales API actuales. Este avance en velocidad es crucial en la era de los Agent de IA, donde las tareas complejas requieren múltiples llamadas al modelo, y una menor latencia mejora la eficiencia y la experiencia del usuario. La innovación técnica de Zhipu se basa en tres pilares: 1. **TileRT:** Un nuevo motor de inferencia que compila el modelo en una única tubería de ejecución continua, eliminando tiempos de espera y maximizando la utilización de la GPU mediante la especialización de Warps. 2. **Paralelización híbrida:** Optimización para el mecanismo de atención MLA (Multi-head Latent Attention), utilizando GPUs de forma heterogénea (una para indexación y otras para cálculo denso) para una colaboración eficiente. 3. **Arquitectura de red ZCube:** Reemplaza la topología de red estándar (ROFT) por un diseño plano y bipartito que elimina los cuellos de botella de comunicación entre GPUs, garantizando una única ruta óptima y evitando la congestión. Los beneficios de esta arquitectura incluyen un aumento del 15% en el rendimiento del clúster, una reducción del 40,6% en la latencia de cola y un ahorro de un tercio en los costos de infraestructura de red. Este enfoque, implementado en software estándar, podría reducir la dependencia de soluciones de hardware propietarias como las de NVIDIA y potencialmente adaptarse a chips chinos, lo que representa un avance significativo en la eficiencia de la inferencia de IA.

marsbit05/23 01:27

¿Por qué la acción de Zhipu se disparó casi un 30% en un solo día?

marsbit05/23 01:27

37 días de detención penal: Los primeros que se enriquecieron con las "Estaciones de transferencia de IA" empiezan a ser detenidos

**Resumen: Riesgos legales del negocio de "estaciones de retransmisión de IA"** En mayo de 2026, según informes del sector, el administrador de una "estación de retransmisión de IA" fue detenido durante 37 días, aparentemente por extraer de manera ilegal y revender recursos de API de IA a bajo coste. Este caso destaca los riesgos legales asociados a este negocio, que ha surgido debido a la alta demanda de modelos de IA extranjeros (como OpenAI, Claude) en regiones con restricciones de acceso. Estas plataformas actúan como intermediarios, facilitando el acceso a los usuarios finales, pero sus modelos de negocio a menudo se basan en prácticas cuestionables: * Revender cuotas gratuitas obtenidas mediante registros masivos de cuentas. * Arbitraje de reembolsos y sobrefacturación de tokens. * Sustitución de modelos (vender acceso a un modelo avanzado pero proporcionar uno inferior). * Venta de datos de conversación de los usuarios. Desde una perspectiva legal, estas actividades conllevan tres riesgos principales: 1. **Modelo operativo ilegal:** Operar sin la licencia de telecomunicaciones requerida y eludir las restricciones regionales de los proveedores podría constituir el delito de operación comercial ilegal. 2. **Falta de seguridad de datos:** Al manejar grandes volúmenes de datos de usuarios sin medidas de seguridad adecuadas, los operadores podrían enfrentarse a cargos por no cumplir con las obligaciones de gestión de seguridad de la red de información. 3. **Recolección y venta ilegal de datos:** La venta de registros de conversación de usuarios sin su consentimiento puede fácilmente alcanzar el umbral para el delito de violación de información personal de ciudadanos. En resumen, aunque estas estaciones de retransmisión reducen las barreras de acceso para los usuarios, operan en un vacío regulatorio, exponiendo los datos sensibles de los usuarios y socavando los modelos comerciales de los proveedores de IA. Este caso subraya la necesidad urgente de establecer un orden comercial y una base de confianza para el desarrollo sostenible de la industria de la IA.

marsbit05/21 14:45

37 días de detención penal: Los primeros que se enriquecieron con las "Estaciones de transferencia de IA" empiezan a ser detenidos

marsbit05/21 14:45

Empresas emergentes de IA con 80.000 millones de dólares de ARR, el 90% se lo llevan 2 compañías

El sector de la IA genera 800.000 millones de dólares en ingresos anuales recurrentes (ARR), de los cuales el 89% (unos 550.000 millones) se concentra en solo dos empresas: OpenAI y Anthropic. OpenAI, con ingresos entre 240.000 y 250.000 millones, depende principalmente de suscripciones de usuarios finales de ChatGPT. Anthropic, superando los 300.000 millones, ha priorizado el mercado empresarial y las API, logrando aumentar su cuota en EE.UU. del 1% a más del 34% en menos de dos años. Las otras 32 empresas líderes comparten el 11% restante del mercado, con una participación media del 0,34% cada una. Aunque empresas como Perplexity (búsqueda), Mistral (código abierto en Europa) o Cohere (implementación privada para empresas) tienen modelos de negocio válidos, enfrentan una creciente presión competitiva en talento, financiación y acceso a potencia de cálculo. A pesar de su dominio, ambos gigantes enfrentan desafíos. OpenAI lidia con litigios y complejas negociaciones comerciales (como con Apple), mientras que Anthropic debe cumplir las altas expectativas de sus grandes inversores, como Amazon. Esta concentración refleja una tendencia histórica en infraestructuras tecnológicas, impulsada por efectos de red y costes de cambio. Sin embargo, la rápida evolución de la IA deja espacio para cambios disruptivos. Para las empresas más pequeñas, la estrategia más viable parece ser especializarse en nichos verticales (legal, sanitario, industrial) donde los modelos generalistas no sean suficientes, en lugar de competir de frente en el terreno de la IA de propósito general.

marsbit05/21 08:08

Empresas emergentes de IA con 80.000 millones de dólares de ARR, el 90% se lo llevan 2 compañías

marsbit05/21 08:08

活动图片