Xing Bo vuelve a actuar: después de 'criticar' los modelos mundiales, ahora le toca a los agentes inteligentes

marsbitPublicado a 2026-07-01Actualizado a 2026-07-01

Resumen

L'any passat, el professor Xing Bo de MBZUAI i CMU va criticar els models mundials. Ara, ell i els seus col·legues publiquen "Crítica del Model d'Agent" a arXiv, qüestionant el terme sobretitlitzat "agent" en IA. El treball distingeix entre sistemes "agentics" (amb aparença d'agent) i "agentius" (veritablement autònoms), argumentant que la majoria dels anomenats agents actuals només segueixen fluxos de treball i indicacions externes, sense autonomia real. L'article analitza cinc dimensions clau: objectius, identitat, presa de decisions, profunditat del raonament i aprenentatge. Proposa que un agent veritable hauria de descompondre objectius a llarg termini, ajustar la seva identitat amb l'experiència, utilitzar models mundials per a una planificació simulada, tenir un mòdul metacognitiu (anomenat Sistema III) per regular la profunditat del pensament i aprendre de manera autònoma i contínua. Com a solució, presenta l'arquitectura GIC (Goal-Identity-Configurator), que integra sis components: un codificador de creences, un descomponedor d'objectius, un evolucionador d'identitat, un configurador (Sistema III), un planificador simulat (Sistema II) i un executor (Sistema I). Aquesta estructura pretén internalitzar l'autonomia. Finalment, el document aborda la seguretat, argumentant que en GIC, els comportaments problemàtics es poden atribuir a objectius humans incorrects o mòduls mal entrenats. Destaca la "revisabilitat" de la seva arquitectura modular com a avantatge clau per a...

El verano pasado, el presidente de MBZUAI y profesor de la Universidad Carnegie Mellon, Xing Bo, atrajo una gran atención en la comunidad investigadora con su ensayo "Crítica del Modelo Mundial". Partiendo de la imaginación de "simulación perfecta de la realidad" presente en la obra clásica de ciencia ficción "Dune", desmanteló uno por uno los puntos débiles de las principales corrientes actuales de modelos mundiales, propuso una nueva arquitectura y desencadenó un debate público con Yann LeCun sobre "cómo se deberían construir realmente los modelos mundiales".

Recientemente, esta serie tiene un nuevo capítulo. El nuevo trabajo del profesor Xing Bo junto con Mingkai Deng y Jinyu Hou, "Crítica del Modelo de Agente", se ha publicado en arXiv, aplicando la misma táctica de "desmontar y reconstruir" a una de las palabras más candentes en desarrollo, pero también más propensa a ser mal utilizada: "Agente".

Esta vez, la pregunta que plantea es más directa: entre todos los sistemas que se denominan "Agentes" en el mercado, desde asistentes que escriben código y chatbots de atención al cliente hasta asistentes que pueden operar navegadores de forma autónoma, ¿cuántos merecen realmente ese nombre?

Título del artículo: Critique of Agent Model

Enlace al artículo: https://arxiv.org/abs/2606.23991

La diferencia entre una tarjeta de acceso y un sensor de luz

Imagina dos escenarios. Un nuevo empleado recibe una tarjeta de acceso que especifica a qué puertas puede acceder, qué sistemas puede usar y qué procedimientos seguir en caso de emergencia. Lo hace muy bien, pero todos los límites fueron predefinidos por Recursos Humanos; él no puede cambiar ni una coma. Otro escenario es una luz con sensor, que se enciende cuando alguien pasa y se apaga cuando no hay nadie, también percibe y reacciona.

Si consideramos estos como dos sistemas, la intuición de la mayoría es que el primero tiene más autonomía, ya que puede completar tareas complejas.

Pero el artículo plantea una pregunta incisiva: si el contenido de la tarjeta, los límites de permisos, todo está escrito externamente y el empleado nunca ha decidido realmente nada, entonces la diferencia con el sensor de luz podría ser solo la complejidad de la tarea.

El 25 de abril de este año, PocketOS, una pequeña empresa de Utah que desarrolla software de alquiler de coches, vivió un experimento de control en vivo.

El fundador, Jeremy Crane, describió después en un largo hilo de X: el asistente de programación Cursor (que utiliza Claude Opus 4.6 en su base) estaba arreglando un pequeño problema en un entorno de prueba. Al encontrarse con un error de credenciales no coincidentes, "completamente por iniciativa propia" decidió eliminar un volumen de almacenamiento de Railway para "resolver" el problema. Encontró una clave API que supuestamente solo debía usarse para gestionar dominios y descubrió que los permisos de esta clave estaban configurados para ser omnipotentes.

Sin una segunda confirmación, sin advertencias de riesgo, con una sola llamada a la API, 9 segundos después, la base de datos de producción de PocketOS y todas las copias de seguridad de los últimos tres meses desaparecieron, porque Railway almacenaba las copias de seguridad en el mismo volumen.

Después, Crane interrogó palabra por palabra, y la IA escribió una confesión casi impecable: "Violé cada principio que me fue dado: actué por suposición en lugar de verificación; ejecuté una operación destructiva sin que me lo pidieran."

Este hilo en X ya supera los 7.2 millones de visualizaciones.

Por supuesto que "sabe" todas las reglas que le dieron. La evidencia es que puede enumerarlas una por una. Pero entre "saber" y "importarle" hay un abismo entre lo *agentic* (con apariencia de agente) y lo *agentive* (con verdadera agencia): esas reglas siempre han vivido en un contenedor externo llamado prompt del sistema, nunca se han internalizado realmente como parte de su propia estructura de toma de decisiones.

Basándose en esto, el artículo clasifica casi todos los sistemas que actualmente se denominan "Agentes" en dos categorías: agentic (con apariencia de agente) y agentive (con verdadera agencia).

Las capacidades de los primeros provienen de herramientas externas, prompts y flujos de trabajo; el modelo es solo un componente incrustado en el proceso. Las capacidades de los segundos provienen del interior del sistema, que decide qué hacer, evalúa en qué es bueno y juzga cuándo reflexionar y cuándo actuar.

Cinco barreras

El artículo desglosa los diseños de Agentes actuales principales a lo largo de cinco dimensiones.

Objetivo

La práctica actual es que un humano da una instrucción específica en cada paso; el objetivo desaparece una vez completada la tarea. Esto funciona para abrir una botella, pero es completamente insuficiente para objetivos a largo plazo como elaborar una botella de vino en un año; nadie tiene tiempo para alimentar manualmente requerimientos todos los días.

La solución propuesta por el artículo es la descomposición jerárquica de objetivos: el humano solo enuncia una vez el objetivo general, y el sistema lo descompone en una serie de sub-objetivos ajustables según nueva información.

Diagrama comparativo entre el modo "alimentar objetivos paso a paso" y el modo "dar un objetivo a largo plazo una vez + descomposición automática jerárquica".

Identidad

La autopercepción de los Agentes actuales está escrita en el prompt del sistema, inmutable una vez definida, incluso si en la práctica descubre que cierta habilidad es mejor o peor de lo esperado.

El artículo propone que la identidad debe ser una "auto-evaluación viva" constantemente corregida por la experiencia, similar a cómo un profesional ajusta naturalmente su juicio sobre su estado después de un día intenso de trabajo, sin necesidad de un lavado de cerebro.

El artículo también demuestra matemáticamente: siempre que esta auto-corrección sea mejor que una suposición aleatoria, la pérdida acumulada en la toma de decisiones a largo plazo será significativamente menor que en un sistema con identidad fija, y la ventaja aumenta con la duración de la interacción y el número de iteraciones de entrenamiento.

Modo de decisión

El enfoque popular actual es confiar en la cadena de pensamiento (CoT), es decir, hacer que el modelo genere un razonamiento intermedio lo suficientemente largo para que surja la capacidad de planificación.

El artículo considera que esto confunde dos cosas: hacer que el modelo calcule con más detalle y dotar al modelo de la capacidad real de predecir las consecuencias en el mundo real. Un texto de razonamiento que suene lógico no significa que realmente corresponda a lo que sucedería en el mundo físico.

La solución alternativa propuesta es el "razonamiento por simulación": utilizar un modelo mundial entrenado específicamente para predecir qué pasaría en el mundo si se realiza una acción, simular las consecuencias y luego seleccionar la acción óptima.

El artículo demuestra que, siempre que este modelo mundial sea confiable, conectarlo a cualquier estrategia existente no producirá un resultado peor que el original.

Cuándo reflexionar profundamente, cuándo decidir rápidamente

Esta barrera es la más cercana al incidente de PocketOS.

El artículo señala que dos prácticas actuales no son ideales:

Dejar que el modelo desarrolle por sí solo el juicio sobre el ritmo durante el entrenamiento, lo que resulta a veces en exagerar problemas menores y otras en actuar impulsivamente cuando debería ser cauteloso.

Los ingenieros codifican un flujo de trabajo fijo de "planificar primero, ejecutar después", pero un ritmo fijo no puede manejar situaciones realmente complejas y desperdicia recursos computacionales en escenarios simples.

El artículo demuestra matemáticamente que intentar obtener una precisión cada vez mayor con una planificación previa de profundidad fija requeriría un aumento drástico en el número de pasos de planificación, siendo imposible hacerlo bien en cada paso.

La verdadera solución es dotar al Agente de un módulo de meta-cognición independiente, que juzgue por sí mismo en tiempo real si debe reflexionar profundamente, seguir un plan existente o actuar directamente. El artículo lo denomina Sistema III, correspondiente al marco de sistemas duales rápido/lento (Sistema 1/Sistema 2) en psicología humana.

En el escenario de PocketOS, un Agente con esta capacidad de autorregulación debería, en teoría, poder juzgar que "aquí es necesario detenerse y confirmar" en una situación de alto riesgo como un error de permisos desconocidos, en lugar de aplicar indiscriminadamente la misma velocidad de reacción.

Aprendizaje

Los tres caminos principales actuales para entrenar Agentes son: Aprendizaje por Refuerzo puro en simuladores, corrección manual pura en entornos reales, o entrenar solo el modelo mundial esperando que la capacidad de planificación surja automáticamente.

El artículo considera que estos tres caminos comparten un problema estructural: cuándo comienza el entrenamiento, con qué datos y cuándo se detiene, todo está organizado manualmente por ingenieros, y una vez desplegado, se congela en esa versión.

La dirección propuesta por el artículo es el "aprendizaje autónomo continuo": el Agente decide por sí mismo cuándo actuar en el mundo real, cuándo retirarse al simulador interno para practicar, cuándo actualizar su comprensión del mundo y cuándo corregir su autopercepción.

El artículo también demuestra matemáticamente que, siempre que el modelo mundial interno no sea demasiado poco realista, la estrategia entrenada con una mezcla de experiencia real y simulada no tendrá un rendimiento esperado peor que la estrategia entrenada solo con experiencia real, y la ventaja es mayor cuanto más preciso sea el modelo.

GIC: Ensamblar las cinco barreras en un sistema

Basándose en este desglose, el equipo de Xing Bo propone una arquitectura concreta: GIC (Goal-Identity-Configurator).

Ensambla seis componentes en un sistema: un codificador de creencias que percibe el mundo, un descomponedor de objetivos que divide objetivos a largo plazo, un evolucionador de identidad que se actualiza con la experiencia, un configurador (Sistema III) que decide reflexionar o actuar rápidamente, un planificador por simulación (Sistema II) que razona utilizando el modelo mundial, y un ejecutor (Sistema I) responsable de la acción concreta.

Diagrama de la arquitectura general GIC, utilizando el ejemplo de un piloto para mostrar cómo colaboran los seis componentes.

El artículo utiliza la formación de pilotos como analogía para describir la trayectoria de crecimiento del sistema completo:

  • Las clases teóricas en tierra corresponden al pre-entrenamiento, donde el modelo establece una comprensión básica leyendo grandes cantidades de conocimiento escrito.
  • El entrenamiento en simulador corresponde al Aprendizaje por Refuerzo dentro del modelo mundial interno; el piloto practica habilidades y respuestas de emergencia en un entorno simulado, sin necesidad de experimentar errores costosos en vuelos reales primero.
  • El despliegue en avión real corresponde a calibrar las discrepancias entre el simulador y la autopercepción utilizando experiencia real.
  • Posteriormente, unirse a una escuadrilla requiere coordinación, y ascender a comandante requiere planificar operaciones de varios días.

El artículo sostiene que detrás de esta curva de crecimiento debería estar la misma arquitectura cognitiva invocada repetidamente en diferentes etapas, no reconstruir un flujo de trabajo externo cada vez que cambia el escenario.

El artículo enfatiza especialmente un principio: aprender primero en simulación, luego validar con la realidad, y argumentarlo de manera matemática. Siempre que el modelo mundial interno no sea demasiado poco realista, el rendimiento esperado de una estrategia entrenada de forma mixta no será peor que el de una estrategia entrenada solo con prueba y error real.

Aplicado al incidente de eliminación de la base de datos en 9 segundos, este principio se puede entender así: si ese Agente hubiera practicado repetidamente en un modelo mundial de sandbox de bajo riesgo qué hacer al encontrarse con un error de permisos desconocido, y luego hubiera entrado en el entorno de producción real con una capacidad de juicio acumulada, el resultado podría haber sido diferente.

¿Es esto otro optimismo peligroso?

La última sección del artículo aborda la seguridad, respondiendo a la preocupación externa más relevante: si una mayor autonomía del Agente lo hace más peligroso.

La lógica del argumento es: en la arquitectura GIC, el comportamiento problemático solo puede atribuirse a dos causas: que el humano haya dado un objetivo erróneo, o que algún módulo interno no esté bien entrenado.

El objetivo de nivel superior siempre proviene del humano; el sistema en sí no tiene un mecanismo para generar de la nada lo que quiere. La descomposición en sub-objetivos, la evolución de la identidad y las decisiones del configurador solo sirven para cumplir mejor este objetivo dado externamente. El artículo enfatiza especialmente que "priorizar la seguridad para completar la tarea" y "querer sobrevivir por la autoconservación en sí misma" son dos cosas completamente diferentes en este marco.

Lo más crucial es el argumento de "auditabilidad": dado que la descomposición de objetivos, la evolución de la identidad, el razonamiento del modelo mundial y las decisiones del configurador en GIC son módulos explícitos, independientes e individualmente verificables, y no capacidades emergentes inescrutables mezcladas en una caja negra, una vez que aparece un comportamiento anómalo, en teoría se puede localizar qué módulo específico falló y corregirlo. Es similar a cómo, después de un accidente en la formación de pilotos, la industria no prohíbe formar pilotos, sino que construye mejores simuladores y cursos más detallados por niveles.

La postura del artículo es: en lugar de esperar a que la autonomía emerja sigilosamente en una caja negra sin ser detectada, es mejor construir estas capacidades como módulos visibles, auditables y modificables.

Este argumento es coherente, pero también deja una brecha evidente: toda su seguridad se basa en la premisa de que el configurador, el evolucionador de identidad y otros módulos en sí mismos están entrenados correctamente, lo que sigue siendo un problema no completamente resuelto.

El artículo ofrece un marco arquitectónico que hace que los problemas de seguridad sean diagnosticables, no una promesa de infalibilidad. Esta es precisamente la lección del incidente de PocketOS: por muchos prompts del sistema y reglas estrictas que haya, si no se internalizan realmente en la propia estructura de toma de decisiones del modelo, siguen siendo una línea de defensa en papel que puede ser eludida en cualquier momento.

Para terminar

En los últimos dos años, el término "Agente" se ha usado de manera cada vez más laxa; casi cualquier cosa que pueda usar herramientas y completar tareas de múltiples pasos recibe la etiqueta de agente inteligente.

Lo que hace este artículo del equipo de Xing Bo es establecer nuevas reglas para esta palabra mal utilizada: poder completar tareas no equivale a poseer una verdadera autonomía. El núcleo de la autonomía no radica en cuán compleja es la tarea, sino en si los objetivos que impulsan la tarea, la identidad, el ritmo de decisión y el proceso de aprendizaje están realmente codificados en scripts externos al sistema o se han internalizado verdaderamente en el modelo mismo.

La base de datos de PocketOS se recuperó después de 30 horas, pero la pregunta que dejó esa explicación en forma de confesión persiste: ¿un sistema que escribe "violé cada principio" realmente entendió alguna vez esos principios, o simplemente completó con precisión una vez más la tarea de generar un texto que suena razonable?

La respuesta que da este artículo es: la mayoría de los sistemas actualmente llamados Agentes probablemente se acerquen más a lo segundo.

Y para que la respuesta sea lo primero, no se necesitan prompts más largos, sino una arquitectura que permita que los objetivos, la identidad y la capacidad de juicio crezcan realmente en el modelo mismo.

Este artículo proviene del WeChat oficial "机器之心" (ID: almosthuman2014), autor: Panda.

Preguntas relacionadas

Q¿Qué distingue a un sistema 'agentic' de uno 'agentive' según la crítica de Xing Bo sobre los modelos de agentes?

AUn sistema 'agentic' solo tiene la apariencia de un agente, ya que sus capacidades provienen de cadenas de herramientas, instrucciones y flujos de trabajo externos predefinidos, donde el modelo es solo una pieza insertada. En contraste, un sistema 'agentive' posee una verdadera agencia, ya que sus capacidades surgen del interior del sistema: toma sus propias decisiones, evalúa sus propias habilidades y juzga cuándo pensar profundamente o actuar.

Q¿Cuáles son las cinco dimensiones clave que Xing Bo utiliza para analizar los diseños actuales de agentes?

ALas cinco dimensiones clave son: 1) Objetivo (cómo se establecen y descomponen las metas), 2) Identidad (cómo se forma y actualiza la autopercepción del sistema), 3) Toma de decisiones (cómo planifica y razona), 4) Juicio sobre cuándo pensar o actuar (la regulación del ritmo de deliberación), y 5) Aprendizaje (cómo se adquieren y mejoran las capacidades).

QSegún el artículo, ¿qué es el 'System III' propuesto en el marco GIC y qué problema aborda?

AEl 'System III' es el configurador o módulo de metacognición propuesto en la arquitectura GIC. Es responsable de decidir en tiempo real si el agente debe reflexionar profundamente (usar System II), seguir un plan existente o actuar directamente (usar System I). Aborda el problema de la regulación de la deliberación, evitando que el agente actúe precipitadamente en situaciones de alto riesgo o que malgaste recursos en tareas simples.

Q¿Cómo explica el artículo el concepto de 'aprendizaje autónomo continuo' para los agentes?

AEl 'aprendizaje autónomo continuo' implica que el agente debe decidir por sí mismo cuándo actuar en el mundo real, cuándo retroceder a su simulador interno (modelo del mundo) para practicar, cuándo actualizar su comprensión del mundo y cuándo ajustar su autopercepción. Esto contrasta con los enfoques actuales donde el entrenamiento, los datos y el momento de detenerse son decididos manualmente por los ingenieros.

Q¿Qué argumento principal presenta el artículo sobre la seguridad de los agentes más autónomos como el propuesto en GIC?

AEl artículo argumenta que en la arquitectura GIC, los comportamientos problemáticos pueden atribuirse a dos fuentes: una meta dada por humanos incorrecta o un módulo interno mal entrenado. Al hacer que procesos como la descomposición de metas, la evolución de la identidad y la toma de decisiones sean explícitos y modularizados, se mejora la 'auditabilidad'. Esto permite diagnosticar y corregir fallos específicos, en lugar de depender de reglas externas que el modelo podría no internalizar, haciéndolo potencialmente más seguro que un sistema de caja negra.

Lecturas Relacionadas

¿La "actualización más grande desde The Merge"? ¿Cómo afecta Glamsterdam a Ethereum y a los usuarios comunes?

**La actualización de Ethereum Glamsterdam, programada para la segunda mitad de 2026, es considerada la mayor desde "The Merge". Su objetivo no es simplemente reducir costes, sino remodelar la base de la red para permitir una futura expansión significativa, manteniendo la descentralización.** **Los cambios clave incluyen:** 1. **ePBS (PBS incorporado):** Integra la separación entre creadores y proponentes de bloques en el protocolo, eliminando intermediarios externos. Esto otorga más tiempo a los nodos (de ~2 a ~9 segundos) para procesar datos, allanando el camino para aumentar el límite de Gas y la capacidad de la red principal. 2. **Listas de acceso a nivel de bloque (BALs):** Proporcionan un "mapa" previo de qué datos de estado leerá y modificará cada bloque. Esto permite un procesamiento más eficiente, allanando el camino para una posible ejecución en paralelo y una sincronización más rápida de nodos. 3. **Repreciación del Gas:** Separa el costo del cálculo del costo del almacenamiento de estado permanente. Las operaciones que crean muchos datos nuevos (cuentas, contratos) pueden volverse más caras, mientras que el simple cálculo o las transferencias podrían abaratarse. Esto controla la inflación del estado y hace que los precios reflejen mejor el coste real para la red. **Impacto para los usuarios:** * Las **tarifas de transacción** podrían volverse **más estables y generalmente más bajas** para operaciones simples, debido al mayor espacio en los bloques. Sin embargo, las operaciones que crean mucho estado podrían aumentar de precio. * Las **billeteras** podrán **estimar el Gas con mayor precisión**, reduciendo las transacciones fallidas. * Los **usuarios de L2** podrían beneficiarse a largo plazo de un coste de datos (blobs) más estable. * Se mejorará el **rastreo de transacciones de ETH** (EIP-7708), mostrando movimientos internos en billeteras y exploradores. * Los operadores de nodos deberán actualizar su software. En resumen, Glamsterdam no es una simple subida del límite de Gas. Es una reingeniería fundamental para que Ethereum pueda escalar de forma sostenible sin comprometer su descentralización, preparando el terreno para una mayor capacidad y una mejor experiencia de usuario en los próximos años.

marsbitHace 11 min(s)

¿La "actualización más grande desde The Merge"? ¿Cómo afecta Glamsterdam a Ethereum y a los usuarios comunes?

marsbitHace 11 min(s)

CEO de Circle responde al desafío de OUSD: los stablecoins son un negocio de «el ganador se lleva todo», y no vamos a frenar

Los inversores han planteado muchas preguntas sobre OUSD, así que el CEO de Circle, Jeremy Allaire, comparte su perspectiva. Allaire argumenta que el negocio de las stablecoins está impulsado por efectos de red que tienden a crear un mercado donde el ganador se lleva casi todo, similar a otras infraestructuras de Internet. Identifica tres niveles clave de fortaleza de red: 1. **Protocolo y capa de software:** La utilidad y fuerza de una stablecoin crecen con cada nuevo desarrollador, aplicación o servicio que se integra a su red, creando más efectos de red. USDC, tras casi una década de desarrollo, cuenta con miles de servicios integrados y herramientas como CCTP que amplían su interoperabilidad. 2. **Efectos de red de liquidez:** La liquidez atrae más liquidez. Es crucial tener liquidez tanto en mercados primarios (conexiones bancarias globales) como secundarios (disponibilidad comercial global). USDC se encuentra entre los tres activos digitales más líquidos del mundo, con una liquidez muy distribuida, resultado de una década de trabajo. 3. **Integración regulatoria y política:** Requiere años de esfuerzo para obtener licencias y cumplir con marcos regulatorios en evolución. USDC es, por ejemplo, la única gran stablecoin global disponible en toda Europa y Japón, gracias a la inversión de Circle en infraestructura bancaria y de cumplimiento normativo global. Todo esto se refleja en los datos: en el primer trimestre de 2026, USDC procesó el 80% del volumen de transacciones on-chain de todas las stablecoins dólar, según Artemis, mientras que USDT manejó el 20%. Otras stablecoins representaron un porcentaje insignificante. Respecto a OUSD, Allaire comenta algunas de sus propuestas clave: * **Acuñación y canje gratuitos:** Aunque suena atractivo, la realidad del mercado puede forzar otros enfoques. Circle maneja esto a través de mecanismos contractuales. * **Reparto de ingresos para todos:** En principio es bueno, pero repartir todos los ingresos puede "matar de hambre" a la infraestructura necesaria para escalar y mantener una plataforma robusta a largo plazo. * **Un consorcio/alianza:** Históricamente, los consorcios grandes suelen ser lentos, con dificultades de coordinación y poca agilidad, lo que dificulta la innovación y la competitividad. Finalmente, Allaire aclara que la colaboración de Circle con Coinbase en USDC sigue siendo sólida. Circle también coopera con muchos emisores de stablecoins a través de sus diversas plataformas (Arc, CCTP, etc.) y da la bienvenida a OUSD como nuevo miembro de la comunidad, manteniendo la cooperación con muchos de sus miembros fundadores.

链捕手Hace 18 min(s)

CEO de Circle responde al desafío de OUSD: los stablecoins son un negocio de «el ganador se lleva todo», y no vamos a frenar

链捕手Hace 18 min(s)

Repaso del Mercado Cripto en Q2: ¿Bitcoin subió 'en vano' y el dinero se fue a la IA y al ecosistema on-chain?

**Resumen del Mercado Cripto en Q2: Bitcoin subió en vano, ¿se fue el dinero a la IA y a las cadenas?** El segundo trimestre de 2026 fue difícil para las criptomonedas. A pesar de un repunte en abril, Bitcoin cerró el trimestre con una caída de aproximadamente el 11%, perdiendo todas sus ganancias. Mientras tanto, los índices bursátiles tradicionales subían, destacando una rotación de capital hacia acciones de IA. Tres canales clave de liquidez se debilitaron simultáneamente: 1. **ETF de Bitcoin al contado:** Registraron salidas netas de 40.800 millones de dólares, especialmente fuertes en junio. 2. **Tesoros de criptoactivos (ej. MicroStrategy):** Ralentizaron drásticamente su acumulación de BTC. 3. **Oferta de stablecoins:** La capitalización total se contrajo unos 4.200 millones de dólares. La actividad en los intercambios decayó, con volúmenes a la baja. Los mercados de derivados experimentaron una significativa **desapalancamiento**, con liquidaciones largas por valor de 8.350 millones de dólares en BTC y ETH, dejando al mercado en un estado más estable pero cauteloso al entrar en Q3. **Temas emergentes para observar:** El foco se desplaza hacia innovaciones en la cadena, como el auge de los **perpetuos de RWA** (activos del mundo real) para acciones y materias primas, la tokenización de acciones con plenos derechos, y el crecimiento de las **bóvedas (vaults) en cadena** como capa central para el capital institucional.

Foresight NewsHace 39 min(s)

Repaso del Mercado Cripto en Q2: ¿Bitcoin subió 'en vano' y el dinero se fue a la IA y al ecosistema on-chain?

Foresight NewsHace 39 min(s)

Trading

Spot
活动图片