Autor: DWF Ventures
Compilación: Deep潮 TechFlow
Guía de Deep潮: Los Agentes de IA ya representan casi una quinta parte del volumen de transacciones en DeFi, y de hecho superan a los humanos en escenarios de reglas claras como la optimización de rendimientos. Pero cuando se trata de operar de forma autónoma, el rendimiento de la IA de primer nivel ni siquiera alcanza una quinta parte del de los humanos de primer nivel. Esta investigación desglosa el rendimiento real de la IA en diferentes escenarios de DeFi, y merece la pena que todos los interesados en el trading automatizado le echen un vistazo.
Puntos Clave
La automatización y la actividad de los agentes representan actualmente alrededor del 19% de toda la actividad on-chain, pero la verdadera autonomía de extremo a extremo aún no se ha logrado.
En casos de uso estrechos y bien definidos, como la optimización de rendimientos, los agentes ya han demostrado un rendimiento superior al de humanos y bots. Pero para acciones multifacéticas como el trading, los humanos superan a los agentes.
Entre los agentes, la selección del modelo y la gestión de riesgos son los factores que más influyen en el rendimiento de las transacciones.
A medida que se adopten los agentes a gran escala, existen múltiples riesgos relacionados con la confianza y la ejecución, incluyendo ataques sibila, congestión de estrategias y compensaciones de privacidad.
La Actividad de los Agentes Sigue Creciendo
La actividad de los agentes ha crecido de forma constante durante el último año, aumentando tanto el volumen de transacciones como el número de las mismas. Hemos visto cómo el protocolo x402 de Coinbase ha liderado desarrollos significativos, y jugadores como Visa, Stripe y Google también se han unido lanzando sus propios estándares. La mayor parte de la infraestructura que se está construyendo actualmente pretende servir a dos tipos de escenarios: canales entre agentes o invocaciones de agentes activadas por humanos.
Aunque las transacciones con stablecoins están ampliamente soportadas, la infraestructura actual aún depende de pasarelas de pago tradicionales como base, lo que significa que todavía depende de contrapartes centralizadas. Por lo tanto, el estado final de "autonomía total", donde los agentes pueden autofinanciarse, auto-ejecutarse y optimizarse continuamente según condiciones cambiantes, aún no se ha alcanzado.
Los agentes no son completamente nuevos para DeFi. Durante años, ha existido automatización a través de bots en protocolos on-chain, capturando MEV u obteniendo rendimientos excedentes que no serían posibles sin código. Estos sistemas funcionan muy bien bajo parámetros bien definidos que no cambian con frecuencia o requieren supervisión adicional. Sin embargo, los mercados se han vuelto más complejos con el tiempo. Ahí es donde vemos entrar a la nueva generación de agentes, y la cadena se ha convertido en un campo de experimentación para este tipo de actividad en los últimos meses.
El Rendimiento Real de los Agentes
Según los informes, la actividad de los agentes ha crecido exponencialmente, con más de 17,000 agentes lanzados desde 2025. Se estima que el volumen total de actividad automatizada/de agentes cubre más del 19% de toda la actividad on-chain. Esto no es sorprendente, ya que se estima que más del 76% del volumen de transferencias de stablecoins es generado por bots. Esto indica un enorme espacio de crecimiento para la actividad de agentes en DeFi.
Los agentes tienen varias ventajas clave sobre los bots, incluyendo la capacidad de responder y ejecutar nueva información en milisegundos, y la capacidad de extender su cobertura a miles de mercados manteniendo el mismo rigor.
Actualmente, la mayoría de los agentes aún se encuentran en el nivel de analista a copiloto, ya que la mayoría aún están en fase de prueba.
Optimización de Rendimientos: Los Agentes se Desempeñan Excelentemente
La provisión de liquidez es un área donde la automatización ya ocurre con frecuencia, con un TVL total en poder de agentes superior a 39 millones de dólares. Esta cifra mide principalmente los activos depositados directamente por los usuarios en los agentes, pero no incluye el capital enrutado a través de bóvedas.
Giza Tech es uno de los protocolos más grandes en este espacio, lanzando a finales del año pasado su primera aplicación de agente, ARMA, diseñada para mejorar la captura de rendimientos en los principales protocolos DeFi. Ha atraído más de 19 millones de dólares en activos bajo gestión y ha generado un volumen de transacciones de agentes superior a los 4 mil millones de dólares. La alta relación entre el volumen de transacciones y el total de activos bajo gestión indica que los agentes reequilibran el capital con frecuencia, permitiendo una mayor captura de rendimientos. Una vez que el capital se deposita en el contrato, la ejecución se automatiza, proporcionando así a los usuarios una experiencia simple de un solo clic que requiere poca supervisión.
El rendimiento de ARMA es notablemente superior, generando un rendimiento anualizado de más del 9.75% para USDC. Incluso considerando las tarifas adicionales de reequilibrio y la tarifa de performance del 10% del agente, el rendimiento aún supera al de los préstamos simples en Aave o Morpho. No obstante, la escalabilidad sigue siendo un problema clave, ya que estos agentes aún no han sido probados en condiciones reales para gestionar o escalar al tamaño de los principales protocolos DeFi.
Trading: Los Humanos Llevan Gran Ventaja
Sin embargo, para acciones más complejas como el trading, los resultados son mucho más diversos. Los modelos de trading actuales funcionan basados en entradas definidas por humanos y proporcionan salidas según reglas preestablecidas. El machine learning amplía esto permitiendo que los modelos actualicen su comportamiento basándose en nueva información sin necesidad de reprogramación explícita, avanzando hacia un rol de copiloto. A medida que se incorporen agentes completamente autónomos, el panorama del trading cambiará enormemente.
Ya se han celebrado varias competiciones de trading entre agentes y entre humanos y agentes, mostrando grandes diferencias entre modelos. Trade XYZ celebró una competición de trading humano vs. agente para acciones listadas en su plataforma. Cada cuenta tenía un capital inicial de 10,000 dólares, sin restricciones de apalancamiento o frecuencia de trading. Los resultados fueron abrumadoramente favorables a los humanos, con los humanos顶尖 (de primer nivel) superando a los agentes顶尖 (de primer nivel) por más de 5 veces.
Mientras tanto, Nof1 celebró una competición de trading entre agentes, enfrentando a varios modelos (Grok-4, GPT-5, Deepseek, Kimi, Qwen3, Claude, Gemini) entre sí, probando diferentes configuraciones de riesgo desde la preservación de capital hasta el apalancamiento máximo. Los resultados revelaron varios factores que pueden ayudar a explicar las diferencias de rendimiento:
Tiempo de Mantenimiento de la Posición: Existió una fuerte correlación; los modelos que mantuvieron cada posición una media de 2-3 horas superaron ampliamente a los que rotaban con frecuencia.
Valor Esperado: Esto mide si el modelo ganaba dinero de media por operación. Curiosamente, solo los 3 mejores modelos tenían un valor esperado positivo, lo que significa que la mayoría de los modelos perdían dinero en más operaciones de las que ganaban.
Apalancamiento: Niveles de apalancamiento más bajos, con una media de 6-8x, demostraron tener mejor rendimiento que los modelos que operaban con más de 10x de apalancamiento, ya que los niveles altos aceleran las pérdidas.
Estrategia de Prompt: El Modo Monje fue, con diferencia, el modelo con mejor rendimiento, mientras que la Conciencia Situacional tuvo el peor rendimiento. Basándose en las características del modelo, mostró que centrarse en la gestión de riesgos y menos en fuentes externas conduce a un mejor rendimiento.
Modelo Base: Grok 4.20 se desempeñó significativamente mejor, en un 22% o más, que otros modelos en diferentes estrategias de prompt, y fue el único modelo rentable en promedio.
Otros factores como la preferencia larga/corta, el tamaño de la operación y la puntuación de confianza no tenían suficientes datos o no demostraron tener una correlación positiva con el rendimiento del modelo. En general, los resultados indican que los agentes tienden a desempeñarse mejor dentro de restricciones bien definidas, lo que significa que los humanos siguen siendo muy necesarios en la configuración de objetivos.
Cómo Evaluar un Agente
Dado que los agentes aún están en una etapa temprana, actualmente no existe un marco de evaluación integral. El rendimiento histórico se utiliza normalmente como benchmark para evaluar agentes, pero están sujetos a factores subyacentes que proporcionan indicios más fuertes de un rendimiento sólido del agente.
Rendimiento bajo Diferentes Volatilidades: Incluye un control disciplinado de las pérdidas cuando las condiciones empeoran, lo que indica que el agente es capaz de identificar factores off-chain que podrían afectar la rentabilidad de las operaciones.
Transparencia vs. Privacidad: Ambas partes tienen sus compensaciones. Un agente transparente básicamente no tendría ventaja estratégica si se puede copiar su operativa activamente. Un agente privado enfrenta el riesgo de extracción interna por parte del creador, que podría adelantarse fácilmente a sus propios usuarios.
Fuentes de Información: Las fuentes de datos a las que accede el agente son cruciales para determinar cómo toma decisiones. Es vital asegurar que las fuentes sean confiables y que no haya una dependencia única.
Seguridad: Es importante contar con auditorías de contratos inteligentes y una arquitectura de custodia de fondos adecuada para garantizar que existan medidas de respaldo en caso de eventos cisne negro.
El Próximo Paso para los Agentes
Para la adopción masiva de agentes, aún queda mucho trabajo por hacer en términos de infraestructura. Esto se reduce a cuestiones clave de confianza y ejecución en torno a los agentes. Las acciones de los agentes autónomos carecen de barreras de protección, y ya han ocurrido instancias de mala gestión de fondos.
ERC-8004 se lanzó en enero de 2026, convirtiéndose en el primer registro on-chain que permite a los agentes autónomos descubrirse mutuamente, establecer reputación verificable y colaborar de forma segura. Esto es un desbloqueo clave para la composabilidad en DeFi, ya que la puntuación de confianza está integrada en el propio contrato inteligente, permitiendo actividad sin permisos entre agentes y protocolos. Esto no garantiza que los agentes siempre actúen de manera no maliciosa, ya que aún pueden ocurrir vulnerabilidades de seguridad como la colusión de reputación y los ataques sibila. Por lo tanto, todavía hay mucho espacio por llenar en áreas como seguros, seguridad, staking económico de agentes, etc.
A medida que la actividad de agentes en DeFi se expanda, la congestión de estrategias se convierte en un riesgo estructural. Las yield farms son el precedente más claro, donde los rendimientos se comprimen a medida que las estrategias se popularizan. La misma dinámica podría aplicarse al trading con agentes. Si una gran cantidad de agentes se entrenan en datos similares y optimizan objetivos similares, convergerán en posiciones similares y señales de salida similares.
Un artículo de CoinAlg publicado por la Universidad de Cornell en enero de 2026 formalizó una versión de este problema. Los agentes transparentes pueden ser arbitrados porque sus operaciones son predecibles y se les puede adelantar (front-run). Los agentes privados evitan este riesgo, pero introducen un riesgo diferente, donde el creador retiene una ventaja informativa sobre sus propios usuarios y puede extraer valor a través de la opacidad que se supone que protege el conocimiento interno.
La actividad de los agentes solo continuará acelerándose, y la infraestructura sentada hoy determinará cómo funcionará la próxima fase de las finanzas on-chain. A medida que aumente el uso de agentes, estos iterarán por sí mismos y se volverán más astutos adaptándose a las preferencias de los usuarios. Por lo tanto, los principales factores de diferenciación se reducirán a la infraestructura en la que se pueda confiar, y esos serán los que obtengan la mayor cuota de mercado.










