La votación de la ley es inminente, ¿por qué Coinbase se «echa atrás» en el último momento?

marsbitPublicado a 2026-01-16Actualizado a 2026-01-16

Resumen

La votación clave de la Ley CLARITY, que busca regular el mercado de criptomonedas en EE.UU., se acerca, pero Coinbase ha retirado su apoyo. Su CEO, Brian Armstrong, argumenta que "una ley mala es peor que ninguna ley". Esta decisión ha dividido la industria: firmas como a16z, Ripple, Kraken y Coin Center apoyan la ley por la claridad regulatoria que aportaría, mientras Coinbase se opone principalmente por una cláusula que prohibiría pagar intereses por tenencia estática de stablecoins, lo que afectaría gravemente sus ingresos (unos 1400 millones de dólares en 2025). El conflicto refleja dos visiones: la postura pragmática de aceptar un marco imperfecto para avanzar, y la posición idealista de Coinbase de rechazar una norma que considera perjudicial a largo plazo. Esta división interna podría debilitar la influencia del sector en Washington y retrasar la ansiada regulación.

El 14 de enero, un proyecto de ley destinado a establecer normas para el mercado de criptomonedas en Estados Unidos, la «Ley CLARITY», se enfrentará a una votación crucial en el Comité Bancario del Senado. Justo en la víspera de este avance para la industria, Brian Armstrong, fundador y CEO de Coinbase, anunció que la empresa retiraría por completo su apoyo a este proyecto de ley, argumentando que «una ley es peor que ninguna ley».

La noticia causó conmoción inmediata en la industria. Pero lo realmente sorprendente fue que casi todos los demás actores importantes del sector se posicionaron en contra de Coinbase.

Chris Dixon, socio del gigante de capital de riesgo a16z, consideró que «es el momento de avanzar»; Brad Garlinghouse, CEO del gigante de pagos Ripple, declaró que «la claridad vence al caos»; Arjun Sethi, co-CEO del exchange competidor Kraken, fue más directo al afirmar que «es una prueba de determinación política»; incluso Coin Center, una organización sin ánimo de lucro conocida por defender los principios de descentralización, señaló que el proyecto de ley «es básicamente correcto en cuanto a la protección de los desarrolladores».

Por un lado, el líder indiscutible de la industria; por el otro, lo que fueron sus importantes aliados. Esta ya no es la vieja historia de la industria de las criptomonedas contra los reguladores de Washington, sino una guerra civil dentro del propio sector.

Coinbase aislada

¿Por qué Coinbase está aislada de los demás?

La respuesta es simple: porque casi todos los demás actores principales, basándose en sus respectivos intereses comerciales y filosofías de supervivencia, han llegado a la conclusión de que este proyecto de ley, aunque imperfecto, es la mejor opción disponible en este momento.

En primer lugar, a16z. Como la firma de inversión en cripto más prestigiosa de Silicon Valley, el portafolio de a16z abarca casi todos los sectores de las criptomonedas. Para ellos, lo más perjudicial no es la severidad de una cláusula específica, sino la continua incertidumbre regulatoria.

Un marco legal claro, incluso con defectos, puede proporcionar un terreno fértil para que todo su ecosistema de inversiones crezca. La postura de Chris Dixon representa el consenso de los inversores: en sus ojos, la certeza regulatoria es más importante que una ley perfecta.

En segundo lugar, el exchange Kraken. Como uno de los competidores directos de Coinbase, Kraken se está preparando activamente para su OPI (Oferta Pública Inicial).

Un respaldo regulatorio del Congreso aumentaría enormemente su valoración en el mercado público. En comparación, las restricciones del proyecto de ley sobre los ingresos por stablecoins afectan mucho menos a las finanzas de Kraken que a las de Coinbase. Intercambiar una pérdida empresarial a corto plazo y controlable por el enorme beneficio a largo plazo de salir a bolsa es una elección obvia para Kraken.

Luego está el gigante de pagos Ripple. Su CEO, Brad Garlinghouse, resumió su postura en seis palabras: «La claridad vence al caos» (clarity beats chaos). Detrás de esto hay años de litigios legales con la SEC (Comisión de Bolsa y Valores de EE.UU.) que han costado cientos de millones de dólares.

Para una empresa agotada por el acoso regulatorio, cualquier forma de paz es una victoria. Incluso una ley imperfecta es mucho mejor que un desgaste interminable en los tribunales.

Finalmente, la organización de defensa Coin Center. Como organización sin ánimo de lucro, su postura es la menos impulsada por intereses comerciales. Su principal demanda durante años ha sido garantizar que los desarrolladores de software no sean erróneamente clasificados como «transmisores de dinero» y sometidos a una regulación excesiva.

Este proyecto de ley incorpora completamente la «Ley de Certeza Regulatoria de Blockchain» (BRCA) que ellos defendían, protegiendo legalmente a los desarrolladores. Habiendo logrado su objetivo principal, pueden ceder en otros detalles. Su apoyo representa la aprobación de los «fundamentalistas» de la industria.

Cuando los capitalistas de riesgo, los exchanges, las empresas de pagos y las organizaciones de defensa están todos del mismo lado, la postura de Coinbase resulta especialmente llamativa.

Entonces, la pregunta es: si toda la industria ve un camino a seguir, ¿qué es lo que Coinbase ve que la lleva a arriesgarse a dividir el sector para impedirlo?

El modelo de negocio determina la postura

La respuesta se esconde en los estados financieros de Coinbase: es un agujero valorado en 1400 millones de dólares.

Para entender la decisión de Armstrong de «volcar la mesa», primero hay que entender la ansiedad por la supervivencia de Coinbase. Durante mucho tiempo, una gran parte de los ingresos de Coinbase dependían de las comisiones por transacciones de criptomonedas.

La fragilidad de este modelo quedó al descubierto durante el invierno cripto: en los mercados alcistas se ganaban grandes sumas, en los bajistas los ingresos se desplomaban, incluso llegando a tener pérdidas trimestrales. La empresa tuvo que encontrar nuevas fuentes de ingresos más estables.

Los ingresos por stablecoins son la segunda curva de crecimiento que Coinbase.

Su modelo de negocio no es complicado: los usuarios mantienen stablecoins USDC, vinculadas 1:1 con el dólar, en la plataforma de Coinbase, y Coinbase presta estos fondos inactivos a través de protocolos DeFi (como Morpho), ganando intereses, y luego devuelve parte de esos ingresos en forma de recompensas a los usuarios. Según los datos del sitio web de Coinbase, los usuarios normales pueden obtener un rendimiento anual del 3.5%, mientras que los miembros premium pueden alcanzar hasta un 4.5%.

Según el informe de resultados del tercer trimestre de 2025 de Coinbase, sus «ingresos por intereses y financieros» ascendieron a 355 millones de dólares, la mayor parte proveniente del negocio de stablecoins. Extrapolando, este negocio contribuyó con aproximadamente 1400 millones de dólares a los ingresos de Coinbase en 2025, representando una proporción cada vez mayor de sus ingresos totales. En un mercado bajista con volúmenes de trading deprimidos, este flujo de caja estable y considerable es un salvavidas para Coinbase.

Y una nueva cláusula añadida en la Ley CLARITY impacta directamente en el punto vital de Coinbase. Esta cláusula estipula que los emisores de stablecoins o partes asociadas no podrán pagar rendimientos por las «tenencias estáticas» (Static Holdings) de los usuarios, pero sí se permiten los pagos por «actividades y transacciones» (Activities and Transactions).

Esto significa que se prohibirá que los usuarios simplemente mantengan USDC en su cuenta de Coinbase para obtener intereses. Este golpe es letal para Coinbase; si el proyecto de ley se aprueba, estos 1400 millones de dólares en ingresos podrían reducirse drásticamente o incluso desaparecer.

Además, los diversos problemas que Armstrong enumeró en las redes sociales parecen más bien una lucha a nivel de estructura de mercado: el borrador podría bloquear indirectamente el camino para las acciones/valores tokenizados, establecer barreras más difíciles de superar para DeFi, facilitar que los reguladores accedan a los datos financieros de los usuarios y, al mismo tiempo, debilitar el papel de la CFTC (Comisión de Comercio de Futuros de Materias Primas) en el mercado spot.

La prohibición de los rendimientos por stablecoins es solo el corte más visible e inmediatamente dañino para Coinbase.

Intereses diferentes, elecciones naturales diferentes.

El negocio de stablecoins de Kraken es mucho más pequeño que el de Coinbase, por lo que puede intercambiar una pérdida a corto plazo por el valor a largo plazo de su OPI; el núcleo de Ripple son los pagos, y la claridad regulatoria lo es todo; el tablero de a16z es todo el ecosistema, y la pérdida de un solo proyecto no afecta al panorama general. Coinbase ve un precipicio, mientras que otras empresas ven un puente.

Sin embargo, hay una tercera parte en este juego: la banca tradicional.

La American Bankers Association (ABA) y el Bank Policy Institute (BPI) argumentan que permitir que los stablecoins paguen rendimientos provocaría que billones de dólares en depósitos abandonen el sistema bancario tradicional, constituyendo una amenaza existencial para miles de bancos comunitarios.

Ya en julio de 2025, se aprobó la Ley de Establecimiento de Stablecoins, que permitía explícitamente que los «terceros y partes asociadas» de los stablecoins pagaran rendimientos, dejando espacio legal para el modelo de Coinbase. Pero durante los 7 meses siguientes, la banca ejerció una poderosa presión de lobby, logrando finalmente que se añadiera la prohibición de las «tenencias estáticas» en la Ley CLARITY.

Los bancos no temen una tasa de rendimiento del 3.5%, sino perder el poder de fijación de precios de los depósitos. Cuando los usuarios puedan elegir libremente mantener sus fondos en un banco o en una plataforma de cripto, terminará el monopolio de décadas de los bancos con intereses bajos. Este es el meollo del conflicto.

Entonces, frente a un juego de intereses tan complejo, ¿por qué solo Armstrong eligió el camino más radical?

Dos filosofías de supervivencia

Esto no es solo un conflicto de intereses comerciales, sino un choque de dos filosofías de supervivencia radicalmente diferentes. Una es el idealismo e intransigencia al estilo de Silicon Valley, la otra es el pragmatismo y la mejora gradual al estilo de Washington.

Brian Armstrong representa la primera. No es la primera vez que se enfrenta abiertamente a los reguladores. Ya en 2023, cuando la SEC demandó a Coinbase por operar ilegalmente una bolsa de valores, Armstrong criticó públicamente a la SEC por su postura «inconsistente» y reveló que Coinbase había mantenido más de 30 reuniones con el organismo regulador, solicitando repetidamente normas claras sin obtener nunca una respuesta.

Su postura es consistente: apoya la regulación, pero se opone firmemente a una «mala regulación». En su opinión, aceptar un proyecto de ley con defectos fundamentales es más peligroso que no tener ley temporalmente. Porque una vez que se promulga una ley, modificarla en el futuro será extremadamente difícil. Aceptar una ley que asfixia el modelo de negocio central a cambio de certeza a corto plazo equivale a beber veneno para calmar la sed.

La lógica de Armstrong es que ahora se puede luchar a cualquier costo; aunque sea doloroso, se preserva la posibilidad de luchar por mejores reglas en el futuro. Ceder ahora sería renunciar permanentemente al territorio de los ingresos por stablecoins. En esta guerra por el futuro de la empresa, comprometerse es rendirse.

Otros líderes de la industria de las criptomonedas, sin embargo, han mostrado una filosofía pragmática截然不同 (radicalmente diferente). Conocen bien las reglas del juego en Washington: legislar es el arte del compromiso, lo perfecto es enemigo de lo bueno.

El CEO de Kraken, Sethi, cree que lo importante es establecer primero un marco legal, darle a la industria un estatus social legal, y luego, a través de un cabildeo y participación continuos, perfeccionarlo gradualmente en la práctica. Primero sobrevivir, luego desarrollarse.

El CEO de Ripple, Garlinghouse, coloca la certeza por encima de todo. Años de litigios le han enseñado que forcejear en el pantano legal es un desgaste enorme para una empresa. Una paz imperfecta es mucho mejor que una guerra perfecta.

Dixon de a16z, desde la altura estratégica de la competencia global, argumenta que si Estados Unidos retrasa la legislación debido a disputas internas, simplemente le cederá el centro de la innovación financiera global a Singapur, Dubái o Hong Kong.

Armstrong todavía está librando la batalla de Washington a la manera de Silicon Valley, mientras que los demás ya han aprendido el lenguaje de Washington.

Una es la adherencia principista de «preferir la muerte a la deshonra», la otra es la consideración realista de «mientras haya vida, hay esperanza». ¿Cuál es más sabia? Hasta que el tiempo nos dé una respuesta, nadie puede decirlo. Pero lo que sí es seguro es que ambas elecciones conllevan un precio沉重 (pesado).

El costo de la guerra civil

¿Cuál es el verdadero costo de esta guerra civil encendida por Coinbase?

En primer lugar, ha causado una división política dentro de la industria de las criptomonedas.

Según informes de Politico, la decisión del presidente del Comité Bancario del Senado, Tim Scott, de posponer la votación, se tomó justo cuando Coinbase se echó atrás en el último momento y el apoyo al proyecto de ley entre los legisladores de ambos partidos aún era incierto. La jugada de Coinbase, aunque no fue la única razón, fue sin duda un factor clave que llevó al esfuerzo general al caos.

Si el proyecto de ley finalmente fracasa por esto, otras empresas podrían culpar en parte a Coinbase, acusándola de priorizar sus intereses privados sobre el progreso de toda la industria.

Lo más grave es que esta riña pública debilita enormemente la capacidad de negociación colectiva de la industria de las criptomonedas en Washington.

Cuando los legisladores ven que la industria no puede formar una voz unificada, se sienten confundidos y frustrados. Una industria dividida será vulnerable frente a los poderosos grupos de presión de las finanzas tradicionales.

En segundo lugar, expone el dilema de la regulación en la era digital.

La Ley CLARITY intenta caminar sobre la cuerda floja entre fomentar la innovación y prevenir riesgos, pero este punto de equilibrio es casi imposible de contentar a todos. Para Coinbase, la ley regula demasiado; para la banca tradicional, es demasiado permisiva; para otras empresas de cripto, quizás sea la adecuada.

El dilema de la regulación es que intenta trazar límites para deseos que nunca se satisfacen. Cada vez que se establece una norma, es solo el comienzo de la siguiente partida.

Pero el costo más importante es que esta guerra civil socava los cimientos de la industria de las criptomonedas.

¿Qué es realmente la industria de las criptomonedas? ¿Es un experimento social sobre descentralización y libertad individual, o es un negocio sobre apreciación de activos y creación de riqueza? ¿Es una revolución del sistema financiero existente, o un complemento y mejora del mismo?

La determinación de Armstrong y el compromiso de los demás en la industria, delinean juntos la verdadera apariencia actual de este sector: un cuerpo contradictorio que oscila constantemente entre el ideal y la realidad, entre la revolución y el comercio.

Preguntas relacionadas

Q¿Por qué Coinbase retiró su apoyo al proyecto de ley CLARITY Act en el último minuto?

ACoinbase retiró su apoyo porque el proyecto de ley contenía una cláusula que prohibía pagar rendimientos por 'tenencias estáticas' de stablecoins, lo que amenazaba su modelo de negocio y unos ingresos estimados de 1400 millones de dólares.

Q¿Qué actores clave de la industria de las criptomonedas apoyaron el proyecto de ley CLARITY Act y por qué?

Aa16z, Ripple, Kraken y Coin Center apoyaron el proyecto de ley. a16z por la certeza regulatoria, Ripple para poner fin a su costosa batalla legal, Kraken para facilitar su OPI, y Coin Center porque protegía a los desarrolladores de software.

Q¿Cómo impacta específicamente la cláusula de 'tenencias estáticas' en el modelo de negocio de Coinbase?

ALa cláusula prohíbe pagar intereses a los usuarios por simplemente mantener stablecoins (como USDC) en sus cuentas, lo que eliminaría una fuente de ingresos crucial de 1400 millones de dólares para Coinbase proveniente de los rendimientos de las stablecoins.

Q¿Qué papel jugó el lobby de la banca tradicional en la redacción del proyecto de ley CLARITY Act?

ALa banca tradicional, a través de asociaciones como la American Bankers Association (ABA), ejerció presión durante 7 meses para incluir la prohibición de rendimientos por 'tenencias estáticas', temiendo una fuga masiva de depósitos de su sistema hacia las plataformas de criptomonedas.

Q¿Qué dos filosofías o enfoques enfrentados sobre la regulación representa este conflicto dentro de la industria?

ASe enfrentan la filosofía de principio y no compromiso de Silicon Valley, representada por Brian Armstrong de Coinbase, que rechaza una 'mala ley', contra el pragmatismo de Washington, representado por otros líderes, que priorizan la certeza legal inmediata y la mejora gradual de las normas.

Lecturas Relacionadas

Informe de Ethereum del primer trimestre de 2026: caen las tarifas, usuarios y volumen de transacciones alcanzan máximos históricos

Resumen del informe del primer trimestre de 2026 sobre Ethereum, por Token Terminal. El reporte destaca una tendencia clave: la cantidad de usuarios activos mensuales (13.2 millones, +53.5%), las transacciones (200.4 millones, +38%) y el rendimiento de la red (25.78 TPS) alcanzaron máximos históricos, mientras que las tarifas de transacción en la capa principal cayeron un 47.9% intertrimestral. Este fenómeno, denominado la "Paradoja de Jevons", sugiere que Ethereum está priorizando deliberadamente la expansión a corto plazo sobre la captura de ingresos inmediatos. La actualización Fusaka, que aumenta la capacidad de datos y reduce el costo del espacio de bloque, es un factor clave. La narrativa central de Ethereum se está desplazando de una cadena de bloques DeFi a una capa de liquidación financiera global. Ethereum mantiene una posición dominante en activos tokenizados, con una capitalización total de $2 billones (-0.7% intertrimestral). Destacan el crecimiento de los fondos tokenizados ($194 mil millones, +4.9%) y las materias primas tokenizadas ($47 mil millones, +60%), reflejando una mayor adopción institucional por parte de entidades como BlackRock y JPMorgan. A pesar de una caída del 30.3% en su capitalización de mercado totalmente diluida, la base de titulares de ETH creció a 292.8 millones. En resumen, Ethereum está sacrificando ingresos a corto plazo para impulsar la adopción, consolidándose como la infraestructura de liquidación preferida para las finanzas tokenizadas, con el objetivo de que una mayor demanda de red compense las tarifas más bajas a largo plazo.

marsbitHace 1 hora(s)

Informe de Ethereum del primer trimestre de 2026: caen las tarifas, usuarios y volumen de transacciones alcanzan máximos históricos

marsbitHace 1 hora(s)

Entrevista inaugural en podcast del CEO de Intel, Tan Lip Bu: Nuestro objetivo es '10 veces en 5-10 años', apostamos por empaquetado avanzado, sustratos de vidrio y diamantes artificiales

El CEO de Intel, Chen Lifu, expresó en una entrevista en un podcast su objetivo de multiplicar por diez el valor de la empresa en un plazo de 5 a 10 años. Para lograrlo, está centrando la estrategia en la superación de los límites físicos de la miniaturización de los semiconductores, invirtiendo en tres áreas clave: tecnologías avanzadas de empaquetado como EMIB, nuevos materiales como el nitruro de galio (GaN), carburo de silicio (SiC), fosfuro de indio (InP) y diamante sintético, y sustratos innovadores como el de vidrio. Destacó que la explosión de la IA, especialmente los agentes autónomos y la inferencia, está impulsando una fuerte demanda de CPUs, cambiando la proporción CPU/GPU en servidores. Chen Lifu también defendió la apuesta de Intel por el negocio de fundición (foundry), subrayando que es crucial para la seguridad de la cadena de suministro en EE.UU. y que se basa en generar confianza a través de altos rendimientos y fiabilidad. Reveló detalles de la colaboración Terafab con Elon Musk para construir fábricas de chips y abordar la escasez de capacidad. Reconoció que Intel aún está en una fase de transformación ("gatear"), reconstruyendo equipos y capacidades fundamentales, pero proyecta que su verdadero potencial en mercados como la informática de borde, la IA física y la de agentes comenzará a materializarse hacia 2030-2032. Con una mentalidad de capitalista de riesgo, su meta clara es entregar un retorno de 10x a los accionistas en la próxima década.

marsbitHace 1 hora(s)

Entrevista inaugural en podcast del CEO de Intel, Tan Lip Bu: Nuestro objetivo es '10 veces en 5-10 años', apostamos por empaquetado avanzado, sustratos de vidrio y diamantes artificiales

marsbitHace 1 hora(s)

Acaba de recaudar 2.700 millones, y Li Feifei también invirtió

En la actualidad, el mercado de inversión está obsesionado con los "Modelos del Mundo". Sin embargo, Pete Florence, ex científico de DeepMind y co-creador de la arquitectura Vision-Language-Action (VLA), fundó Generalist AI y rechaza esta etiqueta. Para él, el objetivo concreto es más importante: crear robots que realicen cualquier tarea con alta tasa de éxito sin datos específicos. Recientemente, Generalist AI recaudó 400 millones de dólares (unos 2.700 millones de RMB) en una ronda de financiación, alcanzando una valoración de 2.000 millones de dólares. Inversores incluyen NVentures de Nvidia, Bezos Expeditions, NFDG, y figuras como el cofundador de Xiaomi Lin Bin, el fundador de Zoom Eric Yuan, y la renombrada científica Fei-Fei Li. Florence, influenciado por su mentor en el MIT Russ Tedrake, prioriza comprender el mundo físico. Su enfoque comienza estableciendo una meta clara, luego diseña la ruta técnica. Tras dejar Google, lanzó Generalist AI en 2025. La compañía presentó su primer modelo de IA incorporada, GEN-0, en noviembre de 2025, demostrando que las leyes de escalado de los LLMs también se aplican al movimiento físico. En abril de 2026, presentaron GEN-1, entrenado con más de 50.000 horas de datos de interacción física recogidos por un dispositivo portátil. GEN-1 logra un 99% de éxito en tareas como plegar cajas y empaquetar teléfonos, siendo tres veces más rápido que GEN-0. Este avance acerca el modelo a un punto de inflexión similar al GPT-3, mostrando un rendimiento apto para despliegues comerciales en ciertas tareas. La inversión récord respalda la visión de Florence: robots universales que sean lo suficientemente expertos en tareas reales como para ser útiles, avanzando hacia la reducción del coste marginal del trabajo físico a cero. La etiqueta "Modelo del Mundo" queda así en segundo plano frente a los resultados tangibles.

marsbitHace 1 hora(s)

Acaba de recaudar 2.700 millones, y Li Feifei también invirtió

marsbitHace 1 hora(s)

Perdiendo a dos leyendas en tres días: ¿Se está resquebrajando el dique de talento de IA de Google?

En solo tres días, Google ha perdido a dos leyendas de la IA. El 18 de junio, Noam Shazeer, coautor del seminal trabajo "Attention is All You Need" y copresponsable de Gemini, anunció su salida para unirse a OpenAI. Dos días después, John Jumper, ganador del Nobel de Química 2024 y líder de AlphaFold, dejó Google DeepMind para incorporarse a Anthropic. Estas partidas no son incidentes aislados, sino parte de una tendencia clara de fuga de talento de Google hacia OpenAI y Anthropic, como lo confirma también la reciente incorporación a Anthropic del exmiembro fundador de OpenAI, Andrej Karpathy. El trasfondo de este éxodo es fundamentalmente una cuestión de misión y enfoque. El modelo de negocio central de Google, basado en la publicidad, impone una lógica orientada a productos y métricas comerciales que, en última instancia, restringe la investigación pura. En contraste, tanto OpenAI (con su misión de AGI) como Anthropic (centrada en la seguridad y la ciencia) ofrecen un entorno de trabajo enfocado únicamente en empujar los límites de las capacidades de los modelos. A esto se suma la fuerte atracción financiera: OpenAI y Anthropic están en camino a una OPI, lo que promete una recompensa económica masiva a través de capital para sus empleados, algo que la ya gigantesca Google difícilmente puede igualar. La fusión de Google Brain y DeepMind en 2023, destinada a consolidar esfuerzos, ha generado en cambio tensiones culturales y ha hecho más evidente la presión por alinear la investigación con los objetivos de los equipos de productos. El resultado es una reorganización estructural del mapa del talento en IA. Google, a pesar de sus vastos recursos en computación y datos, está perdiendo a las personas que definen el futuro del campo. La verdadera ventaja competitiva en IA reside en retener a las mentes más brillantes, y Google está descubriendo que esa es quizás su batalla más difícil.

marsbitHace 3 hora(s)

Perdiendo a dos leyendas en tres días: ¿Se está resquebrajando el dique de talento de IA de Google?

marsbitHace 3 hora(s)

Tras las notas de la IA, se esconde un "creador de exámenes" chino

Cada vez que se lanza un modelo de IA de vanguardia, la comunidad fija su atención en ciertas "hojas de resultados" familiares: MMLU-Pro, MMMU, MMMU-Pro. Estos puntos de referencia se han convertido en exámenes estándar para evaluar y comparar modelos como GPT, Claude, Gemini, Llama, Qwen y DeepSeek. Detrás de estas influyentes evaluaciones está el investigador chino Wenhu Chen, profesor asistente en la Universidad de Waterloo y fundador del TIGERLab (apodado "虎头帮"). Su trabajo surge de una necesidad crítica: a medida que los modelos avanzaban, las pruebas antiguas como MMLU se saturaban con puntuaciones casi perfectas, dejando de ser útiles para discernir diferencias reales. En 2024, Chen y su equipo presentaron MMLU-Pro, una renovación exhaustiva del original. Con 12,032 preguntas de 14 disciplinas, aumenta las opciones de respuesta de 4 a 10 para reducir las conjeturas e incorpora problemas más complejos que requieren razonamiento. El resultado fue una caída del 16% al 33% en la precisión de los modelos y una evaluación más estable y discriminatoria, rápidamente adoptada por la industria. Su contribución se extiende al ámbito multimodal con MMMU, un conjunto de 11,500 preguntas que combinan imágenes (gráficos, mapas, fórmulas) con conocimientos académicos para probar una comprensión integrada. Incluso los mejores modelos como GPT-4V inicialmente solo alcanzaron un 56% de precisión, revelando un largo camino por recorrer. Su sucesor, MMMU-Pro, cierra aún más las brechas, obligando a los modelos a utilizar la información visual y no solo el texto. La experiencia de Chen, que incluye investigación doctoral en preguntas complejas y una etapa en Google DeepMind trabajando en Gemini, le permite anticipar cómo los modelos pueden "aparentar" competencia. Su laboratorio no solo diseña evaluaciones, sino que también desarrolla modelos (como UniVideo para video o MoCha para avatares), asegurando que sus "exámenes" reflejen desafíos reales y los límites actuales de la tecnología. Actualmente, Chen continúa este trabajo en el laboratorio de superinteligencia de Meta, enfocado en datos y evaluación multimodal. Su historia destaca el papel fundamental, aunque a menudo menos visible, de los investigadores que construyen las herramientas para medir el verdadero progreso de la IA.

marsbitHace 3 hora(s)

Tras las notas de la IA, se esconde un "creador de exámenes" chino

marsbitHace 3 hora(s)

Trading

Spot
Futuros
活动图片