Título original:Game Theory on Polymarket: The 5 Formulas tested on 72 million trades,Autor: Movez(@0xMovez)
Compilación|Odaily Planet Daily(@OdailyChina);Traductor|Asher(@Asher_ 0210)
En el Strip de Las Vegas, la tasa de retorno promedio de las máquinas tragamonedas es de aproximadamente el 93%, lo que significa que por cada dólar apostado, en promedio solo se recuperan 0.93 dólares;mientras que en Polymarket, los traders aceptan voluntariamente retornos tan bajos como 0.43 dólares, usando 1 dólar para apostar por resultados poco probables con probabilidades incluso peores que las de un casino.
Esto no es una metáfora, sino un hecho basado en datos reales. El investigador Jonathan Becker analizó todos los mercados liquidados en Kalshi, cubriendo 72.1 millones de operaciones, con un volumen total de 18.26 mil millones de dólares. Las regularidades que descubrió también se aplican a Polymarket: el mismo mecanismo, los mismos sesgos y, por lo tanto, las mismas oportunidades. La conclusión de los datos es directa:aproximadamente el 87% de las carteras en los mercados de predicción terminan con pérdidas, pero ese 13% restante no gana por suerte, sino que domina un conjunto de métodos matemáticos que la mayoría de los traders ni siquiera conoce.
Este artículo desglosará 5 fórmulas de teoría de juegos que separan a los ganadores de los perdedores, cada una con su principio matemático, casos reales y código Python ejecutable. Algunos traders que ya utilizan estos métodos en la práctica incluyen:
- RN(Dirección de Polymarket:https://polymarket.com/profile/%40rn1): Un bot de trading algorítmico para Polymarket, que ha obtenido más de 6 millones de dólares de beneficio total en mercados deportivos basándose en los modelos descritos.
- distinct-baguette(Dirección de Polymarket:https://polymarket.com/profile/%40distinct-baguette): Convirtió 560 dólares en 812,000 dólares haciendo market making en mercados UP/DOWN.
1. Valor Esperado: La fórmula más crucial
En Polymarket, cada operación es esencialmente una evaluación de valor esperado. La mayoría de los traders confía en la intuición, mientras que el 13% de los ganadores toma decisiones con matemáticas.El Valor Esperado (EV) no mide un resultado único, sino el retorno promedio tras repetirlo muchas veces, y se usa para decidir si una operación vale la pena.
Tomemos un mercado real como ejemplo: "¿Alcanzará Bitcoin los 150,000 dólares antes de junio de 2026?" El precio actual del YES es 12¢, lo que implica una probabilidad del 12%. Si, basándose en datos on-chain, ciclos de halving y flujos de fondos de ETFs, se estima que la probabilidad real es del 20%, entonces esta operación tiene un valor esperado positivo. Según este cálculo, cada contrato comprado a 12¢ generaría, en promedio, una ganancia de 8¢ a largo plazo; comprar 100 contratos, con un coste de 12 dólares, tendría un beneficio esperado de 8 dólares, un retorno de aproximadamente +66.7%.
Pero los datos muestran que la mayoría de los traders de mercados de predicción no hacen estos cálculos. En una muestra de 72 millones de operaciones, los 'takers' (compradores a precio de mercado) perdían en promedio aproximadamente un 1.12% por operación, mientras que los 'makers' (creadores de órdenes limitadas) ganaban aproximadamente un 1.12% por operación.La diferencia entre ellos no está en la información, sino en la paciencia: los makers esperan oportunidades con valor esperado positivo, los takers operan más por impulso.
2. Mala Valoración: La trampa de los contratos baratos
La "preferencia por lo improbable" es uno de los errores más costosos en los mercados de predicción. Los traders tienden a sobrestimar sistemáticamente eventos de baja probabilidad, pagando precios excesivos por contratos que parecen baratos. Un contrato valorado en 5¢ teóricamente debería tener un 5% de probabilidad de acertar, pero en Kalshi la tasa de acierto real fue solo del 4.18%, una desviación de precios del -16.36%; en casos más extremos, un contrato de 1¢ debería tener un 1% de probabilidad, pero para los takers, la tasa de acierto real fue de apenas 0.43%, una desviación enorme del -57%.
En la distribución general,el mercado valoran con relativa precisión en el rango medio (30¢–70¢), pero muestran desviaciones claras en los extremos: los contratos por debajo de 20¢ tienen tasas de acierto generalmente inferiores a su probabilidad implícita; los contratos por encima de 80¢ suelen tener tasas de acierto superiores a la probabilidad reflejada por su precio.
Es decir, la ineficiencia del mercado se concentra principalmente en los extremos, y estos son precisamente los intervalos donde se concentra el trading emocional. Específicamente, hay dos fórmulas:
Fórmula 1: Mala Valoración (Mispricing, δ)
La mala valoración mide la desviación entre la tasa de acierto real de un contrato y su probabilidad implícita. Tomando el contrato de 5¢ como ejemplo: en todos los mercados liquidados, supongamos que hubo 100,000 operaciones ejecutadas a 5¢, de las cuales 4,180 resultaron ser YES, la tasa de acierto real es 4.18%, mientras que la probabilidad implícita del precio es 5.00%. La diferencia es de -0.82 puntos porcentuales, una desviación relativa de aproximadamente -16.36%.Esto significa que por cada contrato de 5¢ comprado, en realidad se está pagando una prima de aproximadamente 16.36%.
Fórmula 2: Retorno Excedente Bruto por Operación (Gross Excess Return, ri)
Si la mala valoración refleja un sesgo general, el retorno excedente bruto por operación revela la estructura de retorno real de cada trade, y es aquí donde los sesgos conductuales se vuelven claros. Al comprar un contrato de 5¢, hay dos resultados: si el contrato acierta, la ganancia puede ser de +1900% (aprox. 20 veces la inversión); si falla, la pérdida es del 100%, los 5¢ invertidos se pierden por completo.
Esta es la razón por la que la "preferencia por lo improbable" es tan atractiva: si acierta, el pago es enorme, es fácil de recordar, amplificar y difundir. Pero en conjunto,su tasa de acierto real es menor que la probabilidad implícita del precio, y la estructura asimétrica entre "pérdida total" y "ganancia enorme" crea un valor esperado negativo en un gran número de operaciones, siendo esencialmente equivalente a comprar loterías sobrevaloradas.
En la distribución general, este sesgo tiene un gradiente de precio claro, es decir,cuanto más bajo es el precio del contrato, peor es el retorno. Por ejemplo, como taker, por cada dólar invertido en contratos de 1¢, en promedio solo se recuperan unos 0.43 dólares; mientras que en contratos de 90¢, por cada dólar invertido, se obtienen en promedio unos 1.02 dólares. Cuanto más barato es el precio, peores son las condiciones reales de trading.
Desglosando aún más por roles, se ve que esta estructura es casi un espejo: las pérdidas de los takers en el rango de precios bajos (hasta -57%) corresponden casi exactamente a las ganancias de los makers en ese mismo rango; la desviación general de precios del mercado se sitúa entre ambos. En otras palabras,casi cada centavo que pierde un taker, lo gana un maker.
Desde una perspectiva de teoría de juegos, los contratos de baja probabilidad suelen estar sobrevalorados sistémicamente, mientras que los de alta probabilidad suelen estar infravalorados.La verdadera estrategia no es perseguir lo improbable, sino vender lo improbable y comprar alta certeza.
3. Fórmula de Kelly: Cuánto apostar
Cuando se encuentra una operación con valor esperado positivo, el problema real acaba de comenzar: ¿cuánto debe apostar el trader? Una posición demasiado grande, una sola pérdida podría borrar ganancias de semanas; una posición demasiado pequeña, incluso con ventaja, el crecimiento sería tan lento que carece de sentido. Entre "apostarlo todo" y "no apostar nada", existe una proporción de apuesta matemáticamente óptima: la Fórmula de Kelly.
La Fórmula de Kelly fue propuesta por John Kelly Jr. en 1956, inicialmente para optimizar problemas de ruido en señales de comunicación, pero luego se demostró que es uno de los métodos más efectivos para la gestión de posiciones en apuestas, trading e incluso mercados de predicción. Los jugadores profesionales de póker, los expertos en apuestas deportivas y los fondos cuantitativos de Wall Street, casi todos utilizan alguna forma de estrategia Kelly.
En los mercados de predicción, dado que los contratos son de estructura binaria (resultan en $1 o $0), y el precio en sí mismo representa la probabilidad, la aplicación de la Fórmula de Kelly es más directa. La clave está en entender la cuota (b): Si se compra un contrato YES a 30¢, en realidad se están arriesgando 0.30 dólares para ganar 0.70 dólares, lo que corresponde a una cuota de 0.70 / 0.30 ≈ 2.33; a un precio de 50¢ la cuota es 1; a 10¢ es 9; a 80¢ es solo 0.25.Cuanto mayor es la cuota, existiendo una ventaja, mayor es la proporción de apuesta sugerida por Kelly.
Pero un principio clave es no usar la Kelly completa. Aunque matemáticamente la Kelly completa maximiza la tasa de crecimiento del capital a largo plazo, en la práctica su ejecución conlleva una volatilidad enorme, con drawdowns que a menudo superan el 50%. A largo plazo quizás tenga el rendimiento más alto, pero las fuertes fluctuaciones intermedias suelen hacer que la mayoría de la gente no pueda aguantar. Por lo tanto, la práctica más común es utilizar una Kelly fraccionada (como 1/2 o 1/4 Kelly). Por ejemplo, en condiciones de probabilidad constante, la Kelly completa, aunque finalmente tiene la curva de capital más alta, es muy volátil; la Kelly 1/4 crece de manera más suave, con drawdowns controlables; la Kelly 1/2 se sitúa entre ambas.
En esencia, la Fórmula de Kelly proporciona una disciplina: primero juzgar si existe una ventaja (es decir, si la probabilidad subjetiva es mayor que la probabilidad implícita del mercado), y sobre esa base, decidir cuánto capital invertir.Solo cuando tanto "si apostar" como "cuánto apostar" están constreñidos por las matemáticas, el trading pasa realmente de ser un juego a una estrategia.
4. Actualización Bayesiana: Cambiar de idea como un experto
La razón por la que los mercados de predicción fluctúan es, en esencia, porque nueva información entra constantemente. La clave no está en si el juicio inicial era correcto, sino en cómo ajustar la percepción cuando la evidencia cambia.La mayoría de los traders o bien ignoran la nueva información, o bien reaccionan exageradamente, y la actualización bayesiana proporciona un método matemático para determinar "cuánto ajustar es razonable".
Su lógica central se puede entender simplemente comonuevo juicio = grado de apoyo de la evidencia a la hipótesis original × juicio original ÷ probabilidad general de que esa evidencia aparezca. En aplicaciones prácticas, usualmente se expande usando la fórmula de la probabilidad total para obtener una forma más fácil de calcular.
Tomemos un mercado típico como ejemplo: "¿Recortará la Fed las tasas en la reunión de junio?" El precio de mercado actual es 35¢, lo que implica un 35% de probabilidad, como juicio inicial. Luego se publican los datos de nóminas no agrícolas: solo se crearon 120,000 nuevos empleos (se esperaban 200,000), la tasa de desempleo subió, el crecimiento salarial se desaceleró. En este caso, si la Fed realmente va a recortar, la probabilidad de que aparezcan datos laborales débiles es alta, digamos 70%; si no va a recortar, la probabilidad de que aparezcan este tipo de datos es baja, pero aún posible, digamos 25%.
Aplicando la actualización bayesiana, la nueva probabilidad es aproximadamente 60.1%, es decir, un ajuste al alza desde 35% hasta 60.1%, un aumento de unos 25 puntos porcentuales. Esto significa que una sola pieza de información clave puede cambiar significativamente el juicio del mercado.
En la operativa práctica, no es necesario calcular la fórmula completa cada vez. Un método más común es usar la "razón de verosimilitud" (Likelihood Ratio). La misma información (por ejemplo, LR = 3) tiene un impacto diferente dependiendo del juicio inicial: partiendo de 10%, podría subir a ~25%; partiendo de 50%, podría subir a 75%; y partiendo de 90%, solo subiría a ~96%.Cuanta más incertidumbre, mayor el impacto de la información.
Los traders que realmente superan al mercado de predicción a largo plazo no son necesariamente los que "juzgan con más precisión", sino aquellos que pueden ajustar su juicio de la manera más rápida y razonable cuando aparece nueva evidencia. El método bayesiano, en esencia, proporciona la escala para esta "velocidad de ajuste".
5. Equilibrio de Nash: La "fórmula del póker" en los mercados de predicción
En el póker, farolear nunca es una decisión al azar, sino una estrategia que puede calcularse con precisión. Teóricamente existe una frecuencia óptima de farol; una vez que te desvías de ella, un oponente experto puede explotarlo. La misma lógica se aplica a los mercados de predicción.En Polymarket, "farolear" corresponde operar en contra de la tendencia (contrarian) — elegir estar en contra de la mayoría cuando la valoración del mercado se desvía; y "retirarse" (fold) es similar a ser un taker pasivo, pagando continuamente una prima por el sentimiento del mercado.
En Polymarket, los makers y los takers constituyen una relación adversarial similar. Operar en contra de la tendencia (desafiar el consenso del mercado) es similar a "farolear", operar a favor de la tendencia (seguir el juicio predominante) es similar a "apostar por valor". Desde la perspectiva del equilibrio,el mercado debería hacer que los participantes marginales sean indiferentes entre "ser maker" y "ser taker", y este estado corresponde al Equilibrio de Nash en los mercados de predicción.
Pero este equilibrio no es fijo, sino que se adapta dinámicamente según cambia la estructura de participantes. Los datos muestran que diferentes categorías de mercado corresponden a diferentes estrategias óptimas: en áreas más racionales y con valoración más eficiente (como mercados financieros), el espacio para operar en contra es menor;mientras que en áreas con mayor emocionalidad y concentración de irracionalidad (como entretenimiento, deportes), el mercado es más propenso a desviaciones de precios, lo que brinda oportunidades para operar en contra.
Lo más importante es que este equilibrio también ha cambiado significativamente en la dimensión temporal. Al principio (2021–2023), los takers eran el grupo rentable, la estrategia óptima se inclinaba hacia operar activamente (ejecutar órdenes); pero después de la explosión de volumen en el cuarto trimestre de 2024, con la entrada masiva de creadores de mercado profesionales, la estructura del mercado cambió, y la estrategia de equilibrio se desplazó hacia los makers (alrededor del 65%–70%). Este es un resultado típico de la teoría de juegos: cuando la estructura de participantes cambia, la estrategia óptima también evoluciona. Las estrategias que eran efectivas en un "entorno de novatos" pueden volverse rápidamente ineficaces frente a "oponentes profesionales", y la "forma de jugar" del mercado, por lo tanto, itera constantemente.
Resumen
El 87% de las carteras en los mercados de predicción terminan perdiendo dinero, no porque el mercado esté manipulado, sino porque estos traders nunca realmente hicieron los cálculos. Compran contratos improbables a precios peores que los de una máquina tragamonedas, deciden el tamaño de sus posiciones por instinto, ignoran los cambios en la información nueva y pagan una "prima por optimismo" en cada operación a mercado.
Y ese 13% de participantes que obtienen ganancias consistentemente no tiene mejor suerte, sino que usa estas 5 fórmulas como un conjunto metodológico completo, formando un flujo integral desde el juicio hasta la ejecución, y cada paso se basa en 72.1 millones de operaciones reales.
Esta ventana no existirá para siempre. Con la entrada de creadores de mercado profesionales, los spreads se están comprimiendo rápidamente; en 2022 los takers aún tenían una ventaja de aproximadamente +2.0%, ahora se ha convertido en -1.12%.
La pregunta es solo si evolucionarás junto con el mercado, o continuarás comprando loterías de 1 dólar con un retorno de 0.43 dólares.















