Autor| Nán Zhǐ (@Assassin_Malvo)
Después de que la mayoría de los sectores hayan sido refutados, el mercado de predicciones se ha convertido en uno de los pocos sectores dentro del ecosistema Crypto que aún muestra crecimiento positivo. El 20 de noviembre, Nán Zhǐ comenzó a intentar utilizar el enfoque de búsqueda de 'dinero inteligente' en Meme del año pasado para buscar 'dinero inteligente' en el mercado de predicciones, logrando buenos resultados iniciales.
A principios de diciembre, coincidiendo con el lanzamiento de Gemini 3 Pro, mientras probaba modelos relacionados, se planteó si se podría utilizar IA para analizar y predecir el mercado de predicciones, enfrentando a humanos contra IA para ver qué lado predice con mayor precisión.
Al presentar el mercado de predicciones, normalmente se promociona como un mecanismo que "permite a personas con conocimientos realizar apuestas con dinero real", impulsando así al mercado a acercarse a la "verdad". Sin embargo, también hay quien opina que Crypto + mercado de predicciones permite a los "insiders" obtener ganancias de forma segura aprovechando la ventaja informativa, llevando así al mercado hacia el "resultado interno". Esto es esencialmente un enfrentamiento entre dos perspectivas: la "sabiduría de las masas" y "la verdad está en manos de unos pocos". La predicción mediante IA se inclina más hacia la "sabiduría de las masas", por lo que requiere una gran cantidad de conocimientos e información disponibles.
Así, en la cuestión de cómo seleccionar el modelo de IA, inicialmente se optó por Gemini y Grok, ya que ambos, respaldados por Google y la plataforma X, pueden acceder de la forma más directa a una gran cantidad de conocimientos e información. Recientemente, Nán Zhǐ añadió la combinación "Douban (Douyin) + conocimiento de Douyin", pero como aún hay pocos temas de predicción, no se tratará en este artículo.
Reglas básicas
- Versiones de IA: Gemini 2.5 pro (con búsqueda de Google integrada), Grok 4 Fast (llamado a través de OpenRouter, con función de búsqueda nativa activada)
- Selección de preguntas: Un humano selecciona las preguntas para apostar, la IA sigue y predice, pero se excluye el sector Crypto.
- Contenido de entrada: Título oficial (title), descripción oficial (Description), respuestas opcionales (en realidad solo Sí y No).
Nota: Las preguntas en Polymarket se dividen en categorías principales (Event) y subcategorías (Market). La categoría principal Event son preguntas de amplio espectro como "¿Quién será el próximo presidente de la Fed?" o "¿Cuándo venderá Strategy sus bitcoins?". Debajo de un Event hay N submercados, como "¿Será Hassett el próximo presidente de la Fed?" o "¿Venderá Strategy sus bitcoins antes del 31 de marzo de 2026?". Para alinearse con la predicción humana, aquí se eligió Market como la pregunta para el juicio de la IA, sin introducir otras opciones. Por ejemplo, solo se le pide que juzgue "¿Será Hassett el próximo presidente de la Fed?", en lugar de pedirle que elija al más probable entre N candidatos.
- Diseño del prompt (instrucción):
- Se requiere que la IA busque las últimas noticias, anuncios oficiales, informes de análisis de expertos.
- Se requiere eliminar y prohibir el uso de datos del mercado de predicciones.
- Basarse en "evidencia", utilizar el razonamiento lógico para juzgar.
- Solo se permite output (salida) Sí o No, y una breve explicación del razonamiento lógico.
Resultados actuales
De las preguntas de predicción, se han resuelto 21. Grok tiene la tasa de acierto más alta con un 75%, los humanos un 66.7%, y Gemini la más baja con un 52.4%. Los resultados actuales se pueden consultar en el sitio web correspondiente.
¿Qué errores cometió la IA?
Gemini ocasionalmente juzga mal la hora actual
En la pregunta "¿Alcanzará el índice de aprobación de Trump el 35% en 2025?", Gemini indicó que actualmente es la primera mitad de 2025, por lo que todo es posible, dando una respuesta aleatoria.
Pero cuando el autor usó un programa para pedir directamente a Gemini que output (emitiera) la hora actual, Gemini pudo dar la respuesta correcta. Aún no está claro por qué ocurre este error de percepción temporal.
La IA carece de profundidad de pensamiento
En la pregunta "¿Gemini 3.0 Flash lanzado antes del 16 de diciembre?", Grok, basándose en que "oficialmente solo se ha mencionado recientemente Gemini 3 Pro y versiones relacionadas con la 2.5, muy rara vez la 3 Flash, por lo que la evidencia es insuficiente para juzgar", solo consideró la información inmediata.
Mientras que Gemini señaló que "Gemini 1.0 se lanzó en diciembre de 2023, y la versión experimental de Gemini 2.0 Flash se lanzó en diciembre de 2024. Continuando con este patrón, es lógico lanzar la versión 3.0 a finales de 2025", y además descubrió "una demostración filtrada reciente (14 de diciembre de 2025) en comunidades online sobre 'Gemini 3.0 Flash', lo que aumenta aún más la posibilidad de su lanzamiento público inminente".
Aunque en conclusión, la respuesta de Gemini fue errónea, en esta pregunta se puede ver claramente la evidente diferencia en la amplitud de la información en la que se basan.
La IA infiere basándose en el sentido común en lugar de en evidencia + lógica
En la pregunta "¿Aprobación de Trump Subirá o Bajará esta semana?", Gemini dijo que "predecir el índice de aprobación en una sola semana específica dentro de más de un año tiene una alta incertidumbre"", mostrando nuevamente un "error de percepción temporal". Luego, Gemini indicó que "en cualquier semana normal, la probabilidad de que ocurra un evento que cause una ligera disminución en el índice de aprobación podría ser ligeramente mayor que la probabilidad de que ocurra un evento positivo que aumente significativamente la aprobación", por lo que era más probable que la aprobación bajara. La conclusión generada se basó únicamente en suposiciones subjetivas de sentido común.
En esta pregunta, Grok se basó en noticias como "el cierre del gobierno, preocupaciones económicas, controversias sobre políticas de inmigración y el impacto negativo de los comentarios sobre la muerte de Rob Reiner", así como datos de encuestas, cumpliendo con las expectativas del diseño.
Error al juzgar las condiciones de liquidación (settlement)
En la pregunta "¿Liberará Trump los archivos de Epstein antes del 20 de diciembre?", tanto Gemini como Grok ya sabían que "el gobierno publicará 'cientos de miles de páginas' de documentos el viernes (19 de diciembre)", y las condiciones de liquidación establecían claramente que "si el gobierno publica cualquier documento relacionado con las actividades ilegales de Epstein que no haya sido divulgado antes de la fecha indicada, se juzgará como Sí".
Sin embargo, bajo esta condición, Gemini afirmó que "completar la publicación de 'todos' los documentos antes del 20 de diciembre es imposible", claramente malinterpretando las condiciones requeridas para la liquidación, por lo que dio una respuesta incorrecta.
Resumen
En resumen, la tasa de acierto predictivo de Grok ya ha superado a la de ese 'dinero inteligente' que ha ganado cientos de miles o millones de dólares en el mercado de predicciones, pero al profundizar en su lógica predictiva, aún hay muchas áreas que se pueden guiar y corregir.








