Original | Odaily Planet Daily (@OdailyChina)
Autor | Nan Zhi (@Assassin_Malvo)
Después de que la mayoría de los sectores fueron invalidados, el mercado de predicciones se ha convertido en uno de los pocos sectores dentro del ecosistema Crypto que aún mantiene un crecimiento positivo. El 20 de noviembre, Nan Zhi comenzó a intentar utilizar el enfoque de búsqueda de 'dinero inteligente' en Memes del año pasado para buscar 'dinero inteligente' en el mercado de predicciones, logrando buenos resultados en las etapas iniciales.
A principios de diciembre, coincidiendo con el lanzamiento de Gemini 3 Pro, mientras probaba los modelos relevantes, se le ocurrió la idea de si se podría utilizar IA para analizar y predecir el mercado de predicciones, enfrentando a humanos contra IA para ver qué lado predice con mayor precisión.
Al presentar el mercado de predicciones, normalmente se promociona como un mecanismo que "permite a personas con conocimientos realizar apuestas con dinero real", impulsando así al mercado a acercarse a la "verdad". Sin embargo, también hay quienes piensan que Crypto + mercado de predicciones permite a los "insiders" obtener ganancias de manera segura aprovechando la ventaja informativa, llevando así al mercado a desarrollarse hacia el "resultado interno". Esto es esencialmente un enfrentamiento entre dos perspectivas: la "sabiduría de las masas" y "la verdad está en manos de unos pocos". La predicción por IA se inclina más hacia la "sabiduría de las masas", por lo que requiere una gran cantidad de conocimientos e información disponible.
Así, en cuanto a la elección del modelo de IA, inicialmente se seleccionaron Gemini y Grok, ya que ambos, respaldados por Google y la plataforma X, pueden acceder de la manera más directa a una gran cantidad de conocimientos e información. Recientemente, Nan Zhi añadió la combinación "Douban + conocimiento de Douyin", pero como aún hay pocos temas de predicción, no se tratará en este artículo.
Reglas básicas
- Versiones de IA: Gemini 2.5 pro (con búsqueda de Google integrada), Grok 4 Fast (llamado a través de OpenRouter, con función de búsqueda nativa habilitada)
- Selección de preguntas: Un humano elige los temas para apostar, la IA sigue y predice, pero se excluyó el sector Crypto.
- Contenido de entrada: Título oficial (title), descripción oficial (Description), respuestas opcionales (en realidad solo Yes y No)
Nota: Las preguntas en Polymarket se dividen en categorías principales (Event) y subcategorías (Market). La categoría principal Event son preguntas de amplio alcance como "¿Quién será el próximo presidente de la Fed?" o "¿Cuándo venderá Strategy sus bitcoins?". Debajo de un Evento hay N submercados, por ejemplo, "¿Será Hassett el próximo presidente de la Fed?" o "¿Venderá Strategy sus bitcoins antes del 31 de marzo de 2026?". Para alinearse con la predicción humana, aquí se eligió Market como la pregunta para el juicio de la IA, sin ingresar otras opciones. Por ejemplo, solo se le pide que juzgue "¿Será Hassett el próximo presidente de la Fed?", en lugar de pedirle que elija al más probable entre N candidatos.
- Diseño del prompt (instrucción):
- Se requiere que la IA busque las últimas noticias, anuncios oficiales, informes de análisis de expertos.
- Se requiere eliminar y prohibir el uso de datos del mercado de predicciones.
- Basarse en "evidencia", utilizar el razonamiento lógico para juzgar.
- Solo se permite output Yes o No, y explicar la lógica del razonamiento en un párrafo.
Resultados actuales
De las preguntas de predicción, se han resuelto 21. Grok tiene la tasa de acierto más alta con un 75%, los humanos con un 66.7%, y Gemini la más baja con un 52.4%. Los resultados actuales se pueden consultar en el sitio web correspondiente.
¿Qué errores cometió la IA?
Gemini ocasionalmente juzga mal la hora actual
En la pregunta "Will Trump's approval rating hit 35% in 2025?", Gemini indicó que actualmente es la primera mitad de 2025, por lo que todo es posible, y dio una respuesta aleatoria.
Pero cuando el autor usó un programa para pedirle directamente a Gemini que output la hora actual, Gemini pudo dar la respuesta correcta. Aún no está claro por qué ocurre este error de percepción temporal.
La IA tiene una profundidad de pensamiento insuficiente
En la pregunta "Gemini 3.0 Flash released by December 16?", Grok, basándose en que "oficialmente solo se ha mencionado recientemente Gemini 3 Pro y versiones relacionadas con la 2.5, rara vez se menciona la 3 Flash, por lo que la evidencia es insuficiente para juzgar", solo consideró la información actual.
Mientras que Gemini señaló que "Gemini 1.0 se lanzó en diciembre de 2023, y la versión experimental de Gemini 2.0 Flash se lanzó en diciembre de 2024. Continuando con este patrón, es lógico lanzar la versión 3.0 a finales de 2025", y además descubrió que "recientemente (14 de diciembre de 2025) circuló en comunidades online un demo filtrado sobre 'Gemini 3.0 Flash', lo que aumenta aún más la posibilidad de su lanzamiento público inminente".
Aunque en conclusión, la respuesta de Gemini fue errónea, en esta pregunta se puede ver claramente la evidente diferencia en la amplitud de la información en la que se basan.
La IA se basa en el sentido común en lugar de en evidencia + lógica para inferir
En la pregunta "Trump approval Up or Down this week?", Gemini dijo que "predecir la tasa de aprobación en una sola semana más de un año después es altamente incierto", mostrando nuevamente un "error de tiempo". Luego, Gemini indicó que "en cualquier semana normal, la probabilidad de que ocurra un evento que cause una ligera caída en la tasa de aprobación podría ser ligeramente mayor que la probabilidad de que ocurra un evento positivo que aumente significativamente la tasa de aprobación", por lo que es más probable que la tasa de aprobación baje. La conclusión generada se basó únicamente en suposiciones subjetivas de sentido común.
En esta pregunta, Grok se basó en noticias y datos de encuestas como "el cierre del gobierno, preocupaciones económicas, controversias sobre políticas de inmigración y el impacto negativo de los comentarios sobre la muerte de Rob Reiner", lo cual cumple con el diseño esperado.
Error al juzgar las condiciones de liquidación
En la pregunta "Will Trump release the Epstein files by December 20?", tanto Gemini como Grok ya sabían que "el gobierno publicará 'cientos de miles de páginas' de documentos el viernes (19 de diciembre)", y las condiciones de liquidación especificaban claramente que "si el gobierno publica cualquier documento relacionado con las actividades ilegales de Epstein que no haya sido divulgado antes de la fecha listada, se juzgará como Yes".
Sin embargo, bajo esta condición, Gemini dijo que "es imposible completar la publicación de 'todos' los documentos antes del 20 de diciembre", claramente juzgando mal las condiciones requeridas para la liquidación, por lo que dio una respuesta incorrecta.
Resumen
En resumen, la tasa de acierto predictivo de Grok ya ha superado a la de ese 'dinero inteligente' que ha ganado cientos de miles o millones de dólares en el mercado de predicciones, pero al profundizar en su lógica predictiva, aún hay muchas áreas que se pueden guiar y corregir.








