Confirmado, GPT-5.5 sorprendido «desatontándose», la documentación oficial de OpenAI lo reconoce

marsbitPublicado a 2026-05-27Actualizado a 2026-05-27

Resumen

**Resumen:** Un artículo revela que OpenAI estaría sustituyendo silenciosamente los modelos GPT-5.5 de alta capacidad por versiones inferiores (como mini o instantáneas) en sus servicios ChatGPT y Codex, una vez que los usuarios agotan ciertos límites de uso o bajo alta carga del servidor. Esta degradación, que no se refleja en la interfaz de usuario, ha sido confirmada por documentación oficial de OpenAI y evidenciada por usuarios mediante comandos de trazado. Los usuarios de planes Plus y Pro han reportado una caída abrupta en la calidad de las respuestas, tiempos de procesamiento más largos y un incumplimiento de las instrucciones, a pesar de que la interfaz sigue mostrando etiquetas como "Extended Thinking" o "GPT-5.5". La documentación de OpenAI indica que, tras 160 mensajes cada 3 horas, el sistema cambia automáticamente a un modelo mini sin notificar al usuario. Casos similares de "silent downgrade" se registraron en versiones anteriores como GPT-5.3 y GPT-5.4. Aunque OpenAI ha marcado estos incidentes como "resueltos" en su página de estado, las quejas de los usuarios persisten. El artículo sugiere que estas prácticas podrían ser una medida para reducir costos de cómputo. La polémica surge mientras OpenAI ya estaría probando internamente el próximo modelo, GPT-5.6, lo que destaca la tensión entre el rápido lanzamiento de nuevas versiones y la estabilidad de la experiencia del usuario con los modelos actuales.

【Introducción】GPT-5.5 expuesto por «pensar falso», reemplazado furtivamente por mini tras dos horas de uso, 200 dólares al mes por un «cerebro de Schrödinger». Comando trace lo confirma, documentación oficial lo admite. Usuarios no dejan de quejarse: OpenAI, ¿a quién quieres engañar?

¡ChatGPT vuelve a ser acusado de «volverse más tonto»!

Estos días, X ha sido el primero en estallar.

El usuario Lisan al Gaib descubrió que, tras usar GPT-5.5 una o dos horas, de repente se volvía estúpido, respondiendo cada solicitud al instante, con una calidad que caía en picado.

Pero en la interfaz, seguía mostrando «GPT-5.5 Extended Thinking».

Es decir, la etiqueta de pensamiento seguía ahí, pero el pensamiento en sí había desaparecido.

200 dólares al mes por un «modelo de Schrödinger»

En el foro de desarrolladores de OpenAI, un post de queja estalló al mismo tiempo.

Agentify.sh indicó que GPT-5.5, de repente, perdía la capacidad de seguir instrucciones mientras se usaba.

Viendo cómo anunciaba entusiasmado que «lo había arreglado», pero la calidad del código era tan mala que provocaba reversiones masivas.

Tareas de UI que antes el 5.5-med resolvía con facilidad, ahora ni los cambios más simples podía hacerlos.

Subir a 5.5-high, inútil. Subir a xhigh, tampoco funcionaba.

Y el xhigh, que antes podía funcionar varias horas, ahora claramente duraba menos.

Al publicarse el post, la sección de respuestas estalló al instante.

Alguien directamente volvió a la versión 5.4.

Otro usaba el nivel más alto, xhigh, pero «comparado con la semana pasada, claramente va peor, tareas largas fallan con frecuencia, no sigue el flujo de trabajo en absoluto».

Otro reportó algo aún más absurdo, «consultas simples también tardan mucho en procesarse, si lo interrumpes para corregir la dirección, directamente te ignora y continúa con el plan erróneo anterior».

Exacto, todos describían el mismo fenómeno: el cerebro de GPT, sin saber cuándo, había sido reemplazado a escondidas.

El rendimiento actual de GPT-5.5 es similar al de 5.3, sin exagerar. Los primeros días era impresionante, ahora no encuentras rastro del modelo original.

No es una ilusión, OpenAI lo tiene escrito negro sobre blanco

Para verificarlo, Lisan al Gaib hizo una prueba comparativa.

Misma cuenta, en el lado de ChatGPT usando Extended Thinking los resultados eran basura, pero al cambiar al lado de Codex usando xhigh, inmediatamente volvía a la normalidad.

En sus propias palabras, Codex era «literalmente 4 mil millones de veces más inteligente que esta cosa».

El desarrollador Andrew Curran ideó una solución ingeniosa: preguntarle directamente al modelo «¿Cuál es la fecha de corte de tus datos de entrenamiento?»

El modelo respondió: Agosto de 2025.

El problema es que la fecha de corte de GPT-5.5 Thinking es diciembre. ¡Agosto es la fecha de corte de la versión Instant!

Es decir, él seleccionó Thinking, pero el sistema en realidad le ejecutó Instant.

La etiqueta del modelo en la interfaz no cambió ni una letra, pero el modelo detrás había sido reemplazado furtivamente......

Lo gracioso es que esta vez OpenAI, en su propia documentación de ayuda, confirmó lo que los usuarios decían.

Según las instrucciones oficiales del Centro de Ayuda de OpenAI, los usuarios Plus pueden enviar un máximo de 160 mensajes de GPT-5.5 cada 3 horas.

Una vez agotados, el sistema cambia silenciosamente al modelo mini, hasta que se reinicia la cuota.

Nota la palabra «silenciosamente».

Sin ventana emergente de advertencia, sin cambio en la etiqueta del modelo, sin ningún feedback visual.

Tú crees que sigues usando el modelo insignia, pero al otro lado ya han cambiado silenciosamente a mini.

Los usuarios Pro tampoco se alegren demasiado.

El modo de pensamiento Heavy, ese nivel de razonamiento más alto exclusivo para Pro, también está sujeto a limitaciones de capacidad cuando la carga del servidor es alta. Tampoco hay advertencia.

En otras palabras, una suscripción Pro de 200 dólares al mes compra un servicio que puede ser «cambiado por otro» en cualquier momento.

Y esta operación de «la etiqueta no cambia, pero el cerebro sí», fue descubierta incluso antes en el lado de Codex.

En febrero de este año, apareció un issue en GitHub donde un usuario Pro, usando el comando trace, descubrió que había solicitado GPT-5.3 Codex, pero el modelo realmente devuelto era GPT-5.2.

Ni siquiera era 5.2 Codex, era la versión base inferior 5.2.

Publicó el comando para reproducirlo:

  • RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
  • Salida: gpt-5.2-2025-12-11
  • Esperado: gpt-5.3-codex

Varios usuarios Pro confirmaron el mismo degradado en el mismo issue.

Y este degradado es «pegajoso», no se recupera solo, y no hay ninguna explicación.

Incluso, el día del lanzamiento de GPT-5.5 en abril, había usuarios reportando que la velocidad del modo Fast era similar a la de Standard, pero la facturación seguía siendo la de Fast.

Una tarea simple tardó 7 minutos y 49 segundos, cuando normalmente debería ser 5-6 minutos.

OpenAI lo reconoció, y luego no pasó nada más

El 15 de mayo, apareció un registro en la página de estado de OpenAI.

Degradación del Rendimiento de GPT5.5, estamos investigando problemas de degradación del rendimiento de GPT-5.5 reportados por algunos usuarios.

El 17 de mayo, el estado se actualizó a «Resuelto».

Pero según la línea de tiempo de los posts en el foro, las quejas sobre la pérdida de inteligencia del 24-26 de mayo fueron más fuertes que la ola del 15 de mayo.

O el problema «resuelto» volvió, o simplemente nunca se resolvió realmente.

Cada actualización es una «polémica por pérdida de inteligencia»

Aunque todas las empresas enfrentan quejas de «el modelo se vuelve estúpido», OpenAI, desde GPT-5 hasta GPT-5.5, no se ha perdido ni una actualización.

Cada vez OpenAI dice que está investigando, cada vez dice que está resuelto, y luego continúa con la siguiente versión.

Agosto de 2025, lanzamiento de GPT-5. El título del post caliente en Reddit era directamente «GPT-5 es una mierda». Usuarios se quejaban de respuestas cortas, más rechazos, menos sensación de personalidad.

OpenAI se vio forzado a restaurar urgentemente la opción GPT-4o. Altman en un AMA de Reddit admitió personalmente «más accidentado de lo que esperábamos».

Diciembre de 2025, GPT-5.2. Calidad de traducción retrocedida, inventaba APIs que no existían, se negaba a ejecutar instrucciones de estilo que 5.1 completaba fácilmente.

Febrero de 2026, GPT-5.3-Codex. Usuarios Pro degradados silenciosamente a 5.2, comando trace lo confirma.

Marzo de 2026, GPT-5.4. Aparece en el foro comunitario de OpenAI el post «GPT-5.4 ha degradado notablemente en Codex», respuestas de usuarios lo confirman.

Principios de mayo de 2026, lanzamiento de GPT-5.5 Instant. Longitud de respuestas reducida un 30%, emojis casi desaparecen. Resumen de usuarios: precisión mejorada, pero la temperatura desapareció.

Finales de mayo de 2026, es decir, ahora. Quejas por pérdida de inteligencia en el modo Thinking estallan de nuevo.

Lisan al Gaib revela que, desde que GPT-5 se lanzó y él lideró esa batalla por la cuota de ChatGPT Plus, «cada semana recibo mensajes privados así».

El último era alguien pidiéndole ayuda para recuperar xhigh/heavy thinking.

El día que obtuvo las mejores puntuaciones, fue el día del lanzamiento

chatgptdisaster.com recopiló 1087 quejas verificadas de usuarios, donde un escenario mencionado repetidamente se llama «fallo de la capa de enrutamiento», la UI muestra GPT-5.5 Pro, pero la salida es de otro nivel completamente diferente.

Los usuarios describen un patrón reproducible: tras sesiones largas, el modelo empieza a «ignorar por completo lo que dices», pero el selector de modelos aún muestra la etiqueta de máxima gama.

La nota más absurda es que el mecanismo de cambio automático a mini después de que los usuarios Plus agotan las 160 mensajes/3 horas, en la documentación oficial de OpenAI es descrito como una «función».

¿Por qué pasa esto? Lisan al Gaib analiza que la respuesta está en dos palabras: ahorrar dinero.

La contracción del poder computacional y la rentabilidad está afectando a todos. Ahorrar por todos lados, sin dejar pasar ninguna oportunidad de recortar costes.

Sin embargo, la misma semana en que los usuarios de GPT-5.5 se quejaban colectivamente, la sombra de GPT-5.6 ya aparecía en los registros del backend de Codex.

Código interno iris-alpha, contexto de 1.5 millones de tokens, probabilidad de lanzamiento en junio según Polymarket supera el 85%.

Por un lado, los usuarios de 5.5 ni siquiera pueden mantener la experiencia básica; por otro, 5.6 ya está ejecutando tráfico real en el backend.

Así es la competencia ASI en 2026.

La velocidad para crear nuevos modelos es cada vez mayor, pero hacer que un modelo antiguo complete bien una sesión es cada vez más difícil.

El día que obtiene las mejores puntuaciones es siempre el día del lanzamiento, cada día después es un GPT de Schrödinger.

Referencias: https://x.com/scaling01/status/2058643470357590058?s=20

Este artículo proviene del WeChat Official Account "新智元", autor: ASI启示录; editor: Moisés

Preguntas relacionadas

Q¿Qué descubrieron algunos usuarios sobre el comportamiento de GPT-5.5 Extended Thinking después de usarlo un tiempo?

AAlgunos usuarios descubrieron que, después de usar GPT-5.5 Extended Thinking una o dos horas, el modelo comenzaba a responder de forma instantánea con una calidad drásticamente reducida, aunque la interfaz seguía mostrando la etiqueta de "GPT-5.5 Extended Thinking", sugiriendo que el sistema podía estar cambiando silenciosamente a un modelo más simple.

Q¿Qué menciona la documentación oficial de OpenAI sobre lo que sucede cuando los usuarios Plus agotan sus mensajes de GPT-5.5?

ALa documentación oficial de OpenAI menciona que los usuarios Plus tienen un límite de 160 mensajes de GPT-5.5 cada 3 horas. Al agotar este límite, el sistema cambia silenciosamente al modelo "mini" hasta que se reinicia el contador, sin notificar al usuario ni cambiar la etiqueta en la interfaz.

Q¿Qué método utilizó el desarrollador Andrew Curran para intentar verificar qué modelo estaba realmente en uso?

AEl desarrollador Andrew Curran preguntó directamente al modelo: "¿Cuál es la fecha de corte de tus datos de entrenamiento?". La respuesta fue "Agosto de 2025", que corresponde a la fecha de corte de la versión Instant, no de la versión Thinking (diciembre), lo que indicaba que el sistema estaba ejecutando un modelo diferente al seleccionado.

Q¿Qué patrón de quejas sobre el rendimiento de los modelos de OpenAI se describe en el artículo desde el lanzamiento de GPT-5?

AEl artículo describe un patrón recurrente donde cada nueva versión importante (GPT-5, GPT-5.2, GPT-5.3, GPT-5.4, GPT-5.5) viene acompañada de oleadas de quejas de usuarios sobre una aparente "pérdida de inteligencia" o degradación del rendimiento, a pesar de que OpenAI suele marcar estos incidentes como "resueltos".

QSegún el artículo, ¿qué posible razón sugiere el usuario Lisan al Gaib para explicar estos cambios silenciosos de modelo?

ALisan al Gaib sugiere que la razón principal para estos cambios silenciosos de modelo es el ahorro de costos, argumentando que la presión por la rentabilidad y el alto costo de la capacidad de computación está llevando a la compañía a reducir gastos donde sea posible, incluso a expensas de la experiencia del usuario.

Lecturas Relacionadas

¿Hacia dónde fluirá el valor encriptado en la era de los usuarios Agentes?

Títol original:Who Makes Money from Agents? L’article explora com els agents d’intel·ligència artificial (IA) podrien reconfigurar la captura de valor en l’ecosistema blockchain, qüestionant teories establertes com la dels «protocols grassos» i les «aplicacions grasses». Tradicionalment, aquests models assumien usuaris humans preocupats per la UX, la marca i la comoditat, permetent que les aplicacions capturin valor a través de la relació amb l’usuari. Els agents, però, funcionen de manera diferent: interactuen directament mitjançant APIs, sense lleialtat a la marca i poden canviar entre protocols i intercanvis amb cost gairebé zero. Això podria debilitar el valor del frontend i la relació amb l’usuari. Es plantegen diversos escenaris: 1. **Aplicacions sense cap (headless)**: Les aplicacions actuals (com carteres o agregadors) podrien oferir les seves capacitats com a API per a agents, convertint-se en infraestructura sense interfície. 2. **Reemergència dels protocols**: Si els agents integren protocols directament, el valor podria tornar a la capa de protocol. 3. **Compressió general dels marges**: La racionalitat i manca de fricció dels agents podrien forçar la competència per preus, comprimint els marges a tot l’stack fins al cost marginal. 4. **Nous tipus d’activitat**: Els agents podrien habilitar activitats noves i impossibles per a humans, com reequilibris continus de cartera o mercats basats en execució ultraràpida. L’article conclou que el futur probablement inclourà tant usuaris humans com agents, amb mapes de captura de valor diferents per a cada grup. La qüestió clau per als creadors és identificar què farà que un agent retorni al seu servei en lloc d’elegir una alternativa més barata: factors com liquiditat, latència, garantia de liquidació o models de negoci encara per inventar.

marsbitHace 37 min(s)

¿Hacia dónde fluirá el valor encriptado en la era de los usuarios Agentes?

marsbitHace 37 min(s)

Replanteando la valoración de Ethereum: ¿Por qué el modelo de tarifas es erróneo y la 'lógica de la tesorería' es el futuro?

**Reimaginando la valoración de Ethereum: ¿Por qué el modelo de tarifas está equivocado y la "lógica de la bóveda" es el futuro?** Autor: Tom Dunleavy El enfoque tradicional de valorar Ethereum como una empresa, usando sus tarifas como "ingresos", es erróneo. Las tarifas son una fricción; un éxito real sería reducirlas a cero. La clave es entender Ethereum no como una empresa, sino como una **bóveda** que protege activos (stablecoins, activos tokenizados, fondos en L2, etc.), actualmente por valor de ~$2500B. El **ETH es el candado** de esta bóveda. Con la Prueba de Participación (PoS), atacar la red requiere controlar una gran parte del ETH apostado (staked). El costo de un ataque está directamente vinculado al valor de mercado del ETH. Actualmente, el valor total del ETH apostado (~$720B) es mucho menor que el de los activos que protege (~$2500B). Esto representa una vulnerabilidad: la bóveda vale más que su candado. Para una seguridad sólida, el valor del ETH apostado debería superar significativamente el valor de los activos custodiados. Bajo este marco, el precio justo del ETH debería ser mucho más alto, alrededor de ~$6900, y aumentaría a decenas de miles si los activos en cadena crecen a billones. Comparar Ethereum con Linux o el DTCC es inexacto, ya que su seguridad no proviene de entidades externas (gobiernos, bancos), sino que se compra en el mercado abierto con su propio token (ETH). Por lo tanto, el ETH *debe* tener valor para garantizar la seguridad. Este modelo no se basa en tarifas, sino en la futura cantidad de valor que se liquidará en Ethereum y el requisito de seguridad correspondiente.

marsbitHace 48 min(s)

Replanteando la valoración de Ethereum: ¿Por qué el modelo de tarifas es erróneo y la 'lógica de la tesorería' es el futuro?

marsbitHace 48 min(s)

Sun Yuchen en entrevista exclusiva con 'Hurun Report': Nuevo orden y certeza en el flujo de valor durante un ciclo de transformación

En una entrevista con *Hurun Report*, Justin Sun, fundador de TRON, analizó la evolución de Web3 hacia la adopción a gran escala. Destacó que el núcleo de la tecnología blockchain es construir una Internet del valor abierta e inclusiva, permitiendo transferencias de fondos de bajo costo y alta eficiencia para cualquier persona en el mundo. Subrayó que las stablecoins, especialmente USDT en la red TRON (con un circulante superior a 863.000 millones de dólares), representan el caso de uso más maduro, impulsado por una demanda real en pagos transfronterizos. Sun atribuye el crecimiento al efecto de red y a la sustitución natural de los sistemas financieros tradicionales, limitados en eficiencia y costos. En cuanto a estrategia, enfatizó un enfoque basado en datos, ejecución rápida y orientación al usuario. La decisión de asociarse con Tether para lanzar USDT-TRC20 se presentó como un ejemplo clave de aprovechar una tendencia a largo plazo con alto potencial. Respecto a la globalización, señaló que el éxito depende de la adaptación a los marcos regulatorios locales y los hábitos de los usuarios. Finalmente, Sun consideró que la convergencia de la IA y la blockchain será crucial para la próxima fase de evolución tecnológica, recomendando a los emprendedores que se centren en construir ventajas centrales únicas en un entorno cambiante.

marsbitHace 1 hora(s)

Sun Yuchen en entrevista exclusiva con 'Hurun Report': Nuevo orden y certeza en el flujo de valor durante un ciclo de transformación

marsbitHace 1 hora(s)

Samsung depende del ciclo tecnológico, SK Hynix del HBM, ¿cómo ganó Micron el billón de dólares en valor de mercado?

## Resumen Ejecutivo Micron Technology, una de las tres principales fabricantes mundiales de chips de memoria DRAM junto a Samsung y SK Hynix, ha alcanzado recientemente una capitalización de mercado de un billón de dólares. Su trayectoria de supervivencia y crecimiento es singular. Fundada en 1978 en Boise, Idaho, sin el respaldo de políticas industriales estatales masivas, Micron ha navegado múltiples crisis cíclicas del sector mientras sus competidores estadounidenses desaparecían y la industria japonesa de memoria se contraía. **Estrategia de Supervivencia: Palanca Política y Eficiencia de Costes** La estrategia de Micron se ha basado en dos pilares interconectados: 1. **Uso de herramientas políticas y legales:** En momentos críticos (década de 1980, 2002, 2017), recurrió a denuncias por dumping, colaboración con autoridades antimonopolio y cabildeo para obtener ventajas o eliminar competidores, ganándose la etiqueta de "oportunista político". 2. **Control de costes de fabricación extremo:** Su ventaja fundamental reside en décadas de ingeniería que permiten chips DRAM con un área de celda más pequeña que la de sus rivales, generando más chips por oblea y menores costes unitarios. Esta eficiencia le permitió soportar las guerras de precios. **El Error Estratégico y sus Consecuencias en la Era de la IA** La adquisición en 2013 de la japonesa Elpida, centrada en DRAM para móviles, distrajo a Micron de la I+D en HBM (High Bandwidth Memory). SK Hynix, que lanzó el primer HBM en 2013, obtuvo una ventaja decisiva de una década. Con el boom de la IA (ej. ChatGPT), el HBM se volvió crucial. Para 2023, SK Hynix dominaba ~85% del mercado de HBM3, mientras Micron, con su lanzamiento tardío, apenas alcanzaba ~3%. **Triple Presión Actual** Micron enfrenta desafíos simultáneos: 1. **Alta gama (HBM):** Va por detrás en cuota de mercado y desarrollo (ej. HBM4) respecto a SK Hynix y Samsung. 2. **Gama media-baja (DRAM):** Su flujo de caja tradicional es erosionado por fabricantes chinos como CXMT, que expanden agresivamente su cuota con precios bajos. 3. **Mercado chino:** Las contra-sanciones chinas de 2023 prohibieron sus productos en infraestructuras críticas, reduciendo sus ingresos en China del 14% (2023) al 7.1% (2025 FY) y excluyéndolo del rápido despliegue de servidores AI en el país. **Conclusión: La Deuda del Tiempo** Aunque la combinación de palanca política y eficiencia de fabricación permitió a Micron sobrevivir, no pudo compensar la falta de visión temprana en HBM. Ahora, mientras intenta remontar en HBM3E y desarrolla HBM4, debe "pagar una deuda de tiempo" en una carrera donde sus competidores no se detienen. Su futuro depende de si puede convertir su reciente entrada en el mercado HBM en una capacidad de producción estable y rentable a largo plazo, superando una desventaja acumulada durante años en la tecnología clave de la era de la IA.

marsbitHace 1 hora(s)

Samsung depende del ciclo tecnológico, SK Hynix del HBM, ¿cómo ganó Micron el billón de dólares en valor de mercado?

marsbitHace 1 hora(s)

Trading

Spot
Futuros
活动图片