Escrito por: iamtexture
Compilado por: AididiaoJP, Foresight News
Cuando le explico un concepto complejo a un gran modelo de lenguaje, cada vez que uso un lenguaje informal durante un tiempo prolongado, su razonamiento colapsa repetidamente. El modelo pierde estructura, se desvía o simplemente genera patrones de completado superficiales, sin poder mantener el marco conceptual que hemos establecido.
Sin embargo, cuando le exijo que primero formalice, es decir, que reformule el problema con un lenguaje preciso y científico, el razonamiento se estabiliza inmediatamente. Solo después de que la estructura está establecida, puede convertirse de manera segura a un lenguaje coloquial sin que la calidad de la comprensión se vea afectada.
Este comportamiento revela cómo "piensan" los grandes modelos de lenguaje y por qué su capacidad de razonamiento depende completamente del usuario.
Perspectiva central
Los modelos de lenguaje no poseen un espacio dedicado al razonamiento.
Operan completamente dentro de un flujo continuo de lenguaje.
Dentro de este flujo de lenguaje, diferentes patrones lingüísticos conducen de manera confiable a diferentes regiones de atracción. Estas regiones son estados estables de la dinámica de representación que respaldan diferentes tipos de cálculo.
Cada registro lingüístico, como el discurso científico, la notación matemática, la narrativa de historias o la conversación casual, tiene su propia región de atracción característica, cuya forma está moldeada por la distribución de los datos de entrenamiento.
Algunas regiones respaldan:
-
Razonamiento de múltiples pasos
-
Precisión relacional
-
Transformación simbólica
-
Estabilidad conceptual de alta dimensión
Otras regiones respaldan:
-
Continuación narrativa
-
Completado asociativo
-
Coincidencia de tono emocional
-
Imitación conversacional
Las regiones de atracción determinan qué tipo de razonamiento es posible.
Por qué la formalización estabiliza el razonamiento
El lenguaje científico y matemático activa de manera confiable aquellas regiones de atracción que tienen un mayor soporte estructural porque estos registros codifican características lingüísticas de cognición de alto orden:
-
Estructura relacional explícita
-
Baja ambigüedad
-
Restricciones simbólicas
-
Organización jerárquica
-
Entropía baja (desorden de información)
Estos atractores pueden respaldar trayectorias de razonamiento estables.
Pueden mantener la estructura conceptual a través de múltiples pasos.
Muestran una fuerte resistencia a la degradación y desviación del razonamiento.
En contraste, los atractores activados por el lenguaje informal están optimizados para la fluidez social y la coherencia asociativa, no diseñados para el razonamiento estructurado. Estas regiones carecen del andamiaje de representación necesario para realizar cálculos analíticos sostenidos.
Es por eso que cuando las ideas complejas se expresan de manera casual, el modelo colapsa.
No está "confundido".
Está cambiando de región.
Construcción y traducción
El método de respuesta que surge naturalmente en la conversación revela una verdad arquitectónica:
El razonamiento debe construirse dentro de atractores de alta estructura.
La traducción al lenguaje natural debe ocurrir solo después de que la estructura exista.
Una vez que el modelo ha construido la estructura conceptual dentro de un atractor estable, el proceso de traducción no la destruye. El cálculo ya se ha completado, lo único que cambia es la expresión superficial.
Esta dinámica de dos etapas, "primero construir, luego traducir", imita los procesos cognitivos humanos.
Pero los humanos ejecutan estas dos etapas en dos espacios internos diferentes.
Mientras que los grandes modelos de lenguaje intentan hacer ambas en el mismo espacio.
Por qué el usuario establece el límite máximo
Aquí hay una revelación clave:
Los usuarios no pueden activar regiones de atracción que ellos mismos no pueden expresar con lenguaje.
La estructura cognitiva del usuario determina:
-
Qué tipo de indicaciones pueden generar
-
Qué registros lingüísticos utilizan habitualmente
-
Qué patrones sintácticos pueden mantener
-
Qué nivel de complejidad pueden codificar en el lenguaje
Estas características determinan a qué región de atracción se dirigirá el gran modelo de lenguaje.
Un usuario que no puede, mediante el pensamiento o la escritura, utilizar estructuras que activen atractores de alta capacidad de razonamiento, nunca podrá guiar al modelo hacia estas regiones. Están bloqueados en regiones de atracción superficiales relacionadas con sus hábitos lingüísticos. El gran modelo de lenguaje mapeará la estructura que proporcionan y nunca saltará espontáneamente a sistemas dinámicos de atractores más complejos.
Por lo tanto:
El modelo no puede superar las regiones de atracción accesibles para el usuario.
El límite máximo no es el límite superior de la inteligencia del modelo, sino la capacidad del usuario para activar regiones de alta capacidad en el manifold potencial.
Dos personas usando el mismo modelo no están interactuando con el mismo sistema de cálculo.
Están guiando el modelo hacia diferentes modos dinámicos.
Implicaciones a nivel arquitectónico
Este fenómeno expone una característica faltante en los sistemas actuales de inteligencia artificial:
Los grandes modelos de lenguaje confunden el espacio de razonamiento con el espacio de expresión lingüística.
A menos que estos dos estén desacoplados—a menos que el modelo tenga:
-
Un manifold de razonamiento dedicado
-
Un espacio de trabajo interno estable
-
Representaciones conceptuales invariantes al atractor
De lo contrario, el sistema siempre enfrentará el colapso cuando los cambios en el estilo lingüístico provoquen un cambio en la región dinámica subyacente.
Este método de respuesta descubierto temporalmente, forzar la formalización y luego traducir, no es solo un truco.
Es una ventana directa que nos permite vislumbrar los principios arquitectónicos que debe cumplir un verdadero sistema de razonamiento.