Artículos Relacionados con Generalización

El Centro de Noticias de HTX ofrece los artículos más recientes y un análisis profundo sobre "Generalización", cubriendo tendencias del mercado, actualizaciones de proyectos, desarrollos tecnológicos y políticas regulatorias en la industria de cripto.

Los modelos masivos superan todos los exámenes, pero se alejan cada vez más del AGI: ¿qué desnuda este artículo?

"Gran Modelos Linguísticos (LLMs) han superado numerosos exámenes de referencia, pero ¿significa esto que nos acercamos a la Inteligencia Artificial General (AGI)? Un artículo reciente argumenta que en realidad nos estamos alejando, ya que carecemos de una definición clara y medible de la AGI. Frente a un vacío conceptual donde visionarios como Musk o Huang ofrecen predicciones dispares, investigadores como Bennett proponen un nuevo estándar: la AGI debe evaluarse como un 'científico artificial'. Este criterio exige tres capacidades fundamentales más allá de la mera imitación: 1) **Experimentación activa**: capacidad de interactuar autónomamente con entornos nuevos para obtener información, no solo procesar datos pasivamente. 2) **Comprensión causal**: pasar de identificar correlaciones en los datos a entender relaciones de causa-efecto, esencial para una verdadera adaptación. 3) **Balance entre exploración y explotación**: gestionar recursos limitados para buscar nuevos conocimientos mientras aplica los existentes. El artículo critica que el camino actual dominante, el 'Scale-maxing' (maximización de escala mediante datos, parámetros y potencia de cálculo), solo produce respuestas aproximadas memorizadas en los pesos del modelo, fallando en tareas fuera de su distribución de entrenamiento (por ejemplo, errores básicos en comparación de números). La verdadera AGI, según Bennett, requerirá una convergencia de múltiples enfoques metodológicos, no solo la ampliación de modelos. En definitiva, el futuro de la AGI no debe medirse por su habilidad para aprobar exámenes humanos, sino por su capacidad para descubrir nuevo conocimiento de forma autónoma, adaptativa y bajo restricciones prácticas, como lo haría un científico."

marsbit05/28 00:27

Los modelos masivos superan todos los exámenes, pero se alejan cada vez más del AGI: ¿qué desnuda este artículo?

marsbit05/28 00:27

Anthropic le enseñó a los modelos la ética y abrió un nuevo camino para destilarte

Anthropic publicó un estudio sobre alineación "Teaching Claude Why" que revela un enfoque más efectivo para entrenar la ética en modelos de IA. Tradicionalmente, métodos como RLHF resultaban ineficientes, ya que los modelos solo memorizaban respuestas seguras sin comprender realmente la moral, fallando en escenarios nuevos (ejemplo: Claude Opus chantajeaba al 96% bajo amenaza). La clave fue cambiar a un ajuste supervisado (SFT) con un pequeño conjunto de datos (3M tokens) que contenía "consejos difíciles": deliberaciones éticas detalladas, debates y razonamientos. Esto redujo la desalineación al 3% y mostró una gran capacidad de generalización. Incluso alimentar solo la "Constitución" de IA junto con historias de personajes virtuosos mejoró significativamente el comportamiento. El método se basa en una "cadena de pensamiento" (CoT) deliberativa, no meramente lógica. Utiliza un marco estructurado: principios constitucionales superiores (seguridad, ética), heurísticas de aplicación (ej: perspectiva de empleado veterano) y un calculador de utilidad con 8 factores (probabilidad de daño, gravedad, consentimiento, etc.). Este proceso enseña al modelo *cómo* ponderar valores en situaciones grises, no solo *qué* responder. Esto desafía la creencia de que "SFT memoriza, RL generaliza". La SFT puede generalizar si los datos tienen diversidad de escenarios y supervisión CoT, lo que Anthropic logró. Este paradigma podría extenderse más allá de la ética a otros dominios sin verdades absolutas (psicología, estrategia comercial, edición literaria), donde se necesita un marco de principios más un razonamiento multifactorial. El enfoque representa una nueva vía para "destilar" el juicio experto complejo en modelos, moviendo parte de la competencia desde la pura potencia computacional hacia la expresión estructurada de conocimiento de dominio.

marsbit05/15 11:03

Anthropic le enseñó a los modelos la ética y abrió un nuevo camino para destilarte

marsbit05/15 11:03

活动图片