MarkTechPost→ original

Nous Research presentó CNA: gestión del comportamiento de LLM sin reentrenamiento

Nous Research presentó el método CNA para gestionar el comportamiento de modelos de lenguaje. Identifica y desactiva circuitos neuronales individuales…

Procesado por IA desde MarkTechPost; editado por Hamidun News
Nous Research presentó CNA: gestión del comportamiento de LLM sin reentrenamiento
Fuente: MarkTechPost. Collage: Hamidun News.
◐ Escuchar artículo

Nous Research presentó el método Contrastive Neuron Attribution (CNA), un enfoque innovador para gestionar el comportamiento de grandes modelos de lenguaje. El método permite identificar y desactivar circuitos neuronales individuales en capas MLP sin requerir reentrenamiento ni modificar sus pesos.

Qué es CNA y cómo funciona

Contrastive Neuron Attribution es una técnica para identificar y desactivar circuitos dispersos de neuronas en redes perceptrónicas multicapa (MLP). Cada capa MLP del modelo contiene miles de neuronas, pero solo una pequeña parte de ellas es responsable de un comportamiento específico, característica o capacidad del modelo. El método CNA utiliza análisis contrastivo: compara las activaciones de la red en ejemplos donde el comportamiento objetivo es pronunciado y en ejemplos donde está ausente.

Este enfoque permite identificar exactamente las neuronas que son más sensibles a la aparición o desaparición del comportamiento que nos interesa. Después de la identificación, estas neuronas pueden desactivarse y el modelo deja de demostrar la característica no deseada. La simplicidad del método radica en su elegancia: no requiere entrenamiento adicional; solo es necesario realizar el análisis y bloquear la señal de las neuronas identificadas durante la inferencia.

Ventaja principal: sin reentrenamiento ni modificación de pesos

La forma tradicional de gestionar el comportamiento de un LLM requiere bien un reentrenamiento completo (ajuste fino con un conjunto de datos grande) o aplicar un autocodificador disperso (SAE): una red neuronal adicional que aprende a identificar componentes dispersos en las activaciones del modelo. Ambos enfoques requieren recursos computacionales significativos, tiempo y a menudo conducen a una ligera degradación del rendimiento. CNA es fundamentalmente diferente.

El método no requiere reentrenamiento ni cambia en absoluto los pesos del modelo. La gestión del comportamiento ocurre exclusivamente a nivel de activaciones neuronales: simplemente pueden desactivarse durante la inferencia. Esto hace que el proceso sea mucho más rápido, económico e importante, completamente reversible: si la solución no funciona, simplemente puede restaurar las neuronas a su estado original.

Un resultado clave del estudio de Nous Research confirma que la aplicación de CNA no causa degradación del rendimiento general del modelo. Después de usar el método, el modelo mantiene: Resultados altos en pruebas estándar (MMLU, GSM8K, HumanEval) El espectro completo de capacidades no relacionadas con el comportamiento objetivo * La velocidad original y eficiencia energética de la inferencia ## Dónde se puede aplicar CNA es útil para eliminar o modificar características no deseadas del modelo: sesgos en las respuestas, contenido tóxico, estilos de generación no deseados, asociaciones distorsionadas. El método también puede aplicarse para reforzar capacidades necesarias, por ejemplo, para mejorar habilidades en un dominio temático especializado.

Para las organizaciones, esto significa la posibilidad de adaptar grandes modelos públicos (GPT-4, Claude, Llama) a sus propios requisitos y valores sin necesidad de un reentrenamiento completo. Esto ahorra recursos, acelera la implementación y permite responder rápidamente a nuevos requisitos.

Qué significa esto CNA abre una nueva forma de ajustar finamente el

comportamiento de los LLM después de su lanzamiento en producción: más barato y simple que el reentrenamiento, pero mucho más efectivo que enfoques ingenuos como la ingeniería de prompts. Esto puede acelerar significativamente el desarrollo de sistemas de IA seguros y adaptados a requisitos específicos, especialmente en industrias reguladas donde el comportamiento del modelo es crítico.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…