Jiqizhixin (机器之心)→ original

Implicit CoT: cómo las redes neuronales aprendieron a pensar sin abrir la boca

Cuando OpenAI presentó el modelo o1, el mundo realmente se enfrentó al concepto de Chain of Thought por primera vez. Estábamos acostumbrados a que las redes…

Procesado por IA desde Jiqizhixin (机器之心); editado por Hamidun News
Implicit CoT: cómo las redes neuronales aprendieron a pensar sin abrir la boca
Fuente: Jiqizhixin (机器之心). Collage: Hamidun News.
◐ Escuchar artículo

Cuando OpenAI presentó el modelo o1, el mundo realmente se enfrentó al concepto de Chain of Thought por primera vez. Estábamos acostumbrados a que las redes neurales produjeran respuestas instantáneamente, pero o1 nos obligó a esperar mientras ella "murmura para sí misma", trabajando a través de posibilidades. Parecía magia, pero esta magia tenía un precio alto: tiempo de espera y un enorme consumo de tokens en razonamiento interno que el usuario quizás nunca viera. Este es el llamado Explicit CoT, que se convirtió en una muleta temporal para modelos que intentan imitar la lógica humana.

Sin embargo, nueva investigación en el campo del razonamiento implícito (Implicit CoT) promete liberarnos de esta redundancia. Los investigadores se preguntaron: ¿realmente necesitan los modelos "articular" cada paso lógico para llegar a la conclusión correcta? Resultó que no. Mediante entrenamiento especializado y destilación del conocimiento, las redes neurales pueden aprender a ocultar estas etapas intermedias dentro de sus estados ocultos (hidden states). Esto cambia fundamentalmente el paradigma: en lugar de gastar recursos computacionales generando texto que nadie lee, el modelo los dirige hacia formar directamente la respuesta correcta.

Para entender la escala del cambio, imagine la diferencia entre un estudiante resolviendo una ecuación escribiendo cada paso y un profesor que ve la solución instantáneamente. El OpenAI o1 es un estudiante dedicado. La tecnología Implicit CoT es un intento de hacer crecer un profesor a partir de él. Transferir el razonamiento de la salida de texto al reino del cálculo interno permite lograr la misma precisión en tareas matemáticas y lógicas, pero con ahorro colosal de recursos. Para la industria, esto significa que los modelos futuros no solo serán más inteligentes, sino significativamente más rápidos y más baratos de operar.

Este cambio también resuelve el problema de la "contaminación" del contexto. Cuando un modelo genera miles de tokens de razonamiento, puede enredarse en sus propias palabras. El razonamiento oculto permite evitar este ruido. Los investigadores utilizaron métodos de aprendizaje por refuerzo para obligar al modelo a "comprimir" sus pensamientos. Como resultado, la red neuronal aprende a operar con abstracciones de orden superior sin desglosarlas en explicaciones textuales primitivas. Esto es esencialmente un paso hacia la creación de lo que Daniel Kahneman llamó "Sistema 1" — pensamiento rápido, automático e intuitivo que, sin embargo, se basa en una preparación lógica profunda.

Para desarrolladores y negocios, esta es una señal de que la carrera por la cantidad de parámetros puede finalmente ceder el paso a la carrera por la elegancia arquitectónica. Si anteriormente pensábamos que resolver problemas complejos requería ventanas de contexto gigantes y computación infinita en la etapa de inferencia, ahora se está haciendo claro: la eficiencia radica en la capacidad del modelo para interiorizar su conocimiento. Estamos al borde del surgimiento de una nueva generación de LLMs que tendrán la profundidad de o1 pero la velocidad de GPT-4o. Esto no es simplemente optimización; es la maduración de una tecnología que finalmente está aprendiendo a pensar por sí misma antes de decir algo.

En conclusión: La era de "pensamientos largos" hablados en voz alta fue meramente una fase transitoria. ¿Podrán los modelos abiertos dominar Implicit CoT más rápido de lo que OpenAI cierre esta brecha en sus productos comerciales?

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…