Habr AI→ original

Por qué el cerebro es cientos de millones de veces más eficiente que GPT-4 y hacia dónde van los chips neuromórficos

El cerebro humano gasta millones de veces menos energía en actos cognitivos que los LLMs modernos, y no es solo cuestión de hardware. La diferencia clave…

Procesado por IA desde Habr AI; editado por Hamidun News
Por qué el cerebro es cientos de millones de veces más eficiente que GPT-4 y hacia dónde van los chips neuromórficos
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

La comparación entre el cerebro humano y los LLMs modernos revela un hecho incómodo para la industria de la IA: incluso los modelos más potentes siguen siendo extremadamente hambrientos de energía. El cerebro funciona a aproximadamente 20 vatios, mientras que los grandes modelos de lenguaje durante la inferencia pueden requerir kilovatios y durante el entrenamiento — megavatios de potencia. Si miramos no a los puntos de referencia de marketing sino al costo de un único pensamiento, la diferencia es colosal: la biología sigue haciendo el mismo trabajo órdenes de magnitud más barato que el silicio.

El artículo comienza la comparación con números de línea de base. Se estima que el cerebro realiza aproximadamente 10^16 operaciones sinápticas por segundo consumiendo alrededor de 20 vatios. Para LLMs modernos, se logra una escala computacional comparable a través de GPUs y TPUs, pero el costo de cada operación es mucho mayor.

En términos de energía por acción, estamos hablando de attojoules para el cerebro versus picojoules y superior para aceleradores digitales. El autor proporciona un ejemplo más vívido: para responder a una pregunta simple como la diferencia entre metano y etano, el cerebro activa solo una pequeña fracción de neuronas y gasta aproximadamente décimas de un julio, mientras que GPT-4 debe cargar un enorme conjunto de parámetros y realizar un volumen gigantesco de operaciones matriciales. En este marco, la brecha puede llegar a cientos de millones de veces.

La razón no es que los ingenieros simplemente tengan hardware deficiente, sino en los propios principios computacionales. El cerebro funciona analógicamente: las neuronas y sinapsis operan en gradientes continuos, potenciales de membrana y corrientes iónicas. Un único elemento biológico simultáneamente almacena estado y participa en la computación.

Los LLMs son diferentes: los datos se representan como bits, la computación se separa de la memoria, y cada operación matricial se desglosa en una larga cadena de interruptores digitales. La segunda ventaja del cerebro es la recurrencia y la dinámica temporal. La misma neurona se involucra múltiples veces en el procesamiento de señales, y el tiempo se convierte en parte de la computación.

Un Transformer, por el contrario, impulsa cada token a través de un conjunto fijo de capas y paga por esto con un número gigantesco de operaciones paralelas. La tercera diferencia es la dispersidad. En el cerebro, solo una pequeña fracción de neuronas está activa simultáneamente, por lo que el sistema no desperdicia energía en la activación total de la red.

En LLMs, en cada paso, se involucran enormes matrices de pesos, incluso si la tarea es relativamente simple. El cuarto factor es el aprendizaje local. El sistema biológico cambia sinapsis específicas donde surgió nueva experiencia, en lugar de ejecutar retropropagación global a través de una red gigantesca.

El quinto es la física del sustrato mismo: los canales de iones y los procesos bioquímicos funcionan cerca del mínimo termodinámico, mientras que incluso los transistores avanzados conmutan con pérdidas mucho mayores. Finalmente, el cerebro obtiene parte de su estructura de forma gratuita: la corteza visual, el hipocampo, el cerebelo y otros módulos especializados le llegaron como resultado de la evolución, mientras que los LLMs deben aprender la estructura del mundo de nuevo a través de conjuntos de datos masivos y entrenamiento muy costoso. Esto no significa que los modelos grandes no tengan futuro.

Más bien, la conclusión es que la arquitectura Transformer actual ha topado con el costo energético de su propia conveniencia. La industria ya está buscando soluciones alternativas: cuantización a 4–8 bits, Transformers dispersos, mezcla de expertos, redes líquidas y pulsantes. Algunos enfoques ya producen mejoras de 5–10x, pero esto es insuficiente para acercarse al nivel biológico.

Por lo tanto, cada vez más atención se está desplazando hacia hardware neuromorfo. Tales sistemas ya existen: SpiNNaker2 se implementa como una supercomputadora especializada e incluso se puede alquilar a través de la nube, BrainChip Akida se orienta hacia edge AI, SynSense Xylo e Innatera Pulsar apuntan a escenarios de microvatio y sensores. Sin embargo, incluso las mejores de estas soluciones actualmente se quedan rezagadas respecto al cerebro aproximadamente tres órdenes de magnitud en eficiencia energética y requieren un stack de software completamente diferente.

El horizonte práctico también se ve sobrio. En 2026–2028, los chips neuromorphos probablemente crecerán en robótica, controladores industriales, sensores y sistemas autónomos, donde la latencia y el consumo de energía son críticos. La electrónica de consumo como smartphones y smartwatches pueden obtener tales coprocesadores, si es que los obtienen, más cerca de 2030 y más allá.

El cuello de botella principal aquí no es solo la fabricación de chips, sino también el software: herramientas familiares como PyTorch y TensorFlow no funcionan con redes pulsantes sin adaptación seria, y aún no existe un estándar de entrenamiento universal para tales sistemas. La conclusión principal es simple: el cerebro hoy no es simplemente más inteligente en tareas individuales, sino radicalmente más económico como máquina computacional. Por lo tanto, el próximo gran salto en IA probablemente no vendrá de un LLM aún más grande en un cluster GPU aún más grande, sino de un cambio en el paradigma computacional fundamental.

Por ahora, GPT-4 y sus sucesores siguen siendo una forma muy poderosa, pero energéticamente costosa de obtener comportamiento similar a la inteligencia.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…