Habr AI→ original

Lina Bessonova presentó arquitectura cognitiva rusa como alternativa a los transformers

Lina Bessonova describió su propia 'arquitectura cognitiva rusa' como alternativa a los transformers. Según su concepto, el sistema se construye sobre…

Procesado por IA desde Habr AI; editado por Hamidun News
Lina Bessonova presentó arquitectura cognitiva rusa como alternativa a los transformers
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

La desarrolladora Lina Besónova presentó el concepto de "arquitectura cognitiva rusa", que propone considerar como una alternativa a la familiar carrera por grandes modelos de lenguaje. El pensamiento principal del texto es simple: la IA soberana, según la autora, no comienza con un conjunto de datos local ni con la compra de aceleradores caros, sino con un intento de redefinir la propia arquitectura del sistema. En lugar de predecir el siguiente token, Besónova propone basarse en un enfoque biomimético, estados internos y acumulación de experiencia.

El texto se construye como una polémica contra lo que hoy se suele llamar "IA soberana" en Rusia. La autora plantea preguntas difíciles: ¿es suficiente tener datos en ruso, marca propia o acceso a H100 escasos para considerar un modelo verdaderamente independiente? Su respuesta es no.

Si el fundamento sigue siendo extranjero y la lógica básica se toma prestada de modelos estadounidenses, entonces la localización, en su opinión, no transforma el producto en una escuela tecnológica independiente. En este sentido, el artículo parece no ser un anuncio de un servicio masivo listo, sino un manifiesto sobre lo que debería ser, en general, una pila de IA nacional. Besónova describe la parte práctica del concepto a través de su propia pila basada en Python, NumPy y SciPy.

Según ella, el sistema no requiere entrenamiento masivo en enormes clústeres de GPU y puede funcionar en tiempo real en una máquina local, desde un servidor doméstico hasta una Mac Mini M4 Pro. Esto es importante no solo como solución de ingeniería, sino también como argumento político y económico: cuanta menor dependencia de hardware sancionado y escaso, mayores las posibilidades de desarrollo autónomo. La autora enfatiza particularmente que tal arquitectura es potencialmente más adecuada para dispositivos edge, donde la compacidad, el consumo de energía y la capacidad de funcionar sin nube son críticos.

La idea técnica clave del artículo es la biomimética en lugar de la predicción estadística. Besónova contrasta con los transformers un sistema en el que el comportamiento de un agente debe determinarse no solo por probabilidades de palabras, sino también por la dinámica de variables internas. Entre ellas, menciona análogos de excitación, inhibición, adaptación y recurso, que se recalculan constantemente e influyen en la respuesta del modelo.

Según el diseño de la autora, esto nos permite hablar no solo de generación de texto, sino de un esquema cognitivo más integral, donde la respuesta nace del estado interno del sistema. Como apoyo científico, Besónova se refiere a la escuela fisiológica rusa y a los nombres de Bekhterev, Chizhevsky y Pavlov, enfatizando que busca el fundamento no en la tradición de ingeniería californiana, sino en la línea científica nacional. Otro elemento importante es el aprendizaje a través de la "sedimentación de experiencia".

A diferencia de los modelos que primero absorben masas gigantescas de datos de internet y luego se ajustan, se propone un camino diferente aquí: un agente debe acumular experiencia personal de la interacción con el usuario y el entorno circundante. Tal lógica acerca el sistema más a un organismo en desarrollo que a un modelo de lenguaje convencional. Al mismo tiempo, la autora apuesta por la independencia legal del proyecto: la arquitectura, según ella, se está preparando para su registro en Rospatent como programa de ordenador y luego para protección de patentes de soluciones inventivas individuales.

Así, el concepto se presenta como un intento de crear no solo una nueva pila tecnológica, sino también un activo intelectual ruso formalmente independiente. La parte más contundente del texto se dedica a la crítica de la corriente principal corporativa. Besónova cree que los modelos de los grandes jugadores, construidos sobre la arquitectura Transformer, siguen siendo dependientes de "planos" extranjeros, incluso si la interfaz, el lenguaje y la marca son locales.

RLHF recibe crítica particular: el aprendizaje con refuerzo basado en retroalimentación humana. La autora interpreta este enfoque como un mecanismo que hace que los asistentes sean seguros y predecibles, pero al mismo tiempo suaviza la agudeza cultural, la controversia y la originalidad intelectual. En su interpretación, el problema no está solo en la ideología sino en la infraestructura: si toda la estrategia está vinculada a grandes centros de datos y suministros de chips raros, entonces cualquier discurso sobre soberanía tecnológica se vuelve vulnerable.

La conclusión del artículo se reduce a un cambio en el propio marco de la discusión. La pregunta, en esencia, se plantea de la siguiente manera: ¿es la IA nacional la que alcanza a los líderes más rápido en su campo, o la que ofrece un modelo básico diferente de pensamiento de máquina? Aunque la arquitectura descrita parece más un programa de investigación y una declaración de cosmovisión que un producto listo para competir con LLMs masivos, la misma formulación del problema es importante: la autora invita al debate no sobre el número de GPUs y el tamaño de los conjuntos de datos, sino sobre quién establece los principios iniciales de los futuros sistemas inteligentes.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…