Lina Bessonova présente une architecture cognitive russe comme alternative aux transformers
Lina Bessonova a décrit sa propre 'architecture cognitive russe' comme alternative aux transformers. Selon son concept, le système est construit sur des…
Traité par IA depuis Habr AI ; édité par Hamidun News
La développeuse Lina Bessonova a présenté le concept d'« architecture cognitive russe », qu'elle propose de considérer comme une alternative à la course familière pour les grands modèles de langage. La pensée principale du texte est simple : l'IA souveraine, selon l'auteure, ne commence pas par un ensemble de données local ou l'achat d'accélérateurs coûteux, mais par une tentative de redéfinir l'architecture du système lui-même. Au lieu de prédire le token suivant, Bessonova propose de s'appuyer sur une approche biomimétique, des états internes et l'accumulation d'expérience.
Le texte est construit comme une polémique contre ce qu'on appelle souvent « l'IA souveraine » en Russie aujourd'hui. L'auteure pose des questions difficiles : est-il suffisant d'avoir des données russes, sa propre marque ou l'accès aux rares H100 pour considérer un modèle comme véritablement indépendant ? Sa réponse est non.
Si le fondement reste étranger et la logique de base est empruntée aux modèles américains, alors la localisation, à son avis, ne transforme pas le produit en une école technologique indépendante. En ce sens, l'article ne ressemble pas à l'annonce d'un service de masse prêt, mais plutôt à un manifeste sur ce qu'une pile IA nationale devrait être en général. Bessonova décrit la partie pratique du concept à travers sa propre pile basée sur Python, NumPy et SciPy.
Selon elle, le système ne nécessite pas d'entraînement massif sur d'énormes clusters GPU et peut fonctionner en temps réel sur une machine locale, d'un serveur domestique à un Mac Mini M4 Pro. C'est important non seulement comme solution d'ingénierie, mais aussi comme argument politique et économique : moins la dépendance au matériel sanctionné et rare, plus les chances de développement autonome sont élevées. L'auteure souligne particulièrement que cette architecture convient potentiellement mieux aux appareils edge, où la compacité, la consommation d'énergie et la possibilité de fonctionner sans cloud sont critiques.
L'idée technique clé de l'article est la biomimétique au lieu de la prédiction statistique. Bessonova oppose aux transformers un système dans lequel le comportement d'un agent doit être déterminé non seulement par les probabilités des mots, mais aussi par la dynamique des variables internes. Parmi celles-ci, elle mentionne des analogues d'excitation, d'inhibition, d'adaptation et de ressource, qui sont constamment recalculés et influencent la réponse du modèle.
Selon la conception de l'auteure, cela nous permet de parler non seulement de génération de texte, mais d'un schéma cognitif plus intégral, où la réponse naît de l'état interne du système. Comme soutien scientifique, Bessonova fait référence à l'école physiologique russe et aux noms de Bekhterev, Chizhevsky et Pavlov, soulignant qu'elle cherche le fondement non dans la tradition d'ingénierie californienne, mais dans la lignée scientifique nationale. Un autre élément important est l'apprentissage par « sédimentation d'expérience ».
Contrairement aux modèles qui absorbent d'abord des masses gigantesques de données Internet puis s'ajustent, un chemin différent est proposé ici : un agent doit accumuler l'expérience personnelle de l'interaction avec l'utilisateur et l'environnement environnant. Une telle logique rapproche le système d'un organisme en développement plutôt que d'un modèle de langage conventionnel. Simultanément, l'auteure mise sur l'indépendance juridique du projet : l'architecture, selon elle, est en cours de préparation pour l'enregistrement à Rospatent en tant que programme informatique, puis pour la protection par brevet de solutions inventives individuelles.
Ainsi, le concept est présenté comme une tentative de créer non seulement une nouvelle pile technologique, mais aussi un actif intellectuel russe formellement indépendant. La partie la plus acérée du texte est consacrée à la critique du courant principal corporatif. Bessonova estime que les modèles des grands acteurs, construits sur l'architecture Transformer, restent dépendants des « plans » étrangers, même si l'interface, la langue et la marque sont locales.
RLHF reçoit une critique particulière : l'apprentissage par renforcement basé sur le retour d'information humain. L'auteure interprète cette approche comme un mécanisme qui rend les assistants sûrs et prévisibles, mais qui lisse également l'acuité culturelle, la controverse et la singularité intellectuelle. Dans son interprétation, le problème ne réside pas seulement dans l'idéologie mais dans l'infrastructure : si toute la stratégie est liée aux grands centres de données et aux approvisionnements en puces rares, alors tout discours sur la souveraineté technologique devient vulnérable.
La conclusion de l'article se résume à un changement du cadre même de la discussion. La question, en essence, se pose comme suit : l'IA nationale est-elle celle qui rattrape les leaders plus rapidement sur leur terrain, ou celle qui propose un modèle fondamental différent de la pensée des machines ? Bien que l'architecture décrite ressemble davantage à un programme de recherche et à une déclaration de vision du monde qu'à un produit prêt à concurrencer les LLM de masse, la formulation même du problème est importante : l'auteure appelle à un débat non pas sur le nombre de GPU et la taille des ensembles de données, mais sur qui définit les principes initiaux des futurs systèmes intelligents.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.