Lina Bessonova apresenta arquitetura cognitiva russa como alternativa aos transformers
Lina Bessonova descreveu sua própria 'arquitetura cognitiva russa' como uma alternativa aos transformers. Segundo seu conceito, o sistema é construído sobre…
Processado por IA de Habr AI; editado por Hamidun News
A desenvolvedora Lina Bessónova apresentou o conceito de "arquitetura cognitiva russa", que propõe considerá-la como uma alternativa à familiar corrida pelas grandes modelos de linguagem. O pensamento principal do texto é simples: a IA soberana, segundo a autora, não começa com um conjunto de dados local ou compras de aceleradores caros, mas com uma tentativa de redefinir a própria arquitetura do sistema. Em vez de prever o próximo token, Bessónova propõe contar com uma abordagem biomimética, estados internos e acúmulo de experiência.
O texto é construído como uma polêmica contra o que hoje é frequentemente chamado de "IA soberana" na Rússia. A autora levanta questões difíceis: é suficiente ter dados em russo, marca própria ou acesso a H100s escassos para considerar um modelo verdadeiramente independente? Sua resposta é não.
Se o fundamento permanece estrangeiro e a lógica básica é emprestada de modelos americanos, então a localização, na opinião dela, não transforma o produto em uma escola tecnológica independente. Nesse sentido, o artigo parece não ser um anúncio de um serviço em massa pronto, mas um manifesto sobre o que deveria ser, em geral, um stack de IA nacional. Bessónova descreve a parte prática do conceito através de seu próprio stack baseado em Python, NumPy e SciPy.
Segundo ela, o sistema não requer treinamento massivo em enormes clusters de GPU e pode funcionar em tempo real em uma máquina local, de um servidor doméstico a um Mac Mini M4 Pro. Isso é importante não apenas como uma solução de engenharia, mas também como um argumento político e econômico: quanto menor a dependência de hardware sancionado e escasso, maiores as chances de desenvolvimento autônomo. A autora enfatiza particularmente que tal arquitetura é potencialmente mais adequada para dispositivos edge, onde compacidade, consumo de energia e a capacidade de funcionar sem nuvem são críticos.
A ideia técnica chave do artigo é a biomimética em vez da predição estatística. Bessónova contrasta aos transformers um sistema em que o comportamento de um agente deve ser determinado não apenas pelas probabilidades de palavras, mas também pela dinâmica de variáveis internas. Entre elas, ela menciona análogos de excitação, inibição, adaptação e recurso, que são constantemente recalculados e influenciam a resposta do modelo.
Segundo o design da autora, isso nos permite falar não apenas de geração de texto, mas de um esquema cognitivo mais integral, onde a resposta nasce do estado interno do sistema. Como apoio científico, Bessónova se refere à escola fisiológica russa e aos nomes de Bekhterev, Chizhevsky e Pavlov, enfatizando que busca o fundamento não na tradição de engenharia californiana, mas na linha científica doméstica. Outro elemento importante é o aprendizado através da "sedimentação de experiência".
Diferentemente dos modelos que primeiro absorvem massas gigantescas de dados da internet e depois se ajustam, propõe-se um caminho diferente aqui: um agente deve acumular experiência pessoal a partir da interação com o usuário e o ambiente circundante. Tal lógica aproxima o sistema mais de um organismo em desenvolvimento do que de um modelo de linguagem convencional. Ao mesmo tempo, a autora aposta na independência legal do projeto: a arquitetura, segundo ela, está sendo preparada para registro na Rospatent como um programa de computador e depois para proteção patentária de soluções inventivas individuais.
Assim, o conceito é apresentado como uma tentativa de criar não apenas um novo tech stack, mas também um ativo intelectual russo formalmente independente. A parte mais contundente do texto é dedicada à crítica do mainstream corporativo. Bessónova acredita que os modelos dos grandes players, construídos na arquitetura Transformer, permanecem dependentes de "projetos" estrangeiros, mesmo que a interface, a linguagem e a marca sejam locais.
O RLHF recebe crítica particular: aprendizado com reforço baseado em feedback humano. A autora interpreta essa abordagem como um mecanismo que torna os assistentes seguros e previsíveis, mas ao mesmo tempo suaviza a agudeza cultural, a controvérsia e a originalidade intelectual. Em sua interpretação, o problema não está apenas na ideologia, mas na infraestrutura: se toda a estratégia está vinculada a grandes data centers e suprimentos de chips raros, então qualquer fala sobre soberania tecnológica se torna vulnerável.
A conclusão do artigo se resume a uma mudança no próprio quadro da discussão. A questão, em essência, é colocada da seguinte forma: a IA nacional é aquela que alcança os líderes mais rápido em seu campo, ou aquela que oferece um modelo básico diferente de pensamento de máquina? Embora a arquitetura descrita pareça mais um programa de pesquisa e uma declaração de cosmovisão do que um produto pronto para competir com LLMs em massa, a própria formulação do problema é importante: a autora convida ao debate não sobre o número de GPUs e o tamanho dos conjuntos de dados, mas sobre quem estabelece os princípios iniciais dos futuros sistemas inteligentes.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.