Habr AI→ original

Lina Bessonova apresenta arquitetura cognitiva russa como alternativa aos transformers

Lina Bessonova descreveu sua própria 'arquitetura cognitiva russa' como uma alternativa aos transformers. Segundo seu conceito, o sistema é construído sobre…

Processado por IA de Habr AI; editado por Hamidun News
Lina Bessonova apresenta arquitetura cognitiva russa como alternativa aos transformers
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

A desenvolvedora Lina Bessónova apresentou o conceito de "arquitetura cognitiva russa", que propõe considerá-la como uma alternativa à familiar corrida pelas grandes modelos de linguagem. O pensamento principal do texto é simples: a IA soberana, segundo a autora, não começa com um conjunto de dados local ou compras de aceleradores caros, mas com uma tentativa de redefinir a própria arquitetura do sistema. Em vez de prever o próximo token, Bessónova propõe contar com uma abordagem biomimética, estados internos e acúmulo de experiência.

O texto é construído como uma polêmica contra o que hoje é frequentemente chamado de "IA soberana" na Rússia. A autora levanta questões difíceis: é suficiente ter dados em russo, marca própria ou acesso a H100s escassos para considerar um modelo verdadeiramente independente? Sua resposta é não.

Se o fundamento permanece estrangeiro e a lógica básica é emprestada de modelos americanos, então a localização, na opinião dela, não transforma o produto em uma escola tecnológica independente. Nesse sentido, o artigo parece não ser um anúncio de um serviço em massa pronto, mas um manifesto sobre o que deveria ser, em geral, um stack de IA nacional. Bessónova descreve a parte prática do conceito através de seu próprio stack baseado em Python, NumPy e SciPy.

Segundo ela, o sistema não requer treinamento massivo em enormes clusters de GPU e pode funcionar em tempo real em uma máquina local, de um servidor doméstico a um Mac Mini M4 Pro. Isso é importante não apenas como uma solução de engenharia, mas também como um argumento político e econômico: quanto menor a dependência de hardware sancionado e escasso, maiores as chances de desenvolvimento autônomo. A autora enfatiza particularmente que tal arquitetura é potencialmente mais adequada para dispositivos edge, onde compacidade, consumo de energia e a capacidade de funcionar sem nuvem são críticos.

A ideia técnica chave do artigo é a biomimética em vez da predição estatística. Bessónova contrasta aos transformers um sistema em que o comportamento de um agente deve ser determinado não apenas pelas probabilidades de palavras, mas também pela dinâmica de variáveis internas. Entre elas, ela menciona análogos de excitação, inibição, adaptação e recurso, que são constantemente recalculados e influenciam a resposta do modelo.

Segundo o design da autora, isso nos permite falar não apenas de geração de texto, mas de um esquema cognitivo mais integral, onde a resposta nasce do estado interno do sistema. Como apoio científico, Bessónova se refere à escola fisiológica russa e aos nomes de Bekhterev, Chizhevsky e Pavlov, enfatizando que busca o fundamento não na tradição de engenharia californiana, mas na linha científica doméstica. Outro elemento importante é o aprendizado através da "sedimentação de experiência".

Diferentemente dos modelos que primeiro absorvem massas gigantescas de dados da internet e depois se ajustam, propõe-se um caminho diferente aqui: um agente deve acumular experiência pessoal a partir da interação com o usuário e o ambiente circundante. Tal lógica aproxima o sistema mais de um organismo em desenvolvimento do que de um modelo de linguagem convencional. Ao mesmo tempo, a autora aposta na independência legal do projeto: a arquitetura, segundo ela, está sendo preparada para registro na Rospatent como um programa de computador e depois para proteção patentária de soluções inventivas individuais.

Assim, o conceito é apresentado como uma tentativa de criar não apenas um novo tech stack, mas também um ativo intelectual russo formalmente independente. A parte mais contundente do texto é dedicada à crítica do mainstream corporativo. Bessónova acredita que os modelos dos grandes players, construídos na arquitetura Transformer, permanecem dependentes de "projetos" estrangeiros, mesmo que a interface, a linguagem e a marca sejam locais.

O RLHF recebe crítica particular: aprendizado com reforço baseado em feedback humano. A autora interpreta essa abordagem como um mecanismo que torna os assistentes seguros e previsíveis, mas ao mesmo tempo suaviza a agudeza cultural, a controvérsia e a originalidade intelectual. Em sua interpretação, o problema não está apenas na ideologia, mas na infraestrutura: se toda a estratégia está vinculada a grandes data centers e suprimentos de chips raros, então qualquer fala sobre soberania tecnológica se torna vulnerável.

A conclusão do artigo se resume a uma mudança no próprio quadro da discussão. A questão, em essência, é colocada da seguinte forma: a IA nacional é aquela que alcança os líderes mais rápido em seu campo, ou aquela que oferece um modelo básico diferente de pensamento de máquina? Embora a arquitetura descrita pareça mais um programa de pesquisa e uma declaração de cosmovisão do que um produto pronto para competir com LLMs em massa, a própria formulação do problema é importante: a autora convida ao debate não sobre o número de GPUs e o tamanho dos conjuntos de dados, mas sobre quem estabelece os princípios iniciais dos futuros sistemas inteligentes.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…