AI neuro-simbólica: como finalmente fazer os modelos de linguagem realizarem cálculos
Modelos de linguagem ainda não sabem calcular — e o problema não está no tamanho do modelo nem na qualidade do treinamento. Um pesquisador no Habr conduziu…
Processado por IA de Habr AI; editado por Hamidun News
As maiores empresas de tecnologia do mundo investiram dezenas de bilhões de dólares em modelos de linguagem capazes de escrever código, traduzir textos e gerar raciocínios coerentes sobre qualquer tema. Mas peça a qualquer uma delas para dividir 7429 por 17 — e começa a loteria. Às vezes a resposta estará correta, às vezes não, e às vezes o modelo produzirá uma alucinação confiante indistinguível do resultado correto. Isto não é um bug que possa ser corrigido com um patch. É uma limitação fundamental da arquitetura, e um dos pesquisadores na plataforma Habr não apenas apontou o problema, mas propôs uma solução funcional.
Antes de entender a solução, vale a pena entender por que o problema existe em primeiro lugar. Modelos de linguagem baseados na arquitetura Transformer processam informações através de transformações matemáticas contínuas — multiplicações de matrizes, funções de ativação, mecanismos de atenção. Tudo isso funciona brilhantemente para tarefas onde padrões, contexto e estimativas aproximadas importam. Mas aritmética é uma operação discreta. Dois mais dois é exatamente quatro, não 3,97 e não 4,02. Quando uma rede neural tenta imitar cálculos precisos através de aproximação, ela inevitavelmente falha — especialmente em números que não apareceram no conjunto de treinamento ou que caem fora dos intervalos conhecidos.
A indústria tentou soluções alternativas. Prompting Chain-of-Thought força o modelo a raciocinar passo a passo, o que melhora os resultados mas não aborda o problema raiz — cada passo na cadeia ainda é executado pela mesma arquitetura aproximadora. Fine-tuning em tarefas matemáticas ajuda em cenários estreitos, mas não generaliza. Aumentar o tamanho da janela de contexto e a escala do modelo produz melhorias marginais ao custo de despesas computacionais colossais. Por fim, as empresas chegaram a uma solução paradoxal: conectar calculadoras ordinárias às redes neurais mais poderosas através de chamadas de ferramentas. Funciona, mas parece um muleta anexada a um foguete.
O pesquisador seguiu um caminho diferente, propondo uma arquitetura neuro-simbólica — um híbrido no qual componentes de rede neural fazem o que são realmente fortes, enquanto módulos simbólicos assumem tarefas que exigem precisão. A ideia não é nova em termos acadêmicos — IA neuro-simbólica tem sido discutida em círculos científicos por vários anos, e pesquisadores como Yoshua Bengio e Gary Marcus há muito apontam a necessidade de combinar dois paradigmas. Mas a distância da discussão teórica para uma implementação funcional é enorme, e é esta distância que o autor tentou transpor.
A essência da arquitetura proposta é uma rede neural semântica na qual o modelo não tenta computar diretamente, mas reconhece o tipo de tarefa e delega a execução ao módulo simbólico correspondente. A rede neural atua como intérprete de intenções e roteador, enquanto operações precisas são executadas por algoritmos determinísticos. Isto é fundamentalmente diferente da abordagem com ferramentas externas: em vez de uma chamada API incômoda a uma calculadora, a lógica simbólica é incorporada diretamente na arquitetura do modelo, permitindo que funcione mais rápido e de forma mais confiável.
Os resultados experimentais descritos pelo autor confirmam a viabilidade da abordagem, embora seja prematuro falar de revolução. A questão chave é escalabilidade. Aritmética é o caso mais simples de raciocínio simbólico. É muito mais complexo integrar módulos simbólicos para inferência lógica, planejamento ou verificação de fatos. Se a arquitetura conseguir se expandir para essas áreas, isso realmente mudará o cenário. Se não, permanecerá uma solução elegante mas de nicho.
Para a indústria, o significado deste trabalho vai além da implementação específica. Destaca uma tendência ganhando força nos últimos meses: o puro dimensionamento de redes neurais está atingindo um teto, e o futuro está com sistemas híbridos. OpenAI, Google e Anthropic já estão experimentando com várias formas de integração neuro-simbólica, embora nem sempre falem sobre isso abertamente. O fato de um pesquisador independente estar propondo ideias competitivas com código aberto fala sobre a maturidade da comunidade e a democratização da pesquisa em IA.
Por fim, o trabalho coloca a pergunta certa: não deveríamos parar de forçar redes neurais a fazer o que não foram criadas para fazer, e em vez disso permitir que cada componente do sistema faça o que faz melhor? A resposta parece óbvia. Tudo o que falta é implementá-la em escala.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.