Habr AI→ original

AI neuro-simbólica: como finalmente fazer os modelos de linguagem realizarem cálculos

Modelos de linguagem ainda não sabem calcular — e o problema não está no tamanho do modelo nem na qualidade do treinamento. Um pesquisador no Habr conduziu…

Processado por IA de Habr AI; editado por Hamidun News
AI neuro-simbólica: como finalmente fazer os modelos de linguagem realizarem cálculos
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

As maiores empresas de tecnologia do mundo investiram dezenas de bilhões de dólares em modelos de linguagem capazes de escrever código, traduzir textos e gerar raciocínios coerentes sobre qualquer tema. Mas peça a qualquer uma delas para dividir 7429 por 17 — e começa a loteria. Às vezes a resposta estará correta, às vezes não, e às vezes o modelo produzirá uma alucinação confiante indistinguível do resultado correto. Isto não é um bug que possa ser corrigido com um patch. É uma limitação fundamental da arquitetura, e um dos pesquisadores na plataforma Habr não apenas apontou o problema, mas propôs uma solução funcional.

Antes de entender a solução, vale a pena entender por que o problema existe em primeiro lugar. Modelos de linguagem baseados na arquitetura Transformer processam informações através de transformações matemáticas contínuas — multiplicações de matrizes, funções de ativação, mecanismos de atenção. Tudo isso funciona brilhantemente para tarefas onde padrões, contexto e estimativas aproximadas importam. Mas aritmética é uma operação discreta. Dois mais dois é exatamente quatro, não 3,97 e não 4,02. Quando uma rede neural tenta imitar cálculos precisos através de aproximação, ela inevitavelmente falha — especialmente em números que não apareceram no conjunto de treinamento ou que caem fora dos intervalos conhecidos.

A indústria tentou soluções alternativas. Prompting Chain-of-Thought força o modelo a raciocinar passo a passo, o que melhora os resultados mas não aborda o problema raiz — cada passo na cadeia ainda é executado pela mesma arquitetura aproximadora. Fine-tuning em tarefas matemáticas ajuda em cenários estreitos, mas não generaliza. Aumentar o tamanho da janela de contexto e a escala do modelo produz melhorias marginais ao custo de despesas computacionais colossais. Por fim, as empresas chegaram a uma solução paradoxal: conectar calculadoras ordinárias às redes neurais mais poderosas através de chamadas de ferramentas. Funciona, mas parece um muleta anexada a um foguete.

O pesquisador seguiu um caminho diferente, propondo uma arquitetura neuro-simbólica — um híbrido no qual componentes de rede neural fazem o que são realmente fortes, enquanto módulos simbólicos assumem tarefas que exigem precisão. A ideia não é nova em termos acadêmicos — IA neuro-simbólica tem sido discutida em círculos científicos por vários anos, e pesquisadores como Yoshua Bengio e Gary Marcus há muito apontam a necessidade de combinar dois paradigmas. Mas a distância da discussão teórica para uma implementação funcional é enorme, e é esta distância que o autor tentou transpor.

A essência da arquitetura proposta é uma rede neural semântica na qual o modelo não tenta computar diretamente, mas reconhece o tipo de tarefa e delega a execução ao módulo simbólico correspondente. A rede neural atua como intérprete de intenções e roteador, enquanto operações precisas são executadas por algoritmos determinísticos. Isto é fundamentalmente diferente da abordagem com ferramentas externas: em vez de uma chamada API incômoda a uma calculadora, a lógica simbólica é incorporada diretamente na arquitetura do modelo, permitindo que funcione mais rápido e de forma mais confiável.

Os resultados experimentais descritos pelo autor confirmam a viabilidade da abordagem, embora seja prematuro falar de revolução. A questão chave é escalabilidade. Aritmética é o caso mais simples de raciocínio simbólico. É muito mais complexo integrar módulos simbólicos para inferência lógica, planejamento ou verificação de fatos. Se a arquitetura conseguir se expandir para essas áreas, isso realmente mudará o cenário. Se não, permanecerá uma solução elegante mas de nicho.

Para a indústria, o significado deste trabalho vai além da implementação específica. Destaca uma tendência ganhando força nos últimos meses: o puro dimensionamento de redes neurais está atingindo um teto, e o futuro está com sistemas híbridos. OpenAI, Google e Anthropic já estão experimentando com várias formas de integração neuro-simbólica, embora nem sempre falem sobre isso abertamente. O fato de um pesquisador independente estar propondo ideias competitivas com código aberto fala sobre a maturidade da comunidade e a democratização da pesquisa em IA.

Por fim, o trabalho coloca a pergunta certa: não deveríamos parar de forçar redes neurais a fazer o que não foram criadas para fazer, e em vez disso permitir que cada componente do sistema faça o que faz melhor? A resposta parece óbvia. Tudo o que falta é implementá-la em escala.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…