Habr AI→ original

Diálogo interno de LLM: como modelos imitam a mente coletiva

Os modernos grandes modelos de linguagem (LLM) demonstram notáveis capacidades de raciocínio, mas como exatamente eles alcançam esses resultados?…

Processado por IA de Habr AI; editado por Hamidun News
Diálogo interno de LLM: como modelos imitam a mente coletiva
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

Os modernos grandes modelos de linguagem (LLM) demonstram notáveis capacidades de raciocínio, mas como exatamente eles alcançam esses resultados? Tradicionalmente, acreditava-se que o método Chain-of-Thought, em que um modelo constrói uma cadeia lógica passo a passo, era a chave para o sucesso. No entanto, um estudo recente conduzido por cientistas do Google Research e da University of Chicago revelou algo muito mais interessante: dentro dos LLMs ocorre não simplesmente um raciocínio sequencial, mas um processo complexo que imita um diálogo multilateral, uma espécie de "reunião de mentes".

Em vez de um monólogo, o modelo gera diferentes perspectivas que entram em conflito, debatem e, finalmente, chegam à reconciliação. Este fenômeno, chamado "Society of Thought" (Sociedade do Pensamento), sugere que os LLMs aprenderam espontaneamente a imitar o que filósofos e psicólogos há muito descrevem como a natureza do pensamento – um diálogo interno entre diferentes "vozes".

Pesquisadores identificaram quatro padrões-chave nesta "dinâmica conversacional": fazer perguntas, mudar perspectivas, conflito e reconciliação. Além disso, descobriram que no processo de raciocínio, os modelos reproduzem 12 papéis socioemociais descritos no sistema Bales' IPA (Interaction Process Analysis), o que testemunha a alta complexidade das interações internas.

Um fator-chave que influencia a precisão do raciocínio é a diversidade de perspectivas. Quanto mais diferentes pontos de vista um modelo gera, maior a probabilidade de encontrar a solução correta. Experimentos com activation steering, aprendizado por RL e transfer effects confirmaram essa hipótese, mostrando que estimular a diversidade dentro do modelo leva a uma melhora no desempenho.

A imitação do diálogo interno abre novos horizontes no desenvolvimento de LLMs. Em vez de simplesmente aumentar o tamanho do modelo e o volume de dados de treinamento, pode-se focar em criar mecanismos mais eficazes para gerar e gerenciar diferentes perspectivas. Isso pode levar à criação de modelos capazes de resolver tarefas mais complexas e tomar decisões mais equilibradas.

Essa descoberta tem consequências de longo alcance para toda a indústria de inteligência artificial, pois mostra que a chave para criar máquinas verdadeiramente inteligentes pode não residir apenas no aumento da potência computacional, mas também na compreensão e reprodução de processos cognitivos complexos inerentes ao pensamento humano. Em última análise, esta pesquisa enfatiza a importância de uma abordagem interdisciplinar para o desenvolvimento de IA, combinando conhecimento da ciência da computação, psicologia e filosofia.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…