Alucinações por GOST: por que ChatGPT não pode ser confiado na construção
Imagine construir uma casa baseado em conselhos da pessoa mais erudita do mundo, que, porém, sofre de amnésia leve e é propensa a fantasias. Esta é…
Processado por IA de Habr AI; editado por Hamidun News
Imagine construir uma casa baseado em conselhos da pessoa mais erudita do mundo, que, porém, sofre de amnésia leve e é propensa a fantasias. Esta é exatamente a situação em que Alexei Krivonosov, proprietário de uma empresa de construção, se viu quando decidiu delegar o trabalho rotineiro ao ChatGPT. No início, tudo correu perfeitamente. A rede neural entusiasticamente escrevia scripts para o canal do YouTube da empresa, compilava planos de conteúdo e polia relatórios técnicos. Esta é uma armadilha clássica: quando a IA se destaca em tarefas criativas, cria a ilusão de que é igualmente boa em ciências exatas. Mas o diabo, como sempre, estava escondido nas normas e regulamentações de construção.
O problema surgiu quando o ChatGPT foi confiado à documentação regulatória — SNiPs e GOSTs. Para quem não está familiarizado com construção: não são apenas livros chatos, mas regulamentações rigorosas onde cada número é pago pela segurança de alguém. A rede neural começou a se comportar como um estudante negligente durante um exame: quando não sabia a resposta exata, a inventava. E o fazia com tanta confiança que o engano não foi imediatamente percebido. O algoritmo gerou pontos regulatórios inexistentes e produziu números que nunca existiram em documentos oficiais. Em uma indústria onde um erro no cálculo de carga de viga pode levar à catástrofe, tal "criatividade" é inadmissível.
Por que isso acontece? ChatGPT é um modelo de linguagem treinado para prever a próxima palavra, não para verificar fatos em um banco de dados. Opera em probabilidades, não em verdade. Quando você pede para encontrar um ponto específico em um GOST, ele não "vai à biblioteca", mas constrói uma resposta que soa o mais plausível possível. Esta é a traição das alucinações: parecem verdade. Para marketing, não é crítico, mas para engenharia, é uma sentença. Alexei compreendeu que usar um LLM "puro" em trabalho profissional é como jogar roleta russa com um revólver carregado.
Em vez de se desiludir com a tecnologia, a equipe de Alexei seguiu o caminho de criar uma ferramenta especializada. Durante seis meses, desenvolveram "Digital Standard". A diferença fundamental entre esta solução e um chatbot comum é o uso da tecnologia RAG (Retrieval-Augmented Generation). O conceito é simples: redes neurais não têm permissão para "recuperar" informações de sua memória. Em vez disso, o sistema é forçado a buscar respostas em um banco de dados vetorizado estritamente limitado de padrões de construção reais. Se a informação não está no banco de dados, o sistema o diz em vez de se indulgir em fantasia. Isso transforma a IA de um contador de histórias em um bibliotecário de alta velocidade.
O caso de Krivonosov destaca uma mudança tectônica importante na indústria. A era do fascínio por modelos universais está passando. Os negócios estão começando a entender que tarefas reais exigem soluções verticais. Simplesmente "conectar uma API do OpenAI" não é suficiente. Você precisa processar dados manualmente, limpá-los de lixo e configurar filtros de saída rigorosos. Somente assim uma rede neural se transforma de um brinquedo em uma ferramenta de trabalho. Hoje vemos tais sistemas aparecendo em direito, medicina e agora em construção. Este é um estágio natural na maturação da tecnologia.
O que isso significa para o mercado? Primeiro, a demanda por "engenheiros de prompt" está caindo, cedendo lugar à demanda por arquitetos de dados capazes de conectar LLMs com conhecimento corporativo. Segundo, a confiança em modelos abertos em indústrias críticas apenas diminuirá. Estamos entrando em uma era de "IA confiável", onde a precisão é mais valorizada do que a eloquência. A experiência de Alexei mostra: para que a IA seja útil, deve primeiro ser privada do direito à criatividade onde reinam números e leis.
Ponto-chave: Redes neurais gerais como ChatGPT atingiram um teto em tarefas profissionais. O futuro pertence aos sistemas RAG e bases de conhecimento altamente especializadas. Você está pronto para confiar o cálculo da fundação de sua casa a um algoritmo que não consegue distinguir verdade de probabilidade?
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.