CollectivIQ quer tornar a AI mais confiável consultando 14 modelos de uma vez
A startup CollectivIQ propõe uma nova abordagem para a confiabilidade das respostas geradas por AI: em vez de um único chatbot, o sistema consulta…
Processado por IA de TechCrunch; editado por Hamidun News
O problema das alucinações em modelos de linguagem continua sendo uma das principais barreiras para a confiança em massa na inteligência artificial. Qualquer pessoa que já recebeu do ChatGPT informações apresentadas com confiança, mas completamente fabricadas, sabe esse sentimento: a tecnologia impressiona, mas confiar nela cegamente é perigoso. A startup CollectivIQ decidiu atacar esse problema por um ângulo inesperado — não melhorando um único modelo, mas consultando catorze simultaneamente.
A ideia, que a TechCrunch reportou, é elegante em sua simplicidade. CollectivIQ agrega respostas do ChatGPT, Gemini, Claude, Grok e até dez outros modelos de linguagem ao mesmo tempo. Um usuário insere uma consulta uma vez e recebe um panorama de respostas, onde pode comparar formulações, identificar pontos de concordância e, mais importante, notar discordâncias. Se treze de catorze modelos dizem uma coisa e um diz outra, esse é um sinal poderoso. Se os modelos discordam igualmente, essa também é informação valiosa: significa que a pergunta é mais complexa do que parece, e confiar cegamente em qualquer resposta única não vale a pena.
Para entender por que essa abordagem pode funcionar, vale lembrar um fenômeno que a teoria de decisão chama de "sabedoria da multidão". Francis Galton descobriu em 1906 que a avaliação média de um grande grupo de pessoas é mais precisa do que a opinião de qualquer especialista individual. CollectivIQ essencialmente transfere esse princípio para o mundo dos grandes modelos de linguagem.
Cada um deles é treinado em dados diferentes, com ênfases e limitações diferentes. GPT-4o é forte em raciocínio, Claude — em precisão e seguimento de instruções, Gemini — em multimodalidade e trabalho com informações atuais, Grok — em tom informal e acesso a dados de redes sociais. Quando suas respostas são combinadas, as fraquezas de um modelo são compensadas pelos pontos fortes de outro.
Tecnicamente, implementar esse serviço levanta várias questões sérias. Em primeiro lugar — custo. Cada solicitação para uma API comercial custa tokens, e multiplicando por catorze, transforma centavos em quantias notáveis.
Para um usuário comum que pergunta uma receita de borscht, isso é excessivo. Mas para profissionais — advogados, médicos, analistas, jornalistas — para quem a precisão é criticamente importante, a economia pode funcionar. A segunda questão é velocidade.
Solicitações paralelas para APIs diferentes têm tempos de resposta diferentes, e o usuário terá que esperar pelo modelo mais lento ou receber respostas de forma assíncrona, conforme chegarem. A terceira é o design da interface. Apresentar catorze respostas de forma que uma pessoa não se perca em informações, mas extraia rapidamente a essência — essa é uma tarefa séria de design.
CollectivIQ não aparece no vácuo. O mercado já tem mecanismos de meta-busca de modelos de IA: Poe do Quora fornece acesso a vários modelos em uma única interface, e serviços como TypingMind e OpenRouter permitem alternar entre provedores. Mas nenhum deles está apostando em comparação simultânea como ferramenta de verificação. CollectivIQ posiciona a multimodalidade não como conveniência, mas como um método de aumentar a confiabilidade — e esse é um narrativa fundamentalmente diferente. Em vez de "escolha o melhor modelo" — "não confie em nenhum único, compare todos".
Há também um contexto mais profundo. A indústria de inteligência artificial está vivenciando uma crise de confiança. Pesquisas mostram que os usuários estão cada vez mais céticos em relação às respostas dos chatbots, mas continuam usando-os — simplesmente porque não há alternativas. CollectivIQ oferece uma solução intermediária: não força confiança cega e não exige abandonar a IA, mas oferece uma ferramenta para análise crítica. De certa forma, esse é um retorno ao princípio jornalístico de verificação cruzada de fontes, exceto que as fontes são redes neurais.
A principal questão é se esse modelo escala. Se os grandes provedores começarem a restringir o acesso à API para agregadores ou aumentarem os preços, os negócios do CollectivIQ estarão ameaçados. Além disso, conforme os modelos se tornam cada vez mais semelhantes um ao outro, aprendendo com conjuntos de dados sobrepostos, o valor da comparação multimodelo pode diminuir. Mas enquanto a diversidade de abordagens se mantiver, a ideia de crowdsourcing entre IAs parece simultaneamente inteligente e prática. Talvez o futuro da inteligência artificial confiável não seja um modelo perfeito, mas um coro de modelos imperfeitos, onde uma nota falsa é imediatamente ouvida.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.