WIRED mostrou como o ChatGPT distorce as recomendações da redação sobre os melhores notebooks, TVs e fones de ouvido
A WIRED testou se o ChatGPT consegue reproduzir com precisão as recomendações de suas análises editoriais e encontrou uma sequência de erros apresentados com…
Processado por IA de Wired; editado por Hamidun News
Um jornalista da WIRED testou a precisão do ChatGPT ao reproduzir as recomendações técnicas da redação e descobriu que o bot comete erros regularmente. Mesmo quando o modelo fornece um link para o guia correto, pode substituir a escolha real dos editores pela sua própria versão.
O Que a WIRED Testou
O novo foco da OpenAI em um cenário de compras por IA foi o motivador. A empresa promete que o ChatGPT ajudará os usuários a escolher produtos mais rapidamente e os livrará de comparações infinitas de abas e listas de "melhores de". A WIRED decidiu testar não a qualidade abstrata dos conselhos, mas um caso mais específico e mensurável: o bot consegue resgatar com precisão quais dispositivos a redação realmente testou e recomenda agora. Para tal teste, esse é um alvo conveniente porque a publicação tem guias regularmente atualizados, construídos sobre análises reais e horas de testes práticos.
As perguntas eram diretas: quais televisores, fones de ouvido sem fio e notebooks a WIRED considera os melhores no momento. A condição-chave era esta: a resposta deveria refletir a escolha dos críticos da WIRED, não análogos gerais de mercado nem modelos "de classe similar". Em outras palavras, esperava-se do ChatGPT não inventar um resumo conveniente de memória, mas recontar com cuidado material já publicado. Nesse nível básico, o modelo começou a falhar, embora visualmente suas respostas parecessem convincentes e acompanhadas por links corretos.
Onde as Respostas Falharam
A falha mais reveladora ocorreu na categoria de televisores. O ChatGPT abriu o guia WIRED correto, mas nomeou o LG QNED Evo Mini-LED como melhor opção para a maioria das pessoas — um modelo que não estava na lista editorial. A escolha real da WIRED era o TCL QM6K.
O erro parecia particularmente desagradável porque um leitor poderia facilmente não notar a substituição: o link vai para onde deveria, fotos de produtos estão próximas, o tom da resposta é confiante, e parece apenas um breve resumo do artigo. Mas na verdade o bot já tinha misturado sua própria interpretação sobre o trabalho editorial.
Uma história similar se repetiu em outras categorias. Na seleção de fones, o ChatGPT listou AirPods Max 2 como recomendação da WIRED para usuários do ecossistema Apple, embora no momento do teste a redação ainda não os tivesse revisado e não os tivesse adicionado ao guia. Com notebooks, o bot insistentemente nomeou o MacBook Air M4 do ano passado como melhor escolha, embora o top atual no guia já fosse o MacBook Air M5 de 2026.
Quando o jornalista apontou as discrepâncias, o próprio modelo admitiu que havia substituído recomendações precisas por opções mais gerais e às vezes desatualizadas.
- Televisores: o bot substituiu a escolha principal da WIRED por um modelo não presente no guia.
- Fones: atribuiu à redação o conselho de comprar um dispositivo que ainda não tinha passado pelos testes.
- Notebooks: apresentou o MacBook Air M4 desatualizado em vez do atual MacBook Air M5.
- Em todos os casos: o link correto conviveu com um resumo incorreto.
"Peguei a escolha real da WIRED e a substituí por uma opção similar mais geral", admitiu o
ChatGPT após a observação.
Por Que Isso Importa
O problema aqui não é apenas o erro factual em si. Quando alguém vem com o pedido "o que a WIRED recomenda", quer não uma resposta média do modelo, mas o resultado de um processo editorial específico: testes, comparações, atualizações e a escolha final do autor. Quando o ChatGPT substitui um produto por outro, o usuário pode interpretar isso como posição da publicação e gastar dinheiro confiando em uma autoridade que não existe realmente nessa recomendação específica. Para mídia, já é uma questão não de conveniência de interface, mas de precisão de atribuição e confiança na marca.
Há também um lado comercial. A WIRED escreve explicitamente que a redação ganha com links de afiliados, e esse dinheiro ajuda a financiar análises e testes extensos de tecnologia. Nas respostas do ChatGPT construídas sobre materiais da publicação, não há tais links, embora o próprio modelo dependa do trabalho dos editores e simultaneamente reduza a motivação para visitar o site.
A situação parece particularmente irônica diante do acordo entre Condé Nast e OpenAI, que deveria ajudar a exibir links para materiais da editora dentro do chatbot. Formalmente o link existe, mas há pouco benefício prático se uma conclusão incorreta está ao lado.
O Que Isso Significa
A história da WIRED mostra que até um cenário de compras por IA atualizado ainda tem dificuldade com a tarefa de recontar com precisão recomendações de outras pessoas. Se você precisa da conclusão de uma redação, laboratório ou equipe de testes específica, ainda é melhor ir à fonte original. Para OpenAI e outros jogadores, esse é um sinal: em cenários de comércio, o que importa não é apenas a entrega conveniente, mas a exatidão literal aos dados.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.
O essencial da IA — uma vez por semana
Sete histórias que realmente importaram, escolhidas a dedo. Sem ruído nem releases.
Pronto! Verifique seu e-mail para a confirmação.