Wired→ original

WIRED mostrou como o ChatGPT distorce as recomendações da redação sobre os melhores notebooks, TVs e fones de ouvido

A WIRED testou se o ChatGPT consegue reproduzir com precisão as recomendações de suas análises editoriais e encontrou uma sequência de erros apresentados com…

Processado por IA de Wired; editado por Hamidun News
WIRED mostrou como o ChatGPT distorce as recomendações da redação sobre os melhores notebooks, TVs e fones de ouvido
Fonte: Wired. Colagem: Hamidun News.
◐ Ouvir artigo

Um jornalista da WIRED testou a precisão do ChatGPT ao reproduzir as recomendações técnicas da redação e descobriu que o bot comete erros regularmente. Mesmo quando o modelo fornece um link para o guia correto, pode substituir a escolha real dos editores pela sua própria versão.

O Que a WIRED Testou

O novo foco da OpenAI em um cenário de compras por IA foi o motivador. A empresa promete que o ChatGPT ajudará os usuários a escolher produtos mais rapidamente e os livrará de comparações infinitas de abas e listas de "melhores de". A WIRED decidiu testar não a qualidade abstrata dos conselhos, mas um caso mais específico e mensurável: o bot consegue resgatar com precisão quais dispositivos a redação realmente testou e recomenda agora. Para tal teste, esse é um alvo conveniente porque a publicação tem guias regularmente atualizados, construídos sobre análises reais e horas de testes práticos.

As perguntas eram diretas: quais televisores, fones de ouvido sem fio e notebooks a WIRED considera os melhores no momento. A condição-chave era esta: a resposta deveria refletir a escolha dos críticos da WIRED, não análogos gerais de mercado nem modelos "de classe similar". Em outras palavras, esperava-se do ChatGPT não inventar um resumo conveniente de memória, mas recontar com cuidado material já publicado. Nesse nível básico, o modelo começou a falhar, embora visualmente suas respostas parecessem convincentes e acompanhadas por links corretos.

Onde as Respostas Falharam

A falha mais reveladora ocorreu na categoria de televisores. O ChatGPT abriu o guia WIRED correto, mas nomeou o LG QNED Evo Mini-LED como melhor opção para a maioria das pessoas — um modelo que não estava na lista editorial. A escolha real da WIRED era o TCL QM6K.

O erro parecia particularmente desagradável porque um leitor poderia facilmente não notar a substituição: o link vai para onde deveria, fotos de produtos estão próximas, o tom da resposta é confiante, e parece apenas um breve resumo do artigo. Mas na verdade o bot já tinha misturado sua própria interpretação sobre o trabalho editorial.

Uma história similar se repetiu em outras categorias. Na seleção de fones, o ChatGPT listou AirPods Max 2 como recomendação da WIRED para usuários do ecossistema Apple, embora no momento do teste a redação ainda não os tivesse revisado e não os tivesse adicionado ao guia. Com notebooks, o bot insistentemente nomeou o MacBook Air M4 do ano passado como melhor escolha, embora o top atual no guia já fosse o MacBook Air M5 de 2026.

Quando o jornalista apontou as discrepâncias, o próprio modelo admitiu que havia substituído recomendações precisas por opções mais gerais e às vezes desatualizadas.

  • Televisores: o bot substituiu a escolha principal da WIRED por um modelo não presente no guia.
  • Fones: atribuiu à redação o conselho de comprar um dispositivo que ainda não tinha passado pelos testes.
  • Notebooks: apresentou o MacBook Air M4 desatualizado em vez do atual MacBook Air M5.
  • Em todos os casos: o link correto conviveu com um resumo incorreto.
"Peguei a escolha real da WIRED e a substituí por uma opção similar mais geral", admitiu o

ChatGPT após a observação.

Por Que Isso Importa

O problema aqui não é apenas o erro factual em si. Quando alguém vem com o pedido "o que a WIRED recomenda", quer não uma resposta média do modelo, mas o resultado de um processo editorial específico: testes, comparações, atualizações e a escolha final do autor. Quando o ChatGPT substitui um produto por outro, o usuário pode interpretar isso como posição da publicação e gastar dinheiro confiando em uma autoridade que não existe realmente nessa recomendação específica. Para mídia, já é uma questão não de conveniência de interface, mas de precisão de atribuição e confiança na marca.

Há também um lado comercial. A WIRED escreve explicitamente que a redação ganha com links de afiliados, e esse dinheiro ajuda a financiar análises e testes extensos de tecnologia. Nas respostas do ChatGPT construídas sobre materiais da publicação, não há tais links, embora o próprio modelo dependa do trabalho dos editores e simultaneamente reduza a motivação para visitar o site.

A situação parece particularmente irônica diante do acordo entre Condé Nast e OpenAI, que deveria ajudar a exibir links para materiais da editora dentro do chatbot. Formalmente o link existe, mas há pouco benefício prático se uma conclusão incorreta está ao lado.

O Que Isso Significa

A história da WIRED mostra que até um cenário de compras por IA atualizado ainda tem dificuldade com a tarefa de recontar com precisão recomendações de outras pessoas. Se você precisa da conclusão de uma redação, laboratório ou equipe de testes específica, ainda é melhor ir à fonte original. Para OpenAI e outros jogadores, esse é um sinal: em cenários de comércio, o que importa não é apenas a entrega conveniente, mas a exatidão literal aos dados.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…