Habr AI→ original

Autor no Habr testou se o ChatGPT consegue reconstruir artigos a partir de prompts curtos

Um autor no Habr pegou dois artigos populares e tentou reconstruí-los com o ChatGPT usando prompts condensados. No primeiro caso, 67 palavras bastaram para…

Processado por IA de Habr AI; editado por Hamidun News
Autor no Habr testou se o ChatGPT consegue reconstruir artigos a partir de prompts curtos
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

Um autor no Habr verificou se o ChatGPT consegue restaurar artigos a partir de prompts curtos

O autor no Habr decidiu testar uma afirmação ousada de que qualquer texto pode ser comprimido em um prompt curto e depois restaurado quase sem perda através do ChatGPT. Em vez de confiar em referências a "pesquisadores de Cambridge", ele pegou artigos reais da plataforma e realizou seu próprio teste.

Como o teste foi configurado

O gatilho foi uma reação a uma tradução anterior do artigo The Prompt, que afirmava que alguns pesquisadores de Cambridge conseguem reduzir qualquer texto a um prompt mínimo com precisão de recuperação de 98%. Os leitores rapidamente notaram que a história parecia uma estilização de "cientistas britânicos", o que levou o autor a testar não a lenda, mas o princípio em si. Para o experimento, ele escolheu Habr como uma plataforma com público técnico rigoroso onde argumentos fracos e exageros geralmente não duram muito.

O esquema era simples: pegar dois artigos recentes com alta classificação, compactá-los em um prompt e pedir ao ChatGPT para escrever um novo texto em um gênero semelhante sem pesquisa na internet. O autor olhou não apenas para o tom geral, mas também para coisas mais concretas: se a estrutura, números-chave, episódios importantes e ordem dos argumentos foram preservados. Ele rastreou separadamente onde o modelo começaria a preencher a história por conta própria, porque essas inserções são facilmente confundidas com detalhes reais.

Onde funcionou

O primeiro teste se mostrou quase uma demonstração do poder da recuperação baseada em modelos. Era sobre um artigo com a tese de que funcionários indispensáveis não são um defeito da arquitetura da equipe, mas um recurso valioso. Para tal publicação, um prompt de apenas 67 palavras era suficiente, após o qual o ChatGPT gerou texto de 651 palavras. De acordo com a avaliação do autor, a correspondência foi tão alta que ao lado do original, a reconstrução parecia assustadoramente convincente.

  • A tese principal sobre o valor de funcionários "indispensáveis" foi preservada
  • A crítica aos modos padrão de reduzir o fator de barramento retornou
  • O modelo reproduziu recomendações: pagar 1,5–2 vezes mais, documentar através do processo, contratar pessoas independentes
  • Dois cenários práticos e a cifra exata de um aumento de 40% permaneceram no lugar
  • O ChatGPT até adicionou um detalhe plausível — uma linha do tempo de nove meses de falha que não estava no original

A taxa de compressão neste caso foi aproximadamente 10:1. Mas junto com o resultado impressionante veio um problema: o modelo não apenas recupera lógica familiar, mas preenche com confiança lacunas com o que "soa como verdade". Para um leitor que não tem o original por perto, a diferença entre o artigo restaurado e o real pode ser quase imperceptível, especialmente se o texto é construído em padrões de gerenciamento comuns que o modelo há muito conhece.

Onde o método tem limites

O segundo artigo deu um resultado completamente diferente. O material foi dedicado não a conclusões abstratas, mas a uma análise de bloqueios do Telegram, DPI e como a comunidade de desenvolvedores corrigiu manualmente erros específicos na implementação do FakeTLS. Para se aproximar da lógica original, o autor teve que escrever 357 palavras de prompts — quase cinco vezes mais.

O ChatGPT gerou 914 palavras, mas a parte importante do texto ainda se dissolveu. O que faltava era exatamente o que distingue uma narrativa do trabalho de engenharia real: valores específicos de extensão TLS, discrepâncias entre tamanho de chave declarado e real, números de pull request, hashes de commit, nome da comunidade que trouxe a correção e outros artefatos extraídos de tráfego e código. Em outras palavras, o modelo recuperou o argumento geral, mas não conseguiu retornar o que foi encontrado manualmente em um sistema ativo, não o que estava nos dados de treinamento.

"O ChatGPT recuperou o argumento. Não recuperou o trabalho."

É aqui que o autor traça a linha entre imitação conveniente e conhecimento real. Se o valor de um texto repousa em estrutura, teses familiares e conclusões típicas, ele compacta bem e descompacta razoavelmente bem. Mas se um artigo consiste em engenharia reversa manual, medições, interceptação de pacotes e novas observações, essas mesmas "perdas de 2%" se transformam em quase tudo pelo qual o material foi lido em primeiro lugar.

O que isso significa

O experimento no Habr não prova que os LLMs já são capazes de substituir completamente os autores, mas mostra com bastante precisão onde está o limite prático. Colunas, textos explicativos e ensaios de gerenciamento com padrões comuns os modelos remontam muito mais facilmente do que materiais com fatos únicos e suas próprias medições. Para editores e leitores, um teste simples se segue: o que importa não é apenas o quanto um artigo soa convincentemente, mas se há algo nele que o autor realmente encontrou, verificou e provou. Esta parte do conteúdo atualmente resiste à compressão em um prompt e reassembly da pior maneira.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…