The Verge→ original

ArXiv vai banir autores por um ano por artigos com 'AI slop' e referências inventadas

O ArXiv está impondo sanções duras a pesquisadores que enviam artigos com sinais claros de conteúdo gerado por LLM sem revisão. Se a plataforma identificar refe

Processado por IA de The Verge; editado por Hamidun News
ArXiv vai banir autores por um ano por artigos com 'AI slop' e referências inventadas
Fonte: The Verge. Colagem: Hamidun News.
◐ Ouvir artigo

ArXiv está endurecendo as regras contra o chamado AI slop — manuscritos científicos nos quais os autores inserem texto gerado por modelo sem verificação. Se a plataforma detectar sinais claros dessa publicação, a punição será significativa: desde um banimento de um ano até restrições adicionais em futuras submissões.

Nova Barreira para Preprints

Para ArXiv, esta não é uma atualização cosmética das regras, mas uma tentativa de proteger a reputação de um dos principais arquivos de preprints. A plataforma há muito se tornou um lugar onde pesquisadores publicam rapidamente resultados frescos antes de publicação formal em revista ou conferência. Mas com o crescimento da acessibilidade dos LLM, o fluxo de manuscritos começou a incluir textos montados com quase nenhuma edição: confiantes em tom, mas com fatos errados, formulações absurdas e referências a trabalhos inexistentes. Para uma plataforma científica, esta não é mais uma questão de estilo, mas uma questão de confiança.

Thomas Dittrich, presidente da seção de ciência da computação da ArXiv, falou sobre a nova abordagem. Segundo ele, as sanções serão aplicadas não pelo simples fato de usar um modelo, mas pela ausência de verificação humana dos resultados. Em outras palavras, o problema não é que os autores usam LLM como ferramenta, mas que alguns carregam a saída quase bruta do modelo com sua própria assinatura. Para ArXiv, isso viola um princípio básico: se você coloca seu nome em um trabalho, você é responsável por cada referência, fórmula e conclusão.

Pelo Que Serão Banidos

A formulação chave — "prova irrefutável de que os autores não verificaram os resultados da geração de LLM." Isso se refere a marcadores que são difíceis de explicar por descuido ordinário. Não é uma disputa sobre qualidade de escrita e não é crítica sobre estilo. Se um manuscrito contém traços de conteúdo gerado por máquina, mostrando que o texto nem foi lido antes da submissão, ArXiv considerará isso motivo suficiente para sanções. ArXiv considera exatamente esses traços como o sinal mais óbvio de submissão desonesta.

  • referências bibliográficas inventadas ou inexistentes
  • comentários meta de serviço do modelo acidentalmente deixados no texto
  • afirmações que contradizem fontes e não foram verificadas pelo autor
  • traços de inserção automática mostrando ausência de revisão final
"Se houver prova irrefutável de que os autores não verificaram os

resultados da geração de LLM, um banimento de um ano se seguirá."

Este é um nuance importante para a comunidade acadêmica. ArXiv não está declarando guerra a ferramentas generativas como tais: um pesquisador pode usar LLM para rascunho, tradução ou edição. A linha vermelha é traçada onde o autor deixa de ser um autor e se torna um operador de copiar-colar. O arquivo científico está tentando estabelecer uma regra simples: a automação é permitida, mas a responsabilidade pelo conteúdo não pode ser delegada a um modelo, especialmente quando se trata de citações e fatos verificáveis.

O Que Aguarda os Autores

A punição para tais publicações será severa: um banimento de um ano no carregamento de novos trabalhos na ArXiv. Além disso, conforme segue da declaração de Dittrich, futuras submissões após tal violação podem exigir confirmação adicional de qualidade — por exemplo, aceitação do artigo em uma conferência revisada por pares respeitável ou em revista. Para um pesquisador, isso é doloroso. ArXiv é frequentemente usado para mostrar rapidamente resultados a colegas, estabelecer prioridade de uma ideia e obter feedback inicial. A perda deste canal por um ano já é um golpe sério na visibilidade do trabalho.

O sinal é direcionado não apenas aos autores infratores, mas a todo o mercado de redação acadêmica. Ao longo do ano passado, uma camada de serviços cresceu em torno da pesquisa que promete "acelerar a publicação" usando geração de texto, anotações e revisão de literatura. A nova medida mostra que as plataformas científicas estão começando a separar o uso produtivo de IA da fabricação imprudente de manuscritos. Quanto mais populares os LLMs se tornam, maior é a chance de que filtros semelhantes apareçam em revistas, conferências e repositórios de dados.

O Que Isto Significa

Para pesquisadores, este é um lembrete de disciplina básica: um modelo pode ajudar a montar um rascunho, mas não pode assinar um artigo em nome de um humano. Para a indústria de IA, este é outro sinal de que o mercado está se afastando do entusiasmo sobre "geração rápida" em direção a demandas de verificação, responsabilidade editorial e qualidade verificável.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…