ArXiv vai banir autores por um ano por artigos com 'AI slop' e referências inventadas
O ArXiv está impondo sanções duras a pesquisadores que enviam artigos com sinais claros de conteúdo gerado por LLM sem revisão. Se a plataforma identificar refe
Processado por IA de The Verge; editado por Hamidun News
ArXiv está endurecendo as regras contra o chamado AI slop — manuscritos científicos nos quais os autores inserem texto gerado por modelo sem verificação. Se a plataforma detectar sinais claros dessa publicação, a punição será significativa: desde um banimento de um ano até restrições adicionais em futuras submissões.
Nova Barreira para Preprints
Para ArXiv, esta não é uma atualização cosmética das regras, mas uma tentativa de proteger a reputação de um dos principais arquivos de preprints. A plataforma há muito se tornou um lugar onde pesquisadores publicam rapidamente resultados frescos antes de publicação formal em revista ou conferência. Mas com o crescimento da acessibilidade dos LLM, o fluxo de manuscritos começou a incluir textos montados com quase nenhuma edição: confiantes em tom, mas com fatos errados, formulações absurdas e referências a trabalhos inexistentes. Para uma plataforma científica, esta não é mais uma questão de estilo, mas uma questão de confiança.
Thomas Dittrich, presidente da seção de ciência da computação da ArXiv, falou sobre a nova abordagem. Segundo ele, as sanções serão aplicadas não pelo simples fato de usar um modelo, mas pela ausência de verificação humana dos resultados. Em outras palavras, o problema não é que os autores usam LLM como ferramenta, mas que alguns carregam a saída quase bruta do modelo com sua própria assinatura. Para ArXiv, isso viola um princípio básico: se você coloca seu nome em um trabalho, você é responsável por cada referência, fórmula e conclusão.
Pelo Que Serão Banidos
A formulação chave — "prova irrefutável de que os autores não verificaram os resultados da geração de LLM." Isso se refere a marcadores que são difíceis de explicar por descuido ordinário. Não é uma disputa sobre qualidade de escrita e não é crítica sobre estilo. Se um manuscrito contém traços de conteúdo gerado por máquina, mostrando que o texto nem foi lido antes da submissão, ArXiv considerará isso motivo suficiente para sanções. ArXiv considera exatamente esses traços como o sinal mais óbvio de submissão desonesta.
- referências bibliográficas inventadas ou inexistentes
- comentários meta de serviço do modelo acidentalmente deixados no texto
- afirmações que contradizem fontes e não foram verificadas pelo autor
- traços de inserção automática mostrando ausência de revisão final
"Se houver prova irrefutável de que os autores não verificaram os
resultados da geração de LLM, um banimento de um ano se seguirá."
Este é um nuance importante para a comunidade acadêmica. ArXiv não está declarando guerra a ferramentas generativas como tais: um pesquisador pode usar LLM para rascunho, tradução ou edição. A linha vermelha é traçada onde o autor deixa de ser um autor e se torna um operador de copiar-colar. O arquivo científico está tentando estabelecer uma regra simples: a automação é permitida, mas a responsabilidade pelo conteúdo não pode ser delegada a um modelo, especialmente quando se trata de citações e fatos verificáveis.
O Que Aguarda os Autores
A punição para tais publicações será severa: um banimento de um ano no carregamento de novos trabalhos na ArXiv. Além disso, conforme segue da declaração de Dittrich, futuras submissões após tal violação podem exigir confirmação adicional de qualidade — por exemplo, aceitação do artigo em uma conferência revisada por pares respeitável ou em revista. Para um pesquisador, isso é doloroso. ArXiv é frequentemente usado para mostrar rapidamente resultados a colegas, estabelecer prioridade de uma ideia e obter feedback inicial. A perda deste canal por um ano já é um golpe sério na visibilidade do trabalho.
O sinal é direcionado não apenas aos autores infratores, mas a todo o mercado de redação acadêmica. Ao longo do ano passado, uma camada de serviços cresceu em torno da pesquisa que promete "acelerar a publicação" usando geração de texto, anotações e revisão de literatura. A nova medida mostra que as plataformas científicas estão começando a separar o uso produtivo de IA da fabricação imprudente de manuscritos. Quanto mais populares os LLMs se tornam, maior é a chance de que filtros semelhantes apareçam em revistas, conferências e repositórios de dados.
O Que Isto Significa
Para pesquisadores, este é um lembrete de disciplina básica: um modelo pode ajudar a montar um rascunho, mas não pode assinar um artigo em nome de um humano. Para a indústria de IA, este é outro sinal de que o mercado está se afastando do entusiasmo sobre "geração rápida" em direção a demandas de verificação, responsabilidade editorial e qualidade verificável.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.