The Verge→ original

ArXiv bannira pendant un an les auteurs d’articles contenant 'AI slop' et des références inventées

ArXiv introduit des sanctions strictes contre les chercheurs qui soumettent des articles présentant des signes évidents de contenu généré par LLM non vérifié. S

Traité par IA depuis The Verge ; édité par Hamidun News
ArXiv bannira pendant un an les auteurs d’articles contenant 'AI slop' et des références inventées
Source : The Verge. Collage: Hamidun News.
◐ Écouter l'article

ArXiv durcit les règles contre le soi-disant AI slop — des manuscrits scientifiques dans lesquels les auteurs insèrent du texte généré par le modèle sans vérification. Si la plateforme détecte des signes clairs de telle publication, la punition sera importante : d'une interdiction d'un an à des restrictions supplémentaires sur les futurs téléchargements.

Nouvelle Barrière pour les Prépublications

Pour ArXiv, ce n'est pas une mise à jour cosmétique des règles, mais une tentative de protéger la réputation de l'une des principales archives de prépublications. La plateforme est devenue depuis longtemps un lieu où les chercheurs publient rapidement des résultats frais avant la publication formelle dans une revue ou une conférence. Mais avec la croissance de l'accessibilité des LLM, le flux de manuscrits a commencé à inclure des textes assemblés avec presque aucune édition : confiants en ton, mais avec des faits erronés, des formulations absurdes et des références à des travaux inexistants. Pour une plateforme scientifique, ce n'est plus une question de style, mais une question de confiance.

Thomas Dittrich, président de la section d'informatique d'ArXiv, a parlé de la nouvelle approche. Selon lui, les sanctions seront appliquées non pas pour le simple fait d'utiliser un modèle, mais pour l'absence de vérification humaine des résultats. En d'autres termes, le problème n'est pas que les auteurs utilisent LLM comme outil, mais que certains téléchargent une sortie de modèle presque brute sous leur propre signature. Pour ArXiv, cela viole un principe fondamental : si vous mettez votre nom sur un travail, vous êtes responsable de chaque référence, formule et conclusion.

Pour Quoi Seront-Ils Bannis

La formulation clé — « preuve irréfutable que les auteurs n'ont pas vérifié les résultats de la génération de LLM. » Cela fait référence à des marqueurs qui sont difficiles à expliquer par une simple négligence. Ce n'est pas une dispute sur la qualité de l'écriture et ce n'est pas une critique du style. Si un manuscrit contient des traces de contenu généré par machine, montrant que le texte n'a même pas été lu avant la soumission, ArXiv considérera cela comme motif suffisant pour des sanctions. ArXiv considère exactement ces traces comme le signal le plus évident d'une présentation malhonnête.

  • références bibliographiques inventées ou inexistantes
  • commentaires méta de service du modèle accidentellement laissés dans le texte
  • affirmations contredisant les sources et non vérifiées par l'auteur
  • traces d'insertion automatique montrant l'absence de relecture finale
« S'il y a une preuve irréfutable que les auteurs n'ont pas vérifié

les résultats de la génération de LLM, une interdiction d'un an s'ensuivra. »

C'est une nuance importante pour la communauté académique. ArXiv ne declare pas la guerre aux outils génératifs en tant que tels : un chercheur peut utiliser LLM pour brouillon, traduction ou édition. La ligne rouge est tracée là où l'auteur cesse d'être un auteur et devient un opérateur copier-coller. L'archive scientifique essaie d'établir une règle simple : l'automatisation est permise, mais la responsabilité du contenu ne peut pas être déléguée à un modèle, surtout quand il s'agit de citations et de faits vérifiables.

Ce Qui Attend les Auteurs

La punition pour de telles publications sera sévère : une interdiction d'un an de télécharger de nouveaux travaux sur ArXiv. De plus, comme il ressort de la déclaration de Dittrich, les soumissions ultérieures après une telle violation peuvent nécessiter une confirmation supplémentaire de qualité — par exemple, l'acceptation de l'article à une conférence révisée par des pairs réputée ou dans une revue. Pour un chercheur, c'est douloureux. ArXiv est souvent utilisé pour montrer rapidement des résultats à des collègues, établir la priorité d'une idée et obtenir des commentaires précoces. La perte de ce canal pendant un an est déjà un coup sérieux à la visibilité du travail.

Le signal est adressé non seulement aux auteurs contrevenants, mais à tout le marché de la rédaction académique. Au cours de l'année écoulée, une couche de services a grandi autour de la recherche qui promet « d'accélérer la publication » en utilisant la génération de texte, les annotations et la revue de littérature. La nouvelle mesure montre que les plateformes scientifiques commencent à séparer l'utilisation productive de l'IA de la fabrication imprudente de manuscrits. Plus les LLM deviennent populaires, plus il y a de chances que des filtres similaires apparaissent dans les revues, les conférences et les référentiels de données.

Ce Que Cela Signifie

Pour les chercheurs, c'est un rappel de la discipline fondamentale : un modèle peut aider à assembler un brouillon, mais ne peut pas signer un article à la place d'un humain. Pour l'industrie de l'IA, c'est un autre signe que le marché s'éloigne de l'enthousiasme concernant la « génération rapide » vers les demandes de vérification, de responsabilité éditoriale et de qualité vérifiable.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…