ArXiv suspendra des auteurs pendant un an pour du contenu AI non vérifié dans leurs articles
ArXiv instaure une suspension d'un an pour le contenu AI non vérifié dans les preprints. La nouvelle politique a été annoncée par Thomas Dietterich, responsable

ArXiv, le référentiel ouvert de préimpressions qui a servi de norme pour la diffusion des recherches scientifiques en informatique, mathématiques et physique pendant plus de trois décennies, a annoncé l'introduction d'une politique stricte pour combattre le contenu de l'IA incontrôlé. Les auteurs qui ont soumis des articles présentant des signes clairs de contenu généré par IA incontrôlé recevront une interdiction d'un an. La décision a été soutenue par Thomas Dietterich, président de la section informatique du référentiel.
Une Vague de Déchets de l'IA en Science
Au cours des deux dernières années, la communauté scientifique a fait face à un afflux sans précédent de préimpressions de faible qualité générées par des réseaux de neurones sans aucun examen humain. Plus de 10 000 préimpressions sont téléchargées sur ArXiv quotidiennement — un chiffre qui a augmenté de façon exponentielle depuis l'apparition d'outils d'IA accessibles comme ChatGPT. Les modérateurs du personnel de la plateforme ne peuvent pas suivre tous les cas, et l'archive elle-même risque de devenir une décharge de déchets générés automatiquement.
Le problème est devenu si critique que la dégradation du signal dans l'espace scientifique commence à rendre difficile la recherche de recherches véritablement précieuses et novatrices. Lorsque la base de données est remplie de textes rédigés par des modèles de déchets, les nouveaux travaux sont perdus dans le bruit et ne reçoivent pas l'attention qu'ils méritent.
Comment les
Déchets de l'IA Nuisent à la Communauté Scientifique
Les déchets de l'IA violent plusieurs aspects clés du processus scientifique:
- Encombre la recherche: les chercheurs gaspillent des heures à lire des déchets évidents au lieu de trouver des travaux pertinents
- Brouille l'examen par les pairs: à mesure que le volume augmente, la qualité de l'examen diminue — il n'y a simplement pas assez de relecteurs
- Sape la confiance: lorsqu'il y a beaucoup de déchets dans l'archive, la communauté scientifique commence à avoir moins confiance dans l'autorité de la plateforme
Le problème est particulièrement aigu dans les nouveaux domaines comme les applications LLM, où chaque chercheur expérimente avec GPT et télécharge les résultats dans l'archive.
Comment les Contrevenants Seront Détectés
La nouvelle politique se concentre sur l'identification des « signes évidents » — des artefacts clairs de génération par IA, des erreurs syntaxiques, des motifs étranges et récurrents, des données numériques absurdes dans les tableaux ou l'absence d'expériences réelles. ArXiv n'utilise délibérément pas de détecteurs d'IA automatiques car ils ne sont pas fiables et produisent de nombreux faux positifs. À la place, la plateforme s'appuie sur le jugement humain des modérateurs et de la communauté scientifique. Une interdiction d'un an est une sanction suffisamment grave pour dissuader les auteurs de télécharger des travaux faibles. Les auteurs seront également invités à ajouter une note sur les outils d'IA utilisés dans leur recherche.
Ce Que Cela Signifie
C'est un signal que les grandes plateformes scientifiques commencent à se défendre sérieusement contre les déchets numériques. Pour les chercheurs honnêtes, c'est une bénédiction — les travaux précieux ne seront pas perdus dans le bruit. Pour les auteurs qui espéraient la publication automatique gratuite, la nouvelle réalité est difficile. ArXiv fait un pari historiquement important: l'examen par les pairs et la responsabilité humaine restent la base de la science, malgré la révolution de l'IA.
Хотите не читать про ИИ, а внедрить его?
«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.