The Verge→ оригинал

ArXiv начнёт банить авторов на год за статьи с «AI slop» и выдуманными ссылками

ArXiv вводит жёсткие санкции против исследователей, которые загружают статьи с явными следами непроверенной генерации LLM. Если платформа увидит галлюцинированн

ArXiv начнёт банить авторов на год за статьи с «AI slop» и выдуманными ссылками
Источник: The Verge. Коллаж: Hamidun News.
◐ Слушать статью

ArXiv ужесточает правила против так называемого AI slop — научных рукописей, в которых авторы без проверки вставляют сгенерированный моделью текст. Если площадка увидит явные признаки такой публикации, наказание будет заметным: от годового бана до дополнительных ограничений на будущие загрузки.

Новый барьер для препринтов

Для ArXiv это не косметическое обновление правил, а попытка защитить репутацию одного из главных архивов препринтов. Платформа давно стала местом, где исследователи быстро публикуют свежие результаты до формального журнала или конференции. Но с ростом доступности LLM в поток рукописей начали попадать тексты, собранные почти без редактуры: с уверенным тоном, но с ошибочными фактами, нелепыми формулировками и ссылками на несуществующие работы.

Для научной площадки это уже не вопрос стиля, а вопрос доверия. О новом подходе рассказал Томас Диттерих, председатель компьютерной секции ArXiv. По его словам, санкции будут применяться не за сам факт использования модели, а за отсутствие человеческой проверки результата.

Иными словами, проблема не в том, что авторы пользуются LLM как инструментом, а в том, что некоторые выгружают почти сырой вывод модели под своей подписью. Для ArXiv это нарушение базового принципа: если ты ставишь имя под работой, ты отвечаешь за каждую ссылку, формулу и вывод.

За что будут банить

Ключевая формулировка — «неопровержимые доказательства того, что авторы не проверили результат генерации LLM». Речь идёт о маркерах, которые трудно объяснить обычной невнимательностью. Это не спор о качестве письма и не придирка к стилю.

Если в рукописи остаются следы машинной заготовки, показывающие, что текст даже не прочитали перед отправкой, ArXiv будет считать это достаточным основанием для санкций. Именно такие следы ArXiv считает самым очевидным сигналом недобросовестной подачи. выдуманные или несуществующие библиографические ссылки служебные мета-комментарии модели, случайно оставленные в тексте утверждения, противоречащие источникам и не проверенные автором следы автоматической вставки, показывающие отсутствие финальной вычитки > «Если есть неопровержимые доказательства, что авторы не проверили результат генерации LLM, последует бан на год».

Это важный нюанс для академической среды. ArXiv не объявляет войну генеративным инструментам как таковым: исследователь может использовать LLM для черновика, перевода или редактуры. Красная линия проходит там, где автор перестаёт быть автором и превращается в оператора копипаста.

Научный архив пытается зафиксировать простое правило: автоматизация допустима, но ответственность за содержание нельзя делегировать модели, особенно когда речь идёт о цитатах и проверяемых фактах.

Что ждёт авторов

Наказание за такие публикации будет жёстким: годовой запрет на загрузку новых работ в ArXiv. Кроме того, как следует из заявления Диттериха, последующие отправки после такого нарушения смогут потребовать дополнительного подтверждения качества — например, принятия статьи на авторитетной рецензируемой конференции или в журнале. Для исследователя это болезненно.

ArXiv часто используют, чтобы быстро показать результаты коллегам, зафиксировать приоритет идеи и получить раннюю обратную связь. Потеря этого канала на год — уже серьёзный удар по видимости работы. Сигнал адресован не только авторам-нарушителям, но и всему рынку академического письма.

За последний год вокруг исследований вырос слой сервисов, которые обещают «ускорить публикацию» с помощью генерации текста, аннотаций и обзоров литературы. Новая мера показывает, что научные платформы начинают отделять продуктивное использование AI от беспечного штампования рукописей. Чем популярнее становятся LLM, тем выше шанс, что подобные фильтры появятся и у журналов, конференций и репозиториев данных.

Что это значит

Для исследователей это напоминание о базовой дисциплине: модель может помочь собрать черновик, но не может подписать статью вместо человека. Для индустрии AI это ещё один признак того, что рынок уходит от восторга по поводу «быстрой генерации» к требованиям верификации, редакторской ответственности и проверяемого качества.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Что вы думаете?
Загружаем комментарии…