The Verge→ original

ArXiv suspenderá por un año a autores por artículos con 'AI slop' y referencias inventadas

ArXiv está imponiendo sanciones duras a los investigadores que envían artículos con señales claras de contenido generado por LLM sin revisar. Si la plataforma d

Procesado por IA desde The Verge; editado por Hamidun News
ArXiv suspenderá por un año a autores por artículos con 'AI slop' y referencias inventadas
Fuente: The Verge. Collage: Hamidun News.
◐ Escuchar artículo

ArXiv está endureciendo las reglas contra el llamado AI slop — manuscritos científicos en los que los autores insertan texto generado por modelo sin verificación. Si la plataforma detecta signos claros de tal publicación, el castigo será significativo: desde una prohibición de un año hasta restricciones adicionales en futuras cargas.

Nueva Barrera para Preprints

Para ArXiv, esto no es una actualización cosmética de las reglas, sino un intento de proteger la reputación de uno de los principales archivos de preprints. La plataforma se ha convertido hace tiempo en un lugar donde los investigadores publican rápidamente resultados frescos antes de la publicación formal en revista o conferencia. Pero con el crecimiento de la accesibilidad de los LLM, el flujo de manuscritos ha comenzado a incluir textos ensamblados con casi ninguna edición: seguros en tono, pero con hechos erróneos, formulaciones absurdas y referencias a trabajos inexistentes. Para una plataforma científica, esto ya no es una cuestión de estilo, sino una cuestión de confianza.

Thomas Dittrich, presidente de la sección de informática de ArXiv, habló sobre el nuevo enfoque. Según él, las sanciones se aplicarán no por el simple hecho de usar un modelo, sino por la ausencia de verificación humana de los resultados. En otras palabras, el problema no es que los autores usen LLM como herramienta, sino que algunos carguen la salida casi bruta del modelo bajo su propia firma. Para ArXiv, esto viola un principio básico: si pones tu nombre en un trabajo, eres responsable de cada referencia, fórmula y conclusión.

Por Qué Se Banirá

La formulación clave — "prueba irrefutable de que los autores no verificaron los resultados de la generación de LLM." Esto se refiere a marcadores que son difíciles de explicar por negligencia ordinaria. Esto no es una disputa sobre la calidad de la escritura ni una crítica al estilo. Si un manuscrito contiene rastros de contenido generado por máquina, mostrando que el texto ni siquiera fue leído antes del envío, ArXiv considerará esto suficiente motivo para sanciones. ArXiv considera exactamente tales rastros como la señal más obvia de presentación deshonesta.

  • referencias bibliográficas fabricadas o inexistentes
  • comentarios meta de servicio del modelo dejados accidentalmente en el texto
  • afirmaciones que contradicen fuentes y no fueron verificadas por el autor
  • rastros de inserción automática que muestran ausencia de corrección final
"Si hay prueba irrefutable de que los autores no verificaron los

resultados de la generación de LLM, seguirá una prohibición de un año."

Este es un matiz importante para la comunidad académica. ArXiv no está declarando guerra a las herramientas generativas como tales: un investigador puede usar LLM para borrador, traducción o edición. La línea roja se traza donde el autor deja de ser autor y se convierte en operador de copiar-pegar. El archivo científico intenta establecer una regla simple: la automatización es permisible, pero la responsabilidad del contenido no se puede delegar a un modelo, especialmente cuando se trata de citas y hechos verificables.

Qué Espera a los Autores

El castigo por tales publicaciones será severo: una prohibición de un año para cargar nuevos trabajos en ArXiv. Además, como se sigue de la declaración de Dittrich, los envíos posteriores después de tal violación pueden requerir confirmación adicional de calidad — por ejemplo, aceptación del artículo en una conferencia revisada por pares respetable o en revista. Para un investigador, esto es doloroso. ArXiv se usa a menudo para mostrar rápidamente resultados a colegas, establecer prioridad de una idea y obtener retroalimentación temprana. La pérdida de este canal durante un año ya es un golpe serio a la visibilidad del trabajo.

La señal está dirigida no solo a autores infractores, sino a todo el mercado de escritura académica. Durante el año pasado, ha crecido una capa de servicios en torno a la investigación que prometen "acelerar la publicación" usando generación de texto, anotaciones y revisión de literatura. La nueva medida muestra que las plataformas científicas están comenzando a separar el uso productivo de IA de la fabricación descuidada de manuscritos. Cuanto más populares se vuelven los LLM, mayor es la posibilidad de que filtros similares aparezcan en revistas, conferencias y repositorios de datos.

Qué Significa Esto

Para los investigadores, esto es un recordatorio de disciplina básica: un modelo puede ayudar a ensamblar un borrador, pero no puede firmar un artículo en nombre de un humano. Para la industria de IA, esto es otra señal de que el mercado se está alejando del entusiasmo sobre "generación rápida" hacia demandas de verificación, responsabilidad editorial y calidad verificable.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…