Habr AI→ original

Google y las empresas de AI están erosionando internet: los sitios pequeños pierden tráfico y los modelos pierden calidad

Google y las empresas de AI se enfrentan a un efecto boomerang: los resúmenes de AI recortan el tráfico de búsqueda, especialmente en los sitios pequeños…

Procesado por IA desde Habr AI; editado por Hamidun News
Google y las empresas de AI están erosionando internet: los sitios pequeños pierden tráfico y los modelos pierden calidad
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

Google y las empresas de IA están reformulando cada vez más cómo funciona la web—no solo como consumidores de datos, sino como competidores para quienes producen esos datos. El nuevo debate revela una paradoja incómoda: la IA simultáneamente drena valor de internet abierta y degrada el material en el que luego aprende.

Ataque al Tráfico

El impacto principal es visible en búsqueda. Según datos de Chartbeat publicados por Axios en marzo de 2026, pequeños editores con 1–10 mil visualizaciones diarias perdieron 60% del tráfico de búsqueda en dos años. Editores medianos vieron una caída del 47%, grandes plataformas 22%. Un estudio separado de Pew Research reveló la causa: cuando Google añade resúmenes con IA, los usuarios hacen clic en enlaces notablemente con menos frecuencia. Sin resúmenes, los clics en resultados normales ocurren casi el doble de veces, mientras que los enlaces dentro del propio resumen reciben solo una fracción de clics.

  • Pequeños sitios perdieron 60% del tráfego de búsqueda en dos años
  • Editores medianos perdieron 47%
  • Grandes plataformas perdieron 22%
  • Con resúmenes de IA, los usuarios hacen clic en enlaces normales notablemente menos

El problema se extiende más allá de medios. Recetas, instrucciones, blogs, sitios educativos y cualquier recurso de nicho que dependía del tráfego de búsqueda se ven todos afectados. Las grandes marcas compensan parcialmente pérdidas a través de visitas directas, aplicaciones y canales de correo electrónico. Los pequeños proyectos carecen de tal colchón. Cuando el tráfego se desploma, la publicidad, las suscripciones y la motivación para publicar nuevo material sufren—especialmente contenido que requiere experiencia, tiempo y trabajo manual.

Internet Pierde Voces

Luego entra en juego el efecto económico. Menos tráfico significa menos dinero para quienes crean contenido original. Menos dinero significa menos reportajes, reseñas, instrucciones, investigaciones e historias locales. Los pequeños sitios independientes, que a menudo proporcionan los temas y ángulos más poco convencionales, desaparecen más rápido. Internet no se está vaciando—se está alisando: en lugar de muchas voces diferentes, surge un flujo de textos intercambiables, optimizados para algoritmos y respuestas rápidas.

La IA socava la mano que la alimenta.

En este contexto, las empresas y redacciones cada vez más llenan vacíos con contenido generado por máquina. Una estimación sugiere que para mediados de 2025, más de la mitad del nuevo contenido en línea ya se estaba creando con IA. Es conveniente y barato, pero este crecimiento cambia la composición de la web: los textos humanos escritos desde la experiencia, observación o experiencia especializada están disminuyendo en términos relativos. Como resultado, internet gradualmente se convierte en un monocultivo donde voces raras y genuinas se ahogan en un mar de publicaciones similares.

Cuando Aprenden los Modelos

Para los sistemas de IA, esto también es mala noticia. Los modelos generativos entrenan en vastos conjuntos de datos web, lo que significa que cada vez más encuentran textos, imágenes y resúmenes creados no por humanos sino por modelos anteriores. Un estudio de Nature en 2024 describe este riesgo como model collapse: bajo entrenamiento recursivo en datos sintéticos, un modelo gradualmente pierde patrones raros pero importantes del mundo real y comienza a reflejar la realidad con menor precisión. Al principio parece una ligera caída de calidad, luego uniformidad, errores y puro sinsentido.

La situación se complica por filtros poco confiables. Los detectores de contenido de IA muestran una amplia varianza de precisión y frecuentemente etiquetan erróneamente textos humanos como generados por máquina. Estos falsos positivos afectan de manera desproporcionada a los hablantes no nativos de inglés y a las personas con estilos de escritura poco convencionales. Los conjuntos de datos sintéticos, propuestos como solución, parecen más una solución temporal: pueden amplificar los puntos débiles de los modelos y no reemplazan datos humanos frescos. En otras palabras, la industria contamina la fuente de la que luego bebe.

Qué Significa

Si esta trayectoria continúa, el mercado enfrenta un efecto doble: los editores pierden su economía y los modelos pierden calidad de datos. Para los usuarios, significa internet más pobre y homogéneo. Para los desarrolladores de IA, significa creciente dependencia de un grupo limitado de contenido genuinamente creado por humanos. Las soluciones teóricamente existen—compensar a los creadores, etiquetado transparente de material generado por máquina y reglas más estrictas de recopilación de datos—pero por ahora, la industria se mueve en la dirección opuesta.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…