Claude y un millón de libros muertos: cómo la IA devoró nuestro legado
¿Recuerdas aquel silencioso noviembre de 2022 cuando el mundo aún no sabía qué eran las alucinaciones de redes neuronales? OpenAI no solo lanzó un producto…
Procesado por IA desde The Verge; editado por Hamidun News
¿Recuerdas aquel silencioso noviembre de 2022 cuando el mundo aún no sabía qué eran las alucinaciones de redes neuronales? OpenAI no solo lanzó un producto entonces, disparó la pistola de salida, un sonido que hizo que todos los gigantes de Silicon Valley abandonaran sus acogedores metaversos y corrieran. En esta carrera, Claude de Anthropic se convirtió en uno de los principales contendientes por la corona. Pero detrás de la brillante fachada de una IA educada y segura se esconde un cementerio de millones de libros que nadie autorizó usar. Seamos honestos: Claude existe en su forma actual solo porque la industria decidió ignorar las reglas del decoro por el bien de la velocidad.
La industria de IA hoy se parece a una era de capitalismo salvaje, donde en lugar de minas de oro hay enormes conjuntos de datos. Cuando quedó claro que ChatGPT no era solo un juguete, sino un fundamento de una nueva economía, la cuestión de la ética pasó a un segundo plano. Para enseñar a un modelo a razonar, necesita más que textos de Reddit o Wikipedia. Necesita estructuras complejas, vocabulario rico y contextos profundos que solo se pueden encontrar en literatura de calidad. Así, millones de libros protegidos por derechos de autor se convirtieron en "datos de entrenamiento" sin el consentimiento de sus creadores. ¿No creías que las redes neuronales aprenden de cuentos infantiles del dominio público, verdad?
Anthropicoften a menudo se posiciona como los "chicos buenos" del mundo de la IA, enfocándose en seguridad y ética. Pero la ironía es que incluso los modelos más "seguros" se construyen sobre una base de contenido cuestionable. Conjuntos de datos como Books3, que contienen cientos de miles de títulos de bibliotecas clandestinas, se convirtieron en el ingrediente secreto que permitió a Claude alcanzar e incluso superar en algunos aspectos los desarrollos de Sam Altman. Para las corporaciones, esto era matemática simple: o usas todo lo que está disponible, o tu competidor lo hará primero y capturará el mercado. En esta lógica, los libros son solo carbón para alimentar el horno del progreso.
¿Por qué importa ahora? Nos estamos acercando a un momento en que los datos "humanos" simplemente se están agotando. Las redes neuronales ya han leído casi todo lo que hemos escrito en los últimos siglos. Y ahora los autores — desde novelistas hasta escritores técnicos — descubren que sus años de trabajo se han convertido en combustible gratuito para sistemas que en el futuro podrían reemplazarlos. Esto no es solo robo de contenido, es un cambio fundamental en la comprensión de la propiedad intelectual. Si antes comprabas un libro para leerlo, ahora las corporaciones lo toman para enseñar a una máquina a imitar tu estilo y lógica de pensamiento.
Los pleitos de autores como Sarah Silverman o George Martin son solo la punta del iceberg. El problema es que el sistema legal es lento, mientras que la industria de IA se mueve a la velocidad de la luz. Mientras que los tribunales tardan años en decidir si el entrenamiento de una red neuronal es "uso justo", los modelos ya están entrenados, los pesos se han guardado y se han comprometido miles de millones de dólares en inversión. Anthropic y otros jugadores apostaron a que los vencedores no son juzgados. O, al menos, las multas por violación de derechos de autor serán una gota en el océano en comparación con la futura capitalización de mercado.
Al final, tenemos una simbiosis extraña. Claude puede analizar para ti un documento legal complejo o escribir un ensayo en el estilo de Proust precisamente porque ha "tragado" miles de textos similares sin preguntar. Obtuvimos una herramienta increíble, pero el precio de su creación es la devaluación del trabajo humano en sí. Los libros no solo sirvieron como base, fueron procesados en carne digital, de la que se moldearon nuevas interfaces convenientes para el consumo. Y ahora tenemos que vivir con esto, usando los frutos de esta expropiación intelectual.
Lo fundamental: Anthropic y OpenAI construyeron sus imperios sobre datos que no les pertenecían, y ahora no hay vuelta atrás. ¿Podrá la industria sobrevivir si realmente tiene que pagar por cada libro "leído"?
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.