Una red neuronal como máquina del tiempo: por qué se enseña a los LLMs a pensar como antes
Los investigadores encontraron una forma paradójica de usar los LLMs: en lugar de ampliar los datos de entrenamiento, los restringen y crean modelos que…
Procesado por IA desde Habr AI; editado por Hamidun News
Los modelos de lenguaje se evalúan convencionalmente por el volumen de conocimiento que poseen: cuantos más datos absorbe una red neuronal, más inteligente se vuelve. Pero un grupo de investigadores y entusiastas invirtió esta lógica de arriba abajo. Deliberadamente reducen los conjuntos de datos de entrenamiento, limitándolos a textos de una época histórica específica, y obtienen algo completamente inesperado: inteligencia artificial que razona como si viviera en el siglo XVII o principios del siglo XX.
A primera vista, la idea parece un capricho exótico. ¿Por qué alguien necesitaría un modelo que no sepa nada sobre antibióticos, teoría de la relatividad e internet? Sin embargo, hay una motivación científica seria detrás de esto. Los LLM modernos se entrenan en corpus de texto que abarcan toda la historia del lenguaje escrito hasta el presente. Inevitablemente ven el pasado a través de la lente del presente — con su terminología, valores y conocimiento acumulado. Un modelo entrenado solo en textos anteriores a 1912 carece de esta lente retrospectiva. No simplemente reproduce las palabras de una era — reproduce su forma de pensar, sus puntos ciegos, su confianza en cosas que hace mucho consideramos delusiones.
Técnicamente, el enfoque se ve de la siguiente manera. Se toma la arquitectura de un modelo de lenguaje estándar — típicamente relativamente compacta, ya que el volumen de textos históricos es limitado. El corpus de entrenamiento se forma exclusivamente de fuentes fechadas en un período específico: libros, periódicos, cartas, tratados científicos, documentos legales. Es crítico excluir cualquier texto escrito después de la fecha de corte elegida. Como resultado, el modelo absorbe no solo el vocabulario y la gramática de la era, sino también su marco epistemológico — es decir, los límites de lo que la gente de esa época consideraba posible, verdadero y permisible.
La aplicación de tales modelos 'temporales' resulta ser mucho más amplia de lo que se podría suponer. En el campo de la epistemología — la ciencia del conocimiento — permiten a los investigadores investigar cómo cambiaron los propios mecanismos de formación del conocimiento. Puedes hacer a un modelo de 1650 una pregunta sobre la naturaleza de las enfermedades y recibir una respuesta basada en la teoría humoral — no como estilización, sino como convicción genuina de un sistema para el cual la teoría de los gérmenes simplemente no existe. Esto proporciona a los científicos una herramienta única para modelar paradigmas históricos del pensamiento.
En las ciencias del comportamiento, tales modelos ayudan a estudiar cómo el contexto cultural e informacional moldea el comportamiento y las decisiones. Si coloca un LLM dentro del marco de conocimiento de una era específica, puede modelar reacciones a eventos, decisiones económicas, actitudes sociales — y compararlas con datos históricos reales. En esencia, es una forma de psicología histórica computacional que habría sido impensable hace apenas unos años.
El potencial educativo también es impresionante. Imagina un diálogo interactivo con un 'erudito' de la Era de la Ilustración que no solo cita textos del siglo XVIII, sino que razona consistentemente dentro del marco de la visión del mundo de esa época. Un estudiante puede hacer preguntas, debatir, encontrarse con una lógica que era impecable para su tiempo, pero se ve absurda hoy. Esta es una forma poderosa de demostrar que el conocimiento no es un valor absoluto, sino un proceso históricamente condicionado.
Varias iniciativas abiertas ya están trabajando en esta dirección. Los proyectos discutidos por especialistas de Beeline Cloud desarrollan tanto los modelos en sí como la metodología para preparar corpus históricos. El desafío clave aquí es la calidad de los datos. Los textos digitalizados de siglos pasados a menudo contienen errores de reconocimiento, y la selección de fuentes requiere experiencia seria de historiadores para garantizar que el corpus represente adecuadamente el pensamiento de la era, no solo su élite literaria.
Y hay una pregunta fundamental que este enfoque plantea. Si un modelo entrenado en textos del pasado reproduce los engaños y prejuicios de su tiempo, ¿qué dice esto sobre los LLM modernos? Están igualmente limitados por los límites de nuestra era — simplemente aún no sabemos cuáles de nuestras 'verdades obvias' las generaciones futuras considerarán ingenuas. Los modelos temporales se convierten en un espejo que nos recuerda: cualquier inteligencia, artificial o no, es un producto de su tiempo. Y la conciencia de este hecho puede ser más valiosa que cualquier avance tecnológico.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.