La IA recupera las voces de pilotos fallecidos de espectrogramas — NTSB cierra el acceso

Q: ¿Cuál es la fuente?

Publicado originalmente en TechCrunch. Hamidun News procesa y adapta los materiales con IA.

Q: ¿Cuándo se publicó?

2026-05-25. Tiempo de lectura: 3 min.

Los investigadores utilizaron inteligencia artificial para recuperar las voces de los pilotos a partir de espectrogramas visuales de grabaciones de cajas negras

Redacción de Hamidun News

Monitoreo de AI · TechCrunch

2026-05-25· 3 min

Procesado por IA desde TechCrunch; editado por Hamidun News

La IA recupera las voces de pilotos fallecidos de espectrogramas — NTSB cierra el acceso — Fuente: TechCrunch. Collage: Hamidun News.

◐ Escuchar artículo

Los investigadores demostraron que la inteligencia artificial es capaz de recuperar las voces de las personas a partir de espectrogramas de grabaciones de cajas negras de aviones. Este descubrimiento obligó a la agencia de aviación estadounidense NTSB a cerrar temporalmente el acceso a su base de datos de accidentes y repensar su política de privacidad.

Cómo recuperar voz de una imagen

Un espectrograma es una representación visual del sonido: un gráfico bidimensional donde el eje X representa el tiempo, el eje Y la frecuencia de las oscilaciones de sonido, y el color muestra la intensidad. Visualmente, consiste en rizos y bandas que a menudo parecen arte abstracto. Pero en realidad, es información completa de la señal de audio codificada en forma gráfica.

Las grabaciones de la caja negra (cockpit voice recorder, CVR) contienen una grabación de audio de los micrófonos de la cabina del piloto. Estas grabaciones se transcriben manualmente y se publican como espectrogramas en los informes de la NTSB — los especialistas leen los gráficos para entender la secuencia de eventos antes del accidente.

Los investigadores utilizaron redes neuronales profundas para la transformación inversa: entrenaron la IA para convertir espectrogramas nuevamente en sonido. Esto fue posible gracias al desarrollo de métodos de aprendizaje profundo (modelos de difusión, transformadores) y la disponibilidad de grandes conjuntos de datos de entrenamiento.

El proceso funciona aproximadamente así:

La IA se entrena en miles de pares: espectrograma + sonido original
La red neuronal aprende patrones entre la señal visual y de audio
Cuando se alimenta el sistema con un nuevo espectrograma, reproduce el sonido original
La calidad depende de la resolución del espectrograma y la complejidad del entorno acústico

Por qué NTSB se preocupó

La NTSB publica espectrogramas en informes abiertos de accidentes para garantizar la transparencia. Esto permite a científicos, periodistas e ingenieros analizar incidentes. Pero estos espectrogramas contienen los últimos minutos de vida de la tripulación — sus voces, diálogos, a veces las últimas palabras antes de la catástrofe.

Los pilotos nunca dieron su consentimiento para que sus voces fueran publicadas y potencialmente recuperadas. Durante años, el espectrograma parecía seguro desde el punto de vista de la privacidad: una persona común no podría extraer voz de un gráfico como este. Pero las nuevas tecnologías de IA mostraron que esta protección era una ilusión.

«La tecnología permitió recuperar voces con suficiente claridad para

escuchar frases individuales e inflexión», — aproximadamente así fue la reacción de la NTSB.

Reacción de la agencia y búsqueda de soluciones

La NTSB cerró el acceso a su sistema de expedientes (docket system), que contiene miles de informes, espectrogramas y materiales sobre accidentes. Este es un paso sin precedentes — la agencia está replanteando cómo equilibrar la transparencia de las investigaciones con la privacidad de las familias.

Las opciones posibles:

Eliminar completamente los espectrogramas de los informes públicos
Cifrar u ofuscar los espectrogramas para que la IA no pueda recuperarlos
Mantenerlos con una advertencia explícita sobre la posibilidad de recuperación
Requerir consentimiento de las familias antes de publicar materiales con voces
Publicar versiones editadas con filtros que distorsionan la voz sin perder información

Qué significa esto

Esto simboliza el conflicto de nuestra época: la tecnología se desarrolla más rápido que la sociedad y la regulación. Lo que parecía seguro debido a la complejidad del acceso ahora se vuelve accesible con un clic. Para la industria aeroportuaria, esto significa que se necesitan nuevos estándares de privacidad que consideren las capacidades de la IA. Para la sociedad en general, es un recordatorio de que las redes neuronales pueden extraer información de fuentes que considerábamos protegidas. Esto requiere una reevaluación de lo que se considera confidencial en la era de la inteligencia artificial poderosa.

Hamidun News

Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

Canal de Telegram RSS hamidun.com

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

🎓 Academy — 7 días gratis Consulta gratuita