TechCrunch→ original

La IA recupera las voces de pilotos fallecidos de espectrogramas — NTSB cierra el acceso

Los investigadores utilizaron inteligencia artificial para recuperar las voces de los pilotos a partir de espectrogramas visuales de grabaciones de cajas negras

Procesado por IA desde TechCrunch; editado por Hamidun News
La IA recupera las voces de pilotos fallecidos de espectrogramas — NTSB cierra el acceso
Fuente: TechCrunch. Collage: Hamidun News.
◐ Escuchar artículo

Los investigadores demostraron que la inteligencia artificial es capaz de recuperar las voces de las personas a partir de espectrogramas de grabaciones de cajas negras de aviones. Este descubrimiento obligó a la agencia de aviación estadounidense NTSB a cerrar temporalmente el acceso a su base de datos de accidentes y repensar su política de privacidad.

Cómo recuperar voz de una imagen

Un espectrograma es una representación visual del sonido: un gráfico bidimensional donde el eje X representa el tiempo, el eje Y la frecuencia de las oscilaciones de sonido, y el color muestra la intensidad. Visualmente, consiste en rizos y bandas que a menudo parecen arte abstracto. Pero en realidad, es información completa de la señal de audio codificada en forma gráfica.

Las grabaciones de la caja negra (cockpit voice recorder, CVR) contienen una grabación de audio de los micrófonos de la cabina del piloto. Estas grabaciones se transcriben manualmente y se publican como espectrogramas en los informes de la NTSB — los especialistas leen los gráficos para entender la secuencia de eventos antes del accidente.

Los investigadores utilizaron redes neuronales profundas para la transformación inversa: entrenaron la IA para convertir espectrogramas nuevamente en sonido. Esto fue posible gracias al desarrollo de métodos de aprendizaje profundo (modelos de difusión, transformadores) y la disponibilidad de grandes conjuntos de datos de entrenamiento.

El proceso funciona aproximadamente así:

  • La IA se entrena en miles de pares: espectrograma + sonido original
  • La red neuronal aprende patrones entre la señal visual y de audio
  • Cuando se alimenta el sistema con un nuevo espectrograma, reproduce el sonido original
  • La calidad depende de la resolución del espectrograma y la complejidad del entorno acústico

Por qué NTSB se preocupó

La NTSB publica espectrogramas en informes abiertos de accidentes para garantizar la transparencia. Esto permite a científicos, periodistas e ingenieros analizar incidentes. Pero estos espectrogramas contienen los últimos minutos de vida de la tripulación — sus voces, diálogos, a veces las últimas palabras antes de la catástrofe.

Los pilotos nunca dieron su consentimiento para que sus voces fueran publicadas y potencialmente recuperadas. Durante años, el espectrograma parecía seguro desde el punto de vista de la privacidad: una persona común no podría extraer voz de un gráfico como este. Pero las nuevas tecnologías de IA mostraron que esta protección era una ilusión.

«La tecnología permitió recuperar voces con suficiente claridad para

escuchar frases individuales e inflexión», — aproximadamente así fue la reacción de la NTSB.

Reacción de la agencia y búsqueda de soluciones

La NTSB cerró el acceso a su sistema de expedientes (docket system), que contiene miles de informes, espectrogramas y materiales sobre accidentes. Este es un paso sin precedentes — la agencia está replanteando cómo equilibrar la transparencia de las investigaciones con la privacidad de las familias.

Las opciones posibles:

  • Eliminar completamente los espectrogramas de los informes públicos
  • Cifrar u ofuscar los espectrogramas para que la IA no pueda recuperarlos
  • Mantenerlos con una advertencia explícita sobre la posibilidad de recuperación
  • Requerir consentimiento de las familias antes de publicar materiales con voces
  • Publicar versiones editadas con filtros que distorsionan la voz sin perder información

Qué significa esto

Esto simboliza el conflicto de nuestra época: la tecnología se desarrolla más rápido que la sociedad y la regulación. Lo que parecía seguro debido a la complejidad del acceso ahora se vuelve accesible con un clic. Para la industria aeroportuaria, esto significa que se necesitan nuevos estándares de privacidad que consideren las capacidades de la IA. Para la sociedad en general, es un recordatorio de que las redes neuronales pueden extraer información de fuentes que considerábamos protegidas. Esto requiere una reevaluación de lo que se considera confidencial en la era de la inteligencia artificial poderosa.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…