Investigadores del Instituto de Tecnología de Massachusetts (MIT), junto a los de Microsoft y Adobe desarrollaron un algoritmo que puede reconstruir una señal de audio mediante el análisis de las vibraciones de objetos filmados.
Se logró recuperar el audio inteligible del entorno cercano a objetos, como por ejemplo una bolsa de papas fritas filmada desde 15 metros de distancia a través de un cristal a prueba de sonido. También se extrajeron las señales de audio útiles a partir de videos de papel de aluminio, la superficie de un vaso con agua, e incluso las hojas de una planta en una maceta.
“Cuando el sonido interacciona contra un objeto, hace que mismo vibre“, dice Abe Davis, una estudiante graduada en ingeniería eléctrica e informática en el MIT y autora principal del nuevo estudio. “El movimiento de esta vibración crea una señal visual muy sutil que es generalmente invisible al ojo. La gente no se da cuenta de que esta información estaba allí “.
La reconstrucción del audio a partir de grabar las vibraciones de un objeto requiere que la frecuencia de las muestras de video (el número de fotogramas de vídeo capturados por segundo), sea superior a la frecuencia de la señal de audio. En algunos de sus experimentos, los investigadores utilizaron una cámara de alta velocidad que captó 2000 a 6000 fotogramas por segundo, que es mucho más rápido que los 60 cuadros por segundo posibles con cámaras comerciales típicas, pero muy por debajo de las frecuencias de cuadros de las mejores cámaras de alta velocidad comerciales, que pueden superar 100 mil fotogramas por segundo.
De manera que como la frecuencia audible para el ser humano es de 20 Hz a 20 mil Hz, con una cámara de alta velocidad de 100 mil cuadros por segundo se podría incluso reconstruir el ultrasonido.
Por otra parte, también se utilizó una cámara digital común, por una peculiaridad en el diseño de sus sensore,s y se logró inferir información acerca de las vibraciones de alta frecuencia incluso de vídeos grabados a un estándar de 60 fotogramas por segundo, aunque con menos fidelidad. Sin embargo, fue posible determinar factores como el género de un hablante en una habitación, el número de hablantes, e incluso obtener información precisa sobre las propiedades acústicas de las voces de los hablantes y sus identidades.
Si bien esta nueva técnica tiene aplicaciones en cuestiones legales y forenses, hay otras posibilidades que entusiasman mucho más, ya que es posible determinar las propiedades estructurales de cada objeto, que responde cada uno de forma diferente al sonido.