Abstract:
|
La escucha binaural es un recurso que puede ser empleado en aplicaciones audiovisuales para obtener una experiencia inversiva que mejora el estéreo clásico y es comparable al sonido estéreo envolvente multicanal. Para ello ...[+]
La escucha binaural es un recurso que puede ser empleado en aplicaciones audiovisuales para obtener una experiencia inversiva que mejora el estéreo clásico y es comparable al sonido estéreo envolvente multicanal. Para ello es necesario un procesado específico a través de filtrado de tipo HRTF (función de transferencia derivada de la cabeza). Este proceso consiste en aplicar a cualquier sonido monofónico o estereofónico las características que el sistema auditivo necesita para interpretar la localización espacial tridimensional del sonido (indicios binaurales). Estos indicios dependen principalmente de características antropomórficas individuales, lo que introduce ciertos problemas debidos al uso de HRTF no individualizadas, como dificultad para localizar sonidos fuera de nuestra cabeza (internalizaciones) o confusiones entre delante y detrás (inversiones). Una buena comprensión de las características de la audición humana es necesaria para optimizar este procesado. En este trabajo se realiza un estado de la cuestión y un repaso de estudios realizados sobre la materia. Se constata que experimentos previos (Kistler, 1999; Mackensen, 2004; Werséni, 2009) apuntan a una mejora de la localización espacial con el uso de sonidos del mundo real, o a través de la simulación de movimientos relativos fuente sonora-oyente (indicios dinámicos). Se propone un diseño experimental consistente en un test de percepción con el fin de comparar el comportamiento de distintas señales de audio con distintas características temporales y espectrales, la influencia del movimiento y la fiabilidad de distintas herramientas de postproducción y grabación de campo binaurales. Se han probado sobre 11 sujetos, 3 tipos de sonido (espectralmente difuso, impulsivo y voz) y 4 técnicas de recreación binaural: procesado mediante software de postproducción de audio (panorama 5, binaural panner), filtrado con matlab y grabación de campo con microfonía binaural (Soundman OKM) sobre muestras estáticas y con movimiento simulado. Los resultados son muy similares para todas las técnicas de recreación, e indican que los sonidos impulsivos son detectados con más precisión y menos errores. El movimiento parece mejorar los problemas de internalización (hasta un 40%), y las confusiones detrás-delante, pero aumenta las confusiones delante-detrás y la precisión en la localización en general. Se constata que un mejor conocimiento de las características de la escucha espacial humana es de interés en la mejora de las estrategias de diseño de sonido y aplicable a la realización de productos audiovisuales novedosos de alta calidad.
Binaural hearing can be used in audiovisual applications allowing an immersive experience that goes beyond the classical stereo and comparable to surround multichannel stereo sound. It requires a specific processing through HRTF (head-related transfer function). This processing consists on applying the characteristics that hearing system needs to interpret the spatial location of the sound (binaural cues) to any monophonic or stereophonic sound. These cues depend on individual anthropomorphic characteristics, what led to problems due to non-individualized HRTF processing, as inside-the-head locations or front-back confusions. A good understanding of the characteristics of human hearing is needed to improve the processing. In this work, a state-of-the-matter and a background review is done. Previous research (Kistler, 1999; Mackensen, 2004; Wersény, 2009) point to an improvement of spatial location using real-world sounds or relative listener-source movement simulation (dynamic cues). An experimental design is proposed consisting on a perceptual test to compare the behavior of different time and space shaped audio signals, the influence of movement and the reliability of different binaural audio postproduction and field recording tools. Eleven subjects have been tested with 3 different sorts of sounds (diffuse spectrum, impulsive and speech) and 4 different binaural simulation technics: audio postproduction software (panorama 5, binaural panner), matlab filtering and binaural field recording (Soundman OKM) through static and moving samples. The results are very similar regarding the simulation technics, and show that impulsive sound is more easily and precisely detected with less confusions. Movement seems to improve the inside-the-head location (up to 40%) and the back to front confusions, but increase the front-to-back and the localization blur in overall. It is verified that a better understanding of the human spatial hearing characteristics is a field of interest on improving the sound design strategies and applicable to produce high quality original audiovisual products.
[-]
|