Resumen:
|
[ES] La voz es la principal forma de comunicación del ser humano. En los últimos años diversos
avances tecnológicos como la telefonía móvil, los sistemas de videoconferencia o los dispositivos
controlados mediante el ...[+]
[ES] La voz es la principal forma de comunicación del ser humano. En los últimos años diversos
avances tecnológicos como la telefonía móvil, los sistemas de videoconferencia o los dispositivos
controlados mediante el habla, han propiciado un nuevo campo de investigación destinado
al realzado de la señal de voz. Esto ha causado la proliferación de novedosas técnicas de tratamiento
de señal aplicadas a tal fin.
En esta tesina, hemos llevado a cabo una revisión del estado del arte de los dos grupos principales
de técnicas de realzado de voz: el beamforming y la separación ciega de fuentes de
audio. Varios algoritmos han sido implementados y comprobados mediante diversos prototipos
de arrays de micrófonos. Además, se ha propuesto un novedoso método de procesado en
array para separación de fuentes en tiempo real. También se muestran resultados obtenidos
mediante experimentos con grabaciones en salas reales
[-]
[EN] Speech is the main form of communication of the human being. In the last years, several technological
advances, such as mobile communications, videoconferencing and speech-controlled
systems, have brought about a ...[+]
[EN] Speech is the main form of communication of the human being. In the last years, several technological
advances, such as mobile communications, videoconferencing and speech-controlled
systems, have brought about a new research field aimed at enhancing speech signals. For this
purpose, several processing techniques have been recently developed.
In this work, we have carried out a state-of-the-art review of the two main speech enhancement
techniques: beamforming and blind audio source separation. Several algorithms haven been
implemented and tested over a set of microphone-array prototypes. Furthermore, we have
proposed a novel array processing method for real-time audio separation. Experiments and
results using recordings obtained in real rooms are discussed
[-]
|