Resumen:
|
[ES] El procesamiento del habla es el estudio de las señales del habla y de los métodos de procesamiento de señal aplicados al análisis y el tratamiento de las mismas. Este tratamiento es actualmente realizado en el dominio ...[+]
[ES] El procesamiento del habla es el estudio de las señales del habla y de los métodos de procesamiento de señal aplicados al análisis y el tratamiento de las mismas. Este tratamiento es actualmente realizado en el dominio discreto, digitalizando previamente la señal del habla.
En este ámbito, la distinción entre el voz hablada y voz cantada es una tarea esencial para ayudar a la consecución de varios tipos de algoritmos y de su posterior toma de decisiones. Esta discriminación es a veces difícil incluso para los humanos, dependiendo del tipo de música en el que se basa la voz cantada. Para lograr una buena discriminación entre ambas clases (hablada y cantada), se debe realizar un estudio profundo y amplio debido a que cada tipo de voz puede requerir de un procesado y de algoritmos de decisión diferentes.
Este trabajo, presenta un clasificador automático entre voz cantada y hablada o discurso, basado en dos parámetros principales: el tono derivado de la clasificación de las notas musicales y la estima de la frecuencia fundamental. Este método obtiene buenos resultados en la tarea de discriminar entre silencio, habla y voz cantada.
Este trabajo tiene una directa aplicación industrial en el campo de la investigación del audio, la aplicación de filtros o algoritmos en función de si hay voz cantada o no, o la discriminación de estilos musicales a partir de los parámetros extraídos de la voz cantada.
[-]
[EN] Speech processing is the study of speech signals and signal processing methods applied to their analysis and treatment. This processing is currently performed in the discrete domain, previously digitizing the speech ...[+]
[EN] Speech processing is the study of speech signals and signal processing methods applied to their analysis and treatment. This processing is currently performed in the discrete domain, previously digitizing the speech signal.
In this area, the distinction between the spoken voice and the sung voice is an essential task to help the achievement of various types of algorithms and their subsequent decision-making. This discrimination is sometimes difficult even for humans, depending on the type of music on which the sung voice is based. To achieve a good discrimination between both classes (spoken and sung), a deep and broad study must be carried out due to each type of voice may require different processing and decision algorithms.
This work presents an automatic classifier between sung and spoken voice or speech, based on two main parameters: the tone derived from the classification of musical notes and the estimation of the fundamental frequency. This method obtains good results in the task of discriminating between silence, speech and sung voice.
This work has a direct industrial application in the field of audio research, the application of filters or algorithms depending on whether there is sung voice or not, or the discrimination of musical styles from the parameters extracted from the sung voice.
[-]
|