- -

Speech and singing voice classifier based on musical note classification and fundamental frequency estimation.

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Speech and singing voice classifier based on musical note classification and fundamental frequency estimation.

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Ramos Peinado, Germán es_ES
dc.contributor.advisor Luzón Álvarez, Clara es_ES
dc.contributor.author Diana Sánchez, Santiago es_ES
dc.date.accessioned 2022-10-14T17:26:29Z
dc.date.available 2022-10-14T17:26:29Z
dc.date.created 2022-07-18 es_ES
dc.date.issued 2022-10-14 es_ES
dc.identifier.uri http://hdl.handle.net/10251/187785
dc.description.abstract [ES] El procesamiento del habla es el estudio de las señales del habla y de los métodos de procesamiento de señal aplicados al análisis y el tratamiento de las mismas. Este tratamiento es actualmente realizado en el dominio discreto, digitalizando previamente la señal del habla. En este ámbito, la distinción entre el voz hablada y voz cantada es una tarea esencial para ayudar a la consecución de varios tipos de algoritmos y de su posterior toma de decisiones. Esta discriminación es a veces difícil incluso para los humanos, dependiendo del tipo de música en el que se basa la voz cantada. Para lograr una buena discriminación entre ambas clases (hablada y cantada), se debe realizar un estudio profundo y amplio debido a que cada tipo de voz puede requerir de un procesado y de algoritmos de decisión diferentes. Este trabajo, presenta un clasificador automático entre voz cantada y hablada o discurso, basado en dos parámetros principales: el tono derivado de la clasificación de las notas musicales y la estima de la frecuencia fundamental. Este método obtiene buenos resultados en la tarea de discriminar entre silencio, habla y voz cantada. Este trabajo tiene una directa aplicación industrial en el campo de la investigación del audio, la aplicación de filtros o algoritmos en función de si hay voz cantada o no, o la discriminación de estilos musicales a partir de los parámetros extraídos de la voz cantada. es_ES
dc.description.abstract [EN] Speech processing is the study of speech signals and signal processing methods applied to their analysis and treatment. This processing is currently performed in the discrete domain, previously digitizing the speech signal. In this area, the distinction between the spoken voice and the sung voice is an essential task to help the achievement of various types of algorithms and their subsequent decision-making. This discrimination is sometimes difficult even for humans, depending on the type of music on which the sung voice is based. To achieve a good discrimination between both classes (spoken and sung), a deep and broad study must be carried out due to each type of voice may require different processing and decision algorithms. This work presents an automatic classifier between sung and spoken voice or speech, based on two main parameters: the tone derived from the classification of musical notes and the estimation of the fundamental frequency. This method obtains good results in the task of discriminating between silence, speech and sung voice. This work has a direct industrial application in the field of audio research, the application of filters or algorithms depending on whether there is sung voice or not, or the discrimination of musical styles from the parameters extracted from the sung voice. en_EN
dc.format.extent 61 es_ES
dc.language Inglés es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Discurso es_ES
dc.subject Voz cantada es_ES
dc.subject Clasificador es_ES
dc.subject Prototipo es_ES
dc.subject Detección de notas es_ES
dc.subject Timbre es_ES
dc.subject Speech en_EN
dc.subject Singing voice en_EN
dc.subject Classifier en_EN
dc.subject Prototype en_EN
dc.subject Note detection en_EN
dc.subject Pitch en_EN
dc.subject.classification TECNOLOGIA ELECTRONICA es_ES
dc.subject.classification INGENIERIA TELEMATICA es_ES
dc.subject.other Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación-Grau en Enginyeria de Tecnologies i Serveis de Telecomunicació es_ES
dc.title Speech and singing voice classifier based on musical note classification and fundamental frequency estimation. es_ES
dc.title.alternative Clasificador de voz y canto basado en la clasificación de notas musicales y la estimación de la frecuencia fundamental. es_ES
dc.title.alternative Classificador de veu i cant basat en la classificació de notes musicals i l'estimació de la freqüència fonamental. es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Ingeniería Electrónica - Departament d'Enginyeria Electrònica es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros de Telecomunicación - Escola Tècnica Superior d'Enginyers de Telecomunicació es_ES
dc.description.bibliographicCitation Diana Sánchez, S. (2022). Speech and singing voice classifier based on musical note classification and fundamental frequency estimation. Universitat Politècnica de València. http://hdl.handle.net/10251/187785 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\149786 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem