Speech emotion recognition from voice messages recorded in real WhatsApp conversations

Gómez Zaragozá, Lucía

RiuNet repositorio UPV
:
Docencia
:
Trabajos académicos
:
Servicio de alumnado - Trabajos académicos
:
Ver ítem

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Speech emotion recognition from voice messages recorded in real WhatsApp conversations

Mostrar el registro completo del ítem

Gómez Zaragozá, L. (2021). Speech emotion recognition from voice messages recorded in real WhatsApp conversations. Universitat Politècnica de València. http://hdl.handle.net/10251/174963

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/174963

Ficheros en el ítem

Nombre: Gomez - Reconocimiento ...

Tamaño: 2.923Mb

Formato: PDF

Solicitar una copia al autor

Metadatos del ítem

Título:

Speech emotion recognition from voice messages recorded in real WhatsApp conversations

Autor:

Gómez Zaragozá, Lucía

Director(es):

Castro Bleda, María José

Marín Morales, Javier

Entidad UPV:

Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació

Fecha acto/lectura:

2021-09-24

Fecha difusión:

2021-10-19

Resumen:

[ES] La comunicación mediante el habla permite a los individuos transmitir no sólo información lingüística, sino también su estado emocional, de forma eficaz y natural. El reconocimiento automático del estado emocional de un individuo a partir de su voz ha dado lugar a un campo de investigación denominado Reconocimiento de Emociones del Habla (del inglés, Speech Emotion Recognition, SER), con aplicaciones en diversas áreas, como la interacción persona-ordenador o la investigación médica. Esta tesis explora el reconocimiento de las emociones del habla utilizando algoritmos de aprendizaje automático supervisado. A diferencia de la mayoría de las investigaciones en este campo, que utilizan bases de datos basadas en emociones actuadas o inducidas, en este proyecto se recopiló primero una base de datos de habla emocional natural para desarrollar modelos de reconocimiento de emociones del habla aplicables en situaciones de la vida real. La base de datos, denominada Vocal Social Media (VOSOME), contenía mensajes de audio procedentes de conversaciones reales de WhatsApp de 100 hablantes españoles, que fueron etiquetados posteriormente en las dimensiones de excitación y valencia de las emociones. Se implementaron dos enfoques de modelado: técnicas clásicas de aprendizaje automático basadas en funciones estadísticas de alto nivel calculadas a partir de características acústicas, y modelos de aprendizaje profundo basados tanto en estadísticas como en descriptores de bajo nivel extraídos de los audios. En concreto, se utilizaron máquinas de vectores de soporte y k-vecinos más cercanos como algoritmos clásicos, mientras que como enfoques de aprendizaje profundo se implementaron redes neuronales artificiales y redes de memoria a corto plazo. Las mismas técnicas de modelado se aplicaron a una conocida base de datos pública llamada RAVDESS, representativa de las típicas bases de datos de habla emocional actuada, para comparar los resultados. [-]

[EN] Speech communication allows individuals to convey not only linguistic information but also their emotional state in an efficient and natural way. The automatic recognition of an individual's emotional state from their ...[+]

Palabras clave:

Valencia emocional , Excitación emocional , Reconocimiento de emociones del habla , Base de datos natural , Aprendizaje automático , Aprendizaje profundo , Speech emotion recognition , Natural database , Machine learning , Deep learning , Emotional arousal , Emotional valence

Derechos de uso:

Cerrado

Editorial:

Universitat Politècnica de València

Titulación:

Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·Ligència Artificial: Reconeixement de Formes i Imatge Digital

Tipo:

Tesis de máster

recommendations

Este ítem aparece en la(s) siguiente(s) colección(ones)

Servicio de alumnado - Trabajos académicos [7391]

Mostrar el registro completo del ítem

Speech emotion recognition from voice messages recorded in real WhatsApp conversations

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Speech emotion recognition from voice messages recorded in real WhatsApp conversations

Ficheros en el ítem

Metadatos del ítem

recommendations

Este ítem aparece en la(s) siguiente(s) colección(ones)