Análisis de audio mediante técnicas de aprendizaje profundo

Pastor Naranjo, Francisco

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Análisis de audio mediante técnicas de aprendizaje profundo

Mostrar el registro sencillo del ítem

Ficheros en el ítem

Nombre: Pastor - Analisis ...

Tamaño: 4.139Mb

Formato: PDF

Abrir

dc.contributor.advisor	Piñero Sipán, María Gemma	es_ES
dc.contributor.advisor	Amor del Amor, María Rocío del	es_ES
dc.contributor.author	Pastor Naranjo, Francisco	es_ES
dc.date.accessioned	2022-10-14T17:32:44Z
dc.date.available	2022-10-14T17:32:44Z
dc.date.created	2022-07-15	es_ES
dc.date.issued	2022-10-14	es_ES
dc.identifier.uri	http://hdl.handle.net/10251/187795
dc.description.abstract	[ES] El análisis de la señal de audio puede definirse como el proceso de extracción de información relevante a partir de las muestras de la señal. En la mayoría de los casos, las señales de voz y música son captadas por equipos electrónicos para su posterior análisis, pero también son alteradas por señales externas como ecos, ruidos, etc., que dificultan su posterior análisis. En este sentido, es fundamental el desarrollo de algoritmos que preprocesen la señal para reducir al máximo las fuentes externas que la alteran. Este TFG se centra en soluciones basadas en Deep Learning (DL) para dos aplicaciones de audio: la cancelación del eco acústico en sistemas de teleconferencia y la detección de emociones en la voz de una persona. Para la cancelación del eco, se utilizarán algoritmos basados en Redes Generativas Adversariales Condicionales (Conditional Generative Adversarial Networks, cGAN), que han demostrado tener un mejor rendimiento en el campo de la mejora del habla que otros modelos de DL. En cuanto al problema de la detección de emociones, se explorarán técnicas híbridas basadas en redes neuronales convolucionales (Convolutional Neural Networks, CNN) y redes de memoria larga a corto plazo (Long Short-Term Memory , LSTM), así como nuevos modelos DL como los Transformers.	es_ES
dc.description.abstract	[EN] Audio signal analysis can be defined as the process of extracting relevant information from signal samples. In most cases, speech and music signals are captured by electronic equipment for further analysis, but they are also altered by external signals such as echoes, noise, etc., which hinder their further analysis. In this sense, it is essential to develop algorithms that preprocess the signal to reduce as much as possible the external sources that alter it. This TFG focuses on Deep Learning (DL) based solutions for two audio applications: acoustic echo cancellation in teleconferencing systems and emotion detection in a person's speech. For echo cancellation, algorithms based on conditional Generative Adversarial Networks (cGAN), which have been shown to perform better in the field of speech enhancement than other DL models, will be used. For the emotion detection problem, hybrid techniques based on Convolutional Neural Networks (CNN) and Long Short-Term Memory (LSTM) networks will be explored, as well as new DL models such as Transformers.	en_EN
dc.format.extent	59	es_ES
dc.language	Español	es_ES
dc.publisher	Universitat Politècnica de València	es_ES
dc.rights	Reserva de todos los derechos	es_ES
dc.subject	Cancelación de eco acústico	es_ES
dc.subject	Detección de emociones	es_ES
dc.subject	Aprendizaje profundo	es_ES
dc.subject	Acoustic echo cancellation	en_EN
dc.subject	Emotion detection	en_EN
dc.subject	Deep learning	en_EN
dc.subject.classification	TEORIA DE LA SEÑAL Y COMUNICACIONES	es_ES
dc.subject.other	Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación-Grau en Enginyeria de Tecnologies i Serveis de Telecomunicació	es_ES
dc.title	Análisis de audio mediante técnicas de aprendizaje profundo	es_ES
dc.title.alternative	Audio analysis using deep learning techniques	es_ES
dc.title.alternative	Anàlisi d'àudio mitjançant tècniques d'aprenentatge profund	es_ES
dc.type	Proyecto/Trabajo fin de carrera/grado	es_ES
dc.rights.accessRights	Abierto	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Departamento de Comunicaciones - Departament de Comunicacions	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros de Telecomunicación - Escola Tècnica Superior d'Enginyers de Telecomunicació	es_ES
dc.description.bibliographicCitation	Pastor Naranjo, F. (2022). Análisis de audio mediante técnicas de aprendizaje profundo. Universitat Politècnica de València. http://hdl.handle.net/10251/187795	es_ES
dc.description.accrualMethod	TFGM	es_ES
dc.relation.pasarela	TFGM\151066	es_ES

Este ítem aparece en la(s) siguiente(s) colección(ones)

ETSIT - Trabajos académicos [2408]
Escuela Técnica Superior de Ingenieros de Telecomunicación

Mostrar el registro sencillo del ítem

Análisis de audio mediante técnicas de aprendizaje profundo

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Análisis de audio mediante técnicas de aprendizaje profundo

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)