- -

Sistemas de síntesis de voz basados en redes neuronales para lenguas europeas

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Sistemas de síntesis de voz basados en redes neuronales para lenguas europeas

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Juan Císcar, Alfonso es_ES
dc.contributor.advisor Iranzo Sánchez, Javier es_ES
dc.contributor.advisor Pérez González de Martos, Alejandro Manuel es_ES
dc.contributor.author Iranzo Sánchez, Jorge es_ES
dc.coverage.spatial east=-0.347276; north=39.482502; name=Learning and Language Processing Group (MLLP) (DSIC) UPV FMM3+23 València, Espanya es_ES
dc.date.accessioned 2022-09-07T10:26:08Z
dc.date.available 2022-09-07T10:26:08Z
dc.date.created 2022-07-13
dc.date.issued 2022-09-07 es_ES
dc.identifier.uri http://hdl.handle.net/10251/185491
dc.description.abstract [ES] La síntesis de voz (TTS, del inglés Text-To-Speech) es una de las áreas más activas dentro de la inteligencia artificial, particularmente en el campo del aprendizaje automático. Recientemente, esta área ha sido el foco de atención por parte de importantes figuras tecnológicas como Google, Facebook, Microsoft, etc. debido a las mejoras de rendimiento obtenidas por esta tecnología gracias a la incorporación de redes neuronales artificiales. En este sentido, la nueva era de sistemas TTS basados en redes neuronales ha traído consigo sistemas de síntesis de voz de gran naturalidad que, en contraste con los sistemas tradicionales, no requieren de gran conocimiento experto en procesado de la señal y aspectos lingüísticos. En este trabajo se propone estudiar e implementar modelos avanzados de TTS en lenguas europeas y, en particular, en castellano y alemán. Para ello, se hará uso de datos, tecnología y experiencia del grupo MLLP del VRAIN, adquiridos en el marco de proyectos de investigación y transferencia tecnológica desarrollados en los últimos cinco años. es_ES
dc.description.abstract [EN] Text-To-Speech (TTS) is one of the most active areas within artificial intelligence, particularly in the field of machine learning. Recently, this area has been the focus of attention of important technological figures such as Google, Facebook, Microsoft, etc. due to the performance improvements obtained by this technology thanks to the incorporation of artificial neural networks. In this sense, the new era of TTS systems based on neural networks has brought with it highly natural speech synthesis systems that, in contrast to traditional systems, do not require great expertise in signal processing and linguistic aspects. In this work we propose to study and implement advanced TTS models in European languages and, in particular, in Spanish and German. For this purpose, we will make use of data, technology and experience of the MLLP group of the VRAIN, acquired in the framework of research and technology transfer projects developed in the last five years. es_ES
dc.description.abstract [CA] La síntesi de veu (TTS, de l’angles Text-To-Speech) és una dels àrees més actives dins de la intel·ligència artificial, particularment en el camp de l’aprenentatge automàtic. Recentment, aquesta àrea ha sigut el focus d’atenció per part d’importants figures tecnològiques com Google, Facebook, Microsoft, etc. a causa de les millores de rendiment obtingudes per aquesta tecnologia gràcies a la incorporació de xarxes neuronals artificials. En aquest sentit, la nova era de sistemes TTS basats en xarxes neuronals ha portat amb si sistemes de síntesis de veu de gran naturalitat que, en contrast amb els sistemes tradicionals, no requereixen de gran coneixement expert en processament del senyal i aspectes lingüístics. En aquest treball es proposa estudiar i implementar models avançats de TTS en llengües europees i, en particular, en castellà i alemany. Per a això, es farà ús de dades, tecnologia i experiència del grup MLLP del VRAIN, adquirits en el marc de projectes d’investigació i transferència tecnològica desenvolupats en els últims cinc anys. es_ES
dc.format.extent 52 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reconocimiento (by) es_ES
dc.subject Inteligencia artificial es_ES
dc.subject Aprendizaje automático es_ES
dc.subject Redes neuronales es_ES
dc.subject Síntesis de voz. es_ES
dc.subject Artificial intelligence es_ES
dc.subject Machine learning es_ES
dc.subject Neural networks es_ES
dc.subject Speech synthesis es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Grado en Ingeniería Informática-Grau en Enginyeria Informàtica es_ES
dc.title Sistemas de síntesis de voz basados en redes neuronales para lenguas europeas es_ES
dc.title.alternative Neural text-to-speech systems for European languages es_ES
dc.title.alternative Sistemes de síntesi de veu basats en xarxes neuronals per a llengües europees es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Iranzo Sánchez, J. (2022). Sistemas de síntesis de voz basados en redes neuronales para lenguas europeas. Universitat Politècnica de València. http://hdl.handle.net/10251/185491 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\148243 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem