Tratamiento de los datos para un sistema de traducción automática adaptado a un dominio

Beteta Francisco, Daniel

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Tratamiento de los datos para un sistema de traducción automática adaptado a un dominio

Mostrar el registro sencillo del ítem

Ficheros en el ítem

Nombre: Beteta - Tratamiento ...

Tamaño: 1.105Mb

Formato: PDF

Abrir

dc.contributor.advisor	Pla Santamaría, Ferran	es_ES
dc.contributor.author	Beteta Francisco, Daniel	es_ES
dc.coverage.spatial	east=-0.2526160995296256; north=39.16153627173267; name=Calle Maestro Serrano, 7, 46400 Cullera, Valencia, Espanya	es_ES
dc.date.accessioned	2022-09-13T14:58:13Z
dc.date.available	2022-09-13T14:58:13Z
dc.date.created	2022-07-14
dc.date.issued	2022-09-13	es_ES
dc.identifier.uri	http://hdl.handle.net/10251/185931
dc.description.abstract	[ES] La finalidad del presente trabajo es mostrar cuantitativamente el efecto positivo de una correcta limpieza, normalización y clasificación de los datos en la creación de motores de traducción. Para ello, por un lado, se realizará un preproceso de limpieza y normalización de los datos para la combinación de idiomas inglés-español. Por otro lado, se desarrollará un clasificador de la temática de los textos que nos ayude a mejorar la traducción en un dominio determinado. El objetivo es poder entrenar dos máquinas de traducción automática: la primera con datos limpios, normalizados y clasificados en el dominio ¿Health¿, y la segunda con datos ¿sucios¿, es decir, sin ninguno de los procedimientos anteriormente nombrados. Finalmente, se realizará una evaluación cuantitativa para determinar la calidad de la traducción, utilizando las medidas usuales para validar la aproximación propuesta en este trabajo de final de grado.	es_ES
dc.description.abstract	[EN] The purpose of this work is to show quantitatively the positive effect of a correct cleaning, normalization and classification of the data in the creation of translation engines. To do this, on the one hand, a data cleaning and normalization pre-process will be carried out for the English-Spanish language combination. On the other hand, a classifier of the theme of the texts will be developed to help us improve the translation in a given domain. The objective is to be able to train two automatic translation machines: the first with clean, normalized and classified data in the "Health" domain, and the second with "dirty" data, that is, without any of the aforementioned procedures. Finally, a quantitative evaluation will be carried out to determine the quality of the translation, using the usual measures to validate the approach proposed in this final degree project.	es_ES
dc.description.abstract	[CA] La finalitat del present treball és mostrar quantitativament l'efecte positiu d'una correcta neteja, normalització i classificació de les dades en la creació de motors de traducció. Per això, d'una banda, es farà un preprocés de neteja i normalització de les dades per a la combinació d'idiomes anglès-espanyol. D'altra banda, es desenvoluparà un classificador de la temàtica dels textos que ens ajudi a millorar-ne la traducció en un domini determinat. L'objectiu és poder entrenar dues màquines de traducció automàtica: la primera amb dades netes, normalitzades i classificades al domini “Health”, i la segona amb dades “brutes”, és a dir, sense cap dels procediments anteriorment anomenats. Finalment, es farà una avaluació quantitativa per determinar la qualitat de la traducció, utilitzant les mesures usuals per validar l'aproximació proposada en aquest treball de final de grau.	es_ES
dc.format.extent	43	es_ES
dc.language	Español	es_ES
dc.publisher	Universitat Politècnica de València	es_ES
dc.rights	Reserva de todos los derechos	es_ES
dc.subject	Preproceso de limpieza y validación	es_ES
dc.subject	Clasificador de dominio	es_ES
dc.subject	Traducción automática neuronal.	es_ES
dc.subject	Cleaning and validation preproces	es_ES
dc.subject	Domain classifier	es_ES
dc.subject	Neural machine translation.	es_ES
dc.subject	Preprocés de neteja i validació	es_ES
dc.subject	Classificador de domini	es_ES
dc.subject	Traducció automàtica neuronal	es_ES
dc.subject.classification	LENGUAJES Y SISTEMAS INFORMATICOS	es_ES
dc.subject.other	Grado en Ingeniería Informática-Grau en Enginyeria Informàtica	es_ES
dc.title	Tratamiento de los datos para un sistema de traducción automática adaptado a un dominio	es_ES
dc.title.alternative	Data processing for a machine translation system adapted to a domain	es_ES
dc.title.alternative	Tractament de les dades per a un sistema de traducció automàtica adaptat a un domini	es_ES
dc.type	Proyecto/Trabajo fin de carrera/grado	es_ES
dc.rights.accessRights	Abierto	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica	es_ES
dc.description.bibliographicCitation	Beteta Francisco, D. (2022). Tratamiento de los datos para un sistema de traducción automática adaptado a un dominio. Universitat Politècnica de València. http://hdl.handle.net/10251/185931	es_ES
dc.description.accrualMethod	TFGM	es_ES
dc.relation.pasarela	TFGM\150778	es_ES

Este ítem aparece en la(s) siguiente(s) colección(ones)

ETSINF - Trabajos académicos [5160]
Escola Tècnica Superior d'Enginyeria Informàtica

Mostrar el registro sencillo del ítem

Tratamiento de los datos para un sistema de traducción automática adaptado a un dominio

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Tratamiento de los datos para un sistema de traducción automática adaptado a un dominio

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)