- -

Tratamiento de los datos para un sistema de traducción automática adaptado a un dominio

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Tratamiento de los datos para un sistema de traducción automática adaptado a un dominio

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Pla Santamaría, Ferran es_ES
dc.contributor.author Beteta Francisco, Daniel es_ES
dc.coverage.spatial east=-0.2526160995296256; north=39.16153627173267; name=Calle Maestro Serrano, 7, 46400 Cullera, Valencia, Espanya es_ES
dc.date.accessioned 2022-09-13T14:58:13Z
dc.date.available 2022-09-13T14:58:13Z
dc.date.created 2022-07-14
dc.date.issued 2022-09-13 es_ES
dc.identifier.uri http://hdl.handle.net/10251/185931
dc.description.abstract [ES] La finalidad del presente trabajo es mostrar cuantitativamente el efecto positivo de una correcta limpieza, normalización y clasificación de los datos en la creación de motores de traducción. Para ello, por un lado, se realizará un preproceso de limpieza y normalización de los datos para la combinación de idiomas inglés-español. Por otro lado, se desarrollará un clasificador de la temática de los textos que nos ayude a mejorar la traducción en un dominio determinado. El objetivo es poder entrenar dos máquinas de traducción automática: la primera con datos limpios, normalizados y clasificados en el dominio ¿Health¿, y la segunda con datos ¿sucios¿, es decir, sin ninguno de los procedimientos anteriormente nombrados. Finalmente, se realizará una evaluación cuantitativa para determinar la calidad de la traducción, utilizando las medidas usuales para validar la aproximación propuesta en este trabajo de final de grado. es_ES
dc.description.abstract [EN] The purpose of this work is to show quantitatively the positive effect of a correct cleaning, normalization and classification of the data in the creation of translation engines. To do this, on the one hand, a data cleaning and normalization pre-process will be carried out for the English-Spanish language combination. On the other hand, a classifier of the theme of the texts will be developed to help us improve the translation in a given domain. The objective is to be able to train two automatic translation machines: the first with clean, normalized and classified data in the "Health" domain, and the second with "dirty" data, that is, without any of the aforementioned procedures. Finally, a quantitative evaluation will be carried out to determine the quality of the translation, using the usual measures to validate the approach proposed in this final degree project. es_ES
dc.description.abstract [CA] La finalitat del present treball és mostrar quantitativament l'efecte positiu d'una correcta neteja, normalització i classificació de les dades en la creació de motors de traducció. Per això, d'una banda, es farà un preprocés de neteja i normalització de les dades per a la combinació d'idiomes anglès-espanyol. D'altra banda, es desenvoluparà un classificador de la temàtica dels textos que ens ajudi a millorar-ne la traducció en un domini determinat. L'objectiu és poder entrenar dues màquines de traducció automàtica: la primera amb dades netes, normalitzades i classificades al domini “Health”, i la segona amb dades “brutes”, és a dir, sense cap dels procediments anteriorment anomenats. Finalment, es farà una avaluació quantitativa per determinar la qualitat de la traducció, utilitzant les mesures usuals per validar l'aproximació proposada en aquest treball de final de grau. es_ES
dc.format.extent 43 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Preproceso de limpieza y validación es_ES
dc.subject Clasificador de dominio es_ES
dc.subject Traducción automática neuronal. es_ES
dc.subject Cleaning and validation preproces es_ES
dc.subject Domain classifier es_ES
dc.subject Neural machine translation. es_ES
dc.subject Preprocés de neteja i validació es_ES
dc.subject Classificador de domini es_ES
dc.subject Traducció automàtica neuronal es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Grado en Ingeniería Informática-Grau en Enginyeria Informàtica es_ES
dc.title Tratamiento de los datos para un sistema de traducción automática adaptado a un dominio es_ES
dc.title.alternative Data processing for a machine translation system adapted to a domain es_ES
dc.title.alternative Tractament de les dades per a un sistema de traducció automàtica adaptat a un domini es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Beteta Francisco, D. (2022). Tratamiento de los datos para un sistema de traducción automática adaptado a un dominio. Universitat Politècnica de València. http://hdl.handle.net/10251/185931 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\150778 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem