Mostrar el registro sencillo del ítem
dc.contributor.advisor | Pla Santamaría, Ferran | es_ES |
dc.contributor.author | Beteta Francisco, Daniel | es_ES |
dc.coverage.spatial | east=-0.2526160995296256; north=39.16153627173267; name=Calle Maestro Serrano, 7, 46400 Cullera, Valencia, Espanya | es_ES |
dc.date.accessioned | 2022-09-13T14:58:13Z | |
dc.date.available | 2022-09-13T14:58:13Z | |
dc.date.created | 2022-07-14 | |
dc.date.issued | 2022-09-13 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/185931 | |
dc.description.abstract | [ES] La finalidad del presente trabajo es mostrar cuantitativamente el efecto positivo de una correcta limpieza, normalización y clasificación de los datos en la creación de motores de traducción. Para ello, por un lado, se realizará un preproceso de limpieza y normalización de los datos para la combinación de idiomas inglés-español. Por otro lado, se desarrollará un clasificador de la temática de los textos que nos ayude a mejorar la traducción en un dominio determinado. El objetivo es poder entrenar dos máquinas de traducción automática: la primera con datos limpios, normalizados y clasificados en el dominio ¿Health¿, y la segunda con datos ¿sucios¿, es decir, sin ninguno de los procedimientos anteriormente nombrados. Finalmente, se realizará una evaluación cuantitativa para determinar la calidad de la traducción, utilizando las medidas usuales para validar la aproximación propuesta en este trabajo de final de grado. | es_ES |
dc.description.abstract | [EN] The purpose of this work is to show quantitatively the positive effect of a correct cleaning, normalization and classification of the data in the creation of translation engines. To do this, on the one hand, a data cleaning and normalization pre-process will be carried out for the English-Spanish language combination. On the other hand, a classifier of the theme of the texts will be developed to help us improve the translation in a given domain. The objective is to be able to train two automatic translation machines: the first with clean, normalized and classified data in the "Health" domain, and the second with "dirty" data, that is, without any of the aforementioned procedures. Finally, a quantitative evaluation will be carried out to determine the quality of the translation, using the usual measures to validate the approach proposed in this final degree project. | es_ES |
dc.description.abstract | [CA] La finalitat del present treball és mostrar quantitativament l'efecte positiu d'una correcta neteja, normalització i classificació de les dades en la creació de motors de traducció. Per això, d'una banda, es farà un preprocés de neteja i normalització de les dades per a la combinació d'idiomes anglès-espanyol. D'altra banda, es desenvoluparà un classificador de la temàtica dels textos que ens ajudi a millorar-ne la traducció en un domini determinat. L'objectiu és poder entrenar dues màquines de traducció automàtica: la primera amb dades netes, normalitzades i classificades al domini “Health”, i la segona amb dades “brutes”, és a dir, sense cap dels procediments anteriorment anomenats. Finalment, es farà una avaluació quantitativa per determinar la qualitat de la traducció, utilitzant les mesures usuals per validar l'aproximació proposada en aquest treball de final de grau. | es_ES |
dc.format.extent | 43 | es_ES |
dc.language | Español | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reserva de todos los derechos | es_ES |
dc.subject | Preproceso de limpieza y validación | es_ES |
dc.subject | Clasificador de dominio | es_ES |
dc.subject | Traducción automática neuronal. | es_ES |
dc.subject | Cleaning and validation preproces | es_ES |
dc.subject | Domain classifier | es_ES |
dc.subject | Neural machine translation. | es_ES |
dc.subject | Preprocés de neteja i validació | es_ES |
dc.subject | Classificador de domini | es_ES |
dc.subject | Traducció automàtica neuronal | es_ES |
dc.subject.classification | LENGUAJES Y SISTEMAS INFORMATICOS | es_ES |
dc.subject.other | Grado en Ingeniería Informática-Grau en Enginyeria Informàtica | es_ES |
dc.title | Tratamiento de los datos para un sistema de traducción automática adaptado a un dominio | es_ES |
dc.title.alternative | Data processing for a machine translation system adapted to a domain | es_ES |
dc.title.alternative | Tractament de les dades per a un sistema de traducció automàtica adaptat a un domini | es_ES |
dc.type | Proyecto/Trabajo fin de carrera/grado | es_ES |
dc.rights.accessRights | Abierto | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica | es_ES |
dc.description.bibliographicCitation | Beteta Francisco, D. (2022). Tratamiento de los datos para un sistema de traducción automática adaptado a un dominio. Universitat Politècnica de València. http://hdl.handle.net/10251/185931 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\150778 | es_ES |