- -

Efectividad de las transformaciones léxicas y sintácticas en los sistemas de memoria de traducción: memoq

RiuNet: Institutional repository of the Polithecnic University of Valencia

Share/Send to

Cited by

Statistics

Efectividad de las transformaciones léxicas y sintácticas en los sistemas de memoria de traducción: memoq

Show simple item record

Files in this item

dc.contributor.advisor Carrió Pastor, Mª Luisa es_ES
dc.contributor.author Silvestre Baquero, Andrea es_ES
dc.date.accessioned 2017-10-27T12:46:03Z
dc.date.available 2017-10-27T12:46:03Z
dc.date.created 2017-09-29
dc.date.issued 2017-10-27 es_ES
dc.identifier.uri http://hdl.handle.net/10251/90174
dc.description.abstract The present work is framed within the studies of translation, specifically, as far as the computer assisted translation (TAO) is concerned. Within this field, our study is focused on the translation memories (MT), whose current exponents are Mitkov (2005) and Orasan (2015), both belonging to the Research Group on Computational Linguistics (RGCL) of the University of Wolverhampton. The main objective to carry out this work is based on the need to verify if the TMs are sufficiently functional to detect changes produced at the semantic and syntactic level and to really help the translator or if, on the contrary, to new approaches. Among the secondary objectives of the work, we can highlight: design a corpus that can be used to implement in other MT or even be used as an aid resource, create templates to examine other MT and implement the results obtained in a system applicable in other works related to the same line of research. Our work will consist of creating a parallel Spanish / English corpus with approximately 150 segments of a length between 5 and 25 words. The corpus has been compiled with authentic and real documents in both languages ¿¿(Spanish-English) with a legislative theme so that the lexicon is not very complicated and the sentences are not excessively long, and thus allow us to achieve the greatest number of transformations possible. The documents have been taken from the websites of the European Union and the United Nations, respectively. We have manually aligned the corpus so that we could have the sentences faced and extracted the 150 that we considered most appropriate for the experiment. Once we have the sentences, we have selected 10 semantic and syntactic rules to apply to sentences. The next step is to upload the original corpus to the translation tool, this MemoQ case, and later translate the transformed sentences to see statistically what coincidence we find with the original sentences. Our initial research hypothesis is that the coincidence percentage will be reduced after performing the transformations of the original sentences compiled in the MT. We expect that the results show the need for improved translation memories, since the statistics must show the semantic deficit that exists and, therefore, the need to implement the translation memories. This, in the long term, can mean an evolution in TM and therefore a greater foothold than the translators can use. In addition, it may also mean the need to introduce natural language processing (PLN) to obtain a substantial improvement of systems, for example the use of paraphrasing or parsing (grammar analysis). Finally, it is noteworthy to mention that although this study is very concrete, we hope that in the consequent it can be applied in other translation tools and in other linguistic combinations. It would even be possible to increase the corpus of research and to search for more varied topics that may have greater applicability. es_ES
dc.description.abstract El presente trabajo se encuentra enmarcado dentro de los estudios de traducción,concretamente, en lo relativo a la traducción asistida por ordenador (TAO). Dentro de este propio campo, nuestro estudio está enfocado hacia las memorias de traducción (MT), cuyos máximos exponentes en la actualidad son Mitkov (2005) y Orasan (2015), ambos pertenecientes al Grupo de Investigación de Lingüística Computacional (RGCL) de la Universidad de Wolverhampton. El objetivo principal para llevar a cabo este trabajo se basa en la necesidad de comprobar si las MT son suficientemente funcionales como para detectar cambios producidos a nivel semántico y sintáctico y servir realmente de ayuda al traductor o si por el contrario, hay que adecuar las MT a nuevos enfoques. Entre los objetivos secundarios del trabajo, podemos destacar: diseñar un corpus que pueda servir para implementarse en otras MT o incluso utilizarse como recurso de ayuda, crear plantillas para examinar otras MT e implementar los resultados obtenidos en un sistema aplicable en otros trabajos relacionados con la misma línea de investigación. Nuestro trabajo consistirá en crear un corpus paralelo español/inglés con aproximadamente 150 segmentos de una longitud entre 5 y 25 palabras. El corpus ha sido compilado con documentos auténticos y reales en ambos idiomas (español-inglés) con una temática de carácter legislativo para que el léxico no resultara muy complicado y las oraciones no fueran excesivamente largas, y así, permitirnos conseguir el mayor número de transformaciones posibles. Los documentos han sido extraídos de las páginas web de la Unión Europea y de las Naciones unidas, respectivamente. El corpus lo hemos alineado manualmente, para que pudiéramos tener las oraciones enfrentadas y hemos extraído las 150 que hemos considerado más apropiadas para el experimento. Una vez tenemos las oraciones, hemos seleccionado 10 reglas semánticas y sintácticas para aplicar a las oraciones. El paso siguiente es subir el corpus original a la herramienta de traducción, este caso MemoQ, y traducir posteriormente las oraciones transformadas para ver estadísticamente que coincidencia encontramos con las frases originales. Nuestra hipótesis de investigación de partida es que el porcentaje de coincidencia se verá reducido después de realizar las transformaciones de las oraciones originales compiladas en la MT. Esperamos que los resultados muestren la necesidad de mejora de las memorias de traducción, ya que las estadísticas deben mostrar el déficit semántico que existe y por tanto, la necesidad de implementar las memorias de traducción. Esto, a largo plazo, puede significar una evolución en las MT y por tanto un punto de apoyo mayor al que los traductores podrán recurrir. Además, también puede significar la necesidad de introducir el procesamiento del lenguaje natural (PLN) para obtener una mejora sustancial de los sistemas, por ejemplo el uso de paráfrasis o parsing (análisis gramatical). Por último, es destacable mencionar que aunque este estudio es muy concreto, esperamos que en lo consiguiente pueda ser aplicado en otras herramientas de traducción y en otras combinaciones lingüísticas. Incluso sería posible aumentar el corpus de investigación y buscar temáticas más variadas que puedan tener mayor aplicabilidad. es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject natural language processing es_ES
dc.subject Computer -assisted translation es_ES
dc.subject Translation memory es_ES
dc.subject Applied linguistics es_ES
dc.subject Lingüística aplicada; memoria de traducción; traducción asistida por ordenador; procesamiento del lenguaje natural. es_ES
dc.subject Lingüística aplicada es_ES
dc.subject Memoria de traducción es_ES
dc.subject Traducción asistida por ordenador es_ES
dc.subject Procesamiento del lenguaje natural es_ES
dc.subject.classification FILOLOGIA INGLESA es_ES
dc.subject.other Máster Universitario en Lenguas y Tecnología-Màster Universitari en Llengües i Tecnologia es_ES
dc.title Efectividad de las transformaciones léxicas y sintácticas en los sistemas de memoria de traducción: memoq es_ES
dc.type Tesis de máster es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Lingüística Aplicada - Departament de Lingüística Aplicada es_ES
dc.description.bibliographicCitation Silvestre Baquero, A. (2017). Efectividad de las transformaciones léxicas y sintácticas en los sistemas de memoria de traducción: memoq. http://hdl.handle.net/10251/90174 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\73114 es_ES


This item appears in the following Collection(s)

Show simple item record