- -

Traducción interactiva basada en segmentos usando grandes modelos de lenguaje

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Traducción interactiva basada en segmentos usando grandes modelos de lenguaje

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Casacuberta Nolla, Francisco es_ES
dc.contributor.advisor Domingo Ballester, Miguel es_ES
dc.contributor.author Gómez González, Sergio es_ES
dc.date.accessioned 2024-09-09T12:45:20Z
dc.date.available 2024-09-09T12:45:20Z
dc.date.created 2024-07-23
dc.date.issued 2024-09-09 es_ES
dc.identifier.uri http://hdl.handle.net/10251/207775
dc.description.abstract [ES] Hoy en día las máquinas no son capaces de ofrecer traducciones de suficiente calidad en muchos ámbitos por sí mismas. Sin embargo, el tiempo que emplean en obtener dichas traducciones es mucho menor que el que necesitaría un traductor humano. La traducción automática interactiva surge como un paradigma que combina la iniciativa de la máquina y la supervisión de un humano experto. En concreto, en un sistema de traducción interactiva basado en segmentos el procedimiento es el siguiente: primero, el ordenador ofrece una traducción preliminar, después, el traductor humano verifica qué partes de la traducción son correctas e introduce algunos (pocos) cambios. Con la nueva información provista por el humano, el ordenador debe ser capaz de elaborar una traducción de mejor calidad. Tras varias iteraciones de este procedimiento se conseguirá una traducción de buena calidad (debido a la supervisión humana) en un tiempo menor del que emplearía un traductor humano (gracias al apoyo de la máquina). El auge de los grandes modelos de lenguaje y las posibilidades que nos ofrecen invitan a introducirlos también en este área. En este trabajo se seleccionarán los modelos que puedan ser más apropiados para utilizarlos en un sistema de traducción interactiva basado en segmentos. Adicionalmente habrán de tenerse en cuenta las restricciones de recursos. Probablemente habrá de hacerse un fine-tuning de dichos modelos y las maquinas disponibles deberán ser capaces de realizar dicho proceso. Para evaluar las prestaciones del sistema a desarrollar se utilizará una porción del dataset Europarl. Concretamente se evaluarán las traducciones entre los pares de lenguas francés-inglés, alemán-inglés y español-inglés. Para cada dirección de traducción se realizará un fine-tuning de cada modelo, se adaptará la generación de texto a una generación en haz restringida y se realizará una simulación de interacción con un traductor humano. Como métricas de evaluación se usarán tanto la puntuación BLEU de las traducciones obtenidas sin supervisión humana, como la tasa de error de palabra (WSR) y la tasa de movimientos de ratón (MAR) de la simulación. es_ES
dc.description.abstract [EN] Today machines are not capable of offering translations of sufficient quality in many applications. However, the time they spend obtaining these translations is much less than what a human translator would need. Interactive machine translation emerges as a paradigm that combines the initiative of the machine and the supervision of an expert human. Specifically, in a segment-based interactive translation system the procedure is as follows: first, the computer offers a preliminary translation, then the human translator verifies which parts of the translation are correct and introduces some (few) changes. With the new information provided by the human, the computer should be able to produce a better quality translation. After several iterations of this procedure, a good quality translation will be achieved (due to human supervision) in less time than a human translator would use (thanks to the support of the machine). The rise of large language models and the possibilities they offer us invite us to also introduce them in this area. In this work, the models that may be most appropriate for use in an interactive translation system based on segments will be selected. Additionally, resource restrictions must be taken into account. Probably fine-tuning of these models will have to be done and the available machines must be capable of carrying out this process. To evaluate the performance of the system to be developed, a portion of the Europarl dataset will be used. Specifically, translations between the French-English, German-English and Spanish-English language pairs will be evaluated. For each translation direction, a fine-tuning of each model will be carried out, the text generation will be adapted to a restricted beam generation and a simulation of interaction with a human translator will be carried out. Both the BLEU score of the translations obtained without human supervision, as well as the word error rate (WSR) and the mouse movement rate (MAR) of the simulation will be used as evaluation metrics. es_ES
dc.format.extent 56 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Inteligencia artificial es_ES
dc.subject Traducción automática es_ES
dc.subject Traducción interactiva es_ES
dc.subject Grandes modelos de lenguaje es_ES
dc.subject Artificial intelligence es_ES
dc.subject Machine translation es_ES
dc.subject Interactive machine translation es_ES
dc.subject Large language models es_ES
dc.subject.other Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·ligència Artificial, Reconeixement de Formes i Imatge Digital es_ES
dc.title Traducción interactiva basada en segmentos usando grandes modelos de lenguaje es_ES
dc.title.alternative Segment-based interactive machine translation using large language models es_ES
dc.title.alternative Traducció interactiva basada en segments utilitzant grans models de llenguatge es_ES
dc.type Tesis de máster es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation Gómez González, S. (2024). Traducción interactiva basada en segmentos usando grandes modelos de lenguaje. Universitat Politècnica de València. http://hdl.handle.net/10251/207775 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\162306 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem