Traducción interactiva basada en segmentos usando grandes modelos de lenguaje

Gómez González, Sergio

RiuNet repositorio UPV
:
Docencia
:
Trabajos académicos
:
Servicio de alumnado - Trabajos académicos
:
Ver ítem

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Traducción interactiva basada en segmentos usando grandes modelos de lenguaje

Mostrar el registro sencillo del ítem

Ficheros en el ítem

Nombre: Gomez - Traduccion ...

Tamaño: 1.116Mb

Formato: PDF

Abrir

dc.contributor.advisor	Casacuberta Nolla, Francisco	es_ES
dc.contributor.advisor	Domingo Ballester, Miguel	es_ES
dc.contributor.author	Gómez González, Sergio	es_ES
dc.date.accessioned	2024-09-09T12:45:20Z
dc.date.available	2024-09-09T12:45:20Z
dc.date.created	2024-07-23
dc.date.issued	2024-09-09	es_ES
dc.identifier.uri	http://hdl.handle.net/10251/207775
dc.description.abstract	[ES] Hoy en día las máquinas no son capaces de ofrecer traducciones de suficiente calidad en muchos ámbitos por sí mismas. Sin embargo, el tiempo que emplean en obtener dichas traducciones es mucho menor que el que necesitaría un traductor humano. La traducción automática interactiva surge como un paradigma que combina la iniciativa de la máquina y la supervisión de un humano experto. En concreto, en un sistema de traducción interactiva basado en segmentos el procedimiento es el siguiente: primero, el ordenador ofrece una traducción preliminar, después, el traductor humano verifica qué partes de la traducción son correctas e introduce algunos (pocos) cambios. Con la nueva información provista por el humano, el ordenador debe ser capaz de elaborar una traducción de mejor calidad. Tras varias iteraciones de este procedimiento se conseguirá una traducción de buena calidad (debido a la supervisión humana) en un tiempo menor del que emplearía un traductor humano (gracias al apoyo de la máquina). El auge de los grandes modelos de lenguaje y las posibilidades que nos ofrecen invitan a introducirlos también en este área. En este trabajo se seleccionarán los modelos que puedan ser más apropiados para utilizarlos en un sistema de traducción interactiva basado en segmentos. Adicionalmente habrán de tenerse en cuenta las restricciones de recursos. Probablemente habrá de hacerse un fine-tuning de dichos modelos y las maquinas disponibles deberán ser capaces de realizar dicho proceso. Para evaluar las prestaciones del sistema a desarrollar se utilizará una porción del dataset Europarl. Concretamente se evaluarán las traducciones entre los pares de lenguas francés-inglés, alemán-inglés y español-inglés. Para cada dirección de traducción se realizará un fine-tuning de cada modelo, se adaptará la generación de texto a una generación en haz restringida y se realizará una simulación de interacción con un traductor humano. Como métricas de evaluación se usarán tanto la puntuación BLEU de las traducciones obtenidas sin supervisión humana, como la tasa de error de palabra (WSR) y la tasa de movimientos de ratón (MAR) de la simulación.	es_ES
dc.description.abstract	[EN] Today machines are not capable of offering translations of sufficient quality in many applications. However, the time they spend obtaining these translations is much less than what a human translator would need. Interactive machine translation emerges as a paradigm that combines the initiative of the machine and the supervision of an expert human. Specifically, in a segment-based interactive translation system the procedure is as follows: first, the computer offers a preliminary translation, then the human translator verifies which parts of the translation are correct and introduces some (few) changes. With the new information provided by the human, the computer should be able to produce a better quality translation. After several iterations of this procedure, a good quality translation will be achieved (due to human supervision) in less time than a human translator would use (thanks to the support of the machine). The rise of large language models and the possibilities they offer us invite us to also introduce them in this area. In this work, the models that may be most appropriate for use in an interactive translation system based on segments will be selected. Additionally, resource restrictions must be taken into account. Probably fine-tuning of these models will have to be done and the available machines must be capable of carrying out this process. To evaluate the performance of the system to be developed, a portion of the Europarl dataset will be used. Specifically, translations between the French-English, German-English and Spanish-English language pairs will be evaluated. For each translation direction, a fine-tuning of each model will be carried out, the text generation will be adapted to a restricted beam generation and a simulation of interaction with a human translator will be carried out. Both the BLEU score of the translations obtained without human supervision, as well as the word error rate (WSR) and the mouse movement rate (MAR) of the simulation will be used as evaluation metrics.	es_ES
dc.format.extent	56	es_ES
dc.language	Español	es_ES
dc.publisher	Universitat Politècnica de València	es_ES
dc.rights	Reserva de todos los derechos	es_ES
dc.subject	Inteligencia artificial	es_ES
dc.subject	Traducción automática	es_ES
dc.subject	Traducción interactiva	es_ES
dc.subject	Grandes modelos de lenguaje	es_ES
dc.subject	Artificial intelligence	es_ES
dc.subject	Machine translation	es_ES
dc.subject	Interactive machine translation	es_ES
dc.subject	Large language models	es_ES
dc.subject.other	Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·ligència Artificial, Reconeixement de Formes i Imatge Digital	es_ES
dc.title	Traducción interactiva basada en segmentos usando grandes modelos de lenguaje	es_ES
dc.title.alternative	Segment-based interactive machine translation using large language models	es_ES
dc.title.alternative	Traducció interactiva basada en segments utilitzant grans models de llenguatge	es_ES
dc.type	Tesis de máster	es_ES
dc.rights.accessRights	Abierto	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació	es_ES
dc.description.bibliographicCitation	Gómez González, S. (2024). Traducción interactiva basada en segmentos usando grandes modelos de lenguaje. Universitat Politècnica de València. http://hdl.handle.net/10251/207775	es_ES
dc.description.accrualMethod	TFGM	es_ES
dc.relation.pasarela	TFGM\162306	es_ES

Este ítem aparece en la(s) siguiente(s) colección(ones)

Servicio de alumnado - Trabajos académicos [7391]

Mostrar el registro sencillo del ítem

Traducción interactiva basada en segmentos usando grandes modelos de lenguaje

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Traducción interactiva basada en segmentos usando grandes modelos de lenguaje

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)