Resumen:
|
[EN] High quality translations are in high demand these days. Although machine
translation offers acceptable performance, it is not sufficient in some cases and
human supervision is required. In order to ease the translation ...[+]
[EN] High quality translations are in high demand these days. Although machine
translation offers acceptable performance, it is not sufficient in some cases and
human supervision is required. In order to ease the translation task of the human,
machine translation systems take part in this process. When a sentence in the
source language needs to be translated, it is fed to the system which outputs a
hypothesis translation. The human then, corrects this hypothesis (also known as
post-editing) in order to obtain a high quality translation. Being able to transfer
the knowledge that a human translator exhibit when post-editing a translation to
the machine translation system is a desirable feature, as it has been proven that a
more accurate machine translation system helps to increase the efficiency of the
post-editing process.
Because the post-editing scenario requires an already trained system, online
learning techniques are suited for this task. In this work, three online learning
algorithms have been proposed and applied to a neural machine translation sys-
tem in a post-editing scenario. They rely on the Passive-Aggressive online learn-
ing approach in which the model is updated after every sample in order to fulfil
a correctness criterion while remembering previously learned information. The
goal is to adapt and refine an already trained system with new samples on-the-
fly as the post-editing process takes place (hence, the update time must be kept
under control).
Moreover, these new algorithms are compared with well-stablished online
learning variants of the stochastic gradient descent algorithm. Results show im-
provements on the translation quality of the system after applying these algo-
rithms, reducing human effort in the post-editing process.
[-]
[ES] La traducción de gran calidad está muy demandada en la actualidad. A pesar
de que la traducción automática ofrece unas prestaciones aceptables, en algunos
casos no es suficiente y es necesaria la supervisión humana. ...[+]
[ES] La traducción de gran calidad está muy demandada en la actualidad. A pesar
de que la traducción automática ofrece unas prestaciones aceptables, en algunos
casos no es suficiente y es necesaria la supervisión humana. Para facilitar la tarea
de traducción del humano, los sistemas de traducción automática toman parte en
este proceso. Cuando una nueva oración en el idioma origen necesita ser tradu-
cida, esta se introduce en el sistema, el cual obtiene como salida una hipótesis de
traducción. El humano entonces, corrige esta hipótesis (también conocido como
post-editar) para obtener una traducción de mayor calidad. Ser capaz de transfe-
rir el conocimiento que el humano exhibe cuando realiza la tarea de post-edición
al sistema de traducción automática es una característica deseable puesto que se
ha demostrado que un sistema de traducción mas preciso ayuda a aumentar la
eficiencia del proceso de post-edición.
Debido a que el proceso de post-edición requiere un sistema ya entrenado, las
técnicas de aprendizaje en línea son las adecuadas para esta tarea. En este traba-
jo, se proponen tres algoritmos de aprendizaje en línea aplicados a un traductor
automático neuronal en un escenario de post-edición. Estos algoritmos se basan
en la aproximación en línea Passive-Aggressive en la cual el modelo se actualiza
después de cada muestra con el objetivo de cumplir un criterio de corrección a
la vez que manteniendo información previa aprendida. El objetivo es adaptar y
refinar un sistema ya entrenado con nuevas muestras al vuelo mientras el pro-
ceso de post-edición se lleva a cabo (por tanto, el tiempo de actualización debe
mantenerse bajo control).
Además, estos algoritmos se comparan con otras bien conocidas variantes en
línea del algoritmo de descenso por gradiente estocástico. Los resultados mues-
tran una mejora en la calidad de las traducciones después de aplicar estos algo-
ritmos, reduciendo así el esfuerzo humano en el proceso de post-edición.
[-]
[CA] La traducció de gran qualitat es troba molt demanada en l’actualitat. Tot i
que la traducció automàtica oferix unes prestacions acceptables, en alguns casos
no és suficient i és necessària la supervisió humana. Per ...[+]
[CA] La traducció de gran qualitat es troba molt demanada en l’actualitat. Tot i
que la traducció automàtica oferix unes prestacions acceptables, en alguns casos
no és suficient i és necessària la supervisió humana. Per a facilitar la tasca de
traducció de l’humà, els sistemes de traducció automàtica prenen part en aquest
procés. Quan una nova oració en el llenguatge origen necessita ser traduïda,
esta s’introduïx en el sistema, el qual obté com a eixida una hipòtesi de traducció.
Llavors, l’humà corregix aquesta hipòtesi (també conegut com a post-editar) per a
obtindre una traducció de major qualitat. Ser capaços de transferir el coneixement
que l’ humà exhibix quan realitza la tasca de post-edició al sistema de traducció
automàtica és una característica desitjable ja que s’ha demostrat que un sistema
de traducció mes precís ajuda a augmentar l‘eficiència del procés de post-edició.
Pel fet que el procés de post-edició requerix un sistema ja entrenat, les tècniques
d’aprenentatge en línia són les adequades per aquesta tasca. En este treball,
es proposen tres algoritmes d’aprenentatge en línia aplicats a un traductor automàtic
neuronal en un escenari de post-edició. Estos algoritmes es basen en
l’aproximació en línia Passive-Aggressive en la qual el model s’actualitza després
de cada mostra amb l’objectiu de complir un criteri de correcció al mateix temps
que manté informació prèvia apresa. L’objectiu és adaptar i refinar un sistema ja
entrenat amb noves mostres al vol mentre el procés de post-edició es du a terme
(per tant, el temps d’actualització ha de mantenir-se controlat).
A més, estos algoritmes es comparen amb altres ben conegudes variants en
línia de l’algoritme de descens per gradient estocàstic. Els resultats mostren una
millora en la qualitat de les traduccions després d’aplicar estos algoritmes, reduint
així l’esforç humà en el procés de post-edició.
[-]
|