Resumen:
|
[ES] Los traductores neuronal constituyen el estado del arte en traducción automática. Sin embargo son necesarios grandes corpus bilingües para el entrenamiento de estos traductores neuronales. Esto supone un gran ...[+]
[ES] Los traductores neuronal constituyen el estado del arte en traducción automática. Sin embargo son necesarios grandes corpus bilingües para el entrenamiento de estos traductores neuronales. Esto supone un gran problema cuando estos recursos son escasos para algún par de lenguas. Una vía para atacar este problema es la traducción multilingüe que trata de la construcción de un traductor de una lengua a varias, de varias a una o de varias a varias lenguas. En este caso si las lenguas destino, por ejemplo, son similares y una de ellas posee suficientes datos paralelos y otra no, el entrenamiento de modelos para la primera puede ayudar a conseguir modelos aceptables para la segunda. En este trabajo se pretende estudiar técnicas que permitan la construcción de estos modelos multilingües Para ello se realizará una simulación con corpus bilingües existentes.
[-]
[EN] Neural translators are the state of the art in machine translation. However, large bilingual corpus are necessary for the training of these neural translators. This is a sever problem when these resources are scarce ...[+]
[EN] Neural translators are the state of the art in machine translation. However, large bilingual corpus are necessary for the training of these neural translators. This is a sever problem when these resources are scarce for a couple of languages. One way to afford this problem is multilingual translation, which deals with the construction of a translator from one language to several, from several to one or from several to several languages. In this case, if the target languages, for example, are similar and one of them has enough parallel data and the other does not, training models for the first can help to achieve acceptable models for the second. The goal of this work is to study techniques that allow the construction of these multilingual models. For this, a simulation will be carried out with existing bilingual corpus.
[-]
[CA] Els sistemes clàssics de traducció automàtica estan basat en l’entrenament de
parells de llengües bilingües. Un model és dissenyat i entrenat per a traduir d’una
llengua font a una llengua destinació. En els últims ...[+]
[CA] Els sistemes clàssics de traducció automàtica estan basat en l’entrenament de
parells de llengües bilingües. Un model és dissenyat i entrenat per a traduir d’una
llengua font a una llengua destinació. En els últims anys, s’han anat desenvolupant
noves aproximacions que intenten millorar la qualitat de la traducció amb l’ajuda de
dues o més llengües en un mateix model. En aquest escenari una llengua és traduïda
a dues o més llengües, moltes llengües poden ser traduïdes a una llengua, o moltes
llengües poden ser traduïdes a moltes llengües. Aquesta aproximació és prometedora, diversos estudis han demostrat que utilitzar models multilingües millora la
traducció d’una llengua, no obstant això, aquesta aproximació comporta una quantitat no menor de reptes depenent del disseny del model de traducció.
En aquest treball es presenta l’entrenament de dos tipus d’aproximacions dins
dels models de traducció multilingüe en NMT-keras. La traducció multilingüe amb
paràmetres totalment compartits i la traducció automàtica multilingüe amb paràmetres controladament compartits. Ambdós aproximacions utilitzen xarxes neuronals sobre la clàssica arquitectura de codificador, descodificador, a més d’un model
d’atenció. D’altra banda, per a aconseguir construir i entrenar un model multilingüe amb paràmetres controladament compartits en NMT-Keras, es va modificar el
toolkit creant i assignant un descodificador per cada llengua objectiu.
Anàlogament, amb un corpus reduït i per cada aproximació multilingüe i per cada línia base per llengua, es proven diferents configuracions de models de traducció
automàtica, amb la finalitat de trobar la millor configuració, la qual serà entrenada
amb la totalitat de les dades.
Finalment s’exposen els resultats de cada aproximació, incloent les línies bases.
Es comparen els resultats entre les aproximacions exposades i amb treballs publicats
en la literatura.
[-]
|