- -

A comparative study of Neural Machine Translation frameworks for the automatic translation of open data resources

RiuNet: Institutional repository of the Polithecnic University of Valencia

Share/Send to

Cited by

Statistics

A comparative study of Neural Machine Translation frameworks for the automatic translation of open data resources

Show simple item record

Files in this item

dc.contributor.advisor Civera Saiz, Jorge es_ES
dc.contributor.advisor Juan Císcar, Alfonso es_ES
dc.contributor.advisor Giménez Pastor, Adrián es_ES
dc.contributor.author Iranzo Sánchez, Javier es_ES
dc.date.accessioned 2018-09-11T10:56:46Z
dc.date.available 2018-09-11T10:56:46Z
dc.date.created 2018-07-12
dc.date.issued 2018-09-11 es_ES
dc.identifier.uri http://hdl.handle.net/10251/107001
dc.description.abstract [EN] Machine Translation (MT) is one of the most active areas in Artificial Intelligence, particularly in Pattern Recognition. MT has recently received a great deal of attention by key technology players such as Google, Facebook, Microsoft, etc. due to the performance boost experienced by MT technology thanks to the incorporation of artificial neural networks that constitute the backbone of deep learning. In this respect, the new era of Neural-based MT (NMT) systems has brought about accurate enough automatic translation to ease human communication in a multilingual society. In this work, conventional theoretical models behind NMT are introduced together with the required background to provide a comprehensive view. In addition, state-of-the-art NMT systems are built on top of two well-known frameworks for machine learning, Tensorflow and MXNet. These systems are trained using the data from two case studies. The first case is the Workshop on Machine Translation for the translation of broadcast news and European Parliament debates from German into English. The second case is poliMedia, UPV’s main repository for educational video lectures, which in this work is used for translation from Spanish into English. The developed systems are evaluated and compared with respect to their quality and efficiency, before being deployed in a real-world production environment such as poliMedia. es_ES
dc.description.abstract [ES] La traducción automática (MT) es una de les áreas más activas dentro de la inteligencia artificial, particularmente en el campo del reconocimiento de formas. Recientemente, esta área ha sido el foco de atención por parte de importantes figuras tecnológicas como Google, Facebook, Microsoft, etc. debido a las mejoras de rendimiento obtenidas por esta tecnología gracias a la incorporación de redes neuronales artificiales, que constituyen la espina dorsal del aprendizaje profundo. En este sentido, la nueva era de sistemas MT basados en redes neuronales (NMT) ha traído consigo traducciones automáticas lo suficientemente precisas como para facilitar la comunicación humana en una sociedad multilingüe. En este trabajo se explican los modelos teóricos que forman la base de NMT, así como los conocimientos previos necesarios para poder proporcionar una visión completa del área. Además, se desarrollan sistemas NMT de última generación utilizando dos conocidos frameworks de aprendizaje automático, Tensorflow y MXNet. Estos sistemas se entrenan con los datos de dos casos de estudio. El primero es el Workshop on Machine Translation para la traducción de comunicados de noticias y debates del Parlamento Europeo de alemán a inglés. El segundo caso es poliMedia, el repositorio principal de la UPV de videos educativos, que en este trabajo se usa para la traducción de español a inglés. Los sistemas desarrollados se evalúan y comparan con respecto a su calidad y eficiencia, antes de ser desplegados en un entorno de producción real como poliMedia. es_ES
dc.description.abstract [CA] La traducció automàtica (MT) és una de les àrees més actives dins de la intel·ligència artificial, particularment en el camp del reconeixement de formes. Recentment, aquesta àrea ha estat el focus d’atenció d’importants figures tecnològiques com Google, Facebook, Microsoft, etc. a causa de les millores de rendiment aconseguides per aquesta tecnologia gràcies a la incorporació de xarxes neuronals artificials, que formen l’espina dorsal de l’aprenentatge profund. En aquest sentit, la nova era de sistemes MT basats en xarxes neuronals (NMT) ha comportat traduccions automàtiques suficientment precises per facilitar la comunicació humana en una societat multilingüe. En aquest treball s’expliquen els models teòrics que formen la base de NMT, així com els coneixements previs necessaris per proporcionar una visió completa de l’àrea. A més a més, es desenvolupen sistemes NMT d’última generació utilitzant dos coneguts frameworks d’aprenentatge automàtic, Tensorflow i MXNet. Aquests sistemes s’entrenen amb les dades de dos cassos d’estudi. El primer és el Workshop on Machine Translation per a la traducció de comunicats de notícies y debat del Parlament Europeu d’alemany a anglés. El segon cas és poliMedia, el repositori principal de la UPV de vídeos educatius, que en aquest treball s’utilitzen per a la traducció d’espanyol a anglés. Els sistemes desenvolupats s’avaluen i es comparen pel que fa a la seua qualitat i eficiència, abans de ser desplegats en un entorn de producció real com poliMedia. es_ES
dc.format.extent 68 es_ES
dc.language Inglés es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Pattern recognition es_ES
dc.subject Machine learning es_ES
dc.subject Machine translation es_ES
dc.subject Deep learning es_ES
dc.subject Comparison es_ES
dc.subject Reconocimiento de formas es_ES
dc.subject Aprendizaje automático es_ES
dc.subject Traducción automática es_ES
dc.subject Aprendizaje profundo es_ES
dc.subject Comparación es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Grado en Ingeniería Informática-Grau en Enginyeria Informàtica es_ES
dc.title A comparative study of Neural Machine Translation frameworks for the automatic translation of open data resources es_ES
dc.title.alternative Estudio comparativo de marcos de traducción automática neuronal para la traducción de recursos de datos abiertos es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Iranzo Sánchez, J. (2018). A comparative study of Neural Machine Translation frameworks for the automatic translation of open data resources. http://hdl.handle.net/10251/107001 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\87967 es_ES


This item appears in the following Collection(s)

Show simple item record