Resumen:
|
[ES] La traducción automática (MT) es un área de investigación sobre el desarrollo de sistemas que traducen textos de manera automática. Actualmente, la mayoría de sistemas de MT utilizan redes neuronales en lo que se ...[+]
[ES] La traducción automática (MT) es un área de investigación sobre el desarrollo de sistemas que traducen textos de manera automática. Actualmente, la mayoría de sistemas de MT utilizan redes neuronales en lo que se conoce como traducción automática neuronal (NMT). Avances recientes en NMT han conseguido mejoras sin precedentes en calidad de la traducción. Estos avances permiten el uso directo de las traducciones, ya que su calidad es lo suficientemente alta como para poder utilizarse directamente sin supervisión humana. En este proyecto se describen los conocimientos teóricos y modelos que forman la base de los sistemas NMT modernos.
En este trabajo, se han desarrollado sistemas NMT para los pares de idiomas inglés-alemán, inglés-español, inglés-francés, inglés-italiano, alemán-francés y español-portugués. Estos pares de idiomas son especialmente relevantes para el proyecto X5gon, un proyecto H2020 para crear una red global de repositorios de contenidos educativos en abierto (OER). La integración de los sistemas desarrollados en los repositorios del proyecto X5gon (incluyendo UPV[media], el repositorio institucional de vídeos educativos de la UPV), así como la evaluación de su calidad y eficiencia, se describe de manera detallada.
Se presta especial énfasis al caso de uso de proveer traducciones en tiempo real, que permite la subtitulación multilingüe en tiempo real de vídeos educativos.
[-]
[EN] Machine Translation (MT) is a research area on the development of systems to translate text automatically. Currently, most MT systems use neural networks in what is known as Neural Machine Translation (NMT). Recent ...[+]
[EN] Machine Translation (MT) is a research area on the development of systems to translate text automatically. Currently, most MT systems use neural networks in what is known as Neural Machine Translation (NMT). Recent advances in NMT have achieved unprecedented improvements in translation quality. These advances allow the direct use of translations since the quality is high enough that it does not require human supervision. This project describes the theoretical background and models that form the basis of modern NMT systems.
For this work, different NMT systems have been developed for the English-German, English-Spanish, English-French, English-Italian, German-French and Spanish-Portuguese language pairs. These language pairs are specially relevant for the X5gon project, an H2020 project to create a global network of Open Educational Resources (OER) repositories. The integration of the developed systems into the X5gon's project repositories (including UPV[media], UPV's repository for educational video lectures), as well as their efficiency and quality evaluations, is described in detail.
Special emphasis is given to the use case of providing on-line translations, which allows live multilingual subtitling of video lectures.
[-]
|