Resumen:
|
[ES] Los modelos existentes de traducción neuronal, en ocasiones, no capturan el contexto y las complejidades lingüísticas del lenguaje produciendo traducciones imprecisas o poco naturales. Además, su capacidad para adaptarse ...[+]
[ES] Los modelos existentes de traducción neuronal, en ocasiones, no capturan el contexto y las complejidades lingüísticas del lenguaje produciendo traducciones imprecisas o poco naturales. Además, su capacidad para adaptarse dinámicamente a nuevos datos y contextos puede ser limitada, lo que requiere soluciones que permitan una mayor flexibilidad y eficacia en la traducción de textos en diferentes idiomas y áreas temáticas. El objetivo de este trabajo es mejorar la precisión y adaptabilidad de los sistemas de traducción automática en entornos multilingües y en constante cambio, especialmente en la fase de post edición, utilizando Generación Aumentada por Recuperación (RAG). RAG permite refinar los datos de entrada y mejorar la contextualización de las traducciones durante la post edición.
La validación del experimento propuesto se lleva a cabo utilizando conjuntos de datos multilingües y multitemáticos que abarcan una gran variedad de contextos lingüísticos y culturales. Se emplean métricas estándar de evaluación de traducción automática, como el BLEU (Bilingual Evaluation Understudy), para medir la calidad y fluidez de las traducciones generadas. También se utilizan sets de datos de machine translation para realizar comparaciones. Además, se realizan evaluaciones cualitativas mediante la participación de evaluadores humanos para validar la naturalidad y precisión de las traducciones en diferentes contextos de uso.
[-]
[EN] Existing neural translation models sometimes fail to capture the context and linguistic complexities of language, resulting in inaccurate or unnatural translations. Moreover, their ability to dynamically adapt to new ...[+]
[EN] Existing neural translation models sometimes fail to capture the context and linguistic complexities of language, resulting in inaccurate or unnatural translations. Moreover, their ability to dynamically adapt to new data and contexts can be limited, requiring solutions that allow for greater flexibility and efficiency in translating texts across different languages and thematic areas. The goal of this work is to improve the accuracy and adaptability of machine translation systems in multilingual and constantly changing environments, especially in the post-editing phase, using Retrieval-Augmented Generation (RAG). RAG allows for refining input data and improving the contextualization of translations during post-editing.
The validation of the proposed experiment is carried out using multilingual and multi-thematic datasets that cover a wide variety of linguistic and cultural contexts. Standard automatic translation evaluation metrics, such as BLEU (Bilingual Evaluation Understudy), are used to measure the quality and fluency of the generated translations. Machine translation datasets are also used for comparisons. Additionally, qualitative evaluations are conducted with the participation of human evaluators to validate the naturalness and accuracy of the translations in different usage contexts.
[-]
|