- -

Enhancing Textual Datasets with Large Language Model-based Data Augmentation for Neural Machine Translation

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Enhancing Textual Datasets with Large Language Model-based Data Augmentation for Neural Machine Translation

Mostrar el registro completo del ítem

Puchol Salort, B. (2023). Enhancing Textual Datasets with Large Language Model-based Data Augmentation for Neural Machine Translation. Universitat Politècnica de València. http://hdl.handle.net/10251/198092

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10251/198092

Ficheros en el ítem

Metadatos del ítem

Título: Enhancing Textual Datasets with Large Language Model-based Data Augmentation for Neural Machine Translation
Otro titulo: Millora de conjunts de dades textuals amb dades artificials a partir de grans models de llenguatge per a la traducció automàtica neuronal
Mejora de conjuntos de datos textuales con datos artificiales a partir de grandes modelos de lenguaje para la traducción automática neuronal
Autor: Puchol Salort, Blai
Director(es): Casacuberta Nolla, Francisco Chatzitheodorou, Konstantinos
Entidad UPV: Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació
Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica
Fecha acto/lectura:
2023-09-20
Fecha difusión:
Resumen:
[EN] This work proposes a parallel textual data augmentation framework for low-resource languages or low-resource domains using different technologies like Masked Language Models, Large Language Models, and Natural Language ...[+]


[CA] En aquest TFG, proposem un sistema d’augment de dades textuals paral·leles per a llenguatges o dominis de baixos recursos utilitzant diferents tecnologies com ara models de llenguatge emmascarat, grans models ...[+]


[ES] En este TFG, proponemos un sistema de aumento de datos textuales paralelos para lenguajes o dominios de bajos recursos utilizando diferentes tecnologías como modelos de lenguaje enmascarado, grandes modelos de lenguaje ...[+]
Palabras clave: Data augmentation , Large language models , Natural language processing , Machine translation , Text generation , Aumento de datos , Grandes modelos de lenguaje , Procesamiento de lenguaje natural , Traducción automática , Generación de texto
Derechos de uso: Reserva de todos los derechos
Editorial:
Universitat Politècnica de València
Titulación: Grado en Ingeniería Informática-Grau en Enginyeria Informàtica
Tipo: Proyecto/Trabajo fin de carrera/grado

recommendations

 

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro completo del ítem