Adaptation of Large Language Models for Streaming Machine Translation

Vicente Hungerbuhler, Daniel Kyu

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Adaptation of Large Language Models for Streaming Machine Translation

Mostrar el registro sencillo del ítem

Ficheros en el ítem

Nombre: Vicente - Adaptation ...

Tamaño: 1.247Mb

Formato: PDF

Abrir

dc.contributor.advisor	Juan Císcar, Alfonso	es_ES
dc.contributor.advisor	Civera Saiz, Jorge	es_ES
dc.contributor.advisor	Iranzo Sánchez, Jorge	es_ES
dc.contributor.author	Vicente Hungerbuhler, Daniel Kyu	es_ES
dc.date.accessioned	2024-09-11T13:07:45Z
dc.date.available	2024-09-11T13:07:45Z
dc.date.created	2024-07-15
dc.date.issued	2024-09-11	es_ES
dc.identifier.uri	http://hdl.handle.net/10251/207986
dc.description.abstract	[CA] La traducció automàtica (MT, de l’anglés) és un àmbit fonamental dins de l’aprenentatge automàtic, on les xarxes neuronals han assolit avanços significatius que han impulsat la recerca en MT. Això s’ha vist encoratjat encara més per la proliferació de plataformes que faciliten la transmissió de contingut audiovisual en streaming (per exemple, YouTube, Twitch) i videoconferències (per exemple, Zoom, Webex). Aquestes plataformes han posat de manifest la necessitat d’adaptar els models i tècniques de MT convencionals al context de transmissió en temps real, és a dir, per a una entrada contínua (en streaming) i sota un temps de resposta determinat (latència). Els avanços en l’entrenament de grans xarxes neuronals amb col·leccions massives de dades per part dels principals proveïdors tecnològics, com ara Google, Meta i Microsoft, han conduït a l’aparició de models de MT multilingüe i grans models de llenguatge que poden ser utilitzats com a models fonamentals per abordar tasques posteriors específiques. En aquest context, aquest treball aprofundeix en l’avaluació de l’eficàcia dels models fonamentals quan s’adapten a tasques de MT, particularment per a MT en streaming. Per a això, utilitzarem dades, tecnologia i experiència del grup MLLP de VRAIN, adquirits en el marc de projectes de recerca i transferència de tecnologia desenvolupats en els últims anys.	es_ES
dc.description.abstract	[EN] Machine translation (MT) stands as a pivotal domain within machine learning, where the rise of neural networks has sparked significant advancements, propelling MT into a highly researched field. This has been further fostered by the proliferation of platforms facilitating audiovisual content streaming (e.g., YouTube, Twitch) and video conferencing (e.g., Zoom, Webex). These platforms have underscored the necessity of adapting conventional MT models and techniques to accommodate real-time streaming scenarios, which entails a continuous input stream to be translated under a given response time (latency). Progress in training large neural networks on massive collections of data by major technological providers, such as Google, Meta, and Microsoft, has led to the emergence of multilingual MT and large language models, which can be used as foundational models to tackle specific downstream tasks. In this context, this study delves into evaluating the efficacy of foundational models when adapted to MT tasks, particularly for streaming MT. To this end, we will make use of data, technology, and expertise from the MLLP group of VRAIN, acquired within the framework of research and technology transfer projects developed in recent years.	es_ES
dc.description.abstract	[ES] La traducción automática (MT, del inglés) es un área fundamental dentro del aprendizaje automático, donde las redes neuronales han alcanzado avances significativos que han impulsado la investigación en MT. Esto se ha visto fomentado aún más por la proliferación de plataformas que facilitan la transmisión de contenido audiovisual en streaming (por ejemplo, YouTube, Twitch) y videoconferencias (por ejemplo, Zoom, Webex). Estas plataformas han puesto de manifiesto la necesidad de adaptar los modelos y técnicas de MT convencionales al contexto de transmisión en tiempo real, esto es, para una entrada continua (en streaming) y bajo un tiempo de respuesta determinado (latencia). Los avances en el entrenamiento de grandes redes neuronales con colecciones masivas de datos por parte de los principales proveedores tecnológicos, como Google, Meta y Microsoft, han conducido a la aparición de modelos de MT multilingüe y grandes modelos de lenguaje que pueden usarse como modelos fundacionales para abordar tareas posteriores específicas. En este contexto, este trabajo profundiza en la evaluación de la eficacia de los modelos fundacionales cuando se adaptan a tareas de MT, particularmente para MT en streaming. Para ello, utilizaremos datos, tecnología y experiencia del grupo MLLP de VRAIN, adquiridos en el marco de proyectos de investigación y transferencia de tecnología desarrollados en los últimos años.	es_ES
dc.format.extent	74	es_ES
dc.language	Inglés	es_ES
dc.publisher	Universitat Politècnica de València	es_ES
dc.rights	Reconocimiento (by)	es_ES
dc.subject	Aprendizaje automático	es_ES
dc.subject	Redes neuronales	es_ES
dc.subject	Traducción automática	es_ES
dc.subject	Traducción automática en streaming	es_ES
dc.subject	Adaptación de modelos	es_ES
dc.subject	Machine learning	es_ES
dc.subject	Neural networks	es_ES
dc.subject	Machine translation	es_ES
dc.subject	Streaming machine translation	es_ES
dc.subject	Large language models	es_ES
dc.subject	Model adaptation	es_ES
dc.subject	Aprenentatge automàtic	es_ES
dc.subject	Xarxes neuronals	es_ES
dc.subject	Traducció automàtica	es_ES
dc.subject	Traducció automàtica en streaming	es_ES
dc.subject	Grans models de llenguatge	es_ES
dc.subject	Adaptació de models	es_ES
dc.subject	Grandes modelos del lenguaje	es_ES
dc.subject.classification	LENGUAJES Y SISTEMAS INFORMATICOS	es_ES
dc.subject.other	Grado en Ingeniería Informática-Grau en Enginyeria Informàtica	es_ES
dc.title	Adaptation of Large Language Models for Streaming Machine Translation	es_ES
dc.title.alternative	Adaptación de grandes modelos de lenguaje para la traducción automática en streaming	es_ES
dc.title.alternative	Adaptació de grans models de llenguatge per a la traducció automàtica en streaming	es_ES
dc.type	Proyecto/Trabajo fin de carrera/grado	es_ES
dc.rights.accessRights	Abierto	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica	es_ES
dc.description.bibliographicCitation	Vicente Hungerbuhler, DK. (2024). Adaptation of Large Language Models for Streaming Machine Translation. Universitat Politècnica de València. http://hdl.handle.net/10251/207986	es_ES
dc.description.accrualMethod	TFGM	es_ES
dc.relation.pasarela	TFGM\162141	es_ES

Este ítem aparece en la(s) siguiente(s) colección(ones)

ETSINF - Trabajos académicos [5160]
Escola Tècnica Superior d'Enginyeria Informàtica

Mostrar el registro sencillo del ítem

Adaptation of Large Language Models for Streaming Machine Translation

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Adaptation of Large Language Models for Streaming Machine Translation

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Ítems relacionados