- -

Adaptation of Large Language Models for Streaming Machine Translation

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Adaptation of Large Language Models for Streaming Machine Translation

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Juan Císcar, Alfonso es_ES
dc.contributor.advisor Civera Saiz, Jorge es_ES
dc.contributor.advisor Iranzo Sánchez, Jorge es_ES
dc.contributor.author Vicente Hungerbuhler, Daniel Kyu es_ES
dc.date.accessioned 2024-09-11T13:07:45Z
dc.date.available 2024-09-11T13:07:45Z
dc.date.created 2024-07-15
dc.date.issued 2024-09-11 es_ES
dc.identifier.uri http://hdl.handle.net/10251/207986
dc.description.abstract [CA] La traducció automàtica (MT, de l’anglés) és un àmbit fonamental dins de l’aprenentatge automàtic, on les xarxes neuronals han assolit avanços significatius que han impulsat la recerca en MT. Això s’ha vist encoratjat encara més per la proliferació de plataformes que faciliten la transmissió de contingut audiovisual en streaming (per exemple, YouTube, Twitch) i videoconferències (per exemple, Zoom, Webex). Aquestes plataformes han posat de manifest la necessitat d’adaptar els models i tècniques de MT convencionals al context de transmissió en temps real, és a dir, per a una entrada contínua (en streaming) i sota un temps de resposta determinat (latència). Els avanços en l’entrenament de grans xarxes neuronals amb col·leccions massives de dades per part dels principals proveïdors tecnològics, com ara Google, Meta i Microsoft, han conduït a l’aparició de models de MT multilingüe i grans models de llenguatge que poden ser utilitzats com a models fonamentals per abordar tasques posteriors específiques. En aquest context, aquest treball aprofundeix en l’avaluació de l’eficàcia dels models fonamentals quan s’adapten a tasques de MT, particularment per a MT en streaming. Per a això, utilitzarem dades, tecnologia i experiència del grup MLLP de VRAIN, adquirits en el marc de projectes de recerca i transferència de tecnologia desenvolupats en els últims anys. es_ES
dc.description.abstract [EN] Machine translation (MT) stands as a pivotal domain within machine learning, where the rise of neural networks has sparked significant advancements, propelling MT into a highly researched field. This has been further fostered by the proliferation of platforms facilitating audiovisual content streaming (e.g., YouTube, Twitch) and video conferencing (e.g., Zoom, Webex). These platforms have underscored the necessity of adapting conventional MT models and techniques to accommodate real-time streaming scenarios, which entails a continuous input stream to be translated under a given response time (latency). Progress in training large neural networks on massive collections of data by major technological providers, such as Google, Meta, and Microsoft, has led to the emergence of multilingual MT and large language models, which can be used as foundational models to tackle specific downstream tasks. In this context, this study delves into evaluating the efficacy of foundational models when adapted to MT tasks, particularly for streaming MT. To this end, we will make use of data, technology, and expertise from the MLLP group of VRAIN, acquired within the framework of research and technology transfer projects developed in recent years. es_ES
dc.description.abstract [ES] La traducción automática (MT, del inglés) es un área fundamental dentro del aprendizaje automático, donde las redes neuronales han alcanzado avances significativos que han impulsado la investigación en MT. Esto se ha visto fomentado aún más por la proliferación de plataformas que facilitan la transmisión de contenido audiovisual en streaming (por ejemplo, YouTube, Twitch) y videoconferencias (por ejemplo, Zoom, Webex). Estas plataformas han puesto de manifiesto la necesidad de adaptar los modelos y técnicas de MT convencionales al contexto de transmisión en tiempo real, esto es, para una entrada continua (en streaming) y bajo un tiempo de respuesta determinado (latencia). Los avances en el entrenamiento de grandes redes neuronales con colecciones masivas de datos por parte de los principales proveedores tecnológicos, como Google, Meta y Microsoft, han conducido a la aparición de modelos de MT multilingüe y grandes modelos de lenguaje que pueden usarse como modelos fundacionales para abordar tareas posteriores específicas. En este contexto, este trabajo profundiza en la evaluación de la eficacia de los modelos fundacionales cuando se adaptan a tareas de MT, particularmente para MT en streaming. Para ello, utilizaremos datos, tecnología y experiencia del grupo MLLP de VRAIN, adquiridos en el marco de proyectos de investigación y transferencia de tecnología desarrollados en los últimos años. es_ES
dc.format.extent 74 es_ES
dc.language Inglés es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reconocimiento (by) es_ES
dc.subject Aprendizaje automático es_ES
dc.subject Redes neuronales es_ES
dc.subject Traducción automática es_ES
dc.subject Traducción automática en streaming es_ES
dc.subject Adaptación de modelos es_ES
dc.subject Machine learning es_ES
dc.subject Neural networks es_ES
dc.subject Machine translation es_ES
dc.subject Streaming machine translation es_ES
dc.subject Large language models es_ES
dc.subject Model adaptation es_ES
dc.subject Aprenentatge automàtic es_ES
dc.subject Xarxes neuronals es_ES
dc.subject Traducció automàtica es_ES
dc.subject Traducció automàtica en streaming es_ES
dc.subject Grans models de llenguatge es_ES
dc.subject Adaptació de models es_ES
dc.subject Grandes modelos del lenguaje es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Grado en Ingeniería Informática-Grau en Enginyeria Informàtica es_ES
dc.title Adaptation of Large Language Models for Streaming Machine Translation es_ES
dc.title.alternative Adaptación de grandes modelos de lenguaje para la traducción automática en streaming es_ES
dc.title.alternative Adaptació de grans models de llenguatge per a la traducció automàtica en streaming es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Vicente Hungerbuhler, DK. (2024). Adaptation of Large Language Models for Streaming Machine Translation. Universitat Politècnica de València. http://hdl.handle.net/10251/207986 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\162141 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem