Mostrar el registro sencillo del ítem
dc.contributor.advisor | Juan Císcar, Alfonso | es_ES |
dc.contributor.advisor | Civera Saiz, Jorge | es_ES |
dc.contributor.advisor | Iranzo Sánchez, Jorge | es_ES |
dc.contributor.author | Vicente Hungerbuhler, Daniel Kyu | es_ES |
dc.date.accessioned | 2024-09-11T13:07:45Z | |
dc.date.available | 2024-09-11T13:07:45Z | |
dc.date.created | 2024-07-15 | |
dc.date.issued | 2024-09-11 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/207986 | |
dc.description.abstract | [CA] La traducció automàtica (MT, de l’anglés) és un àmbit fonamental dins de l’aprenentatge automàtic, on les xarxes neuronals han assolit avanços significatius que han impulsat la recerca en MT. Això s’ha vist encoratjat encara més per la proliferació de plataformes que faciliten la transmissió de contingut audiovisual en streaming (per exemple, YouTube, Twitch) i videoconferències (per exemple, Zoom, Webex). Aquestes plataformes han posat de manifest la necessitat d’adaptar els models i tècniques de MT convencionals al context de transmissió en temps real, és a dir, per a una entrada contínua (en streaming) i sota un temps de resposta determinat (latència). Els avanços en l’entrenament de grans xarxes neuronals amb col·leccions massives de dades per part dels principals proveïdors tecnològics, com ara Google, Meta i Microsoft, han conduït a l’aparició de models de MT multilingüe i grans models de llenguatge que poden ser utilitzats com a models fonamentals per abordar tasques posteriors específiques. En aquest context, aquest treball aprofundeix en l’avaluació de l’eficàcia dels models fonamentals quan s’adapten a tasques de MT, particularment per a MT en streaming. Per a això, utilitzarem dades, tecnologia i experiència del grup MLLP de VRAIN, adquirits en el marc de projectes de recerca i transferència de tecnologia desenvolupats en els últims anys. | es_ES |
dc.description.abstract | [EN] Machine translation (MT) stands as a pivotal domain within machine learning, where the rise of neural networks has sparked significant advancements, propelling MT into a highly researched field. This has been further fostered by the proliferation of platforms facilitating audiovisual content streaming (e.g., YouTube, Twitch) and video conferencing (e.g., Zoom, Webex). These platforms have underscored the necessity of adapting conventional MT models and techniques to accommodate real-time streaming scenarios, which entails a continuous input stream to be translated under a given response time (latency). Progress in training large neural networks on massive collections of data by major technological providers, such as Google, Meta, and Microsoft, has led to the emergence of multilingual MT and large language models, which can be used as foundational models to tackle specific downstream tasks. In this context, this study delves into evaluating the efficacy of foundational models when adapted to MT tasks, particularly for streaming MT. To this end, we will make use of data, technology, and expertise from the MLLP group of VRAIN, acquired within the framework of research and technology transfer projects developed in recent years. | es_ES |
dc.description.abstract | [ES] La traducción automática (MT, del inglés) es un área fundamental dentro del aprendizaje automático, donde las redes neuronales han alcanzado avances significativos que han impulsado la investigación en MT. Esto se ha visto fomentado aún más por la proliferación de plataformas que facilitan la transmisión de contenido audiovisual en streaming (por ejemplo, YouTube, Twitch) y videoconferencias (por ejemplo, Zoom, Webex). Estas plataformas han puesto de manifiesto la necesidad de adaptar los modelos y técnicas de MT convencionales al contexto de transmisión en tiempo real, esto es, para una entrada continua (en streaming) y bajo un tiempo de respuesta determinado (latencia). Los avances en el entrenamiento de grandes redes neuronales con colecciones masivas de datos por parte de los principales proveedores tecnológicos, como Google, Meta y Microsoft, han conducido a la aparición de modelos de MT multilingüe y grandes modelos de lenguaje que pueden usarse como modelos fundacionales para abordar tareas posteriores específicas. En este contexto, este trabajo profundiza en la evaluación de la eficacia de los modelos fundacionales cuando se adaptan a tareas de MT, particularmente para MT en streaming. Para ello, utilizaremos datos, tecnología y experiencia del grupo MLLP de VRAIN, adquiridos en el marco de proyectos de investigación y transferencia de tecnología desarrollados en los últimos años. | es_ES |
dc.format.extent | 74 | es_ES |
dc.language | Inglés | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reconocimiento (by) | es_ES |
dc.subject | Aprendizaje automático | es_ES |
dc.subject | Redes neuronales | es_ES |
dc.subject | Traducción automática | es_ES |
dc.subject | Traducción automática en streaming | es_ES |
dc.subject | Adaptación de modelos | es_ES |
dc.subject | Machine learning | es_ES |
dc.subject | Neural networks | es_ES |
dc.subject | Machine translation | es_ES |
dc.subject | Streaming machine translation | es_ES |
dc.subject | Large language models | es_ES |
dc.subject | Model adaptation | es_ES |
dc.subject | Aprenentatge automàtic | es_ES |
dc.subject | Xarxes neuronals | es_ES |
dc.subject | Traducció automàtica | es_ES |
dc.subject | Traducció automàtica en streaming | es_ES |
dc.subject | Grans models de llenguatge | es_ES |
dc.subject | Adaptació de models | es_ES |
dc.subject | Grandes modelos del lenguaje | es_ES |
dc.subject.classification | LENGUAJES Y SISTEMAS INFORMATICOS | es_ES |
dc.subject.other | Grado en Ingeniería Informática-Grau en Enginyeria Informàtica | es_ES |
dc.title | Adaptation of Large Language Models for Streaming Machine Translation | es_ES |
dc.title.alternative | Adaptación de grandes modelos de lenguaje para la traducción automática en streaming | es_ES |
dc.title.alternative | Adaptació de grans models de llenguatge per a la traducció automàtica en streaming | es_ES |
dc.type | Proyecto/Trabajo fin de carrera/grado | es_ES |
dc.rights.accessRights | Abierto | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica | es_ES |
dc.description.bibliographicCitation | Vicente Hungerbuhler, DK. (2024). Adaptation of Large Language Models for Streaming Machine Translation. Universitat Politècnica de València. http://hdl.handle.net/10251/207986 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\162141 | es_ES |