- -

Fine-tuning machine translation quality-rating scales for new digital genres: The case of user-generated content

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Fine-tuning machine translation quality-rating scales for new digital genres: The case of user-generated content

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.author Candel-Mora, Miguel Ángel es_ES
dc.date.accessioned 2023-10-04T18:01:25Z
dc.date.available 2023-10-04T18:01:25Z
dc.date.issued 2022 es_ES
dc.identifier.issn 0212-7636 es_ES
dc.identifier.uri http://hdl.handle.net/10251/197564
dc.description.abstract [ES] Con la participación activa de los usuarios en las plataformas de reseñas de productos, los contenidos online generados por los consumidores, y más concretamente, las opiniones de los usuarios se han convertido en una clara referencia en los procesos de decisión de compra, que en ocasiones superan el impacto de las campañas publicitarias. Una característica común de la mayoría de las plataformas de reseñas turísticas es el uso de sistemas de traducción automática para poner inmediatamente las reseñas a disposición de los usuarios en diferentes idiomas. Sin embargo, la calidad de la traducción automática de estas reseñas varía en gran medida debido a la subjetividad y a la naturaleza no estructurada de este género digital. Diferentes estudios confirman que no existen escalas universales de valoración de la calidad y que la evaluación de la calidad del resultado de la MT suele depender de factores como la finalidad del texto o el valor que se da a la inmediatez de la traducción. Los nuevos sistemas de traducción automática neuronal han supuesto una revolución en el incremento de la calidad del texto traducido, sin embargo, se abren nuevas líneas de investigación para verificar si la calidad de este nuevo paradigma de traducción automática se puede valorar con las escalas existentes, procedentes en su mayoría de los anteriores sistemas basados en reglas y traducción estadística, o si es necesario desarrollar nuevas métricas de calidad acordes con estos nuevos sistemas inteligentes. Por otro lado, una de las cuestiones que quedan por resolver en este nuevo contexto de traducción automática neuronal es si la utilización de grandes cantidades de datos textuales en el entrenamiento de estos sistemas es igual de eficaz que un uso de menos cantidad de datos pero de mayor calidad y más ajustados a la especialidad y el tipo de texto en el que se utiliza. Partiendo de la hipótesis de que cada género requiere escalas de valoración de la calidad específicas, este trabajo identifica patrones de error y características textuales de las reseñas de usuarios en línea a partir de un análisis basado en un corpus que contribuirá a adaptar las escalas de valoración de la calidad a este género digital específico. es_ES
dc.description.abstract [EN] With the active participation of users in product review platforms, online consumer-generated content, and, more specifically, user-generated reviews, have become a clear reference in purchasing decision-making processes, which sometimes exceed the impact of advertising campaigns. A common feature of most tourism review platforms is the use of machine translation (MT) systems to immediately make reviews available to users in various languages. However, the quality of the MT output of these reviews varies greatly, primarily due to the subjective and unstructured nature of this digital genre. Different studies confirm that there are no universal quality rating scales. The assessment of MT output quality usually depends on factors such as the purpose of the text or the value given to the immediacy of the translation. New neural MT systems have been a revolution in the quality increase of the translated output; however, new lines of research are opening up to verify whether the quality of this new paradigm of MT can be assessed with the existing scales, mainly from previous rule-based systems and statistical translation, or whether it is necessary to develop new quality metrics specifically for these new intelligent systems. On the other hand, one of the questions that remain to be resolved in this new context of neural MT is whether the use of large amounts of textual data in the training of these systems is as effective as the use of less data but of higher quality and better-adjusted to the specialty and type of text for which it is used. Based on the hypothesis that each genre requires specific quality rating scales, this work identifies the error patterns and textual characteristics of online user reviews from a corpus-based approach analysis that will contribute to adapting quality rating scales to this specific digital genre. es_ES
dc.language Inglés es_ES
dc.publisher Publicaciones Universidad de Alicante es_ES
dc.relation.ispartof ELUA Estudios de Lingüística Universidad de Alicante es_ES
dc.rights Reconocimiento (by) es_ES
dc.subject Machine translation es_ES
dc.subject Postediting es_ES
dc.subject Quality assessment es_ES
dc.subject User-generated content es_ES
dc.subject Online reviews es_ES
dc.subject Traducción automática es_ES
dc.subject Posedición es_ES
dc.subject Evaluación de la calidad es_ES
dc.subject Contenido generado por el usuario es_ES
dc.subject Reseñas en línea es_ES
dc.subject.classification FILOLOGIA INGLESA es_ES
dc.title Fine-tuning machine translation quality-rating scales for new digital genres: The case of user-generated content es_ES
dc.title.alternative Adaptación de las escalas de calidad de la traducción automática a los nuevos géneros digitales: el caso del contenido generado por el usuario es_ES
dc.type Artículo es_ES
dc.identifier.doi 10.14198/ELUA.21900 es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros Industriales - Escola Tècnica Superior d'Enginyers Industrials es_ES
dc.description.bibliographicCitation Candel-Mora, MÁ. (2022). Fine-tuning machine translation quality-rating scales for new digital genres: The case of user-generated content. ELUA Estudios de Lingüística Universidad de Alicante. (38):117-136. https://doi.org/10.14198/ELUA.21900 es_ES
dc.description.accrualMethod S es_ES
dc.relation.publisherversion https://doi.org/10.14198/ELUA.21900 es_ES
dc.description.upvformatpinicio 117 es_ES
dc.description.upvformatpfin 136 es_ES
dc.type.version info:eu-repo/semantics/publishedVersion es_ES
dc.description.issue 38 es_ES
dc.relation.pasarela S\469289 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem