Fine-tuning machine translation quality-rating scales for new digital genres: The case of user-generated content

Candel-Mora, Miguel Ángel

doi:10.14198/ELUA.21900

Identificarse

Buscar en RiuNet

Listar

Todo RiuNet
Esta colección

Mi cuenta

Acceder

Estadísticas

Ver Estadísticas de uso

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Fine-tuning machine translation quality-rating scales for new digital genres: The case of user-generated content

Mostrar el registro sencillo del ítem

Ficheros en el ítem

Nombre: Candel-Mora - ...

Tamaño: 402.6Kb

Formato: PDF

Descripción: Versión editorial

Abrir

dc.contributor.author	Candel-Mora, Miguel Ángel	es_ES
dc.date.accessioned	2023-10-04T18:01:25Z
dc.date.available	2023-10-04T18:01:25Z
dc.date.issued	2022	es_ES
dc.identifier.issn	0212-7636	es_ES
dc.identifier.uri	http://hdl.handle.net/10251/197564
dc.description.abstract	[ES] Con la participación activa de los usuarios en las plataformas de reseñas de productos, los contenidos online generados por los consumidores, y más concretamente, las opiniones de los usuarios se han convertido en una clara referencia en los procesos de decisión de compra, que en ocasiones superan el impacto de las campañas publicitarias. Una característica común de la mayoría de las plataformas de reseñas turísticas es el uso de sistemas de traducción automática para poner inmediatamente las reseñas a disposición de los usuarios en diferentes idiomas. Sin embargo, la calidad de la traducción automática de estas reseñas varía en gran medida debido a la subjetividad y a la naturaleza no estructurada de este género digital. Diferentes estudios confirman que no existen escalas universales de valoración de la calidad y que la evaluación de la calidad del resultado de la MT suele depender de factores como la finalidad del texto o el valor que se da a la inmediatez de la traducción. Los nuevos sistemas de traducción automática neuronal han supuesto una revolución en el incremento de la calidad del texto traducido, sin embargo, se abren nuevas líneas de investigación para verificar si la calidad de este nuevo paradigma de traducción automática se puede valorar con las escalas existentes, procedentes en su mayoría de los anteriores sistemas basados en reglas y traducción estadística, o si es necesario desarrollar nuevas métricas de calidad acordes con estos nuevos sistemas inteligentes. Por otro lado, una de las cuestiones que quedan por resolver en este nuevo contexto de traducción automática neuronal es si la utilización de grandes cantidades de datos textuales en el entrenamiento de estos sistemas es igual de eficaz que un uso de menos cantidad de datos pero de mayor calidad y más ajustados a la especialidad y el tipo de texto en el que se utiliza. Partiendo de la hipótesis de que cada género requiere escalas de valoración de la calidad específicas, este trabajo identifica patrones de error y características textuales de las reseñas de usuarios en línea a partir de un análisis basado en un corpus que contribuirá a adaptar las escalas de valoración de la calidad a este género digital específico.	es_ES
dc.description.abstract	[EN] With the active participation of users in product review platforms, online consumer-generated content, and, more specifically, user-generated reviews, have become a clear reference in purchasing decision-making processes, which sometimes exceed the impact of advertising campaigns. A common feature of most tourism review platforms is the use of machine translation (MT) systems to immediately make reviews available to users in various languages. However, the quality of the MT output of these reviews varies greatly, primarily due to the subjective and unstructured nature of this digital genre. Different studies confirm that there are no universal quality rating scales. The assessment of MT output quality usually depends on factors such as the purpose of the text or the value given to the immediacy of the translation. New neural MT systems have been a revolution in the quality increase of the translated output; however, new lines of research are opening up to verify whether the quality of this new paradigm of MT can be assessed with the existing scales, mainly from previous rule-based systems and statistical translation, or whether it is necessary to develop new quality metrics specifically for these new intelligent systems. On the other hand, one of the questions that remain to be resolved in this new context of neural MT is whether the use of large amounts of textual data in the training of these systems is as effective as the use of less data but of higher quality and better-adjusted to the specialty and type of text for which it is used. Based on the hypothesis that each genre requires specific quality rating scales, this work identifies the error patterns and textual characteristics of online user reviews from a corpus-based approach analysis that will contribute to adapting quality rating scales to this specific digital genre.	es_ES
dc.language	Inglés	es_ES
dc.publisher	Publicaciones Universidad de Alicante	es_ES
dc.relation.ispartof	ELUA Estudios de Lingüística Universidad de Alicante	es_ES
dc.rights	Reconocimiento (by)	es_ES
dc.subject	Machine translation	es_ES
dc.subject	Postediting	es_ES
dc.subject	Quality assessment	es_ES
dc.subject	User-generated content	es_ES
dc.subject	Online reviews	es_ES
dc.subject	Traducción automática	es_ES
dc.subject	Posedición	es_ES
dc.subject	Evaluación de la calidad	es_ES
dc.subject	Contenido generado por el usuario	es_ES
dc.subject	Reseñas en línea	es_ES
dc.subject.classification	FILOLOGIA INGLESA	es_ES
dc.title	Fine-tuning machine translation quality-rating scales for new digital genres: The case of user-generated content	es_ES
dc.title.alternative	Adaptación de las escalas de calidad de la traducción automática a los nuevos géneros digitales: el caso del contenido generado por el usuario	es_ES
dc.type	Artículo	es_ES
dc.identifier.doi	10.14198/ELUA.21900	es_ES
dc.rights.accessRights	Abierto	es_ES
dc.contributor.affiliation	Universitat Politècnica de València. Escuela Técnica Superior de Ingenieros Industriales - Escola Tècnica Superior d'Enginyers Industrials	es_ES
dc.description.bibliographicCitation	Candel-Mora, MÁ. (2022). Fine-tuning machine translation quality-rating scales for new digital genres: The case of user-generated content. ELUA Estudios de Lingüística Universidad de Alicante. (38):117-136. https://doi.org/10.14198/ELUA.21900	es_ES
dc.description.accrualMethod	S	es_ES
dc.relation.publisherversion	https://doi.org/10.14198/ELUA.21900	es_ES
dc.description.upvformatpinicio	117	es_ES
dc.description.upvformatpfin	136	es_ES
dc.type.version	info:eu-repo/semantics/publishedVersion	es_ES
dc.description.issue	38	es_ES
dc.relation.pasarela	S\469289	es_ES

Este ítem aparece en la(s) siguiente(s) colección(ones)

Artículos, conferencias, monografías [48344]

Mostrar el registro sencillo del ítem

Fine-tuning machine translation quality-rating scales for new digital genres: The case of user-generated content

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Buscar en RiuNet

Listar

Todo RiuNet

Esta colección

Mi cuenta

Estadísticas

Ayuda RiuNet

Admin. UPV

Compartir/Enviar a

Citas

Estadísticas

Fine-tuning machine translation quality-rating scales for new digital genres: The case of user-generated content

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)