- -

Overview of AuTexTification at IberLEF 2023: Detection and Attribution of Machine-Generated Text in Multiple Domains

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Overview of AuTexTification at IberLEF 2023: Detection and Attribution of Machine-Generated Text in Multiple Domains

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.author Sarvazyan, Areg Mikael es_ES
dc.contributor.author González, José Ángel es_ES
dc.contributor.author Franco-Salvador, Marc es_ES
dc.contributor.author Rangel, Francisco es_ES
dc.contributor.author Chulvi-Ferriols, María Alberta es_ES
dc.contributor.author Rosso, Paolo es_ES
dc.date.accessioned 2024-06-05T18:19:20Z
dc.date.available 2024-06-05T18:19:20Z
dc.date.issued 2023-09 es_ES
dc.identifier.issn 1135-5948 es_ES
dc.identifier.uri http://hdl.handle.net/10251/204744
dc.description.abstract [EN] This paper presents the overview of the AuTexTification shared task as part of the IberLEF 2023 Workshop in Iberian Languages Evaluation Forum, within the framework of the SEPLN 2023 conference. AuTexTification consists of two subtasks: for Subtask 1, participants had to determine whether a text is human-authored or has been generated by a large language model. For Subtask 2, participants had to attribute a machine-generated text to one of six different text generation models. Our AuTexTification 2023 dataset contains more than 160.000 texts across two languages (English and Spanish) and five domains (tweets, reviews, news, legal, and how-to articles). A total of 114 teams signed up to participate, of which 36 sent 175 runs, and 20 of them sent their working notes. In this overview, we present the AuTexTification dataset and task, the submitted participating systems, and the results. es_ES
dc.description.abstract [ES] Este artículo presenta un resumen de la tarea AuTexTification como parte del workshop IberLEF 2023 sobre el Iberian Languages Evaluation Forum, en el marco de la conferencia SEPLN 2023. AuTexTification consta de dos subtareas: en la Subtarea 1, los participantes tuvieron que determinar si un texto fue escrito por un humano o generado por un modelo de lenguaje masivo. Para la Subtarea 2, los participantes debían atribuir un texto generado automáticamente a uno de seis modelos de generación de texto diferentes. El conjunto de datos AuTexTification contiene más de 160.000 textos en dos idiomas (inglés y español) y cinco dominios (tweets, reseñas, noticias, legislación y artículos instructivos). Un total de 114 equipos se inscribieron para participar, de los cuales 36 enviaron 175 resultados y 20 de ellos enviaron artículos. En este artículo, presentamos el conjunto de datos y la tarea AuTexTification, los sistemas enviados por los participantes y sus resultados. es_ES
dc.description.sponsorship The work from Symanto has been partially funded by the Pro<SUP>2</SUP>Haters - Proactive Profiling of Hate Speech Spreaders (CDTi IDI-20210776), the XAI-DisInfodemics: eXplainable AI for disinformation and conspiracy detection during infodemics (MICIN PLEC2021-007681), the OBULEX - OBservatorio del Uso de Lenguage sEXista en la red (IVACE IMINOD/2022/106), and the ANDHI - ANomalous Diffusion of Harmful Information (CPP2021-008994) R&D grants. The work of Areg Mikael Sarvazyan has been partially developed with the support of valgrAI - Valencian Graduate School and Research Network of Artificial Intelligence and the Generalitat Valenciana, and co-founded by the European Union. The research at the Universitat Politecnica de Valencia was framed under the FairTransNLP research project, Grant PID2021-124361OB-C31 funded by MCIN/AEI/10.13039/501100011033 and by ERDF, EU A way of making Europe. es_ES
dc.language Inglés es_ES
dc.publisher Sociedad Española para el Procesamiento del Lenguaje Natural es_ES
dc.relation.ispartof Procesamiento del Lenguaje Natural es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Machine-generated text es_ES
dc.subject Large language models es_ES
dc.subject Generalization es_ES
dc.subject AuTexTification es_ES
dc.subject Texto generado por máquina es_ES
dc.subject Modelos de lenguaje masivos es_ES
dc.subject Generalización es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.title Overview of AuTexTification at IberLEF 2023: Detection and Attribution of Machine-Generated Text in Multiple Domains es_ES
dc.title.alternative Resumen de AuTexTification en IberLEF 2023: Detección y Atribución de Texto Generado Automáticamente en Múltiples Dominios es_ES
dc.type Artículo es_ES
dc.identifier.doi 10.26342/2023-71-21 es_ES
dc.relation.projectID info:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2017-2020/PLEC2021-007681/ES/IA explicable para desinformación y detección de conspiración durante infodemias (XAI-DisInfodemics)/ es_ES
dc.relation.projectID info:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2021-2023/PID2021-124361OB-C31/ES/FAIRTRANSNLP-STEREOTYPES: IDENTIFICACION DE ESTEREOTIPOS Y PREJUICIOS Y DESARROLLO DE SISTEMAS EQUITATIVOS/ es_ES
dc.relation.projectID info:eu-repo/grantAgreement/IVACE//IMINOD%2F2022%2F106/ es_ES
dc.relation.projectID info:eu-repo/grantAgreement/AEI//CPP2021-008994//ANDHI - ANomalous Diffusion of Harmful Information/ es_ES
dc.relation.projectID info:eu-repo/grantAgreement/MICINN//IDI-20210776/ es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Sarvazyan, AM.; González, JÁ.; Franco-Salvador, M.; Rangel, F.; Chulvi-Ferriols, MA.; Rosso, P. (2023). Overview of AuTexTification at IberLEF 2023: Detection and Attribution of Machine-Generated Text in Multiple Domains. Procesamiento del Lenguaje Natural. (71):275-288. https://doi.org/10.26342/2023-71-21 es_ES
dc.description.accrualMethod S es_ES
dc.relation.publisherversion https://doi.org/10.26342/2023-71-21 es_ES
dc.description.upvformatpinicio 275 es_ES
dc.description.upvformatpfin 288 es_ES
dc.type.version info:eu-repo/semantics/publishedVersion es_ES
dc.description.issue 71 es_ES
dc.relation.pasarela S\512185 es_ES
dc.contributor.funder AGENCIA ESTATAL DE INVESTIGACION es_ES
dc.contributor.funder Agencia Estatal de Investigación es_ES
dc.contributor.funder European Regional Development Fund es_ES
dc.contributor.funder Ministerio de Ciencia e Innovación es_ES
dc.contributor.funder Institut Valencià de Competitivitat Empresarial es_ES
dc.contributor.funder Valencian Graduate School and Research Network of Artificial Intelligence es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem