- -

Machine-Generated Text Detection and Attribution

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Machine-Generated Text Detection and Attribution

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Rosso, Paolo es_ES
dc.contributor.advisor Franco Salvador, Marc es_ES
dc.contributor.author Sarvazyan, Areg Mikael es_ES
dc.date.accessioned 2023-09-27T10:38:03Z
dc.date.available 2023-09-27T10:38:03Z
dc.date.created 2023-07-25
dc.date.issued 2023-09-27 es_ES
dc.identifier.uri http://hdl.handle.net/10251/197189
dc.description.abstract [ES] Las sólidas capacidades lingüísticas de los Modelos de Lenguaje de Gran Tamaño (LLMs) actuales están motivando su adopción a gran escala en los flujos de trabajo de empresas y particulares. Estos LLMs tienen el potencial de ser utilizados en aplicaciones de vanguardia, pero también podrían ser aprovechados con intenciones maliciosas. Una línea prometedora de investigación para controlar su uso es la detección de Texto Generado por Máquina (MGT) y su atribución a modelos específicos. Si bien este enfoque se ha explorado para dominios específicos, es escaso el estudio de la detección y atribución de MGT en escenarios más realistas. Este trabajo explora la detección y atribución de MGT en un entorno multilingüe, multidominio, multiestilo y multimodelo. Esto se logra mediante la compilación de conjuntos de datos para las tareas, la organización de una campaña de evaluación y el desarrollo diversos modelos de detección y atribución de MGT. Nuestro enfoque es triple: (i) estudiar los modelos de detección y atribución de MGT que logren un alto rendimiento en diversos contextos, (ii) explorar sus capacidades de generalización a diferentes escenarios, analizando su aplicabilidad a tipos de datos no observados, y (iii) organizar con éxito una campaña de evaluación para la detección y atribución de MGT, fomentando así nuevos desarrollos en esta línea de investigación. es_ES
dc.description.abstract [EN] The strong language capabilities of current Large Language Models (LLMs) are motivating a large-scale adoption in the workflows of businesses and individuals. These LLMs have the potential to be used in cutting-edge applications, but they could also be leveraged for malicious intents. A promising line of research to control their use is detecting Machine-Generated Text (MGT) and attributing it to specific models. While this approach has been explored for specific domains, the detection and attribution of MGT in more realistic scenarios is yet to be studied. This work explores MGT detection and attribution in a multilingual, multi-domain, multi-style and multi-generator setting. This is achieved by compiling corpora for the tasks, organizing an evaluation campaign, and developing various MGT detection and attribution models. Our focus is threefold: (i) to study the MGT detection and attribution models that achieve high performance under various settings, (ii) to explore their generalization capabilities to different scenarios, analyzing their applicability to unseen types of data, and (iii) to successfully organize an evaluation campaign for MGT detection and attribution, thereby encouraging further developments in this line of research. es_ES
dc.format.extent 90 es_ES
dc.language Inglés es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reconocimiento (by) es_ES
dc.subject Atribución de textos generados por IA es_ES
dc.subject Detector de textos generados por IA es_ES
dc.subject Modelos de generalización es_ES
dc.subject Modelos de detección es_ES
dc.subject Modelos de atribución es_ES
dc.subject Texto generado por máquina (TGM) es_ES
dc.subject Machine-Generated Text (MGT) es_ES
dc.subject Large Language Models (LLMs) es_ES
dc.subject Generalization models es_ES
dc.subject MGT detection es_ES
dc.subject MGT attribution es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Máster Universitario en Inteligencia Artificial, Reconocimiento de Formas e Imagen Digital-Màster Universitari en Intel·ligència Artificial, Reconeixement de Formes i Imatge Digital es_ES
dc.title Machine-Generated Text Detection and Attribution es_ES
dc.title.alternative Detección y atribución de texto generado por máquina es_ES
dc.title.alternative Detecció i atribució de text generat per màquina es_ES
dc.type Tesis de máster es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.description.bibliographicCitation Sarvazyan, AM. (2023). Machine-Generated Text Detection and Attribution. Universitat Politècnica de València. http://hdl.handle.net/10251/197189 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\158155 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem