- -

Anonimización Personalizada

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Anonimización Personalizada

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Monserrat Aranda, Carlos es_ES
dc.contributor.advisor Garcia Martinez, Maria Mercedes es_ES
dc.contributor.author Durá Santonja, Carlos es_ES
dc.date.accessioned 2022-09-06T14:34:11Z
dc.date.available 2022-09-06T14:34:11Z
dc.date.created 2022-07-14
dc.date.issued 2022-09-06 es_ES
dc.identifier.uri http://hdl.handle.net/10251/185385
dc.description.abstract [CA] El desenvolupament i l'expansió de les noves tecnologies plantegen un nou repte, el de continuar amb el progrés tecnologic alhora que es garanteix la privacitatdels seus usuaris. Aquí és on entra en joc l'anonimització; aquest procés serveix per protegir les dades personals sensibles mitjarn;ant diferents tecniques. L' objectiu d' aquest treball fi­nal de grau és el desenvolupament d'un model capa<; d'anonimitzar text no estructurat adaptant-se a les necessitats de l'usuari. Per desenvolupar aquest treball s'han utilitzat models de reconeixement d'entitats pre-entrenats de spaCy. Per al fine tunning dels models s'han utilitzat principalment les dades pre-anotades del projecte wikiner. A banda dels reentrenaments, també s'ha afegit al model la possibilitat de personalitzar-lo a través de diferents opcions com l'anonimit­zació vía expressions regulars o l'anonimització for<;ada a través de llistes d'entitats, entre d'altres opcions. Finalment, s'ha realitzat una analisi dels resultats obtinguts avaluant la correcta ano­nimització de diferents textos i les millares respecte al model base de spaCy. es_ES
dc.description.abstract [ES] El desarrollo y la expansión de las nuevas tecnologías plantean un nuevo reto, el de continuar con el progreso tecnológico al tiempo que se garantiza la privacidad de sus usuarios. Aquí es donde entra en juego la anonimización. Este proceso sirve para proteger los datos personales sensibles mediante diferentes técnicas. El objetivo de este trabajo final de grado es el desarrollo de un modelo capaz de anonimizar texto no estructurado adaptándose a las necesidades de un usuario. Para el desarrollo de este trabajo se han utilizado modelos de reconocimiento de en­tidades pre-entrenados de spaCy. Para el fine tunning de los modelos se han utilizado principalmente los datos anotados del proyecto wikiner, incluyendo anotaciones de los mismos datos de nuevas etiquetas, como profesión o nacionalidad. A parte de los reentre­namientos también se ha añadido al modelo la posibilidad de personalizarlo a través de diferentes opciones como la anonimización vía expresiones regulares o la anonimización forzada a través de listas de entidades, entre otras opciones. Por último, se ha realizado un análisis de los resultados obtenidos evaluando la co­rrecta anonimización de diferentes textos y las mejoras respecto al modelo base de spaCy es_ES
dc.description.abstract [EN] The development and expansion of new technologies pose a new challenge, that of continuing technological progress while ensuring the privacy of its users. This is where anonymization comes into play, this process serves to protect sensitive personal data using different techniques. The objective of this final degree work is the development of a model capable of anonymizing unstructured text adapting to the needs of a user. Por the development of this work, pre-trained entity recognition models of spaCy have been used. Por the fine tuning of the models we mainly used the annotated data from the wikiner project. Apart from the re-training, we have also added to the model the possibility of customizing it through different options such as anonymization vía regular expressions or forced anonymization through lists of entities, among other options. Pinally, an analysis of the results obtained has been carried out, evaluating the correct anonymization of different texts and the improvements with respect to the spaCy base model. es_ES
dc.format.extent 50 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Traducció Automatica es_ES
dc.subject Estimació de qualitat de la traducció automàtica es_ES
dc.subject Europeana Translate es_ES
dc.subject Aprenentatge Automàtic es_ES
dc.subject Aprenentatge Profund es_ES
dc.subject Xarxes Neuro­nals es_ES
dc.subject Traducción Automática es_ES
dc.subject Estimación de calidad de la traducción automá­tica es_ES
dc.subject Aprendizaje Automático es_ES
dc.subject Aprendizaje Profundo es_ES
dc.subject Redes Neu­ronales es_ES
dc.subject Machine Translation es_ES
dc.subject Machine Translation Quality Estimation es_ES
dc.subject Machine Learning es_ES
dc.subject Deep Learning, es_ES
dc.subject Neural Networks es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Grado en Ciencia de Datos-Grau en Ciència de Dades es_ES
dc.title Anonimización Personalizada es_ES
dc.title.alternative Customized Anonymization es_ES
dc.title.alternative Anonimització personalitzada es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Durá Santonja, C. (2022). Anonimización Personalizada. Universitat Politècnica de València. http://hdl.handle.net/10251/185385 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\148912 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem