Mostrar el registro sencillo del ítem
dc.contributor.advisor | Sempere Luna, José María | es_ES |
dc.contributor.author | Gómez Ruiz, Iván | es_ES |
dc.date.accessioned | 2024-09-03T18:29:38Z | |
dc.date.available | 2024-09-03T18:29:38Z | |
dc.date.created | 2024-07-12 | |
dc.date.issued | 2024-09-03 | es_ES |
dc.identifier.uri | http://hdl.handle.net/10251/207240 | |
dc.description.abstract | [ES] El presente Trabajo de Fin de Grado aborda el diseño e implementación de modelos de lenguaje para la información genómica asociada a enfermedades raras, específicamente la retinosis pigmentaria, utilizando algoritmos de inferencia gramatical k-testables. La investigación se centra en desarrollar modelos de autómatas finitos deterministas (AFD) que puedan identificar patrones en secuencias genéticas, diferenciando entre muestras de ADN mutado y no mutado. El estudio comenzó con la recopilación de datos genómicos a partir de archivos VCF proporcionados por el Instituto de La Fe de Valencia. Estos datos fueron procesados para generar muestras de secuencias genéticas, las cuales se utilizaron para entrenar y evaluar los modelos. Se implementaron dos tipos de modelos: uno con secuencias mutadas y otro con secuencias no mutadas. Cada modelo fue optimizado variando el parámetro k, que define el tamaño de la ventana de contexto del autómata. Los resultados del estudio muestran que los modelos entrenados con secuencias mutadas y no mutadas presentan diferentes niveles de precisión, especificidad y recall. La investigación demuestra el potencial de los AFD basados en algoritmos k-testables para el análisis genómico y la identificación de mutaciones, aportando valor al campo de la bioinformática y el diagnóstico de enfermedades raras. | es_ES |
dc.description.abstract | [EN] This Final Degree Project addresses the design and implementation of language models for genomic information associated with rare diseases, specifically retinitis pigmentosa, using k-testable grammatical inference algorithms. The research focuses on developing deterministic finite automata (DFA) models capable of identifying patterns in genetic sequences, differentiating between mutated and non-mutated DNA samples. The study began with the collection of genomic data from VCF files provided by the Instituto de La Fe de Valencia. These data were processed to generate samples of genetic sequences, which were used to train and evaluate the models. Two types of models were implemented: one with mutated sequences and another with non-mutated sequences. Each model was optimized by varying the k parameter, which defines the context window size of the automaton. The study results show that models trained with mutated and non-mutated sequences exhibit different levels of precision, specificity, and recall. The research demonstrates the potential of DFA based on k-testable algorithms for genomic analysis and mutation identification, contributing to the field of bioinformatics and the diagnosis of rare diseases. | es_ES |
dc.format.extent | 53 | es_ES |
dc.language | Español | es_ES |
dc.publisher | Universitat Politècnica de València | es_ES |
dc.rights | Reconocimiento (by) | es_ES |
dc.subject | Inferencia gramatical | es_ES |
dc.subject | Información genómica | es_ES |
dc.subject | Enfermedades raras | es_ES |
dc.subject | Modelos de lenguaje | es_ES |
dc.subject | Retinosis pigmentaria (RP) | es_ES |
dc.subject | Autómatas finitos deterministas | es_ES |
dc.subject | Secuencias genéticas | es_ES |
dc.subject | Mutaciones | es_ES |
dc.subject | Bioinformática | es_ES |
dc.subject | Diagnóstico genético | es_ES |
dc.subject | Language models (LMs) | es_ES |
dc.subject | Rare Diseases | es_ES |
dc.subject | Retinitis Pigmentosa (RP) | es_ES |
dc.subject | Grammatical Inference | es_ES |
dc.subject | Deterministic Finite Automata | es_ES |
dc.subject | Genetic Sequences | es_ES |
dc.subject | Mutations | es_ES |
dc.subject | BioInformatics | es_ES |
dc.subject | Genetic Diagnosis | es_ES |
dc.subject.classification | LENGUAJES Y SISTEMAS INFORMATICOS | es_ES |
dc.subject.other | Grado en Ingeniería Informática-Grau en Enginyeria Informàtica | es_ES |
dc.title | Diseño e implementación de modelos de lenguaje para información genómica asociada a enfermedades raras mediante inferencia gramatical | es_ES |
dc.title.alternative | Design and implementation of language models for genomic information associated with rare diseases through grammatical inference | es_ES |
dc.title.alternative | Disseny i implementació de models de llenguatge per a informació genòmica associada a malalties rares mitjançant inferència gramatical | es_ES |
dc.type | Proyecto/Trabajo fin de carrera/grado | es_ES |
dc.rights.accessRights | Abierto | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació | es_ES |
dc.contributor.affiliation | Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica | es_ES |
dc.description.bibliographicCitation | Gómez Ruiz, I. (2024). Diseño e implementación de modelos de lenguaje para información genómica asociada a enfermedades raras mediante inferencia gramatical. Universitat Politècnica de València. http://hdl.handle.net/10251/207240 | es_ES |
dc.description.accrualMethod | TFGM | es_ES |
dc.relation.pasarela | TFGM\161423 | es_ES |