- -

Diseño e implementación de modelos de lenguaje para información genómica asociada a enfermedades raras mediante inferencia gramatical

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Diseño e implementación de modelos de lenguaje para información genómica asociada a enfermedades raras mediante inferencia gramatical

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Sempere Luna, José María es_ES
dc.contributor.author Gómez Ruiz, Iván es_ES
dc.date.accessioned 2024-09-03T18:29:38Z
dc.date.available 2024-09-03T18:29:38Z
dc.date.created 2024-07-12
dc.date.issued 2024-09-03 es_ES
dc.identifier.uri http://hdl.handle.net/10251/207240
dc.description.abstract [ES] El presente Trabajo de Fin de Grado aborda el diseño e implementación de modelos de lenguaje para la información genómica asociada a enfermedades raras, específicamente la retinosis pigmentaria, utilizando algoritmos de inferencia gramatical k-testables. La investigación se centra en desarrollar modelos de autómatas finitos deterministas (AFD) que puedan identificar patrones en secuencias genéticas, diferenciando entre muestras de ADN mutado y no mutado. El estudio comenzó con la recopilación de datos genómicos a partir de archivos VCF proporcionados por el Instituto de La Fe de Valencia. Estos datos fueron procesados para generar muestras de secuencias genéticas, las cuales se utilizaron para entrenar y evaluar los modelos. Se implementaron dos tipos de modelos: uno con secuencias mutadas y otro con secuencias no mutadas. Cada modelo fue optimizado variando el parámetro k, que define el tamaño de la ventana de contexto del autómata. Los resultados del estudio muestran que los modelos entrenados con secuencias mutadas y no mutadas presentan diferentes niveles de precisión, especificidad y recall. La investigación demuestra el potencial de los AFD basados en algoritmos k-testables para el análisis genómico y la identificación de mutaciones, aportando valor al campo de la bioinformática y el diagnóstico de enfermedades raras. es_ES
dc.description.abstract [EN] This Final Degree Project addresses the design and implementation of language models for genomic information associated with rare diseases, specifically retinitis pigmentosa, using k-testable grammatical inference algorithms. The research focuses on developing deterministic finite automata (DFA) models capable of identifying patterns in genetic sequences, differentiating between mutated and non-mutated DNA samples. The study began with the collection of genomic data from VCF files provided by the Instituto de La Fe de Valencia. These data were processed to generate samples of genetic sequences, which were used to train and evaluate the models. Two types of models were implemented: one with mutated sequences and another with non-mutated sequences. Each model was optimized by varying the k parameter, which defines the context window size of the automaton. The study results show that models trained with mutated and non-mutated sequences exhibit different levels of precision, specificity, and recall. The research demonstrates the potential of DFA based on k-testable algorithms for genomic analysis and mutation identification, contributing to the field of bioinformatics and the diagnosis of rare diseases. es_ES
dc.format.extent 53 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reconocimiento (by) es_ES
dc.subject Inferencia gramatical es_ES
dc.subject Información genómica es_ES
dc.subject Enfermedades raras es_ES
dc.subject Modelos de lenguaje es_ES
dc.subject Retinosis pigmentaria (RP) es_ES
dc.subject Autómatas finitos deterministas es_ES
dc.subject Secuencias genéticas es_ES
dc.subject Mutaciones es_ES
dc.subject Bioinformática es_ES
dc.subject Diagnóstico genético es_ES
dc.subject Language models (LMs) es_ES
dc.subject Rare Diseases es_ES
dc.subject Retinitis Pigmentosa (RP) es_ES
dc.subject Grammatical Inference es_ES
dc.subject Deterministic Finite Automata es_ES
dc.subject Genetic Sequences es_ES
dc.subject Mutations es_ES
dc.subject BioInformatics es_ES
dc.subject Genetic Diagnosis es_ES
dc.subject.classification LENGUAJES Y SISTEMAS INFORMATICOS es_ES
dc.subject.other Grado en Ingeniería Informática-Grau en Enginyeria Informàtica es_ES
dc.title Diseño e implementación de modelos de lenguaje para información genómica asociada a enfermedades raras mediante inferencia gramatical es_ES
dc.title.alternative Design and implementation of language models for genomic information associated with rare diseases through grammatical inference es_ES
dc.title.alternative Disseny i implementació de models de llenguatge per a informació genòmica associada a malalties rares mitjançant inferència gramatical es_ES
dc.type Proyecto/Trabajo fin de carrera/grado es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació es_ES
dc.contributor.affiliation Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica es_ES
dc.description.bibliographicCitation Gómez Ruiz, I. (2024). Diseño e implementación de modelos de lenguaje para información genómica asociada a enfermedades raras mediante inferencia gramatical. Universitat Politècnica de València. http://hdl.handle.net/10251/207240 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\161423 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem