- -

Optimización de la secuenciación del genoma de berenjena (Solanum melongena) a baja cobertura

RiuNet: Repositorio Institucional de la Universidad Politécnica de Valencia

Compartir/Enviar a

Citas

Estadísticas

  • Estadisticas de Uso

Optimización de la secuenciación del genoma de berenjena (Solanum melongena) a baja cobertura

Mostrar el registro sencillo del ítem

Ficheros en el ítem

dc.contributor.advisor Gramazio, Pietro es_ES
dc.contributor.advisor Plazas Ávila, María de la O es_ES
dc.contributor.advisor Arrones Olmo, Andrea es_ES
dc.contributor.author Baraja Fonseca, Virginia es_ES
dc.date.accessioned 2023-10-02T08:31:19Z
dc.date.available 2023-10-02T08:31:19Z
dc.date.created 2023-09-15
dc.date.issued 2023-10-02 es_ES
dc.identifier.uri http://hdl.handle.net/10251/197392
dc.description.abstract [ES] La berenjena común (Solanum melongena L., 2n = 2x = 24) es la sexta hortaliza con mayor producción mundial, ocupando el tercer lugar entre las solanáceas, después del tomate y la patata. A pesar de su gran relevancia, en comparación con otros cultivos económicamente importantes y especies modelo, se ha quedado rezagada en el avance de herramientas genómicas. Sin embargo, el progreso tecnológico, la disminución de los costes de secuenciación y los avances logrados en el desarrollo de programas bioinformáticos están permitiendo la reducción de la brecha entre especies en términos de disponibilidad de recursos genómicos. Esto se refleja en el acceso a genomas de referencias, incluso de cultivos minoritarios, así como en la adopción de nuevas estrategias de genotipado masivo, como el skim whole genome resequencing (SWGR), que permite la identificación de un gran número de polimorfismos, incluso a bajas coberturas de secuenciación (<10X). Para analizar y optimizar la estrategia SWGR en berenjena, se evaluaron cinco coberturas de secuenciación (1-5X) generadas in silico. La evaluación consistió en el mapeo de las lecturas contra el genoma de referencia de berenjena 67/3, el marcado de las secuencias duplicadas, la identificación de polimorfismos y su filtrado a diferentes profundidades mínimas de mapeo (1-10FD). Finalmente, cada conjunto de datos se comparó con un estándar de referencia resultante de la resecuenciación a 20X del mismo genotipo. En relación a la identificación de polimorfismos, se observó una reducción en el número de variantes al marcar las secuencias duplicadas con respecto a no marcarlas, salvo para coberturas de secuenciación bajas (1X). El número de polimorfismos identificados aumentó con la cobertura de secuenciación (227.346 y 932.989 polimorfismos a 1X y 5X, respectivamente, filtrando a 1FD), y disminuyó al aplicar filtros de cobertura mínima más altos (3.248 y 62.802 polimorfismos a 1X y 5X, respectivamente, filtrando a 10FD). El uso de coberturas de secuenciación más bajas ofrece una mayor precisión a nivel de polimorfismos y genotipos con respecto al estándar de referencia al utilizar umbrales de profundidad mínima bajos (1-4FD), alcanzando el 69% y 62% a 1X y 5X para 1-2FD, respectivamente, mientras que se alcanza una mayor precisión con el uso de coberturas de secuenciación más altas al utilizar filtros de umbral más alto (5-10FD), siendo del 43% y 54% a 1X y 5X para 10FD, respectivamente. Este estudio ofrece una valiosa evaluación de parámetros relevantes a considerar en la caracterización genotípica de la berenjena mediante SWGR, tomando en cuenta variables económicas, número de genotipos, abundancia de polimorfismos y tipo de estudio o programa de mejora, entre otras. Es por ello que la mejor combinación de cobertura de secuenciación y filtrado de polimorfismos debe ser evaluada en cada caso concreto. En términos generales, los resultados indican que SWGR es una herramienta efectiva, rentable y pragmática para el análisis genético y genómico de la berenjena, lo que permitirá a los investigadores avanzar en el desarrollo de nuevos recursos genéticos y a los mejoradores implementar programas de mejora más precisos, rápidos y eficientes. es_ES
dc.description.abstract [EN] The common eggplant (Solanum melongena L., 2n = 2x = 24) is the sixth vegetable with the highest world production, ranking third among the Solanaceae, after tomato and potato. Despite its great relevance, compared to other economically important crops and model species, it has lagged behind in the advancement of genomic tools. However, technological progress, decreasing sequencing costs and advances made in the development of bioinformatics programs are allowing the reduction of the gap between species in terms of availability of genomic resources. This is reflected in the access to reference genomes, even from minority crops, as well as in the adoption of new massive genotyping strategies, such as skim whole genome resequencing (SWGR), which allows the identification of a large number of polymorphisms, even at low sequencing coverages (<10X). To analyze and optimize the SWGR strategy in eggplant, five sequencing coverages (1-5X) generated in silico were evaluated. The evaluation consisted of mapping reads against the eggplant reference genome 67/3, tagging duplicate sequences, identifying polymorphisms and filtering them at different minimum mapping depths (1-10FD). Finally, each data set was compared with a reference standard resulting from 20X resequencing of the same genotype. Regarding the identification of polymorphisms, a reduction in the number of variants was observed when tagging duplicate sequences with respect to not tagging them, except for low sequencing coverages (1X). The number of polymorphisms identified increased with sequencing coverage (227,346 and 932,989 polymorphisms at 1X and 5X, respectively, filtering at 1FD), and decreased when applying higher minimum coverage filters (3,248 and 62,802 polymorphisms at 1X and 5X, respectively, filtering at 10FD). The use of lower sequencing coverage provides higher accuracy at the polymorphism and genotype level with respect to the reference standard when using low minimum depth thresholds (1-4FD), reaching 69% and 62% at 1X and 5X for 1-2FD, respectively, while higher accuracy is achieved with the use of higher sequencing coverage when using higher threshold filters (5-10FD), being 43% and 54% at 1X and 5X for 10FD, respectively. This study offers a valuable evaluation of relevant parameters to consider in the genotypic characterization of eggplant by SWGR taking into account economic variables, number of genotypes, abundance of polymorphisms and type of study or breeding program, among others. Therefore, the best combination of sequencing coverage and polymorphism filtering should be evaluated on a case-by-case basis. Overall, the results indicate that SWGR is an effective, cost-effective and pragmatic tool for genetic and genomic analysis of eggplant, which will allow researchers to advance the development of new genetic resources and breeders to implement more accurate, rapid and efficient breeding programs. es_ES
dc.format.extent 80 es_ES
dc.language Español es_ES
dc.publisher Universitat Politècnica de València es_ES
dc.rights Reserva de todos los derechos es_ES
dc.subject Eggplant es_ES
dc.subject Genotyping es_ES
dc.subject Sequencing coverage es_ES
dc.subject Reference standard es_ES
dc.subject Berenjena es_ES
dc.subject Genotipado es_ES
dc.subject Skim whole genome resequencing es_ES
dc.subject Cobertura de secuenciación es_ES
dc.subject Estándar de referencia es_ES
dc.subject.classification GENETICA es_ES
dc.subject.other Máster Universitario en Mejora Genética Vegetal-Màster Universitari en Millora Genètica Vegetal es_ES
dc.title Optimización de la secuenciación del genoma de berenjena (Solanum melongena) a baja cobertura es_ES
dc.title.alternative Guidelines for skim whole genome sequencing optimization in eggplant (Solanum melongena) es_ES
dc.title.alternative Optimització de la seqüenciació del genoma d'albergínia (Solanum melongena) a baixa cobertura es_ES
dc.type Tesis de máster es_ES
dc.rights.accessRights Abierto es_ES
dc.contributor.affiliation Universitat Politècnica de València. Departamento de Biotecnología - Departament de Biotecnologia es_ES
dc.description.bibliographicCitation Baraja Fonseca, V. (2023). Optimización de la secuenciación del genoma de berenjena (Solanum melongena) a baja cobertura. Universitat Politècnica de València. http://hdl.handle.net/10251/197392 es_ES
dc.description.accrualMethod TFGM es_ES
dc.relation.pasarela TFGM\157144 es_ES


Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem