Resumen:
|
[ES] La berenjena común (Solanum melongena L., 2n = 2x = 24) es la sexta hortaliza con mayor producción mundial, ocupando el tercer lugar entre las solanáceas, después del tomate y la patata. A pesar de su gran relevancia, ...[+]
[ES] La berenjena común (Solanum melongena L., 2n = 2x = 24) es la sexta hortaliza con mayor producción mundial, ocupando el tercer lugar entre las solanáceas, después del tomate y la patata. A pesar de su gran relevancia, en comparación con otros cultivos económicamente importantes y especies modelo, se ha quedado rezagada en el avance de herramientas genómicas. Sin embargo, el progreso tecnológico, la disminución de los costes de secuenciación y los avances logrados en el desarrollo de programas bioinformáticos están permitiendo la reducción de la brecha entre especies en términos de disponibilidad de recursos genómicos. Esto se refleja en el acceso a genomas de referencias, incluso de cultivos minoritarios, así como en la adopción de nuevas estrategias de genotipado masivo, como el skim whole genome resequencing (SWGR), que permite la identificación de un gran número de polimorfismos, incluso a bajas coberturas de secuenciación (<10X).
Para analizar y optimizar la estrategia SWGR en berenjena, se evaluaron cinco coberturas de secuenciación (1-5X) generadas in silico. La evaluación consistió en el mapeo de las lecturas contra el genoma de referencia de berenjena 67/3, el marcado de las secuencias duplicadas, la identificación de polimorfismos y su filtrado a diferentes profundidades mínimas de mapeo (1-10FD). Finalmente, cada conjunto de datos se comparó con un estándar de referencia resultante de la resecuenciación a 20X del mismo genotipo. En relación a la identificación de polimorfismos, se observó una reducción en el número de variantes al marcar las secuencias duplicadas con respecto a no marcarlas, salvo para coberturas de secuenciación bajas (1X). El número de polimorfismos identificados aumentó con la cobertura de secuenciación (227.346 y 932.989 polimorfismos a 1X y 5X, respectivamente, filtrando a 1FD), y disminuyó al aplicar filtros de cobertura mínima más altos (3.248 y 62.802 polimorfismos a 1X y 5X, respectivamente, filtrando a 10FD). El uso de coberturas de secuenciación más bajas ofrece una mayor precisión a nivel de polimorfismos y genotipos con respecto al estándar de referencia al utilizar umbrales de profundidad mínima bajos (1-4FD), alcanzando el 69% y 62% a 1X y 5X para 1-2FD, respectivamente, mientras que se alcanza una mayor precisión con el uso de coberturas de secuenciación más altas al utilizar filtros de umbral más alto (5-10FD), siendo del 43% y 54% a 1X y 5X para 10FD, respectivamente.
Este estudio ofrece una valiosa evaluación de parámetros relevantes a considerar en la caracterización genotípica de la berenjena mediante SWGR, tomando en cuenta variables económicas, número de genotipos, abundancia de polimorfismos y tipo de estudio o programa de mejora, entre otras. Es por ello que la mejor combinación de cobertura de secuenciación y filtrado de polimorfismos debe ser evaluada en cada caso concreto. En términos generales, los resultados indican que SWGR es una herramienta efectiva, rentable y pragmática para el análisis genético y genómico de la berenjena, lo que permitirá a los investigadores avanzar en el desarrollo de nuevos recursos genéticos y a los mejoradores implementar programas de mejora más precisos, rápidos y eficientes.
[-]
[EN] The common eggplant (Solanum melongena L., 2n = 2x = 24) is the sixth vegetable with the highest world production, ranking third among the Solanaceae, after tomato and potato. Despite its great relevance, compared to ...[+]
[EN] The common eggplant (Solanum melongena L., 2n = 2x = 24) is the sixth vegetable with the highest world production, ranking third among the Solanaceae, after tomato and potato. Despite its great relevance, compared to other economically important crops and model species, it has lagged behind in the advancement of genomic tools. However, technological progress, decreasing sequencing costs and advances made in the development of bioinformatics programs are allowing the reduction of the gap between species in terms of availability of genomic resources. This is reflected in the access to reference genomes, even from minority crops, as well as in the adoption of new massive genotyping strategies, such as skim whole genome resequencing (SWGR), which allows the identification of a large number of polymorphisms, even at low sequencing coverages (<10X). To analyze and optimize the SWGR strategy in eggplant, five sequencing coverages (1-5X) generated in silico were evaluated. The evaluation consisted of mapping reads against the eggplant reference genome 67/3, tagging duplicate sequences, identifying polymorphisms and filtering them at different minimum mapping depths (1-10FD). Finally, each data set was compared with a reference standard resulting from 20X resequencing of the same genotype. Regarding the identification of polymorphisms, a reduction in the number of variants was observed when tagging duplicate sequences with respect to not tagging them, except for low sequencing coverages (1X). The number of polymorphisms identified increased with sequencing coverage (227,346 and 932,989 polymorphisms at 1X and 5X, respectively, filtering at 1FD), and decreased when applying higher minimum coverage filters (3,248 and 62,802 polymorphisms at 1X and 5X, respectively, filtering at 10FD). The use of lower sequencing coverage provides higher accuracy at the polymorphism and genotype level with respect to the reference standard when using low minimum depth thresholds (1-4FD), reaching 69% and 62% at 1X and 5X for 1-2FD, respectively, while higher accuracy is achieved with the use of higher sequencing coverage when using higher threshold filters (5-10FD), being 43% and 54% at 1X and 5X for 10FD, respectively. This study offers a valuable evaluation of relevant parameters to consider in the genotypic characterization of eggplant by SWGR taking into account economic variables, number of genotypes, abundance of polymorphisms and type of study or breeding program, among others. Therefore, the best combination of sequencing coverage and polymorphism filtering should be evaluated on a case-by-case basis. Overall, the results indicate that SWGR is an effective, cost-effective and pragmatic tool for genetic and genomic analysis of eggplant, which will allow researchers to advance the development of new genetic resources and breeders to implement more accurate, rapid and efficient breeding programs.
[-]
|