Resumen:
|
[ES] El objetivo del presente Trabajo de fin de grado consiste en la generación de un catálogo de secuencias ortólogas en las especies silvestres relacionadas con el tomate cultivado, que incluye 13 especies de la sección ...[+]
[ES] El objetivo del presente Trabajo de fin de grado consiste en la generación de un catálogo de secuencias ortólogas en las especies silvestres relacionadas con el tomate cultivado, que incluye 13 especies de la sección Lycopersicon, así como 2 especies de la sección Lycopersicoides. Para estas especies se dispone de estudios de resecuenciación previos, pero no se han generado ensamblajes genómicos ni anotaciones para la mayoría de ellas por lo que no hay secuencias de transcritos disponibles. Por lo tanto, la estrategia adoptada ha consistido en ensamblar los transcriptomas de cada especie a partir de los datos de secuenciación de ARN localizados en los repositorios públicos de secuencias. En primer lugar, se evaluó la calidad de las lecturas descargadas de cada una de las especies y, a continuación, estas secuencias se procesaron para eliminar las de menor calidad. A continuación, el conjunto de lecturas obtenidas para cada especie fue utilizado para ensamblar, al menos, un transcriptoma para cada especie. Posteriormente, los transcriptomas obtenidos fueron anotados funcionalmente, previa detección de las ORFs presentes en cada transcrito. Una vez se dispuso de todos los transcriptomas anotados se procedió a generar los grupos de genes ortólogos utilizando las herramientas disponibles en la base de datos eggNOG. Se analizó, por último, la relación de ortólogos entre el tomate (S. lycopersicum) y sus parientes salvajes más cercanos (S. pimpinellifolium, S. cheesmaniae, S. galapagense).
[-]
[EN] The aim of this degree dissertation is the generation of an orthologous sequences index for wild species related to domesticated tomato; this includes 13 species in the Lycopersicon section, as well as 2 species in ...[+]
[EN] The aim of this degree dissertation is the generation of an orthologous sequences index for wild species related to domesticated tomato; this includes 13 species in the Lycopersicon section, as well as 2 species in the Lycopersicoides section.
Previous re-sequencing projects are available for these species, but no genomic assemblies nor annotations have been performed for most of them, so there are no transcipt sequences available. Therefore, our strategy has consisted in a transcriptomic assembly for each species, from RNA sequencing data collected in public sequence repositories.
In first place, the quality of the loaded reads was evaluated for each species and, following, these sequences were parsed and trimmed to remove those of lowest quality. Next, the sets of reads were used to assembly, at least, one transcriptome per species. Finally, the obtained transcriptomes were functionally annotated, previously detecting the ORFs present in each transcript.
Once we disposed all annotated transcriptomes, we proceeded to generate the orthologous genes clusters by the hierarchy tools available at eggNOG database. Lastly, we analyzed the relationship of orthologs among tomato (S. lycopersicum) and its closest wild relatives (S. pimpinellifolium, S. cheesmaniae, S. galapagense).
[-]
|