Resumen:
|
[ES] Clasificación de Solanum lycopersicum y parientes silvestres mediante técnicas de
aprendizaje automático partiendo de datos genéticos.
Desde la domesticación del tomate (Solanum lycopersicum), y especialmente tras ...[+]
[ES] Clasificación de Solanum lycopersicum y parientes silvestres mediante técnicas de
aprendizaje automático partiendo de datos genéticos.
Desde la domesticación del tomate (Solanum lycopersicum), y especialmente tras su
introducción en Europa en el siglo XVI, esta planta ha evolucionado en función de las
necesidades de las poblaciones humanas que lo cultivaban, dando lugar a multitud de
variedades. Estas variedades se diferencian tradicionalmente en base a caracteres
morfológicos, pero ahora también disponemos de herramientas genómicas que nos permiten
comparar sus genomas. Con esta información se pueden crear grupos genéticos que
podemos comparar con las variedades basadas en los caracteres morfológicos. El objetivo
de este trabajo es analizar la capacidad de distintos sistemas de clasificación automático
para realizar estas clasificaciones. A partir de un conjunto de datos, que contiene las
diferencias genéticas entre las muestras, se ha realizado una serie de agrupaciones
automáticas de las distintas muestras en grupos en función de sus variaciones genéticas.
Dichas clasificaciones se han comparado con otras hechas manualmente para comprobar la
fiabilidad del modelo y la capacidad del sistema de clasificar las muestras en la categoría
anteriormente asignada. Esta comparación ha permitido concluir la utilidad de un modelo
automático para la clasificación de distintas especies salvajes emparentadas con el tomate,
pero también ha demostrado la dificultad de clasificar la diversidad del tomate moderno.
[-]
[EN] Clasification of Solanum lycopersicum and wild relatives with machine learning techniques
and genetic data
Since tomato (Solanum lycopersicum) was domesticated, and particularly after it was
introduced in Europe ...[+]
[EN] Clasification of Solanum lycopersicum and wild relatives with machine learning techniques
and genetic data
Since tomato (Solanum lycopersicum) was domesticated, and particularly after it was
introduced in Europe in 16th century, this plant has evolved according to the needs of the
human population that grew it, giving as a result many different varieties. The differences
between them are traditionally morphologic traits, but nowadays genomic tools enable
comparison of their genomes. With this data, we can now create genetic groups we that can
be compared with morphology based varieties. The main goal of this study is to analyse the
ability of different automatic machine learning systems to make these classifications. Starting
from a dataset that contains genetic differences between samples, several automatic
clusterings were performed, placing samples into groups according to their genetic
variations. These classifications were compared with other manually made to check the
reliability of the model and the system’s ability to assign the sample to the manually assigned
category. This comparison concluded that the model was useful to classify different tomatorelated wild species, but also showed the existent hardship to classify the intraspecies
diversity of modern tomato.
[-]
|