[ES] Las nuevas tecnologías de secuenciación y genotipado han abaratado el coste de estos análisis y propiciado el desarrollo de proyectos que contemplan el análisis de cientos o miles de individuos. Además, estas tecnologías ...[+]
[ES] Las nuevas tecnologías de secuenciación y genotipado han abaratado el coste de estos análisis y propiciado el desarrollo de proyectos que contemplan el análisis de cientos o miles de individuos. Además, estas tecnologías son capaces de obtener el genotipo de millones marcadores genéticos en cada muestra. La combinación de número de individuos y número de marcadores crean matrices de datos inmensas que no son fáciles de analizar y manejar. Gran parte del software de análisis genéticos existentes no está adaptado al manejo de esta cantidad de datos, haciendo necesario el desarrollo de nuevos programas o la adaptación de los ya existentes a esta cantidad de información. Por otro lado, el manejo de esta cantidad de datos también resulta complejo para el investigador, por lo que es necesario el desarrollo de herramientas que faciliten su manejo, almacenamiento y visualización. El objetivo de este proyecto se enmarca en este problema: el manejo y la visualización de matrices con información genéticas de cientos de individuos procedentes de las nuevas herramientas de genotipado. Es necesario agilizar la gestión y el acceso a esta multitud de datos para poder realizar los diferentes análisis genéticos. Concretamente en este proyecto se van a estudiar diferentes estrategias y paquetes del lenguaje Phython para facilitar el acceso a los datos de genotipado y utilizar estos para realizar análisis multivariantes.
[-]
[EN] New sequencing and genotyping technologies have cheapened the cost of these
analyzes and led the development of projects involving the analysis of hundreds or
thousands of individuals. Moreover, these technologies ...[+]
[EN] New sequencing and genotyping technologies have cheapened the cost of these
analyzes and led the development of projects involving the analysis of hundreds or
thousands of individuals. Moreover, these technologies are able to get genotype
million genetic markers in each sample. The combination of number of individuals and
number of markers create huge data arrays, that aren’t easy to analyze and manage.
Much of the existing genetic analysis software isn’t adapted to manage this amount of
data, necessitating the development of new programs or adapting existing ones to this
wealth of information. On the other hand, the management of this amount of data is
also complex for researchers, so that the development of tools to facilitate its handling,
storage and visualization is necessary. The objective of this project is part of this
problem: handling and display matrices with genetic information from hundreds of
individuals from new tools of genotyping. It’s necessary to streamline the management
and access to this multitude of data to perform the different genetic analysis.
Specifically in this project they are to study different strategies and Python language
packages for easy access to genotyping data and use these to perform multivariate
analysis
[-]
|