Resumen La presente tesis doctoral aborda el análisis estadístico de series simples y múltiples de experimentos de “Time Course Microarray” (TCM). El trabajo se centra en el desarrollo, aplicación y evaluación de métodos estadísticos específicos que consideran la problemática de este tipo de datos, tanto desde el punto de vista de selección de genes como del análisis funcional. Las técnicas desarrolladas se comparan con otros métodos del estado del arte actual evaluando las diferentes metodologías en términos de eficiencia y significado biológico de los resultados. La tesis está estructurada en dos bloques principales. En el primero, se revisa la literatura relevante y se resume en una parte introductoria. Los Capítulos 1 y 2 incluyen la descripción del funcionamiento de la tecnología de “microarrays” así como una revisión crítica de los métodos estadísticos aplicados a este tipo de datos. En esta parte se muestran los inconvenientes que surgen al aplicar métodos generales a series temporales de “microarrays” y se justifica la necesidad de desarrollar nuevas técnicas para el análisis de TCM. El Capítulo 3 finaliza este primer bloque con una revisión de los métodos estadísticos específicos para TCM. Muchas de las técnicas que se presentan en este capítulo han sido publicadas en el mismo período de elaboración de esta tesis. En el Segundo bloque, se presentan las técnicas estadísticas para TCM desarrolladas en el proceso de investigación llevado a cabo en esta tesis. El Capítulo 4 describe la primera técnica de análisis de TCM propuesta: la metodología maSigPro (“microarray Significant Profile”). La técnica maSigPro usa análisis de regresión lineal para modelar la expresión génica y lleva a cabo una estrategia en dos pasos para seleccionar los genes diferencialmente expresados (d.e.g.): en el primer paso se identifican los genes de interés y en el segundo paso se detectan, gen a gen, los perfiles con evolución diferencialmente significativa en el tiempo. En el Capítulo 5 se adapta la técnica multivariante ASCA (ANOVA Simultaneous Component Analysis) a datos de TCM, obteniendo como resultado el método ASCA-genes que combina la exploración multivariante de datos de series temporales con un procedimiento de selección para la identificación de genes con cambios relevantes. El capítulo 6 incluye un tercer estudio en el que se combina la habilidad de ASCA para detectar las señales de expresión génica, teniendo en cuenta el comportamiento coordinado de los genes, con la habilidad de maSigPro para modelar los datos de series temporales e identificar los d.e.g. Los resultados muestran que, especialmente cuando hay alto nivel de ruido estructural en los datos, el uso de ASCA como una estrategia de preprocesamiento de datos mejora los resultados de maSigPro. También se muestra que la estrategia de filtrado de datos desarrollada puede ser usada con otros métodos para análisis de TCM mejorando las tasas de falsos negativos y positivos. Estas técnicas, al igual que muchas otras de análisis de datos de TCM, ofrecen como resultados listas de genes diferencialmente expresados. Sin embargo, en el estudio de la expresión génica, se considera un resultado mucho más útil e interpretable el indicar la regulación génica como función celular o de procesos biológicos. Normalmente, esta traducción se lleva a cabo a partir de la lista de genes diferencialmente expresados (d.e.g.). Esto implica en muchos casos limitaciones en el poder de detección debido a la necesidad de un nivel arbitrario de d.e.g. sin tener en cuenta la coordinación entre funciones biológicas. El último capítulo aborda el desarrollo de métodos estadísticos para una evaluación directa e integrada de las alteraciones que pueden sufrir las funciones génicas en TCM. Para este propósito, se han adaptado las técnicas maSigPro, ASCA y PCA incorporándoles información funcional obteniendo las metodologías maSigFun, PCA-maSigFun y ASCA-functional. El documento acaba con el Capítulo 8 donde se incluyen las conclusiones y algunas propuestas de investigación futura.