Resum La present tesi doctoral aborda l'anàlisi estadística de sèries simples i múltiples d'experiments de “ Time Course Microarray ” (TCM). El treball es centra en el desenvolupament, aplicació i avaluació de mètodes estadístics específics que consideren la problemàtica d'aquest tipus de dades, tant des del punt de vista de selecció de gens com de l'anàlisi funcional. Les tècniques desenvolupades es comparen amb altres mètodes de l'estat de l'art actual avaluant les diferents metodologies en termes d'eficiència i significat biològic dels resultats. La tesi està estructurada en dos blocs principals. En el primer, es revisa la literatura rellevant i es resumeix en una part introductòria. Els Capítols 1 i 2 inclouen la descripció del funcionament de la tecnologia de “microarrays” així com una revisió crítica dels mètodes estadístics aplicats a aquest tipus de dades. En aquesta part es mostren els inconvenients que sorgeixen a l'aplicar mètodes generals a sèries temporals de “microarrays” i es justifica la necessitat de desenvolupar noves tècniques per a l'anàlisi de TCM. El Capítol 3 finalitza aquest primer bloc amb una revisió dels mètodes estadístics específics per a TCM. Moltes de les tècniques que es presenten en aquest capítol han estat publicades en el mateix període d'elaboració d'aquesta tesi. En el Segon bloc, es presenten les tècniques estadístiques per a TCM desenvolupades en el procés d'investigació portat a terme en aquesta tesi. El Capítol 4 descriu la primera tècnica d'anàlisi de TCM proposta: la metodologia maSigPro (“microarray Significant Profile”). La tècnica maSigPro usa anàlisi de regressió lineal per a modelar l'expressió génica i porta a terme una estratègia en dos passos per a seleccionar els gens diferencialment expressats (d.e.g.): en el primer pas s'identifiquen els gens d'interès i en el segon pas es detecten, gen a gen, els perfils amb evolució diferencialment significativa en el temps. En el Capítol 5 s'adapta la tècnica multivariante ASCA (ANOVA Simultaneous Component Analysis) a dades de TCM, obtenint com resultat el mètode ASCA-genes que combina l'exploració multivariante de dades de sèries temporals amb un procediment de selecció per a la identificació de gens amb canvis rellevants. El capítol 6 inclou un tercer estudi en el qual es combina l'habilitat de ASCA per a detectar els senyals d'expressió génica, tenint en compte el comportament coordinat dels gens, amb l'habilitat de maSigPro per a modelar les dades de sèries temporals i identificar els d.e.g. Els resultats mostren que, especialment quan hi ha alt nivell de soroll estructural en les dades, l'ús de ASCA com una estratègia de preprocesamiento de dades millora els resultats de maSigPro. També es mostra que l'estratègia de filtrat de dades desenvolupada pot ser usada amb altres mètodes per a anàlisis de TCM millorant les taxes de falsos negatius i positius. Aquestes tècniques, igual que moltes altres d'anàlisis de dades de TCM, ofereixen com resultats llestes de gens diferencialment expressats. No obstant això, en l'estudi de l'expressió génica, es considera un resultat molt més útil i interpretable l'indicar la regulació génica com funció cel·lular o de processos biològics. Normalment, aquesta traducció es porta a terme a partir de la llista de gens diferencialment expressats (d.e.g.). Açò implica en molts casos limitacions en el poder de detecció a causa de la necessitat d'un nivell arbitrari de d.e.g. sense tenir en compte la coordinació entre funcions biològiques. L'últim capítol aborda el desenvolupament de mètodes estadístics per a una avaluació directa i integrada de les alteracions que poden patir les funcions génicas en TCM. Per a aquest propòsit, s'han adaptat les tècniques maSigPro, ASCA i PCA incorporant-los informació funcional obtenint les metodologies maSigFun, PCA-maSigFun i ASCA-functional. El document acaba amb el Capítol 8 on s'inclouen les conclusions i algunes propostes d'investigació futura.