Como consecuencia del incremento de los problemas de eutrofización en ríos, lagos y costas, se ha producido en las últimas décadas un notable aumento del interés por la eliminación de nutrientes en las aguas residuales previamente a su vertido en los sistemas naturales. Inicialmente, la eliminación de la materia orgánica y el nitrógeno presente en el agua residual se realizaba por medio de procesos biológicos mientras que el fósforo se eliminaba mediante procesos químicos. Sin embargo, las ventajas que presenta la eliminación biológica de fósforo han contribuido a que gradualmente este proceso haya sido implantado cada vez en más estaciones depuradoras de aguas residuales (EDARs). El control de un proceso tan complejo como es el tratamiento de las aguas residuales con eliminación biológica de fósforo, exige conocer las variables de calidad que definen la eficacia del mismo (concentración de ortofosfatos, de amonio, demanda química de oxígeno,...). Los métodos existentes para la medición de estas variables en tiempo real suponen fuertes inversiones y elevados costes de mantenimiento. Por otro lado, existen otras variables (variables de proceso: pH, conductividad,...) que se pueden medir en tiempo real por medio de sensores robustos, de bajo coste y que requieren poco mantenimiento, pero que no suministran de forma directa información del funcionamiento del proceso. El elevado número de variables de proceso que actualmente se registran en tiempo real en EDARs modernas, hace necesaria la utilización de técnicas que permitan extraer la información contenida en la gran cantidad de datos registrados. El objetivo principal de la presente tesis ha sido estudiar las posibilidades de utilización de las variables de proceso para obtener información acerca de la evolución de las variables de calidad, así como sobre la evolución del proceso a lo largo del tiempo, mediante la aplicación de métodos estadísticos multivariantes. De esta forma, se pretende detectar cualquier anomalía que pueda ocurrir (causa especial de variabilidad que puede provocar un funcionamiento inaceptable o inusual del proceso y/o un efluente de baja calidad) y ayudar en la identificación de su origen, obviando la utilización de las sondas de calidad cuyo elevado coste hace inviable su disponibilidad en la mayor parte de las EDARs existentes. El trabajo realizado se ha centrado en el estudio de un reactor discontinuo secuencial (SBR, Sequencing Batch Reactor) a escala de laboratorio operado para la eliminación biológica de fósforo de las aguas residuales. Se trata de un proceso por lotes (discontinuo), en el que se alternan condiciones anaerobias y aerobias para favorecer el crecimiento de las bacterias acumuladoras de polifosfatos. Para el análisis “a posteriori” (off-line), es decir, de lotes (ciclos) ya finalizados, se han estudiado y comparado dos enfoques: el propuesto por Nomikos y MacGregor (1995) y el propuesto por Wold et al. (1998). Debido a las limitaciones presentadas por el nivel de observación del enfoque de Wold et al. (1998) en el conjunto de datos utilizado, se han propuesto y analizado dos alternativas para mejorarlo: una consistente en reemplazar la regresión en mínimos cuadrados parciales (PLS, Partial Least Squares) por un análisis de componentes principales (PCA, Principal Component Analysis), y la segunda consistente en realizar un preprocesamiento diferente y reemplazar el PLS por un PCA para extraer la información relevante del proceso. Para la monitorización en tiempo real del proceso se han estudiado y comparado seis estrategias: el nivel de observación de la metodología propuesta por Wold et al. (1998), la alternativa que emplea un preprocesamiento diferente, la construcción de múltiples modelos de referencia y los tres métodos de imputación para la parte futura del lote sugeridos por Nomikos y MacGregor (1995): desviación nula, desviación constante y datos faltantes. Para predecir la evolución de las variables de calidad (fósforo, potasio y magnesio), determinadas analíticamente en laboratorio, se han desarrollado diversos modelos predictivos o soft sensors, entre los cuales se han considerado tanto modelos de proyección sobre estructuras latentes como modelos de redes neuronales. Todos los modelos han sido validados utilizando un conjunto de datos diferente al utilizado para la construcción de los mismos y se han comparado desde el punto de vista del error cuadrático medio de este conjunto de datos de validación. A partir de los resultados obtenidos, se ha propuesto un sistema integral para la monitorización, diagnóstico y predicción en tiempo real del SBR, mediante la aplicación de métodos de control estadístico multivariante de procesos basados en técnicas de proyección sobre estructuras latentes. Para tener en cuenta que en el proceso estudiado además de las autocorrelaciones y correlaciones cruzadas entre las variables a lo largo de cada lote existe una correlación importante entre lotes, el esquema de monitorización propuesto incluye dos niveles, de manera que permite visualizar el transcurso en tiempo real del lote actual y también la evolución general del proceso asociada a los lotes anteriores ya finalizados. Los resultados que se han obtenido a lo largo del desarrollo del presente trabajo ponen de manifiesto que la aplicación de técnicas estadísticas avanzadas puede ayudar a conseguir una operación más eficiente y segura del proceso utilizando la información contenida en las variables de proceso de fácil medición.