Resum El desenvolupament de models matemàtics predictius de fenòmens de distint tipus és una de les aplicacions principals de la Mineria de Dades. Els mètodes simples disponibles per al desenvolupament de models de predicció sovint reduïxen la complexitat del problema a costa de sacrificar precisió en la resposta. Enfront d'esta disjuntiva hi ha la possibilitat d'aplicar les tècniques de mineria de dades, que partint de l'existència i disponibilitat de grans volums de dades, exploren les relacions i correlacions entre les diferents variables descriptores del fenomen i un conjunt d'observacions del mateix, buscant descobrir patrons de comportament amb l'objectiu de construir un model de predicció d'aquell. Este és el cas en la modelació d'elements contaminants en l'aire. La contaminació atmosfèrica és un fenomen amb un comportament altament no lineal i multivariant, l'estudi del qual exigeix disposar de matrius de dades de grans mides, per la qual cosa arriben a ser necessàries ferramentes d'anàlisi i maneig de dades molt complexes. A vegades s'utilitzen diversos mètodes, alguns objectius, altres un tant subjectius buscant un balanç entre les fortaleses i debilitats existents en les distintes ferramentes, així com avaluar (sovint per mitjà de mètodes de prova i error) distints horitzons de temps d'anticipació en la predicció, jugar amb la presència i absència de variables involucrades, amb la quantitat de dades, amb distintes agrupacions dels mateixos, etc. sempre tractant d'obtindre una millor comprensió del fenomen i aconseguir les millors prediccions possibles tenint en compte les limitacions derivades de la disponibilitat de dades relatives al sistema analitzat. En el cas concret d'esta tesi, els models de predicció desenvolupats es van enfocar per a la predicció del valor mitjà de Partícules Fines (PM2.5) presents en l'aire respirable amb un temps d'anticipació de 8 hores i de l'Ozó Troposfèric Màxim (O3) amb 24 hores d'anticipació. Es va treballar amb un interessant conjunt de tècniques de predicció partint de ferramentes de naturalesa paramètrica tan senzilles com Persistència, Modelació Lineal Multivariant, així com la tècnica semi- paramètrica denominada “Regression Ridge” a més de ferramentes de naturalesa no paramètrica com a Xarxes Neuronals Artificials i Màquines de Vectors Suport (SVM). Considerant que es coneixia prèviament la naturalesa altament no lineal dels contaminants modelats, les tècniques paramètriques van tindre la comesa d'establir límits màxims d'error en la predicció i de ser importants referències comparatives respecte a la resta de models desenvolupats. Un resultat significatiu del treball va ser l'obtenció de models de predicció millors als disponibles en la bibliografia, aplicant ferramentes de Xarxes Neuronals Artificials com Perceptron Multicapa (MultiLayer Perceptron, MLP), Perceptron Multi Capa Quadràtica (SMLP), Funció de Base Radial (RBF) i Xarxes Elman, així com Màquina de Vectors Suport (SVM).