Resumen:
|
[ES] En las últimas décadas, el aumento de la capacidad para tomar medidas de los sistemas que se
van a estudiar, ha provocado un increíble aumento de la información que se obtiene de los
objetos de estudio. En consecuencia, ...[+]
[ES] En las últimas décadas, el aumento de la capacidad para tomar medidas de los sistemas que se
van a estudiar, ha provocado un increíble aumento de la información que se obtiene de los
objetos de estudio. En consecuencia, aparecen matrices multidimensionales con decenas de
variables y con millones de entradas, lo cual provoca que sea casi imposible obtener
conclusiones de esa gigantesca nube de datos utilizando métodos descriptivos clásicos.
El método estadístico aplicado (Análisis de Componentes Principales, PCA) permite una
condensación de los datos reduciendo el número de variables las cuales describen casi la
misma información y por tanto, simplifican el modelo.
En este trabajo se expone cómo utilizar el PCA y los pasos previos, así como la manera de
interpretar las nuevas variables obtenidas del modelo.
Este método nos permite el estudio de matrices de datos muy grandes donde presuponemos
que las variables estudiadas tienen una correlación entre ellas y por tanto, se sabe que se
están estudiando variables redundantes. De esta manera, se puede saber qué implicación
tiene cada variable en el modelo.
Se han estudiado los datos de 4 estaciones meteorológicas a lo largo de un año. El fin de este
estudio es verificar la validez de los datos obtenidos, y mediante el PCA, saber qué variables
son las que determinan las características de las estaciones para futuros estudios. Gracias al
PCA se puede observar cómo se descartan variables que parecían importantes, y aparecen
rasgos del entorno que afectan a la variabilidad de las estaciones.
[-]
[EN] In the last decades, with the rise in the ability to take measurements from the systems that will
be studied, it cause an incredible increase in the information that we obtain from the objects
that we study. In ...[+]
[EN] In the last decades, with the rise in the ability to take measurements from the systems that will
be studied, it cause an incredible increase in the information that we obtain from the objects
that we study. In consequence, appears a multi-way matrix with around ten or more variables
with millions of inputs, which cause that is almost impossible to get any conclusión about that
huge cloud of data using the classic descriptive methods.
The stadistical method studied (PCA) allows for condensation the data reducing the number of
variables which will describe almost the same amount of information, so it simplifies the
model.
In this work it is explained how to use the PCA and the prior steps as well as the way to
understand the new variables obtained from the model.
This method allows the study of really big data matrix which we presuppose that the variables
studied in it have a correlation among them, therefore is known that there are redundant
variables. In this way, it can be known the involvement of each variable in the model.
Has been studied the data from 4 different wether stations over a year. The purpose of this
study is verify the validity of the data obtained, and using PCA, know the variables that
determine the characteristics of the station for the future studies. Thanks to the PCA it can be
seen how variables which seems importants to the model are discarded, and appear features
from the environment that affect the variability of the stations.
[-]
[CA] En les últimes dècades, amb l’aument de la capacitat per a pendre mesures dels sistemes que
es van a estudiar, ha provocat un increíble aument de la información que s’obté dels objectes
d’estudi. En conseqüència, ...[+]
[CA] En les últimes dècades, amb l’aument de la capacitat per a pendre mesures dels sistemes que
es van a estudiar, ha provocat un increíble aument de la información que s’obté dels objectes
d’estudi. En conseqüència, apareixen matrius multidimensionals amb desenes de variables i
amb milions d’entrades, el qual provoca que siga quasi imposible obtindre conclusions d’eixe
gegantí núvol de dades utilizant métodes descriptius clàssics.
El mètode estadístic estudiat (PCA) permet una condensació de les dades reduint el nombre de
variables les quals descriuen quasi la mateixa informació i per tant, simplifiquen el model.
En este treball s'exposa com utilitzar el PCA i els passos previs així com la manera d'interpretar
les noves variables obtingudes del model.
Este mètode ens permet l'estudi de matrius de dades molt grans on pressuposem que les
variables estudiades tenen una correlació entre elles i per tant, se sap que s'estan estudiant
variables redundants. D'esta manera, es pot saber que implicació té cada variable en el model.
S'han estudiat les dades de 4 estacions meteorològiques al llarg d'un any. El fi d'este estudi és
verificar la validesa de les dades obtingudes, i per mitjà del PCA, saber que variables són les
que determinen les característiques de les estacions per a futurs estudis. Gràcies al PCA es pot
observar com es descarten variables que pareixien importants, i apareixen característiques de
l'entorn que afecten la variabilitat de les estacions.
[-]
|