Gran parte de la información química medio ambiental es de tipo multivariante, es decir se determinan diferentes variables en diferentes objetos. En el caso de los estudios de los contenidos de metales pesados en suelos, las variables son los metales y los objetos son los suelos. Los resultados se pueden poner en forma de matriz bidimensional, X, con un úmero de filas, n, igual al número de suelos muestreados, y un número de columnas, p, igual al número de metales analizados.
Los métodos quimiométricos multivariantes, se emplean como herramientas para visualizar mejor la información contenida en esa tabla, poniendo de manifiesto las relaciones existentes tanto entre las variables (metales) como entre los objetos (suelos).
El Análisis en Componentes Principales (ACP or PCA) es una de esas herramientas. La matriz X es descompuesta de acuerdo a:
Donde uif y vjf son los elementos de las matrices de scores y loadings (cargas) U y V con (n x NF) y (p x NF) dimensiones respectivamente y eij es el término de error de cada elemento de la matriz de datos X. NF es el número de factores o componentes - también llamados variables latentes - ortogonales (que no comparte información) escogido tan pequeño como sea posible, pero manteniendo la mayor cantidad posible de varianza explicada, es decir de información. La matriz V proporciona una comprensión considerable de las interrelaciones entre los metales. mientra que U trata de los relaciones entre las muestras de suelos.
El algoritmo concentra la varianza en los primeros factores, por lo que una gráfica de las dos primeras columnas de V o U, contendrá usualmente la mayor cantidad de información presente en la tabla original. Además, una representación bivariada o conjunta de loadings y scores, mostrará simultáneamente las relaciones entre variables y muestras.
A large amount of the environmental information is multivariate, i.e. different variables are determined in different objects. In the case of the estudy of the contents of heavy metales in soils, the varaibles are the metals and the objects are the soils. The results can be arrayed as a bidimensional matrix, X, with a number of rows equals to the number of sampled soils, and a number of columns equal to the number of analyzed metals.
Chemometric multivariate methods are a series of tools used to best highlight the information of such tables, finding the existing relationships amongst variables (metals) and objects (soils).
Principal Component Analysis (PCA) is a such tool. The X matrix is decomposed according to:
Where uif and vjf are the elements of the scores and loading matrices U and V of (n × NF)and (p × NF) dimensions respectively, and eij is the error term of each element of the X data array. NF is the number of orthogonal (no sharing information) significant factors or componentes - also known as latent variables - chosen as small as possible, but accounting for the greater amount of explained variance, i.e. information. V matrix provides considerable insights about the relationships amongst the metals, whereas U takes account of the relatioships amongst the soil samples.
The algorithm concentrates the variance in the first factors, so a plot of the two first columns of V and U, will usually contain the larger amount of information of the original table, showing the relationships amongst variables (loadings plot) or samples (scores plot). Additionally, a joint or bivariate plot of both loadings ans scores, will show simultaneously the relationships amongst variables and samples.
Continuará/To be continued
Suscribirse a:
Enviar comentarios (Atom)
No hay comentarios:
Publicar un comentario