26 nov 2011

Unscrambler: PLS Regression (Part 1)

Ya os he comentado la imprescindible ayuda que proporciona el libro "Multivariate Data Analysis - in practice" del Kim H. Esbensen para iniciarte en la práctica de Unscrambler. Lo hemos estado haciendo en la serie "Repasando Unscrambler" con datos espectroscópicos de espectros de gasolina.
Esta serie de espectros los estudia también A.M.C. Davies en la Tony Davies Column en tres artículos:
The value of pictures 10/4 (1998).
More pictures from PLS regression analysis 10/6 (1998).
Uncertainty testing in PLS regression 13/2 (2001).
Podéis encontrarlos y descargarlos en Spectroscopy Europe.
En ellos comenta la importancia de mirar a los gráficos que se generan y no simplemente a los ya conocidos X-Y plot, así como a estadísticos como el RSQ y SEP.
También comenta en estos artículos, un comentario de Ian Cowe, que realmente debemos de tener en cuenta "What we (chemometricians) do is mainly to look at the pictures". 
Es importante por tanto, para nosotros que tratamos de introducirnos y profundizar en lo posible en este complejo mundo de la quimiometría de interpretar y entender los gráficos que se generan con el proceso de calibración y no solo quedarnos con el resultado final.
Hemos estado trabajando con los espectros con los análisis PCA, y ahora lo haremos con la regresión  PLS1.
En la regresión se recomiendan usar 3 factores, por lo que podemos ver mapas de dos dimensiones:
Term 1 vs Term 2
Term 1 vs Term 3
Term 2 vs Term 3
Observemos el 1 vs 2:

Volvemos a encontrar las muestras M52 y H59, que son las dos muestras aditivadas.
Estas muestras en el gráfico de influencia (usando los tres términos)  y en el eje de varianza residual Y, muestran un valor practicamente de cero:
Teniendo la H59 una gran influencia sobre el modelo.
Sin quitar ninguna muestra y con los tres factores PLS, el gráfico X-Y  es:

No hay comentarios:

Publicar un comentario