29 nov. 2011

Unscrambler: PLS Regression (part 2)

Después de desarrollar la regresión PLS, debemos fijarnos en el gráfico de Varianza Explicada o Varianza residual (depende del que más nos guste). En el caso de la varianza explicada, lo normal es que aumente en función de los términos que vayamos añadiendo. No olvidemos que este cálculo lo realiza con el método de validación que hayamos elegido (leverage o cross validation). En este caso estamos usando leverage.
Claramente en el ejemplo que estamos usando ocurre algo extraño, la varianza explicada decrece al usar el primer término, lo que nos indica de una manera clara la existencia de anómalos.
Comprobamos que con tres términos se explica practicamente toda la varianza, y que no es conveniente añadir más términos.
Observar los espectros, nos ayudará a decidir si estas dos muestras (de las que venimos hablando) deben  o no, ser incluidas en la regresión.


Observar los loadings (X), nos ayudará a conocer la causa que hacen a estas muestras ser anómalas, concretamente el primero, que es el que claramente las separa del resto.

La banda de 1410 nm esta asociada a los grupos OH, y se muestra claramente en estas dos muestras que tienen alcohol añadido.

No hay comentarios:

Publicar un comentario