25 mar 2018

What condition must have the "loadings" in PLSR?

In the case of the loadings for PLS we do not have the condition of orthogonality as in the weights or scores, even if they are coming from orthogonal scores.
So the product of the matrices Pt.P is not a diagonal matrix, and this condition is what makes PLS regression special and different from Principal Components Regression.

Let´s check:
Xodd_pls3_ld1
Xodd_pls3_ld2
Xodd_pls3_ld3
Xodd_pls3_ld4
p.matrix<-cbind(Xodd_pls3_ld1,Xodd_pls3_ld2,
                Xodd_pls3_ld3,Xodd_pls3_ld4)


 > round(t(p.matrix) %*% p.matrix,4)
              Xodd_pls3_ld1 Xodd_pls3_ld2 Xodd_pls3_ld3 Xodd_pls3_ld4
Xodd_pls3_ld1        1.0132       -0.1151        0.0000        0.0000
Xodd_pls3_ld2       -0.1151        1.2019       -0.4493        0.0000
Xodd_pls3_ld3        0.0000       -0.4493        1.8783       -0.9372
Xodd_pls3_ld4        0.0000        0.0000       -0.9372        1.0134

We can see the red numbers that makes that we don´t get the condition of orthogonality, and how the loadings 2 and 3 are specially involved, and these is because in this case the loadings 1 and 4 are very similar to the weights 1 and 4, and 2 and 3 are quite different.

So loadings 1 and 4 are orthogonal between them. So there is no condition for the loadings.



7 comentarios:

  1. Hola mi nombre es Andres, soy estudiante de la universidad Industrial de Santander (Colombia), tengo que realizar una curva de calibracion para un NIR con los espectros y valores de referencia determinados en el laboratorio. ¿cual post me recomienda para poderme guiar?. No tengo experiencia en el uso de WinISI. Agradezco su colaboracion

    ResponderEliminar
    Respuestas
    1. Hola Andrés. Gracias por el comentario y por hacerte seguidor del blog. No se que equipo NIR es y el software de calibración que usa, ya que cada casa comercial usa su software concreto para posteriormente poner los modelos que se hagan en el software de rutina y poder hacer predicciones cuando la muestra es analizada. Si este es el caso tendrás que hacerlo con el software de la casa comercial. Si se trata de un trabajo, tesis p publicación puedes hacerlo con softwares comerciales como Unscrambler o con software libre como R. Todo parte de tener un fichero con los espectros donde una de las columnas tiene los nombres de las muestras y luego todas las demás columnas tiene los valores de reflectancia o absorción a cada longitud de onda, esta sería la matriz X, después está la matriz Y con los valores de referencia y a partir de ahí ya se puede comenzar el proceso de: Estudio de los espectros para identificar posibles muestras anómalas, grupos,... Desarrollo de la calibración,.....

      Eliminar
    2. Este comentario ha sido eliminado por el autor.

      Eliminar
  2. Muchas gracias por la información, una ultima duda cuando te refieres a un valor de refencia es un valor puntual (por ejemplo un % De aceite de la muestra)?. Si esa asi como hago para desarrollar la respectiva curva de calibracion con el valor de referencia y el espectro de la muestra (si cada espectro tiene varios valores de absorcion y no uno puntual caracteristico de la muestra)

    ResponderEliminar
    Respuestas
    1. Si Andres, el valor de referencia es el valor que da el laboratorio para una muestra de la que hemos recogido su espectro por NIR a varias longitudes de onda, por lo que para cada muestra tendremos su valor se referencia "Y1" y su valor de Absorbacia, o Reflectancia a muchas longitudes de onda (hay equipos que toman 700 o incluso muchas más) y que solemos llamar "X1". Necesitaremos varias muestras "N" con sus espectros y valores de referencia para desarrollar una calibración (por lo que tendremos Yn datos de referencia y Xn espectros, puedes poner por ejemplo unas 100 y los valores de referencia deberán de cubrir un rango determinado, que nos permita predecir las muestras que analicemos después de que hayamos puesto la calibración para trabajar en rutina en el equipo.
      Las calibraciones las haremos normalmente con PLS y podemos utilizar todo el espectro, y no solo las longitudes de onda a las que absorbe normalmente el analito de interés, ya que los espectros NIR tienen muchos solapamientos y tenemos que quitar interferencias de otras bandas que interfieren en las bandas del analito que nos interesa.
      es por ello que vamos añadiendo términos que llevan asociados sus loadings, scores, etc y van extrayendo la información de interés, mientras vamos validando con una validación cruzada para no cometer el fallo de sobreajustar nuestro modelo de calibración y que no prediga todo lo bien que debería.
      Si quieres ya me mandas un correo con más datos del equipo NIR que estas usando, así como las muestras de que dispones, etc y ya te podría dar algún detalle más.
      Saludos

      Eliminar
    2. A cual dirección de correo electrónico le puedo enviar el mensaje?

      Eliminar