R & Chemometrics: Distancia de Mahalanobis (3)

26 ene 2011

Distancia de Mahalanobis (3)_rev.1

La varianza es una medida de dispersión y podemos calcularla individualmente para cada una de las variables independientes o de longitudes de onda, de modo que encontremos en que longitudes de onda existe mayor variabilidad, para tratar de correlacionar, de ser posible, esa varianza con la concentración de determinado analito. La correlación y la covarianza sin embargo dan una medida de como las variables independientes están relacionadas entre sí. Podemos ir al caso mas sencillo de un gráfico de dos ejes XY.

Representando en dicho espacio un círculo, la varianza de los valores en el eje X es igual que la varianza de los valores en el eje Y (sus proyecciones). Sin embargo la covarianza en el círculo es de "cero", no hay correlación entre las variables[1].Sin embargo en una elipse, las varianzas varían o son iguales en función de sus proyecciones, y las covarianza y la correlación, tendrán valores mas o menos altos.

Es una manera simple de asociar la matriz de covarianzas a el cálculo de una elipse. En el caso de espacios multidimensionales, hablaremos de elipsoides distribuidos respecto a un determinado centroide.. Los ejes de este elipsoide respecto, serán mayores o menores y tendrán unas direcciones determinadas. Estamos por tanto ante un espacio multidimensional distinto al euclideo, donde la representación es esférica en lugar de elipsoidal.

Determinar el umbral para que una muestra pertenezca a un grupo,se puede hacer por los valores de desviación estándar: 1, 2, 3 desviaciones estándar. En función de la posición de una muestra desconocida dentro de los límites nos dará una medida de probabilidad de que la muestra pertenezca a ese grupo. La probabilidad es mayor si cae dentro del are de 1 desviación estándar que en la de 3. No obstante puede ocurrir que una muestra este fuera de los umbrales para el caso del elipsoide y este dentro para el caso de la esfera, o viceversa. En el caso del elipsoide nos referimos a la distancia de Mahalanobis (por tener en cuenta la covarianza) y en el caso de la esfera a la distancia euclidiana.

En el caso del punto A, está fuera para el espacio de Mahalanobis y dentro para el Euclidiano, y el B está dentro para el de Mahalanobis y fuera para el Euclidiano.

[1] En este caso la distancia de Mahalanobis y la distancia euclidiana coinciden.Si ademas de esto la varianza de cada una de las variables es 1 (estaríamos ante la matriz unidad o de identidad), la distancia de Mahalanobis coincidiría con la distancia euclidiana reducida o normalizada.

R & Chemometrics

26 ene 2011

Distancia de Mahalanobis (3)_rev.1

No hay comentarios:

Publicar un comentario