18 jun 2011

Ejercicios: "IRIS" (1ª Parte)

Esta entrada será actualizada según se vaya desarrollando. Se trata de aplicar a una serie de datos (en este caso flores “iris”) los métodos quimiométricos que hemos ido viendo hasta ahora, y los que iremos viendo en el futuro. La entrada quedará dentro de un grupo con la etiqueta “Ejercicios”.
This input will be updated as son as it will be developed. I like to apply to a data table (in this case about “iris flowers”some  chemometric methods.
La idea es trabajar con Excel y algunas otras herramientas que encontremos por Internet para obtener información relevante acerca de este grupo. Estos ficheros están pensados para trabajar en Matlab o R,y también trabajaremos con ellos en caso necesario.
The idea is to work with Excel mainly, and with other tolos available on Internet, to obtain relevant information about this data. If necessary we will use Matlab or R.
Descargar los ficheros de “iris” desde una interesante página web.
You can download the Iris files from this interesting webpage.
Importar los datos a Excel y organizarlos por categorías: (1, 2 y 3)
Import the data to Excel and organize it by categories.
En Excel organizar una primer columna para la categoría, después las demás son para la longitud y anchura del sépalo (1 y 2) y pala la longitud y anchura de los pétalos (3 y 4).
In Excel organize the data this way:

Clase
Sepal Length
Sepal Widht
Petal length
Petal Width
1
5.10
3.50
1.40
0.20
1
4.90
3.00
1.40
0.20
1
4.70
3.20
1.30
0.20
1
4.60
3.10
1.50
0.20

Crear categorías y crear un gráfico para sacar ciertas conclusiones sobre los grupos y podemos contestar a las preguntas de la página 3 del “PDF de Ejercicios”.
Create categories in Excel, to obtain information about the Data, and we can answer the questions of page 3 in  “Exercices_PDF”
Guardar la Hoja de Excel para seguir desarrollandola.
Save the Excel file to continue developing.

Centramos los datos (ver video "centrado de una matriz en Excel" ) y calculamos la matriz de covarianzas.
We centered the data (see the video “centrado de una matriz en Excel”), and we calculate the “covariance matrix”.

Matriz de covarianzas
Covariance Matrix
0.6811-0.04221.26580.5128
-0.04220.1887-0.3275-0.1208
1.2658-0.32753.09551.2870
0.5128-0.12081.28700.5771


Seleccionamos solo las covarianzas de las longitudes de "sépalo" (columna 1) respecto al "pétalo" (columna 3):
We select only the covariance’s of the length of sepal (column 1) and petal (column 3).

0.6811221.265820
1.2658203.095503

Ahora calculamos los eigenvectors y eigenvalues con la calculadora del MIT:
Now we calculate the eigenvectors and eigenvalues with the M.I.T calculator.

Los resultados calculados estan escalados para que el vector tenga una longitud de "1".
The results are scaled, so the vector has length = 1
Trazamos estos vectores ( y sus múltiplos) sobre el gráfico centrado (con su linea común):
We draw this new vectors on the graphic to see them versus the originals.


¿Deseas la hoja Excel de datos para practicar?. Insertar comentarios para información.
Do you need the data to practice?. Insert comments how to get it.





No hay comentarios:

Publicar un comentario