En el último blog , presentamos e implementamos el algoritmo PCA usando código, en este blog aplicamos el algoritmo PCA para reducir la dimensionalidad y visualizar el conjunto de datos del iris.
Introducción al conjunto de datos de iris
Implementación de código
El siguiente código es del curso "Aplicación Python Machine Learning" en MOOC .
import matplotlib.pyplot como plt desde sklearn.decomposition import PCA desde sklearn.datasets import load_iris data = load_iris () # carga el conjunto de datos del iris en forma de diccionario y = data.target # usa y para representar la etiqueta en el conjunto de datos X = data.data # Use X para representar los datos de atributo en el conjunto de datos pca = PCA (n_components = 2) # Cargue el algoritmo PCA y establezca el número de componentes principales después de la reducción de dimensionalidad en 2 reduce_X = pca.fit_transform (X) # Reduzca la dimensionalidad de los datos originales y guárdelo en reduce_X Medio red_x, red_y = [], [] # primer punto de datos de tipo blue_x, blue_y = [], [] # segundo punto de datos de tipo green_x, green_y = [], [] # tercer punto de datos de tipo para i en rango (len (reduce_X)): # Guarde los puntos de datos con dimensionalidad reducida en diferentes listas según la categoría de iris. si y [i] == 0: elif y [i] == 1: red_x.append (reduce_X [i] [0]) red_y.append (reduce_X [i] [1]) azul_x.append (reducido_X [i] [0]) azul_y.append (reducido_X [i] [1]) más: green_x.append (reducido_X [i] [0]) verde_y.append (reducido_X [i] [1]) plt.scatter (red_x, red_y, c = 'r', marcador = 'x') plt.scatter (blue_x, blue_y, c = 'b', marcador = 'D') plt.scatter (green_x, green_y, c = 'g', marcador = '.') plt.show ()
Resultado de la operación: