-->

Welcome to our Coding with python Page!!! hier you find various code with PHP, Python, AI, Cyber, etc ... Electricity, Energy, Nuclear Power

Saturday 22 June 2019

Estimation of number of Clusters via gap statistics and prediction strength

I am trying to translate the R implementations of gap statistics and prediction strength into python scripts for the estimation of number of clusters in iris data with 3 clusters.

here is the python code

# coding: utf-8

# Implémentation de K-means clustering python



#Chargement des bibliothèques

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn import datasets


#chargement de jeu des données Iris

iris = datasets.load_iris()

#importer le jeu de données Iris dataset à l'aide du module pandas

x = pd.DataFrame(iris.data)

x.columns = ['Sepal_Length','Sepal_width','Petal_Length','Petal_width']



y = pd.DataFrame(iris.target)



y.columns = ['Targets']



#Création d'un objet K-Means avec un regroupement en 3 clusters (groupes)

model=KMeans(n_clusters=3)



#application du modèle sur notre jeu de données Iris

model.fit(x)



#Visualisation des clusters

plt.scatter(x.Petal_Length, x.Petal_width)
plt.show()




colormap=np.array(['Red','green','blue'])




#Visualisation du jeu de données sans altération de ce dernier (affichage des fleurs selon leur étiquettes)

plt.scatter(x.Petal_Length, x.Petal_width,c=colormap[y.Targets],s=40)
plt.title('Classification réelle')
plt.show()

#Visualisation des clusters formés par K-Means

plt.scatter(x.Petal_Length, x.Petal_width,c=colormap[model.labels_],s=40)
plt.title('Classification K-means ')
plt.show()

No comments:

Post a Comment

Thanks for your comments

Rank

seo