k平均法 による IRISデータのクラスタリング
import seaborn as sns
from sklearn.cluster import KMeans
iris = sns.load_dataset("iris")
iris.head(10)
k-meansクラスから iris データセット向けに設定したインスタンスを作ります。
KMeansの引数は
kmeans = KMeans(n_clusters=3, max_iter=30, init="random" )
iris.values[ : , [0:4]]:irisデータフレームの0列から4列まで使用
cluster = kmeans.fit_predict(iris.values[:,0:4])
iris_after = iris.iloc[:,[0,1,2,3]]
iris_after["cluster"] = ["cluster = "+str(x) for x in cluster]
iris_after.head(10)
sns.pairplot(iris_after, hue = "cluster", diag_kind="kde")