k-means法 準備

k-means法で理想的な結果が出せるようにデータを予めプロットしておく方法

# -*- coding: utf-8 -*- impo
from sklearn.datasets import make_blobs
import matplotlib.pyplot as plt
X,y = make_blobs(n_samples=150, #サンプル点の総数
                n_features=2,   #特徴量の個数
                centers=5,      #クラスタの個数
                cluster_std=0.5,#クラスタの標準偏差
                shuffle=True,   #サンプルをシャッフル
                random_state=0) #乱数生成器の状態を指定
plt.scatter(X[:,0],X[:,1],c='blue',marker='o',s=30)
plt.grid()
plt.show()

plt.scatter()の色指定はcolorはcでもイイらしい.
横軸にX[:,0],縦軸にX[:,1]をセット
X[:,0]はXの全ての要素の1つ目の要素という意味

plt.scatter(X[:,0],X[:,1],c='blue',marker='o',s=30)

f:id:umashika5555:20170411075422p:plain