紙媒体で知識や経験を管理すると無くなりがちなのでブログで管理することにしました.
      殆どの記事は自分自身のためだけに書いているため,他人に見せる前提の内容, 文章ではありません.
      また, ブログのコメント欄を解放していたらbotからの迷惑行為を受けたため現在コメント欄は解放しておりません.

【pandas】 DataFrameの操作について

Irisで試す

# データCSVの読み込み
iris = pd.read_csv("input.csv")

f:id:umashika5555:20171113212446p:plain

# データのある特徴列を削除する
iris.drop("Id", axis=1, inplace=True)

f:id:umashika5555:20171113212515p:plain

# 同データのカウント
# ”Species”という特徴列の名義特徴量の種類をそれぞれカウント
iris["Species"].value_counts()

f:id:umashika5555:20171113212537p:plain

# 各特徴列の値の個数をカウント
# null値があるかもチェック
# memoryなども表示してくれる
iris.info()

f:id:umashika5555:20171113212608p:plain

# count, mean, std, min, 25, 50, 75, maxを算出
iris.describe()

f:id:umashika5555:20171113212623p:plain