紙媒体で管理するとなくなりがちなのでブログで進捗などを管理することにしました
※殆どの記事は自分自身のためだけにかいています.他人に見せられるレベルには至っていません...

【Ubuntu】MeCabインストール

Ubuntu16.06LTSにMeCabとPython3用のMeCabのインストールを行った. MeCabのインストール 1. Gitからcloneして展開する $ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git2. mecab-ipadic-NEologdをインストールする $ ./bin/insta…

確率分布書き方

ポアソン分布の作り方 import scipy.stats import numpy as np import matplotlib.pyplot as plt #figsize(12.5,4) lambda_ = [1.5, 4.25] colors = ["#348ABD","#A60628"] a = np.arange(16) plt.bar(a,scipy.stats.poisson.pmf(a,lambda_[0]),color=colors…

ベイズ推論イントロ

Pythonで体験するベイズ推論Pythonで体験するベイズ推論 PyMCによるMCMC入門作者: キャメロンデビッドソン=ピロン,玉木徹出版社/メーカー: 森北出版発売日: 2017/04/06メディア: 単行本(ソフトカバー)この商品を含むブログを見るから, ベイズ推論について…

【scikit-learn】Ridge回帰【その2】

RidgeCVというモデルがあるらしい. CVとはCrossVaridationのことで,正則化パラメータαに交差検証を用いる方法である. これによって最適なαを自動で求めてくれるそう. reg = linear_model.RidgeCV(alpha= [0.1, 1.0, 10.0]) reg.fit(X_train, y_train) reg.al…

【scikit-learn】Ridge回帰

Ridge回帰は係数に対してを満たすを見つけるというもの. Ridge回帰による正則化係数と係数の関係を見てみる import numpy as np import matplotlib.pyplot as plt import sklearn.linear_model # 10*10の行列を作る X = 1. / (np.arange(1, 11) + np.arange(…

【numpy】行列操作【その1】

numpyの行列操作で面白い行列の作り方を知ったので書く. a = np.arange(1,11) b = np.arange(0,10) #b: [0,1,2,3,4,5,6,7,8,9] c = b[:,np.newaxis] #c: #[[0] # [1] # [2] # [3] # [4] # [5] # [6] # [7] # [8] # [9]] d = a + c #[[ 1 2 3 4 5 6 7 8 9 10]…

matplotlib.pyplotで一枚の枠に図を複数埋め込む方法

下のように宣言すればよい plt.figure() plt.subplot(y,x,i) これは文字列でもできるらしく,scikit-learnの公式documentではこちらの方が使用されていたため,文字列のほうが主流なのか? plt.subplot(211) plt.subplot(212) 正規分布を作る numpy.random.ran…

【scikit-learn】線形回帰

研究で識別/分類問題について実装することになるだろうので,scikit-learnの公式ドキュメント(http://scikit-learn.org/stable/index.html)のうち classificationを勉強していこうと思う. 今回は線形回帰について(なぜ回帰?)scikit-learnは #modelの定義 reg…

識別器に意図的に誤分類させる研究

識別器に意図的に誤分類を誘発させる研究の記事を読んだ. 今のプロジェクトが終わったらやってみたいのでメモ. https://www.mbsd.jp/blog/20170516.html https://www.mbsd.jp/blog/20170117.html

TeX余白の設定

TeX

箇条書における余白の設定 http://sumi-nyasu.hatenablog.com/entry/2015/06/27/232345 表や図における余白の設定 http://d.hatena.ne.jp/pyopyopyo/20120416/p1

【Windows】TeXworksにforestを入れる

dirtreeパッケージよりもforestのほうが綺麗にディレクトリツリーを表示できたのでメモ. インストールの仕方 forestパッケージのダウンロード https://www.ctan.org/pkg/forest https://github.com/sasozivanovic/forest inlinedefパッケージのダウンロード …

WidowsのTeXworksにstyファイルを読み込む

TeX

今回はdirtreeというパッケージを入れた. 忘れないようにメモTeXの\usepackage{hoge}という宣言ではhoge.styというファイルを読み込んでいる. 最も簡単な方法はそのtexファイルと同じディレクトリに入れることである. しかしそのプロジェクトのみでしか使え…

不均衡データへの対応

正例と負例の数が極端に偏っているデータのことを不均衡データという. 今回はBoW(Bag of Words)でスパムメールの判定をロジスティック回帰で行った. BoWでは大量の単語の集合のうち, 出現頻度の高い単語のみを残すためサンプル数の多いクラスに影響されてし…

【tensorflow】Irisデータセットで線形分離で二値分類

Irisデータセットは特徴量として「萼片の長さ」「萼片の幅」「花びらの長さ」「花びらの幅」が与えられ ラベルはそれぞれ0:setosa, 1:versicolor, 3:virginicaである. setosa versicolor verginicaこのデータセットに対してsetosaとそれ以外の二値分類を行っ…

League of Legendsのチャンプ間の分析

pythonのライブラリnetworkxの勉強がてらにLeague of Legends(以後LoL)におけるチャンピオン間のネットワークを作った. LoLとは世界的に人気のオンラインゲームであり,全10人のプレイヤーが5人,5人に分かれて戦い合う. 下のようなマップで相手の陣地の一番奥…

DeepLearning実装 #1

名著『ゼロから作るDeepLearning』を読み終わったので特に重要であった4,5,6,7章について4回に渡って解説をしたいと思う. 第1回目は4章の「ニューラルネットワークの学習」である. 4.1 データから学習する ニューラルネットワークは他の機械学習の手法と違っ…

教師あり学習分類問題の決定境界の可視化

パーセプトロン,SVM,ロジスティック回帰,ランダムフォレストなど「決定境界を求める」という分類問題を解く際に下のような2次元グラフで決定境界を可視化できると嬉しい. 今回は決定境界を引くアルゴリズムをまとめた. 手順は以下の通りである. 学習モデルで…

ベイズの定理

条件付き確率 事前確率P(A)についてBという事象が起こるという情報が与えられたときにAという事象が起こる確率を求めたい. AとBの同時確率を事前確率で割る. イメージとしてはこんな感じ. オレンジの確率を赤の確率で割る. ベイズの定理 結果がわかっている…

分類問題の手法

ロジスティック回帰 決定木 ランダムフォレスト ニューラルネットワーク SVM ロジスティック回帰の考え方・使い方 - TokyoR #33 from horihorio www.slideshare.net

apacheの設定

index.htmlは自分の環境だと/var/www/html/index.html d.hatena.ne.jp

UbuntuにVirtualBoxを入れる

Ubuntu で Virtualbox を使う Linux_Downloads – Oracle VM VirtualBox

【Python】condaでkerasを入れる

Keras :: Anaconda Cloud

【GitHub】ファイル名変更

Git

ローカルリポジトリで名前を変更する $git mv a.txt b.txtローカルリポジトリにコミット $git commmit -m "名前変更したぞ"リモートリポジトリに反映 $git push origin masterGitよくわかってないので間違ってるかも

GitHub使い方

qiita.com

【Ubuntu】ターミナルの起動

Ctrl+Alt+T

「5000兆円欲しい」までツイートし続ける

#!/usr/bin/env python # -*- coding: utf-8 -*- from requests_oauthlib import OAuth1Session def Tweet(tweet): """str型のtweetを受け取り,それをツイートする """ CK = '' # Consumer Key CS = '' # Consumer Secret AT = '' # Access Token AS = '' # …

【蟻本】Lake Counting

// 蟻本p.35 // Lake Counting(POJ No.2386) // 深さ優先探索で同じ文字を消していく問題 #include <bits/stdc++.h> using namespace std; static const int MAX_N = 100; static const int MAX_M = 100; char field[MAX_N][MAX_M]; int n,m; int dx[8]={1,1,0,-1,-1,-1,0,1</bits/stdc++.h>…

【蟻本】部分和問題

// あり本 p.34 // 部分和問題 // 数列の中からいくつか選び和がkにできるか判定する #include <bits/stdc++.h> using namespace std; static const int MAX_N = 20; int cnt = 0; int k,n; int a[MAX_N]; bool dfs(int i,int s) { if(i==n)return s==k; //a[i]を使わない場</bits/stdc++.h>…

【画像処理】画像機械学習の前処理

前処理フィルタについて | 画像処理.com | キーエンス 元の画像 グレイスケール 膨張フィルタ 収縮フィルタ 平均化フィルタ メディアンフィルタ 平均化フィルタ #coding:utf-8 """ $jupyter notebook $for python3.x """ from mpl_toolkits.mplot3d import A…

【Python】【画像処理】k-means法で画像を減色

減色された画像の色(代表ベクトル)とグラフの点の色が同じになるように改良した. matplotlib.pyplotのscatterの色の指定ではc="#000000"のように16進数でRGBの順に指定する必要がある. OpenCVではGBRの順なので気をつける. #coding:utf-8 """ $jupyter noteb…