2017-09-01から1ヶ月間の記事一覧

twitterAPIを用いたtimelineの取得【その2】

あるアカウントを200ツイート取得してCSVに保存する from requests_oauthlib import OAuth1Session import json from urllib import request import subprocess import csv keys = { "CK":'xxx', "CS":'xxx', "AT":'xxx', "AS":'xxx', } sess = OAuth1Sessio…

twitterAPIを用いたtimelineの取得

from requests_oauthlib import OAuth1Session import json from urllib import request keys = { "CK":'xxxxx', "CS":'xxxxx', "AT":'xxxxx', "AS":'xxxxx', } sess = OAuth1Session(keys["CK"], keys["CS"], keys["AT"], keys["AS"]) url = "https://api.t…

Pythonで積分計算

区分求積法より と をはさんだものが積分の値となるので分割数nを大きくすればその値に近似できる. 今回はについて計算する. まずは区分求積法をnumpyで実装. import numpy as np import matplotlib.pyplot as plt n = 1000 x = np.linspace(0,1,n) y = x*(1…

pygeocoderのインストール

1. ファイルをダウンロードし解凍 https://pypi.python.org/pypi/pygeocoder2. 以下のコマンドを実行 $ python setup.py build; python setup.py install;【参考】 http://t-nkb.hatenablog.com/entry/2016/12/21/213024

はてなブログのデザインを一部いじる

まずオリジナルのデザインはこちら 今回はブラウザがGoogleChromeでやることを想定する.1.F12キーを押すとブラウザの右か下にバーが現れるので, その左上マウスのマークをクリック 2.オリジナルのデザインで変更したい部分にマウスを当てクリックする3.該当…

【Ubuntu】MeCabインストール

Ubuntu16.06LTSにMeCabとPython3用のMeCabのインストールを行った. MeCabのインストール 1. Gitからcloneして展開する $ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git2. mecab-ipadic-NEologdをインストールする $ ./bin/insta…

確率分布書き方

ポアソン分布の作り方 import scipy.stats import numpy as np import matplotlib.pyplot as plt #figsize(12.5,4) lambda_ = [1.5, 4.25] colors = ["#348ABD","#A60628"] a = np.arange(16) plt.bar(a,scipy.stats.poisson.pmf(a,lambda_[0]),color=colors…

ベイズ推論イントロ

Pythonで体験するベイズ推論Pythonで体験するベイズ推論 PyMCによるMCMC入門作者: キャメロンデビッドソン=ピロン,玉木徹出版社/メーカー: 森北出版発売日: 2017/04/06メディア: 単行本(ソフトカバー)この商品を含むブログを見るから, ベイズ推論について…

【scikit-learn】Ridge回帰【その2】

RidgeCVというモデルがあるらしい. CVとはCrossVaridationのことで,正則化パラメータαに交差検証を用いる方法である. これによって最適なαを自動で求めてくれるそう. reg = linear_model.RidgeCV(alpha= [0.1, 1.0, 10.0]) reg.fit(X_train, y_train) reg.al…

【scikit-learn】Ridge回帰

Ridge回帰は係数に対してを満たすを見つけるというもの. Ridge回帰による正則化係数と係数の関係を見てみる import numpy as np import matplotlib.pyplot as plt import sklearn.linear_model # 10*10の行列を作る X = 1. / (np.arange(1, 11) + np.arange(…

【numpy】行列操作【その1】

numpyの行列操作で面白い行列の作り方を知ったので書く. a = np.arange(1,11) b = np.arange(0,10) #b: [0,1,2,3,4,5,6,7,8,9] c = b[:,np.newaxis] #c: #[[0] # [1] # [2] # [3] # [4] # [5] # [6] # [7] # [8] # [9]] d = a + c #[[ 1 2 3 4 5 6 7 8 9 10]…

matplotlib.pyplotで一枚の枠に図を複数埋め込む方法

下のように宣言すればよい plt.figure() plt.subplot(y,x,i) これは文字列でもできるらしく,scikit-learnの公式documentではこちらの方が使用されていたため,文字列のほうが主流なのか? plt.subplot(211) plt.subplot(212) 正規分布を作る numpy.random.ran…

【scikit-learn】線形回帰

研究で識別/分類問題について実装することになるだろうので,scikit-learnの公式ドキュメント(http://scikit-learn.org/stable/index.html)のうち classificationを勉強していこうと思う. 今回は線形回帰について(なぜ回帰?)scikit-learnは #modelの定義 reg…

識別器に意図的に誤分類させる研究

識別器に意図的に誤分類を誘発させる研究の記事を読んだ. 今のプロジェクトが終わったらやってみたいのでメモ. https://www.mbsd.jp/blog/20170516.html https://www.mbsd.jp/blog/20170117.html

TeX余白の設定

TeX

箇条書における余白の設定 http://sumi-nyasu.hatenablog.com/entry/2015/06/27/232345 表や図における余白の設定 http://d.hatena.ne.jp/pyopyopyo/20120416/p1

【Windows】TeXworksにforestを入れる

dirtreeパッケージよりもforestのほうが綺麗にディレクトリツリーを表示できたのでメモ. インストールの仕方 forestパッケージのダウンロード https://www.ctan.org/pkg/forest https://github.com/sasozivanovic/forest inlinedefパッケージのダウンロード …

WidowsのTeXworksでstyファイルを読み込む

TeX

今回はdirtreeというパッケージを入れた. 忘れないようにメモTeXの\usepackage{hoge}という宣言ではhoge.styというファイルを読み込んでいる. 最も簡単な方法はそのtexファイルと同じディレクトリに入れることである. しかしそのプロジェクトのみでしか使え…

不均衡データへの対応

正例と負例の数が極端に偏っているデータのことを不均衡データという. 今回はBoW(Bag of Words)でスパムメールの判定をロジスティック回帰で行った. BoWでは大量の単語の集合のうち, 出現頻度の高い単語のみを残すためサンプル数の多いクラスに影響されてし…

【tensorflow】Irisデータセットで線形分離で二値分類

Irisデータセットは特徴量として「萼片の長さ」「萼片の幅」「花びらの長さ」「花びらの幅」が与えられ ラベルはそれぞれ0:setosa, 1:versicolor, 3:virginicaである. setosa versicolor verginicaこのデータセットに対してsetosaとそれ以外の二値分類を行っ…