画像処理

【PyTorch】DataLoaderで(images, labels)だけでなく(images, labels, paths)をロードできるようにする

まずglob.glob()を用いて, すべての画像データのパスを保持したリストを作る. def make_datapath_list(phase="train"): rootpath = "./data/" target_path = os.path.join(rootpath, phase, "**", "*.jpg") # 最初の**はクラスのディレクトリ path_list = []…

物体認識を試す

ImageNetにおける物体認識をしたいとする. 通常ならイチからモデルを組み, データを入手し, 学習させ……という作業が必要なわけだが, ディープラーニングのフレームワークKearsならこれが簡単にできる. さらに, VGGやResNet, Xception, MobileNetなど自宅の計…

【ギャラリー】k-meansクラスタリングにおける画像減色を3Dグラフに表す

k = 1 k = 2 k = 3 k = 4 k = 5 k = 6 k = 7 k = 8 k = 9 k = 10 k =20 k = 30 k = 50 k = 70 k = 100 k = 200 k = 300

【ギャラリー】 k-meansによる画像減色

元画像 k=3 k=5 k=7 k=10 k=12 k=20 なお画像が大きいためサーバーで実行したのだが, OpenCVが入っていなかったのでPILで書きなおした. この際に画素のRGB値を書き換えた(OpenCVはGBRの順で紛らわしい)のだが, 混乱して正しく書き換えられているか分からない.…

【画像処理】画像機械学習の前処理

前処理フィルタについて | 画像処理.com | キーエンス 元の画像 グレイスケール 膨張フィルタ 収縮フィルタ 平均化フィルタ メディアンフィルタ 平均化フィルタ #coding:utf-8 """ $jupyter notebook $for python3.x """ from mpl_toolkits.mplot3d import A…

【Python】【画像処理】k-means法で画像を減色

上の画像を7色に減色した. ソースコードは適宜変数を付け足していったので自分でもわからなくなったので注意. #coding:utf-8 """ $jupyter notebook $for python3.x """ from mpl_toolkits.mplot3d import Axes3D import matplotlib.pyplot as plt import nu…

【Python】【画像処理】画像の画素毎のGBR値を3Dグラフにプロットする

#coding:utf-8 """ $jupyter notebook $for python3.x """ from mpl_toolkits.mplot3d import Axes3D import matplotlib.pyplot as plt import numpy as np from sklearn.cluster import KMeans from PIL import Image from PIL import ImageDraw from rando…

【Python】【OpenCV】n*m のランダムな色の画像を作成

# vim: set fileencoding=utf-8 : import numpy as np import cv2 from random import randint import numpy as np cols = 320 rows = 320 #イメージ生成 image = np.zeros((rows, cols, 3), np.uint8) div = 16 # 縦横の分割数 w = cols / div # 分割された…

パターン識別

LBG+splitting εはセントロイドから最も遠い特徴ベクトルの1/100倍したベクトルの場合

アニメop顔検出器+分類器

うまく分類できないなもっと精度あげたい pic.twitter.com/nEsDQc7Vio— 雨宿まち (@vocky_Zn) 2017年3月31日今後すること トレーニング画像の種類を増やす. 出力層の出力を増やして分類の数を増やす.

CNNで画像の前処理

判定処理を行う入力画像の前処理 1.画像の周囲を切り落とす(Cropping) 2.画像のダイナミックレンジを平準化する(Whitening)トレーニングデータとして入力する画像にする前処理 1.画像の周囲をランダムに切り落とす(Random Cropping) 2.画像をランダムに左右…

アニメOPの顔検出

kivantiumさんの『ご注文はDeepLearningですか?』にインスピレーションを受け, まだキャラを分類するなど学習を取り入れたワケではないが作った.pic.twitter.com/kfOZLXh8xz— 雨宿まち (@vocky_Zn) 2017年3月24日 できたぞ pic.twitter.com/GahPUbEgVc— 雨…

ubuntu 動画と音声を組み合わせる

コレの通りにやる! brlat.sakura.ne.jp

ubuntu 動画ファイルから音声のみを抽出

$ ffmpeg -y -i input.mp4 -ab 128k output.mp3d.hatena.ne.jp

ubuntu 連番画像から動画を作る

コマ落ちを防ぐために1秒間に30枚取得していたものを1秒間に60枚をのせるという設定. $ ffmpeg -r 30 -i image_%03d.png -vcodec libx264 -pix_fmt yuv420p -r 60 out.mp4qiita.com ffmpegの使い方:tech.ckme.co.jp

ubuntu 動画から静止画を取得する

ffmpeg を用いる. ffmpeg -i sample.mp4 -ss 0 -t 10 -r 2 -f image2 %06d.jpg ss:開始時刻 t :終了時刻 r :1秒あたりにキャプチャする数 f :出力先 qiita.com 【追記】 $ ffmpeg -i input.mp4 -vcodec png image_%03d.png

python opencv7 カスケード分類器

事前に学習したい物体の特徴を抽出して, 特徴量を機械が学習し, 学習データのまとまりをカスケード分類器というらしい. OpenCVでは"/usr/local/share/OpenCV/haarcascades/lbpcascade_animeface.xml"のようにxml形式で扱う.pythonでは読み込んだ画像を 1.グ…

Filter処理

www.youtube.com

HSV色空間

色相(H):大まかな色、360度の角度で表現彩度(S):色の鮮やかさ明度(V):色の明るopencv.blog.jp

python opencv6 グレイスケールへの変換

cv2.cvtColor(img,cv2.COLOR_RGB2GRAY)を用いる. imgread()で第二引数に0を指定しても同じ効果な気がする. # -*- coding: utf-8 -*- import cv2 def main(): img = cv2.imread("cocoa.jpg",0) cv2.imshow("cocoa",img) img = cv2.imread("cocoa.jpg") gray =…

python opencv5 画像の重ねあわせ

im = im1 + im2という感じで重ねあわせられる(すごすぎ!) im1,im2は同じサイズでなければならない. # -*- coding: utf-8 -*- import cv2 def main(): # 2枚の画像をグレースケールで取得 im1 = cv2.imread("test1.png",0) im2 = cv2.imread("test2.png",0) …

python opencv4 画像のりサイズ

画像のりサイズにはcv2.resize()を使う. 引数には読み込んだ画像と,リサイズしたい高さと幅のタプル #!/usr/bin/env python # -*- coding: utf-8 -*- import numpy as np import cv2 # Load an color image in grayscale original_size_img = cv2.imread('co…

python opencv3 画像の範囲切り取り+保存

#!/usr/bin/env python # -*- coding: utf-8 -*- import numpy as np import cv2 # Load an color image in grayscale img = cv2.imread('cocoa.jpg',1)#0:グレースケール 1:通常 cv2.imshow('cocoa',img)#読み込んだ画像を表示 x = 200 y = 200 width = 100…

python opencv2 画素へのアクセス

RGBではなくBGRの順にリストになっているのが注意 #!/usr/bin/env python # -*- coding: utf-8 -*- import numpy as np import cv2 # Load an color image in grayscale img = cv2.imread('cocoa.jpg',1)#0:グレースケール 1:通常 cv2.imshow('cocoa',img)#…

python opencv1 画像を読み込んで表示

#!/usr/bin/env python # -*- coding: utf-8 -*- import numpy as np import cv2 # Load an color image in grayscale img = cv2.imread('cocoa.jpg',0)#0:グレースケール 1:通常 cv2.imshow('cocoa',img)#読み込んだ画像を表示 cv2.waitKey(0)#キーを押すと…

クラスタリング

k-means法を用いてクラスタリングを行った. 元画像 2色 4色 8色 16色 32色 64色 128色 256色 1024色 1024色までいくとかなり立体感のあるものとなった. 1ピクセルあたり3バイト = (2^8)^3色を表現できるから1024色だからといって元画像に近くは難しい.

画像二値化

ithat.me このサイトを参考にしてPythonで実装した. PILでGlayScaleにする方法はあるそうだが今回は敢えて使わずに実装した. #coding:utf-8 from PIL import Image from PIL import ImageDraw from random import randint from os.path import exists from o…

遺伝的アルゴリズムで画像再現

遺伝的アルゴリズムを用いて画像を再現するというプロジェクトを行った. まだまだ検討箇所があるので現在の結果を貼っておく. 目標の画像 0世代 1000世代 ツイートは0~800世代くらい https://twitter.com/vockyX/status/816646900392656897 今後の活動 ・100…