Pythonでいろいろやってみる

Pythonを使った画像処理や機械学習などの簡単なプログラムを載せています。

マッチング

TF-IDFとコサイン類似度により文書の類似度を判定する

Pythonの機械学習ライブラリscikit-learnを使って文書の類似度を求めます。文書中に含まれる単語が「その文書内でどれくらい重要か」を表す尺度であるTF-IDFにより、すべての単語を次元とした文書ベクトルを作成します。文書ベクトル同士のコサイン類似度を…

N-gramで文章の類似度を調べる

N-gramは文章の類似度を調べる方法の一つです。文章を隣り合う連続したN個の文字の集合に分解し、別の文章で同様に求めた文字の集合と一致するかを調べることで文書の類似度を求めます。Pythonのfor文で文書から2文字ずつ区切った文字のリストを作り、リスト…

AKAZE特徴量による画像マッチング

2つの画像から特徴が一致する部分を見つけます。Pythonの画像処理ライブラリOpenCVのAKAZE(Accelerated KAZE)特徴量検出により2つの画像に含まれる一致する文字を検出します

テンプレートマッチングで類似画像を探す

OpenCVの物体検出手段の一つ、テンプレートマッチングを行います。画像とそこから一部切り出したテンプレート画像を用意します。元画像の中でテンプレート画像と一致する場所を検出します。 関連記事 画像のヒストグラムを比較し類似度を求める AKAZE特徴量…

画像のヒストグラムを比較し類似度を求める

Pythonの画像処理ライブラリOpenCVには画素値(輝度)と画素数のヒストグラムを求めるcalcHist関数があります。またcompareHist関数を使うとヒストグラムの類似度が求められます。2つの画像のチャンネル別のヒストグラムを表示し、ヒストグラム類似度を求めま…