Pythonでいろいろやってみる

Pythonを使った画像処理や機械学習などの簡単なプログラムを載せています。

2019-05-01から1ヶ月間の記事一覧

Yahooニュース・アクセスランキングの見出しを取得し頻出単語を調べる

Yahooニュースのアクセスランキングページの見出しを取得し、出てくる名詞を出現回数順に表示し、何に関するニュースが興味を持たれているのかを調べます。 アクセスランキングページのスクレイピング→形態素解析し名詞のみ取得→出現が高い順に並べる→グラフ…

特定の色を別の色に変換する(赤い服を緑の服に変える)

赤い服を着た人物写真の服の色を緑や青に変えます。Pythonの画像処理ライブラリOpenCVで画像をBGR色空間からHSV色空間に変換し、ライブラリnumpyのwhereメソッドにより色相Hが赤の範囲にある画素についてHをシフトさせることで赤を緑や青に変換します。

写真をミニチュア風に加工する

ミニチュア写真の特徴として、斜め上から撮影されている、コントラストが強い、上下がぼけている、があります。斜め上から撮影した写真をPythonの画像処理ライブラリOpenCVでコントラスト強調処理と上下のぼかし処理をすることでミニチュア風に加工できます。

ルックアップテーブルによる画像コントラストの補正

画素値0~255のそれぞれに対する係数をあらかじめ決めておき、画像を処理する手法があります。この係数のリストをルックアップテーブルと言い、ルックアップテーブルを用意することでOpenCVのcv2.LUT()メソッドにより画像処理が可能です。ガンマ補正とS字カ…

N-gramで文章の類似度を調べる

N-gramは文章の類似度を調べる方法の一つです。文章を隣り合う連続したN個の文字の集合に分解し、別の文章で同様に求めた文字の集合と一致するかを調べることで文書の類似度を求めます。Pythonのfor文で文書から2文字ずつ区切った文字のリストを作り、リスト…

googleimagesdownloadで画像をダウンロードする

googleimagesdownloadはグーグル画像検索から画像をダウンロードするスクリプトです。 環境 windows10 home Anaconda 3/ jupyter notebook 5.6.0 Python 3.7.0 google-images-download 2.7.0 準備 pipコマンドでgoogle-images-downloadをインストールします…

Linear SVCによる言語判定 - 頻出単語を特徴量に使う

scikit-learnは機械学習用ライブラリで以下のアルゴリズムが使用できます。 classification(識別:教師あり学習) clustering(分類:教師なし学習) regression(回帰:教師あり学習) dimensionality reduction(次元削減,主成分分析:教師なし学習) cla…

word2vecにより単語をベクトル化し類似語検索をする

word2vecは文章中の単語をベクトル化する技術で、関連する単語の抽出や単語同士の類似度を調べたり単語の線形計算ができるようになります。ベクトル化処理をするためには単語の区切りを示す必要があるため、先に文章を分かち書きします。手順は以下の通りで…