2019-05-01から1ヶ月間の記事一覧
Yahooニュースのアクセスランキングページの見出しを取得し、出てくる名詞を出現回数順に表示し、何に関するニュースが興味を持たれているのかを調べます。 アクセスランキングページのスクレイピング→形態素解析し名詞のみ取得→出現が高い順に並べる→グラフ…
赤い服を着た人物写真の服の色を緑や青に変えます。Pythonの画像処理ライブラリOpenCVで画像をBGR色空間からHSV色空間に変換し、ライブラリnumpyのwhereメソッドにより色相Hが赤の範囲にある画素についてHをシフトさせることで赤を緑や青に変換します。
ミニチュア写真の特徴として、斜め上から撮影されている、コントラストが強い、上下がぼけている、があります。斜め上から撮影した写真をPythonの画像処理ライブラリOpenCVでコントラスト強調処理と上下のぼかし処理をすることでミニチュア風に加工できます。
画素値0~255のそれぞれに対する係数をあらかじめ決めておき、画像を処理する手法があります。この係数のリストをルックアップテーブルと言い、ルックアップテーブルを用意することでOpenCVのcv2.LUT()メソッドにより画像処理が可能です。ガンマ補正とS字カ…
N-gramは文章の類似度を調べる方法の一つです。文章を隣り合う連続したN個の文字の集合に分解し、別の文章で同様に求めた文字の集合と一致するかを調べることで文書の類似度を求めます。Pythonのfor文で文書から2文字ずつ区切った文字のリストを作り、リスト…
googleimagesdownloadはグーグル画像検索から画像をダウンロードするスクリプトです。 環境 windows10 home Anaconda 3/ jupyter notebook 5.6.0 Python 3.7.0 google-images-download 2.7.0 準備 pipコマンドでgoogle-images-downloadをインストールします…
scikit-learnは機械学習用ライブラリで以下のアルゴリズムが使用できます。 classification(識別:教師あり学習) clustering(分類:教師なし学習) regression(回帰:教師あり学習) dimensionality reduction(次元削減,主成分分析:教師なし学習) cla…
word2vecは文章中の単語をベクトル化する技術で、関連する単語の抽出や単語同士の類似度を調べたり単語の線形計算ができるようになります。ベクトル化処理をするためには単語の区切りを示す必要があるため、先に文章を分かち書きします。手順は以下の通りで…