Pythonでいろいろやってみる

Pythonを使った画像処理や機械学習などの簡単なプログラムを載せています。

スクレイピング

Yahooニュース・アクセスランキングの見出しを取得し合成音声で読み上げる(Windows)

Yahooニュース・アクセスランキングの見出しをスクレイピングで取得し、それを合成音声で読み上げます。pywin32(win32com)はPythonからウィンドウズアプリケーションを制御するためのライブラリです。win32comでウィンドウズ標準の音声合成機能Microsoft Spe…

ブログの検索順位を調べる

Pythonでgoogle検索し検索結果を取得、このブログが検索何位に出るかを調べます。検索の実施と結果取得はライブラリRequestsを使い、取得した検索結果からライブラリBeautifulsoup4により必要な情報を抽出します。

食べログ全国ランキングTOP20の星をジャンル別に比較する

食べログの全国ランキングTOP20の星(レーティング)をフレンチ、ラーメン、寿司、天ぷらの4ジャンルで集計・比較し、どのような傾向にあるかを調べます。 環境 windows10 home Anaconda 3/ jupyter notebook 5.6.0 Python 3.7.0 コード %matplotlib inline # …

Yahooニュース・アクセスランキングの見出しを取得し頻出単語を調べる

Yahooニュースのアクセスランキングページの見出しを取得し、出てくる名詞を出現回数順に表示し、何に関するニュースが興味を持たれているのかを調べます。 アクセスランキングページのスクレイピング→形態素解析し名詞のみ取得→出現が高い順に並べる→グラフ…

googleimagesdownloadで画像をダウンロードする

googleimagesdownloadはグーグル画像検索から画像をダウンロードするスクリプトです。 環境 windows10 home Anaconda 3/ jupyter notebook 5.6.0 Python 3.7.0 google-images-download 2.7.0 準備 pipコマンドでgoogle-images-downloadをインストールします…

word2vecにより単語をベクトル化し類似語検索をする

word2vecは文章中の単語をベクトル化する技術で、関連する単語の抽出や単語同士の類似度を調べたり単語の線形計算ができるようになります。ベクトル化処理をするためには単語の区切りを示す必要があるため、先に文章を分かち書きします。手順は以下の通りで…

円周率一万桁に0~9がそれぞれ何個含まれるか調べる

円周率一万桁に0~9がそれぞれ何個含まれるか調べます。 こちらのサイト(円周率.jp >> 円周率の値 1万桁まで)から円周率1万桁をスクレイピングで取得し、.count()メソッドで各数字の出現回数を求めます。 使った関数 requests.get() : Responseオブジェクト…

Yahoo!知恵袋の閲覧数ランキングベスト20の質問を取得して'令和'が何個含まれるか調べる

今日、新しい元号'令和'が発表されました。ネットでもこの話題で持ちきりです。ここではYahoo!知恵袋の閲覧数ランキングベスト20のページをスクレイピングして、そこに載っている20個の質問文の中に、'令和'がいくつ含まれているかを数えます。 使った関数 r…