Pythonでいろいろやってみる

Pythonを使った画像処理や機械学習などの簡単なプログラムを載せています。

scikit-learn

scikit-learnの回帰分析でマンション価格を予測する(結果を可視化)

scikit-learnの回帰分析でマンション価格を予測するで行った駅からの徒歩時間、広さ、築年数に対する、マンション価格の線形重回帰分析結果を可視化します。徒歩時間(or広さor築年数) vs マンション価格(実際の値and学習用データを用いた予測結果and予測用デ…

scikit-learnの回帰分析でマンション価格を予測する

scikit-learnの回帰分析で緯度、標高から気温を予測すると同じく、scikit-learnで重回帰分析を行います。海浜幕張駅の中古マンション価格を題材に、説明変数として駅からの徒歩時間、広さ、築年数、目的変数としてマンション価格を用います。 すなわち説明変…

scikit-learnの回帰分析で緯度、標高から気温を予測する

scikit-learnを用いて回帰分析を行います。回帰分析は数値の予測を行う手法で、入力(説明変数)と出力(目的変数)の関係を求めて、その関係に基づいて未知の入力値に対する出力値を予測します。ここでは説明変数として緯度と標高、目的変数として2019年1月の平…

TF-IDFとコサイン類似度により文書の類似度を判定する

Pythonの機械学習ライブラリscikit-learnを使って文書の類似度を求めます。文書中に含まれる単語が「その文書内でどれくらい重要か」を表す尺度であるTF-IDFにより、すべての単語を次元とした文書ベクトルを作成します。文書ベクトル同士のコサイン類似度を…

Linear SVCによる言語判定 - 頻出単語を特徴量に使う

scikit-learnは機械学習用ライブラリで以下のアルゴリズムが使用できます。 classification(識別:教師あり学習) clustering(分類:教師なし学習) regression(回帰:教師あり学習) dimensionality reduction(次元削減,主成分分析:教師なし学習) cla…