Pythonでいろいろやってみる

Pythonを使った画像処理や機械学習などの簡単なプログラムを載せています。

Wikipedia-APIでWikipediaの記事を取得する

 ライブラリWikipedia-APIWikipediaAPIを簡単に制御できるラッパーで、これを使うとWikipediaの記事の要約や全文を短いコマンドで取得できます。

環境
準備  

ライブラリWikipedia-APIをインストールします。


記事の要約(summry)を取得する場合。

コード

 まず、wikiという名前でwikipediaオブジェクトを生成し、その際言語として日本語を指定します('ja')。さらに記事のタイトル(ここでは「台風」)をパラメーターとしてpageオブジェクトを生成します。pageオブジェクトのsummaryプロパティを出力させることで要約が表示されます。

import wikipediaapi

wiki = wikipediaapi.Wikipedia('ja')
page = wiki.page('台風')

print(page.summary)  
実行結果

「台風」のページの要約が表示されます。

台風(たいふう、颱風、英: Typhoon)とは、熱帯低気圧のうち北西太平洋または南シナ海に存在し、かつ低気圧域内の最大風速が約17.2 m/s(34ノット(kt)、風力8)以上にまで発達したものを指す呼称。 強風域や暴風域を伴って強い雨や風をもたらすことが多く、ほとんどの場合、気象災害を引き起こす。上空から地球に向かって見ると反時計回りの積乱雲の渦からなる。超大型と呼ばれる台風は風速15m/sの強風域が半径800km以上と、とても大きな台風となる。「年別台風記事一覧」も参照。


記事の全文(text)を取得する場合。

コード

 まず、wikiという名前でwikipediaオブジェクトを生成し、その際言語として日本語を指定します('ja')。さらに記事のタイトル(ここでは「台風」)をパラメーターとしてpageオブジェクトを生成します。pageオブジェクトのtextプロパティを出力させることで全文が表示されます。

import wikipediaapi

wiki = wikipediaapi.Wikipedia('ja')
page = wiki.page('台風')

print(page.text)  
実行結果

「台風」のページのテキスト全文が表示されます。

台風(たいふう、颱風、英: Typhoon)とは、熱帯低気圧のうち北西太平洋または南シナ海に存在し、かつ低気圧域内の最大風速が約17.2 m/s(34ノット(kt)、風力8)以上にまで発達したものを指す呼称。 強風域や暴風域を伴って強い雨や風をもたらすことが多く、ほとんどの場合、気象災害を引き起こす。上空から地球に向かって見ると反時計回りの積乱雲の渦からなる。超大型と呼ばれる台風は風速15m/sの強風域が半径800km以上と、とても大きな台風となる。「年別台風記事一覧」も参照。
定義 気圧が最も低い位置を「気圧中心」といい、その位置と勢力で台風は定義される。温帯低気圧との最大の違いは、前線を伴っていないことである。


以下略

以下のサイトを参考にさせていただきました

pypi > Wikipedia-API
Men of Letters > Pythonでwikipedia-apiを使用し単一ページを取得する

ブログランキングに参加しています

にほんブログ村 IT技術ブログへ
にほんブログ村</