気象庁のオープンデータを活用しよう!


この記事の所要時間: 340秒 〜 440秒程度(2086文字)


こんなニュースをご存知だろうか。
気象庁がオープンデータ化に乗り出したというニュースだ。

気象庁、気象観測データをWebサイトで公開|マイナビニュース
 
気象庁は5月1日、過去の気象観測データをWebサイトで公開する取り組みを開始した。CSV形式でデーターのダウンロードが行える。

公開されるのは、全国の気象台やアメダス観測地点における気温や降水、湿度などに関するデータ。日別や上旬/中旬/下旬別、月別に、平均気温や日照時間などのデータが取得できるようになっている。

同庁では、公開の理由を「情報通信技術の進展により、政府などが保有する多様で膨大な公共データについて様々な場面での活用が期待されるようになってきてきている」ためとしている。

行政が保有する情報のオープンデータ化では、総務省がテストケースとして情報通信白書を二次使用も含めて公開するなど徐々に取り組みが広がりつつある。

 
大きな一歩であるにもかかわらず、過去の気象データ・ダウンロードという素っ気ないページ名で公開しており、オープンデータであることは強調していない。しかし、ページを見ると気象庁の本気を感じる。
 
なぜ本気と感じるのか、そしてどのように使えばいいのか。
今回はこれについて書いてみることにしよう。
 

photo credit : tamaki via photopin cc

photo credit : tamaki via photopin cc

 


気象庁はデータを有効活用して欲しいに違いない


このシステムは極めてシンプルで、地点、項目、期間を選ぶだけ。
後は、「画面に表示」ボタンもしくは「CSVファイルをダウンロード」ボタンを押せば、結果が表示される。画面の説明もわかりやすく、ほんの数クリックでデータを手に入れることができる。ダウンロードされるデータもシンプルなので、加工も簡単だ。
 
同時に 気象情報を活用して気候の影響を軽減してみませんか?というページも用意された。ここでは、販売業、農業の気象データ活用の事例が紹介されており、かなり充実した内容になっている。
 
所有しているデータに自信を持っており、それを少しでも有効活用して欲しいという意志を感じるページだ。通り一遍のものが多い他の省庁のオープンデータと較べ、実用度の高さは群を抜いているのではないだろうか。「本気を感じる」としたのは、このためだ。
 


まずは散布図から


このシステムを使えば、財務データと気象データに関連があるを確認できる。
例えば、アイスクリームの日別売上高はと「最高気温と関連しているのか」、「湿度の影響があるのか」、それとも「気候とは無関係なのか」を見ることが可能なのだ。冷暖房の普及で以前と較べて関連が弱くなっていると考えるなら、長期のデータを使って集計すればいい。
 
関連があるかを見るのに適しているのは散布図だ。

最高気温・最低気温  平均気温・平均風速

この2つを見れば、左側の図で関連が強く、右側の図で関連が弱いのは一目瞭然だろう。いくつもの散布図をつくり、左側のようなものが出てくれば、関連を発見できたことになる。上の図は左が最高気温と最低気温、右が平均気温と平均風速(共に東京の最近1年間)なので、このような結果になって当然だが、実際にやるなら縦軸を財務データで固定して、横軸を最高気温、最低気温、湿度、・・・など順々に変えて、関連のある項目を探すことになる。
 
散布図は難しそうというのは思い込みだ。エクセルのグラフ機能にある。
プロットしたい2列のデータを選択した状態で、散布図ボタンを押せばすぐに見ることができる。使ったことのない人が多いだろうが、とても簡単な機能なので、ぜひ試してみて欲しい。
 


当たりをつけるときは慎重に!


「縦軸を財務データで固定して、横軸を最高気温、最低気温、湿度、・・・など順々に変えていけばいい」を見て、不思議に思った人もいるだろう。このようにデータを見るとき、自分が関連すると思う指標についてだけ作業すればいいと考える人は多い。
 
しかし、それでは自分の思い込みにあったデータを探しているだけになってしまう。
少しでも有効なデータを探そうとするなら、どの指標と関連が強いかをできる限り広い視野で見る必要があるのだ。役立つデータに当たりをつけるときには、慎重な作業が求められる。せっかく使いやすい形でたくさんのデータが公開されているのだから、いろいろ試してみた方がいい。
 
そう。データ活用は試してみるに限る。
「できない」とか、「難しそう」と思わず、トライしてみるといい。価値あるデータにたどり着くのは簡単ではないが、何よりデータを使おうという姿勢が重要になる。そして、壁にぶちあたったら誰かに相談すればいい。自分で試行錯誤をすることこそが、有効なデータ活用への唯一の近道なのだ。

  1. コメントはまだありません。

This blog is kept spam free by WP-SpamFree.