ソチ五輪で一番盛り上がっている国は・・・


この記事の所要時間: 330秒 〜 430秒程度(2014文字)


2014年ソチ冬季オリンピックが始まった。4年に一度の冬の祭典。楽しみにしている人も多いのだろうが、その盛り上がり具合はいまいち捉え難い。盛り上がっている人もそうでない人もいるため、どのくらいの盛り上がりかがわからないのだ。
 
そんな中、ITmediaニュースの記事で紹介されたソチ五輪の特設ページが目を引いた。このページでは、「ソチ五輪に関する世界中のツイート数を可視化」しているという。ページはグラフ作成ツール・Datawrapperにあり、記事にあるように「Twitterが公開した」ものなのか、誰かがTwitterのデータを使って作成したものなのかは自分には確認できなかったが、そこさえ気にしなければなかなかおもしろいページに見える。
 

Photo credit : Sally Mahoney / CC BY-SA

Photo credit : Sally Mahoney / CC BY-SA

 


ソチ五輪で一番盛り上がっている国は日本!

このページ・Tweets about #Sochi2014は、オリンピックについてつぶやいている過去24時間のツイートを対象にしており、人口100万人あたりのツイート数で国をランキングしている。地図には順位別の色付けがされており、ポインターを近付けるとのその国の順位が表示される仕組みだ。
 

※画像はTweets about #Sochi2014からキャプチャー


※画像はTweets about #Sochi2014からキャプチャー

 
2月13日6時現在のランキング1位は日本。順位は刻々と変わっており、日本は途中で順位を4位まで下げたものの、現在は1位に戻っている。過去24時間のデータなので時差は関係ない筈だが、国によって注目を集める競技が違うため順位が変動するのだろう。
 
1位にせよ4位にせよ、日本が上位にいるのは間違いない。ツイート数を他国と比較する限り、日本はソチ・オリンピックでかなり盛り上がっているようだ。
 


単純なビッグデータこそ素晴らしい

「オリンピックについてつぶやいている」をどう定義するかで、このデータの結果は変わってくる。オリンピックという単語が含まれていればいいのか、何らかのハッシュダグを条件とするのかでも、結果は全然違ってしまうだろう。オリンピックという言葉がなくソチに言及しているツイートをどうするか、ニュースのツイートをリツイートしただけのものを「盛り上がり」と捉えていいのかなど、細かいことを考え出せばキリがない。
 
ただし、定義の部分さえ「これで行く」と割り切ってしまえば、こういうシンプルなビッグデータの分析は強力だ。あれこれデータをこねくり回していないので紛れがない。分析者や紹介者の解釈が入り込む余地も少なく、無理な誇張もしていないので、結果が「かたい」のだ。こういう単純なビッグデータこそ素晴らしいと思う。
 


複雑な分析はプロダクトアウト?

ビッグデータの活用というと、新たに開発した複雑な分析手法を持ち出すものが多いが、玉石混淆で正直言ってよくわからない。もっともらしい数字を並べて説明しているものの、かなり大胆な仮定を置いて結論を導いていたり、数少ない事例から分析手法を一般化しているものも多数見受けられる。ビッグデータの複雑な分析を総じて信じられないとは言わないが、かなりいい加減なものも含まれている。
 
一部の分析に至っては、ビッグデータを扱えるソフトウェアやハードウェアをつくっている企業、そしてそれらを使った分析者のために、無理に難しくしているようにさえ感じる。データと目的から分析手法を決めているのではなく、まずソフトウェアやハードウェアありきで分析方法を決めているように見えるのだ。まるで「プロダクトアウト」でつくったようなデータ分析が、ゴロゴロ転がっている。
 
ビッグデータについてのこれらの認識は自分の理解不足のせいかも知れないが、データ分析にも顧客志向が必要なのは間違いない。お客が必要とする結果を導くために、データ分析の手法をゼロベースで考える必要があるのだ。何も複雑な分析手法を使うだけが能ではない。今のビッグデータブームでは、この点が軽視されているように思えてならない。一方で、今回紹介したソチ五輪のツイートデータ分析ツールはそういう手垢が付いてないように見える。
 
ビッグデータの分析はいろいろあっていいと思うが、ハッタリをかましただけの分析が横行すれば徐々に化けの皮が剥がれてしまうだろう。出来ることならこういう単純で質の高いビッグデータの分析をたくさん見たいものだ。

  1. コメントはまだありません。

  1. トラックバックはまだありません。

This blog is kept spam free by WP-SpamFree.