ビッグデータの「What」を考える


この記事の所要時間: 30秒 〜 40秒程度(1791文字)


中小企業診断士の佐々木孝です。
 
前回、いろいろなサイトにある定義を参考にして、ビッグデータを自分なりに以下のように定義しました。

 ビジネスに役立てるために(Why)
 今までなかったようなデータを(What)
 最先端の技術で分析すること(How)

こうまとめてしまえば何も文句が言えないほど(?)ざっくりした定義ですが、この程度しか共通項がないのもまた事実のようです。
 
さて、とは言えこのままではあまり役に立ちません。
Why、What、Howの各要素をそれぞれ検討してみる必要がありそうです。
そこで、まずはWhatの「今までなかったようなデータを」について考察してみます。
 

photo credit : MelvinSchlubman via photopin cc

 


大量で、多様で、リアルタイム性があるデータが対象


ビッグデータから今までにない新しい価値があるアウトプットを出せる根拠として、インプットとなるデータが「今までなかったようなデータ」だという主張があります。
 
ビッグデータでは、これまでは分析できなかったような

 ・Volume:大量で
 ・Variety:多様で(非構造、非定形)
 ・Velocity:速度がはやくリアルタイム性がある

データを対象にできるというのです。この部分については各社の見解にあまり違いがなく、一部では3Vと呼んでいるようです。
 
情報化が進み以前に増して記録されるようになったログデータ、SNSを中心にした個人発信のデータが急激に増えているのは間違いなく、対象とでなり得るデータがたくさんあることは反論のしようがありません。
 


インプットが豊富ならアウトプットがリッチになる?


問題は、これまでにないほど豊富なインプットから、果たしてリッチなアウトプットを導き出せるかです。
 
個人的な経験から言えば、データの量が増えてもアウトプットはリッチになりません。
サンプル(人)が増えれば統計上の誤差は減ってデータが安定しますが、多くの場合それだけです。アイテム(データの種類)が増えれば、様々なパターンの分析が可能になりますが、よい組み合わせを見つけ出すのは困難になります。非構造、非定形なデータは、もっと複雑にいろいろできるのだと言われても、数少ない成功事例だけが根拠では、説得力に限界があります。プログラムを使ってデータの良い組み合わせを見付けることは可能という考えもあるようですが、コンピュータは魔法使いではありません。有意差がもっとも大きくなる組み合わせとか、◯◯指数が××になる組み合わせとかを見つけるのは得意ですが、あまり人間の心や商売とは相性が良くないように思います。
 
以前、メカニズム解明法で『売れる仕組み』を考えたいという記事で、モノの考え方としてカテゴリー適用法、要因列挙法、メカニズム解明法の3つがあると書いたことがあります。大雑把に言えば、「iPhoneはアップル製だから素晴らしい」がカテゴリー適用法、「iPhoneは①ユーザビリティがよく、②便利なアプリケーションがたくさんあり、③デザインが美しいので素晴らしい」が要因列挙法、「iPhoneはユーザビリティ、デザイン、話題性でお客を集め、それにより便利なアプリケーションが増えることになり、誰でも使いやすくカスタマイズできる付加価値を提供しているので素晴らしい」がメカニズム解明法です。後者ほど、説得力があるロジックになります。
 
ビッグデータが役立つ理由は、Whatに関して言えば要因列挙法に留まっているように思います。「大量で」「多様で」「リアルタイム性がある」のそれぞれの要素はリッチなアウトプットにつながりそうなのですが、そのつながりのメカニズムが弱いのです。
 
リッチなアウトプットを出すために必要なのは分析の視点や技術となります。
これについては「最先端の技術で分析すること(How)」でどうにかなっているという話のようですが、この部分については次回触れることにしましょう。

  1. コメントはまだありません。

  1. トラックバックはまだありません。

This blog is kept spam free by WP-SpamFree.