大学発ベンチャー調査と生き残りバイアス


この記事の所要時間: 330秒 〜 430秒程度(2002文字)


帝国データバンクが大学発ベンチャー企業の実態調査を行ない、その結果を発表した(参考:大学発ベンチャー、過半数が黒字経営|帝国データバンク)。調査結果を取り上げた記事もいくつか出たので、目にした方もいるだろう。
 
さて、このリリースでは「2012年の損益状況は、損益が判明している304社中166社(構成比54.6%)が黒字を計上」としている。見出しとなっている「過半数が黒字経営」を支えるデータだ。これを読むと、まるで大学発ベンチャーに挑戦した企業の半数以上が黒字化に成功したようだが、そうとは限らない。なぜなら、この調査結果には生き残りバイアスが存在しているからだ。
 

Photo credit : ekai / Foter / CC BY-NC-SA Photo credit : ekai / Foter / CC BY-NC-SA

 


黒字化できずに廃業した企業を含めないと・・・


この調査では、大学発ベンチャー企業を帝国データバンクの自社データベース・信用調査報告書ファイル「CCR」から抽出している。つまり、設立された大学発ベンチャーのうち「現存している企業」を対象にした調査結果ということだ。大学発ベンチャーの現状だけを知りたいなら、この調査設計で充分と言えよう。
 
しかし、大学発ベンチャーに挑戦した企業が、どのくらい黒字化したのかを知りたいなら、話は違ってくる。黒字化した比率を考えるためには、大学発ベンチャーに「挑戦した企業」すべてを対象としなくてはならないからだ。「黒字化できない」などの理由で廃業した企業を含めなければ、正しい黒字化率を算出することはできない。
 
廃業した企業を追跡調査することは難しい。
そこでついつい生き残った企業を調査することになるが、それではわかることが限られる。大学発ベンチャー企業の例で言えば、その現状はわかっても黒字化率はわからないのだ。それでも、このリリースの受け手の多くは生き残りバイアスに気付かず、「大学発ベンチャーは過半数が黒字化する」と誤解してしまう。このあたりが、生き残りバイアスの罪つくりなところだ。
 


生き残り客を調べても・・・


このように、調査対象を「現存しているモノに限る」ことで生じる歪みを生き残りバイアスという。生存バイアス、生存者バイアスなどと呼ばれることも多い。理にかなった分析をするためには「全部」を調べなくてはいけないのに、生き残った「一部」のみを調べてしまう間違いだ。
 
毎年のように「宝くじ当選者の特徴」がリリースされるが、あれはまさにこの典型と言える。本来なら、宝くじを買ったすべての人を対象にして、各属性(年齢、性別、職業、・・・)の当選率を比較するべきだが、それは手間が掛かって現実的でない。そこで代替案として、当選者に多い属性をもって「宝くじ当選者の特徴」としているが、これは誰もが知りたい「宝くじに当たりやすい人」を意味しないのだ。このようなやり方で「宝くじ当選者の特徴」を示しても、それはきっとその属性の人がよく宝くじを買うだけ。もちろん、「宝くじ当選者の特徴」といって間違いではないが、宝くじを買う人が欲しているデータとは違うし、多くの人がその意味を勘違いするだろう。
 
ビジネスの現場で考えるなら、小売店の客数減少の原因を既存客に聞くアンケートなどが典型だろうか。店から離れていった人にはアンケートができないので、現存客=生き残り客にアンケートをするのだが、そこで店の不満点を聞いて果たして意味があるだろうか。生き残り客はそのお店にそこそこ満足しているのだから、その人たちの意見と離れていったお客の意見は違って当然だ。しかし、このようなボタンを掛け違えた調査は後を絶たない。
 
生き残りだけを調査しても、欲しいデータを得られない場合がある。
この場合、調査のやり方を変える必要がある。しかし、それが困難だと生き残りのみへの調査を実施してしまう。そして、そこから得られる結果はミスリードを招く可能性が高いが、それを活用してしまう。それでは、不幸な結果に行き着くのは見えている。生き残りバイアスには、くれぐれも注意が必要なのだ。
 


調査は数値よりも調べ方が重要


いろいろな調査結果が公表されると、誰もが見出しなどにある数値に飛びつく。しかし、その数値がどのような調べ方で得られた結果なのかがわからないと、その数値の意味するところはわからない。生き残りバイアスがあるかも知れないし、他の歪みがあるかも知れないのだ。
 
データを有効に活用したいのなら、表面にある数値に引っ張られることなく、どのような調べ方をしたか確認する必要がある。そこから数値の意味を解釈できてこそデータ活用なのだ。一朝一夕になせることではないが、調べ方を確認する癖をつけることは役に立つ。何せ、調査は数値よりも調べ方が重要なのだから。

  1. コメントはまだありません。

  1. トラックバックはまだありません。

This blog is kept spam free by WP-SpamFree.