特異日に騙されるな!または娯楽の統計の罪?


この記事の所要時間: 330秒 〜 430秒程度(2009文字)


中小企業診断士の佐々木孝です。
 
11月3日は文化の日。
俗に、晴れの特異日と言われています。しかし、果たして本当に「特定の日が晴れ易い」などということがあり得るのでしょうか。
 
今回は、この特異日について考えてみることにします。
 

photo credit : Nils Geylen via photopin cc

 


偶然とは思われないほどの高い確率で・・・


特異日とは何か。
ウィキペディア日本語版では、次のように説明されています。

特異日
特異日(とくいび)とは、その前後の日と比べて偶然とは思われないほどの高い確率で、特定の気象状態(天気、気温、日照時間など)が現れる日のこと。特異日は外国でも認められており、英語では「シンギュラリティ(singularity)」と呼ばれる。〔略〕
 
特異日に関する研究は1920年代にドイツのオーギュスト・シュマウス(August Schmauss)によって行われた。気温の特異性に関しては、実際のデータを用いて多変量解析を行うことにより、特異性があるか否か(ある特定の日が特異日であるといえるか否か)を統計的に検定することができる。〔略〕

 
どうやら一般に捉えられている意味と大差はありません。
「偶然とは思われないほどの高い確率」で、晴れや台風の襲来など特定の気象状態が起きる日のことを言うようです。「偶然とは思われない」という部分には統計学の出番がありそうですし、現に「気温の特異性に関しては、実際のデータを用いて多変量解析を行うことにより〔略〕検定することができる」と書いてありますが、今回調べた限り学問的に厳密な定義はないようです。
 
つまり、何をもって「偶然とは思われないほどの高い確率」とするかは、データを分析する人の考え次第ということになります。
 


特異日は「ただの偶然」


統計により何らかの傾向(例えば「11月3日は晴れが多い」)が見出された場合、その傾向が常識的に考えて起こり得ることなのかを疑う必要があります。データの傾向だけに注目すると、「ただの偶然」を「意味のある差」と判断し易いからです。データ分析はできる限り客観的に行なう必要がありますが、分析者も人間です。多くの場合、「意味のある差」を見付けるためにデータ分析をしているのですから、分析者はついつい「意味のある差」を無理にでも見つけ出そうとする傾向があります。ここに注意が必要なのです。
 
さて、常識的に考えてみましょう。
ある特定の時期、例えば11月初旬の天候に何らかの傾向があることは容易に想像できます。四季の変化があるのと同じように、もっと詳細な単位で天候の傾向があっても何ら不思議はありません。時期により発生し易い気圧配置があり、そこから天候に傾向が生じると考えるのは極めて自然です。
 
しかし、特定の1日を考えた場合は話が違ってきます。
データを分析した結果、ある1日だけ「晴れ易い」ことがわかったとしても、その原因を見付け出すことができないからです。
 
一般論で考えれば、既存の知識で説明のつかない傾向があった場合、そこに隠された意味を考えた方がいいでしょう。先入観を取り除いて、その傾向の意味を考えるアプローチをすることが新しい発見につながるかも知れないからです。しかし、今回の題材は気象状態と日付の関係なので、隠された意味が存在する可能性はほとんどありません。ある特異日について、たとえ有意に「晴れ易い」というデータがあったとしても、それは「ただの偶然」と考える方が妥当なのではないでしょうか。
 


「娯楽の統計」はほどほどに


統計の活用法の中には、「娯楽の統計」とでも言うしかないようなジャンルがあります。データを分析することで出てくる「ただの偶然」に意味を持たせて、話のネタにするのです。晴れの特異日しかり、宝くじに当たりやすい人しかり、競馬の出目予測しかりです。そして、データ分析の目的が違うと考えれば、これを否定する理由はありません。おもしろい「ただの偶然」を見付けてそれを楽しめるのなら、それはそれで豊かな文化でしょう。
 
ただ、それをあまりに信じ過ぎるとおかしなことになります。「娯楽の統計」はあくまでシャレにとどめて活用しなければなりません。これに本気になって金儲けに使うようなことがあれば、楽しむはずの「娯楽の統計」が罪つくりな存在になってしまいます。
 
「娯楽の統計」は、基本的に「ただの偶然」に過ぎないことを見失ってはいけません。
決して騙されることなく、ほどほどに楽しむことが大切なのです。

  1. コメントはまだありません。

  1. トラックバックはまだありません。

This blog is kept spam free by WP-SpamFree.