「選挙の予測は案外簡単」・・・なこともある


この記事の所要時間: 420秒 〜 520秒程度(2395文字)


第23回参議院議員通常選挙が公示された。
選挙といえば付きものなのが結果の予測だ。このあと、新聞や雑誌などがそれぞれの予測を展開することになる。仮にもアンケート結果のデータに基づく予測、記者や専門家による「独自の情勢分析」という根拠が曖昧な予測を混在させる姿勢は感心しないが、何もムキになることはない。話の種として楽しむのなら、それはそれで悪くないのだ(参考:ズバリあたる選挙予測も夢じゃない?)。
 
今回の選挙からインターネットを使った選挙活動が解禁になることもあり、ネット上の書き込みデータなどを使った予測が増えるのは間違いない。候補者名が含まれるツイートの量や内容のポジティブ/ネガティブを分析したり、政党名の検索エンジンでの検索数を集計したりして、選挙結果を予測するのだ。選挙が終われば、「ビッグデータを使って選挙予測をしたら、的中率9割以上でした」といったようなリリースが数多く発表されることになるだろう。
 
かなり高い的中率になるだろうが、これに騙されてはいけない。
なぜなら、「選挙の予測は案外簡単」だからだ。
 

 


常識的に考えても9割は当たる?


一般的に言って、予測には当たりやすいものと当たりにくいものがある。例えば、大気が安定している夏や冬の天気予報は当てやすいが、季節の替り目である春や秋の天気予報は当てにくい。成熟した市場を相手にしている老舗企業の業績は予測できても、でき上がったばかりの成長期の市場で活躍する新興企業の業績はなかなかうまく予想できない。もちろん、選挙も同じで、予測が当たりやすい選挙、当たりにくい選挙がある。
 
今回の参議院選挙では、すでに自民党の圧勝が予測されている。これに拮抗するような勢力はないし、破竹の勢いの新政党もない。情勢ははっきりしており、今回の選挙結果が予測がしやすいのは間違いないだろう。
 
例えば、1人区のほとんどで自民党の候補が当選するであろうことは、何の調査をしなくても予測できる。2人区以上でも、事前の政党支持率調査の結果を当てはめて常識的に考えるだけで、9割は当たるのではないだろうか。「9割」は当てずっぽうの数値に過ぎないが、当たりやすいのはわかっていただけると思う。各党の支持率が大きく開いていれば、選挙予測はたやすいのだ。
 


的中率の評価には基準が必要


天気予報の的中率は、持続予報(「昨日と同じ」)、気候値予報(「例年と同じ」)などと比較して評価されると言う。天気には持続性があるので、「今日が晴れなら明日も晴れ」、「今日の最高気温が30度なら明日も30度」と言っているだけでかなり高い精度で予報が当たるためだ。天気予報の的中率が85%だとしても、持続予報の的中率が75%ならその付加価値は10%分しかないと考える。厳しいようにも思うが、シビアに考えれば価値があるのは上乗せ部分だけだ。
 
選挙予測の評価も同じように行なうのが正しい。
一般市民がこれまでの経験や知識から予想した結果、前回の衆議院選挙の政党別得票率を機械的に当てはめた結果などを基準にして比較する必要がある。それより高かった部分のみが選挙予測の付加価値なのだ。算出された数値は、何かと比較してみないとその真の価値を見極められないことが多い。
 


的中率をどう計算するかも大切


的中率の算出方法もいろいろ考えられる。
各選挙区の当選者を予測して、そのうち実際に何人が当選したかを的中率とするのが妥当だと思うが、他の算出方法もつくることができる。例えば、一人一人の当落を予測して、その正解/不正解を的中率としても何らおかしくはない。
 
東京都で考えてみよう。
定員5名に候補者は20名。当選者を予測して1名間違えた場合、前者の方法では4 ÷ 5 = 80%の的中率となる。一方、後者で計算すれば不正解は2名(落選を当選1名、当選を落選1名)なので、( 20 – 2 ) ÷ 20 = 90%になる。的中率の定義次第で、「いかにも当たっている」印象をつくることができるのだ。
 
的中率を高めたいなら、当たりやすいところだけを予想する方法もある。この場合、参議院選挙なら比例区の当選者名は避けた方がいいことになるだろう。選挙区の結果や、比例区の当選人数と較べて、比例区の当選者名は予測しにくいと考えられるからだ。選挙の予測結果を(研究成果などの位置づけで)事後的に公開するものについては、当たった部分だけ公開している可能性すら考えられる。
 


予測者は「評価されたい」ことを忘れずに!


選挙予測をする団体なり個人なりが、その作業結果を「評価されたい」と思うのは自然な心理だ。しかし、その思いが強過ぎるとおかしなことになる。大した価値がない予測を、かさ上げして価値あるものに見せる小細工が行なわれてしまうのだ。そして、多くの人はそれに気付かない。
 
今回の選挙予測の精度の高さを使い、自分たちのデータ活用力の高さをアピールする人たちが現れるのは必至だ。そのとき、今回のような当たりやすい選挙予測で成功したからといって、他の事例で本当に成功できるのかをよく考える必要がある。
 
データ活用の価値を過大評価しないように注意しなければいけない。
多くの企業でデータ活用は役立つが、できないこともたくさんある。データ活用をまるで魔法の道具のように紹介する人がいたら、強く疑った方がいいだろう。

  1. コメントはまだありません。

  1. トラックバックはまだありません。

This blog is kept spam free by WP-SpamFree.