原爆投下日アンケートは回答者構成に難アリ!?


この記事の所要時間: 630秒 〜 730秒程度(3481文字)


少し前に、NHK世論調査 原爆投下日を7割が不正解というニュースがあった。

NHK世論調査 原爆投下日を7割が不正解
 
被爆70年に合わせてNHKが行った世論調査で、広島と長崎に原爆が投下された日付について聞いたところ、正しく答えられなかった人がそれぞれ全国で7割程度に上り、専門家は原爆について意識を高めていく必要があると指摘しています。
NHKはことし6月下旬に、広島市と長崎市、それに全国の20歳以上の男女を対象に、コンピューターで無作為に発生させた番号に電話をかける「RDD」という方法で調査を行い、それぞれ1000人余りから回答を得ました。

まず、広島に原爆が投下された日付について聞いたところ、「昭和20年8月6日」と正しく答えられた人は、広島で69%、長崎で50%、全国で30%でした。

また、長崎に原爆が投下された日付について聞いたところ、「昭和20年8月9日」と正しく答えられた人は、広島で54%、長崎で59%、全国で26%でした。〔略〕

 
直感的に意外なほど低い正解率で、どのような調査をしたのか興味を持っていたところ、NHK放送文化研究所で少し詳細なデータが公開されていた。『原爆意識調査(広島・長崎・全国) 単純集計結果』がそれだ。これを読むと、ニュースだけからではわからない歪みが見えてくる。
 

ゆがみから

credit: BriBra via pixabay

 


質問文と正解の認定方法は極めて自然


まず、一部で話題になっていた質問文と正解の認定方法が恣意的でないかという指摘。これは、結論から言えば、あまり問題を感じない。レポートにある質問文は、広島の場合、

あなたは、いつ、広島に原爆が落とされたかを知っていますか。「何年何月何日」というようにおっしゃってください。

で、集計カテゴリーは

1.昭和20年(1945年)8月6日」
2.上記以外の日(不正解)」
3.知らない、わからない、無回答」

といったもの。「何年何月何日」で答えるようにお願いして、元号でも西暦でも正解にしたのなら極めて自然だ。月日だけ回答した人に、「何年なのかもお答えください」と催促したかはわからないものの、直前に「何年何月何日」と指定している限り大きな問題ではないだろう。
 
「年まで質問するのは正解率を下げるため」という指摘もあるようだが、そこは価値観の問題でしかない。「年まで答えられて初めて正解」とする価値観に異論があるとしても、年を聞くのはそこまで特異な発想ではない。価値観の違いはあれど、多くの人に受け入れられ得る範囲にある考え方のように思う。
 
むしろ残念なのは集計カテゴリーの方。ここで「上記以外の日(不正解)」を、「年は不正解&月日は正解」、「年は正解&月日は不正解」、「年も月日も不正解」にわけておけば、余計な詮索をされずに済んだ筈だからだ。もちろん、このアイデアは後知恵に過ぎないが、「年は不正解&月日は正解」がどのくらいいたかは興味深い。
 


回答者は女性6割、20歳代+30歳代で1割程度


一方で、問題を感じるのは回答者の構成。構成比をグラフにすると以下のようになる。

原爆意識調査の回答者構成

いかがだろう。一番下の人口推計(平成26年10月1日現在)と比較するまでもなく、性別で女性が6割と多く、年齢で20歳代、30歳代が極端に少ない結果。『20歳代+30歳代』は人口推計で3割弱の27.7%となるのに対し、回答者構成では広島市(11.7%)、長崎市(9.3%)、全国(11.7%)とも1割程度にとどまる。回答者の構成が、全国の人口構成と較べてかなり歪んでいるのは間違いないと言えるだろう。
 
戦争や原爆についての知識不足というと、比較的若い層を思い浮かべる人が多いように思う。しかし、この調査はそもそも若い人の回答者が極端に少ない。層別の正解率が出てないためこれ以上のことはわからないが、若い人の正解率が低かったとしても、その影響は小さい筈だ。回答者の歪みを知らずにでデータを見ると、間違った推測をすることに成り兼ねないように思う。
 


RDD法でランダムな回答者は集まる?


さて、引用したデータによれば、この調査は「電話法(RDD追跡法)」で行なわれている。「RDD法」と違って「RDD追跡法」という用語はあまり聞かないが、想像することはできそうだ。ただランダムに電話をするだけではなく、その後も少しでもサンプリングを正確にするため個人を追跡しているという主張だろう。
 
調査に詳しくない人は、RDD法でランダムに電話番号を発生させるだけで無作為なサンプリングができると思いがちだ。しかし、これは大きな勘違い。固定電話は世帯単位、調査は個人単位なので、電話番号だけランダムに発生させても回答者をランダムにピックアップすることはできない。電話がつながった世帯の「誰に調査をするか」もランダムに決めなくてはならないのだ。何も考えず最初に電話に出た人にアンケートをしたら、回答者構成の歪みは今回のアンケートの比ではない。女性と高齢者だらけになってしまう。
 
そこで、一般的には、最初に電話に出た人に家族構成を聞き、そこからランダムに回答者を選ぶ。更に、選ばれた人が不在の場合、後から追跡(?)して調査することで、少しでも歪みをおさえようとする訳だ。家族構成を聞くため、個人を追跡するために何度も何度も電話をかければ、そのぶんだけサンプリングの精度が上がることになる。
 


RDD法の理想と現実


こう書くと、「それならRDD追跡法で集めた回答者はランダムになっているのでは」と思う人もいるだろうが、そう簡単にはいかないのが調査の難しさだ。まず、電話に出る世帯と出ない世帯がある。常識的な時間帯に電話調査をした場合、一人暮らしの世帯、共働きの世帯、高齢者がいる世帯で在宅率に大きな違いがあるのは想像できるだろう。電話に出ない世帯は調査対象にならないので、ここに歪みの元がひとつある。
 
また、家族構成の質問もハードルになる。警戒心が強い人は家族構成など教えたがらないからだ。ここの協力がなければ、調査は先に進まない。この部分も歪みを生むわけだ。
 
そして、一番の問題が実際にアンケートに回答してくれるかどうか。いくらうまくサンプリングできたとしても、アンケートへの協力を拒否されてしまったら、回答者にはならない。自分の場合で考えてみて欲しい。突然電話が掛かってきて「アンケートに答えて欲しい」と言われたら応じるだろうか。協力してくれない人が増えれば、そのぶん歪みが増すことになるのだ。
 
さて、今回のアンケートで不正解率が高い原因は何だろう。もちろん、世間一般の正解率が低い可能性もあるが、自分の印象ではここまで低いとは思えない。そうなると問題は、調査手法による歪みだ。以前から思っていたことだが、RDD法の調査に協力するような人に偏りがある可能性がある。例えば、時間に余裕がないビジネスマンはあまり協力しないだろうし、ずっと家にいるような人は協力してくれそうだ。性別や年齢だけでは表せない偏りが、この低正解率を生み出している可能性は案外あるように思う。
 


源にふれろ


自分としては、これだけ若い人が少ないなら、データを公表するときにその点を積極的にアナウンスした方がいいように思う。RDDの「ランダム」という言葉のイメージが強いため、一般の人はRDDによる電話調査を、もっと歪みの少ない調査だと思っている可能性があるからだ。歪みが直せないなら、それを積極的にアナウンスすることで、誤解を避ける必要がある。
 
そして、もうひとつ大切なのは、データをおかしいと感じたら源にふれること。今回のアンケートも、ニュースを聞いただけでは回答者の歪みに気付くことはできない。元の単純集計にあたって、はじめて歪みが見えてきた訳だ。もちろん、いちいち調査手法を疑っていてはきりがない。でも、「ここは重要」と思った場合は確認するに越したことはないように思う。疑い過ぎる必要はないが、なんでもそのまま受け入れるのも考えもの。時と場合に応じて源にふれることが、現代人の嗜み(?)のように思う。

  1. コメントはまだありません。

  1. トラックバックはまだありません。

This blog is kept spam free by WP-SpamFree.