危険なパスワードがなくならない理由


この記事の所要時間: 20秒 〜 30秒程度(1283文字)


前回の記事で紹介した「よく使われたパスワードランキング」。毎回、上位は数字の羅列や簡単な英単語ばかりで、安全なパスワードの使用をうながす啓蒙は失敗しているように見えるが、実はそうとも限らない。
 
上位に危険なパスワードが並ぶのには、集計上のトリック(?)があるからだ。啓蒙が成功して、ほとんどの人が安全なパスワードを使うようになったとしても、「よく使われたパスワードランキング」の上位には今と同じようなパスワードが並ぶことになるだろう。
 

カウンター

credit: Hans via pixabay

 


他人と重複するのは危険なパスワードだけ


なぜそんなことが起きるのかというと、安全なパスワードは重複しにくいからだ。何をもって安全なパスワードとするかは一概に決められないが、他人から想像できないように英字と数字と記号を混ぜたり、辞書にある単語のつづりを避けたりすれば、一人一人のパスワードはバラバラになる。そうなると、偶然、他の人とパスワードが一致することはまず起きない。安全なパスワードのバラツキが大きいため集計しても重複せず、上位にランクインしないわけだ。
 
つまり、サイトで使用されるパスワードがいくら改善しようとも、「よく使われたパスワードランキング」は危険なパスワードだらけになる。たとえ99.9%の人が安全なパスワードを使うようになっても、パスワードが重複するのは主に残り0.1%の人たち。数の多いパスワードを集計すれば、上位の顔ぶれは変わらないことになる。
 
では、何が重要かと言えば、それは危険なパスワードが占める割合ということになる。例えば、上位100位までのパスワード使用者が全体の何%にあたるのかなどだ。危険なパスワードの使用状況を知りたいなら、ランキングではなく割合のデータを見る必要がある。「よく使われたパスワードランキング」は啓蒙になるが、パスワード利用の実態をあらわしているとは言いがたい。
 


「たくさん」より「どれくらい」


芸能界やスポーツ界の薬物汚染の話などにも、似たようなトリックが働いている。薬物で逮捕された人、有罪になった人を集めることで「汚染されている」と言っているが、同じ特徴の人を集めればそれが「たくさん」になるのは当たり前。日本全体の1000人あたり薬物犯罪率と、芸能界、スポーツ界のそれとを比べることで、はじめて相対的に多い/少ないの議論ができるようになる。「たくさん」いるという情報だけでは、実態は何もわからないのだ。
 
「たくさん」あるという情報だけでは、そこにどのような意味があるかわからない。それがどのくらいの割合で、他のグループと比べてどれくらい多いか、少ないかを考えることが統計的なモノの見方となる。何かが「たくさん」という情報があったときは、その多さに驚く前に、それが「どのくらい」なのか疑いを持つことが大切だ。

  1. コメントはまだありません。

  1. トラックバックはまだありません。

This blog is kept spam free by WP-SpamFree.