タグ : データの罠

アイス・バケツ・チャレンジとネズミ講


この記事の所要時間: 330秒 〜 430秒程度(2009文字)


8月後半、日本でもアイス・バケツ・チャレンジが大きな話題となった。ALS(筋萎縮性側索硬化症)患者支援のためのアメリカ発のこの企画。その拡散スピードは凄まじく、何とも異様な広がりを見せた。日本ALS協会によれば、「8月18日から31日までの2週間で、協会に寄せられた寄付は合計2747万円」とのこと。単純に1人1万円と考えると、2,747人が寄付したことになる(「アイスバケツチャレンジ」に日本ALS協会が感謝のコメント 募金額は2週間で2747万円に|ねとらぼ)。
 

 ●指名された人は24時間以内に
   ・ALS協会に100ドルを寄付する
   ・頭から氷水をかぶる
  のいずれかを選ぶ ※両方を行なってもよい

 ●次にバトンを渡す3人を指名する

アイス・バケツ・チャレンジ企画の肝はこの基本ルールにある。(1)対象者1人が「3人を指名する」ため、その対象者は指数関数的に裾野を広げて増加する。しかも、(2)「24時間以内」という厳しい条件があることにより、1回転のサイクルが早い。そして、(3)寄付も氷水も強制ではないとはいえ、根底にチャリティの理念があるので何となくスルーはし難い。これら3つの条件が揃った結果、対象者の輪が勢いよく広まった訳だ。いつの間にか収束したようだが、何かの拍子に再燃すればまた同じような現象が起きないとも限らない。
 

pyramid selling

credit: Nickay3111 via FindCC

 
このルールとその広がりを見て、俗に言う「ネズミ講」を連想した人は多いだろう。その目的は大きく違うと言えども、拡散の様相は極めて似通っている。1人が複数人に紹介することで、巻き込まれる人数が爆発的に増えていく仕組みに変わりはない。ことが善意の広がりならば、それはそれでいいように思うかも知れないが、ネズミ講を連想するような拡散の仕組みには大きな注意が必要だ。一つ間違えれば、収拾の付かないことになる。たとえ善意の連鎖が目的だとしても、不用意に手を出さない方が無難だろう。
 
続きを読む

ゴキブリ指数は有効?無効?


この記事の所要時間: 320秒 〜 420秒程度(1876文字)


ゴキブリの発生リスクが一番高い都道府県は東京都らしい。マイスタースタジオという会社が発表したデータによるもので、東京都の指数は2.31。これが全国平均を1として算出した値だから、東京のゴキブリ発生リスクは全国の2倍以上ということになる(参考:ゴキブリ「発生リスク」が高い街はどこか?|MSN産経west)。
 
この「ゴキブリ指数」とでも言いたくなる数値。
「まあ、そんなところかな」と思いつつも、算出方法が気になるのがデータ好きの性だ。そこで、この指数についてちょっと考察してみた。
 

計算

credit: geralt via FindCC

 
続きを読む

Wikipediaの医療情報は信用できない?


この記事の所要時間: 310秒 〜 410秒程度(1833文字)


どうやらWikipediaの病気や健康に関する情報は信用できないらしい。米キャンベル大学の研究チームが行なった調査によれば、「90%もの内容が誤情報であることがわかった」とのことだ(参考:ウィキペディアを信じるべからず。病気や健康に関する記載の9割が虚偽情報だと判明|IRORIO)。
 
正誤の判断基準などがわからないため確定的なことは言えないものの、誤情報が「90%」というのは絶対的な割合としてかなり高い。Wikipediaの医療情報が信用できないのは確かだろう。しかし、これをもってWikipediaを批判するのには些か抵抗がある。なぜなら、この数値には比較の視点が欠けているからだ。
 

Wikipedia

credit: Kalexanderson via FindCC

 
続きを読む

「小保方さん応援ツイートが多い」は本当か?


この記事の所要時間: 420秒 〜 520秒程度(2437文字)


毎日新聞にツイッター分析:小保方氏会見への応援・支持、批判の2倍にという、俄に信じ難い記事があった。何も、小保方さんへの応援や支持が増えたことを驚いているのではない。こんなことが「分析ソフト」を使ったくらいでわかると考えている新聞社の不見識にびっくりしたのだ。
 
世の中には、ソフトウェアを使ったデータ分析に過度な期待をする向きがある。しかし、ソフトウェアとて魔法の道具ではない。「できること」と「できないこと」、更に「条件付きでできること」がある。そして、今回の記事での分析のような「条件付きでできること」を頭から信じると、その結果について大きな勘違いをすることになってしまう。
 
データ分析を行なう側に「騙してやろう」という悪意があるかは定かではない。しかし、個人も企業も自分のやっていることを大きく見せたいのは確か。多少の針小棒大、羊頭狗肉は付きものだ。このため、分析結果が本当に信じられるかどうか疑う習慣を持つことが、データの罠に引っ掛からないために極めて重要となる。ビジネス誌などでデータ分析が大きく取り上げられる今だからこそ、身に付けて損のないスキルのように思う。
 

Twitter

Photo credit : mkhmarketing / CC BY

 
続きを読む

座高測定廃止はもったいない?


この記事の所要時間: 320秒 〜 420秒程度(1890文字)


文部科学省が学校の健康診断での座高測定を廃止する。検査項目の見直しを要請していた有識者会議からの報告を受けて、省令を改正する方針とのこと。廃止の理由は、座高測定の検査結果が「ほとんど活用されていない」と単純明快だ(参考:27年度にも座高測定廃止 学校の健診見直し 文科省|MSN産経ニュース)。
 
これまでなぜ座高測定をしていたかはよくわからない。座高の測定がはじまった当初は「内蔵がある上半身の発達を確認する」目的があったという説もあるが、本当にこんな目的だったのか、そもそも座高を測ることで内蔵や上半身の発達を確認できるのかは不明。「学校で使う机や椅子の高さ決定に使う」ためという説は理に適っているものの、生徒全員の座高を毎年測定する理由にはならないだろう。報告書で「ほとんど活用されていない」と指摘されているのだから、測定を続けていた理由は「誰も止めようと言わなかったから」が真相なのかも知れない。
 
さて、こういう測定廃止の取り組みがあると、必ずと言っていいほど「データの継続性を考え、安易に測定を止めるべきではない」という反論が登場する。しかし、これに説き伏されてはいけない。一理あるのは間違いないものの、そこにあるのはデータ活用に対する熟考ではなく、現状維持バイアスに基づく過剰な「もったいない精神」だからだ。
 

Photo credit : lowa Digital Library / CC BY-NC Photo credit : lowa Digital Library / CC BY-NC

 
続きを読む