ネガ・ポジ分析は手作業で!


この記事の所要時間: 420秒 〜 520秒程度(2409文字)


自社の製品やサービスについて、顧客がどのように考えているかは誰もが気になるところ。顧客の声は、接客の現場で拾ったり、アンケート調査で集めたりすることが多いが、インターネットに投稿された内容を分析するというアプローチもある。こちらが知りたいことを当て込みで聞き出すより、消費者が問わず語りにみずから書き込んだことに価値があるという考え方だ。アンケート調査を生業にしてきた者から見ればいろいろツッコミどころはあるものの、なかなか魅力的なアプローチなのは間違いない。
 
先日の記事(トレンドの風速や風向きを確認する!?)では、アイス・バケツ・チャレンジへの意見がどう変わったのかをGoogleトレンドを使って簡易的に調べてみた。試しに行なったかなりアバウトな取り組みながら、「賛成」と「反対」の意見の変わり目を見るというアプローチの有効性はわかっていただけたように思う。任意の商品について、世間の反応を数量的に捉えることには、大きな価値があると言っていいだろう。
 
このような目的でよく使われるのが、ネガ・ポジ分析だ。ネガ・ポジ分析では、対象とする商品について書かれたブログやツイートなどを探し出し、それらをネガティブな意見とポジティブな意見にわける。その上で、ネガ・ポジの時系列での推移を追い掛けることで、世論の趨勢をうかがうことができる訳だ。これをテキストマイニングツールなどを使ってやるのではなく、手作業でやてみようというのが今回のオススメとなる。
 

plus minus

credit: ntr23 via FindCC

 


単語に点数を与えてネガ・ポジを判定?


テキストマイニングツールのネガ・ポジ分析は、それぞれの単語にネガ・ポジの点数を与えて行なうものが多い。これまでの蓄積などから、各単語にネガティブかポジティブかの点数を与えるのだ。例えば、「好き」はプラス5.0点、「嫌い」はマイナス6.0点といった具合。こうした上で、一つの文章に含まれる単語の点数を足し上げて、合計がプラスならポジティブ意見、マイナスならネガティブ意見とする。当然、「好き」や「嫌い」などネガ・ポジが明確な単語だけでなく、「新しい」、「切ない」、「印象的」、「斬新」など単語の持つニュアンスが曖昧なものにも点数が付く。それどころか、ネガ・ポジがまったくわからないような「情報」、「理解」、「辞書」、「スマートフォン」などといった言葉も点数を持っている。
 
ただし、この方法では、いろいろな事柄について書かれている投稿の判定が難しい。例えば、「映画『○○』がおもしろかった。主人公のAさんの演技は大根だったけど、ストーリーが抜群。映画の後に食べた餃子は、いまいちだった。」などという投稿があったとしよう。この場合、文章の構造をしっかり捉えなければ、何がポジティブで何がネガティブかわからない。餃子がいまいちだったことは映画の評価にまったく関係ないが、単純に点数を足し上げればこの部分が映画のネガティブ要因になってしまうのだ。
 
この欠点を補うために文章の構造を活用する構文解析などの手法を使うこともあるが、まだまだ発展途上の段階。そもそも、インターネットに書き込まれる文章が文法的に正しいとは限らない、という難題もある。一部のサイトで導入されているネガ・ポジ分析が不正確に見えるのは、大雑把に言えば、このような仕組みが原因となっている。今後の進展には期待したいものの、コンピュータやアプリケーションに文章の大意を掴むことを期待することは、筋が悪い印象だ。
 


複数の人でネガ・ポジ分析すれば・・・


一方で、人間は文章の大意を掴むことが上手。そこで、手作業でのネガ・ポジ分析の登場となる。例えば、Twitterなどで自社の商品を検索し、その結果出てきた投稿を人間が読んで、一つ一つネガかポジかの判定をするのだ。
 
もちろん、人間が読めばネガ・ポジが確実にわかるというものではないが、自分の知る限りテキストマイニングツールより精度が高い。ネガ・ポジのどちらでもないニュートラルを認めた上で、複数の人にネガ・ポジ判定してもらい、それをすり合わせれば一定の品質のネガ・ポジ判定ができる。ネガ・ポジの意見が大きくわかれた投稿は、それ自体をニュートラルにしてもいいだろう。
 
テキストマイニングツールで分析した結果は、いかにも客観的で説得力を持つ。これに対して、人間が手作業で分析した結果は主観が混じりそうで、信頼が低いように見えるかも知れない。しかし実際には、ツールでのネガ・ポジ分析の精度は限界があり、複数の人で分析することを前提とすれば、手作業の方が高い精度が期待できるのだ。
 


いろいろ試してみるのが得策


何でも機械に頼る世の中だが、ものには向き不向きというものがある。コンピューターは力強い味方だが、万能ではない。現時点では、コンピューターが行なった文章内容の分析結果を、全面的に信頼するのはやや冒険だと思われる。分析の過程をブラックボックスのままにして信じるのは自由だが、一度その分析の中身を知れば、コンピューターが出すアウトプットへ過度の信頼は揺らぐだろう。
 
作業の目的を明確にして、そのために手段を考える。これは極めて当たり前のことだが、現実のデータ分析では「まず道具ありき」で進むことも多い。そしてそれでは、いくら分析をしても大きな成果が得られないことになる。ぜひ、本当にやりたいことをギリギリまで考えて、それにあった分析方法をみずから考えて欲しい。少し大変でも手作業の分析は楽しいものだ。いろいろ試してみるのが得策のように思う。

  1. コメントはまだありません。

  1. トラックバックはまだありません。

This blog is kept spam free by WP-SpamFree.