Googleの映画興行成績予測がかなり凄い!


この記事の所要時間: 420秒 〜 520秒程度(2391文字)


CNET Japanに映画の興行成績は検索動向で予測可能–グーグルが発表という記事が掲載された。Googleが持つデータを使えば、「映画が公開された週末の興行成績を92%、その後の週末は90%の正確さで予測できる」というのだから、かなり凄い。「ハリウッド関係者なら間違いなく入手したい種類の情報」という評価も納得だ。
 
どんなビジネスでも、未来を予測できるのならこんな結構なことはない。未来がわかることで仕入れや人員手配の精度が上がれば経費削減になる。発売前の新商品が失敗しそうだとわかれば、その発売を中止することで損失を最小限にとどめることができるだろう。だからこそ、どの企業も必死になって未来を予測しようとするが、なかなかうまくいかないのが実情だ。
 
では、Googleの予測はなぜこんなに高い精度で当たるのだろう。
そして、この予測は実際に役立つのだろうか。
今回はこれについて考えてみる。
 

photo credit : muckster via photopin cc

photo credit : muckster via photopin cc

 


充分なデータと変数があれば・・・


未来の予測方法はいろいろあるが、ある変数(被説明変数)を別のいくつかの変数(説明変数)であらわすモデル式をつくるのがオーソドックスな方法だ。これまでの実績からモデル式をつくっておけば、次の一つについては説明変数の数値を当てはめるだけで未来予測が可能になると考える。
 
例えば、ある1軒のコンビニエンスストアについて1日のアイスクリーム売上高を予測するなら、最高気温、湿度、曜日、近隣でのイベント有無などを使ってモデル式をつくればいいだろう。最高気温の5倍(25度なら125個)を基本に、湿度が80%を超えたらプラス10個、イベントがあったら更にプラス20個、土曜・日曜なら足しあげた個数を1.5倍にするといった具合だ。もちろん、実際に予測するときには統計ソフトなどを使ってもう少し精密なことをするが、まずはこんなイメージをもってもらえればいい。過去の実績から次の一つが予測できる可能性があるのは納得していただけると思う。
 
ここで予測の精度をあげるに必要なのは、少しでも多くの実績データ、充分な数と種類の説明変数となる。Googleの予測がよく当たるのは、実績データと説明変数が豊富だからと言えそうだ。大量のデータが蓄積されているのは当然のこと、説明変数もいろいろつくれる。何も検索回数のみを変数にしているわけではない。記事では明確に書いてないが、Googleならば出演者の検索回数、Twitterで話題になった回数、試写会で見た人の評価などさまざまな変数を簡単にデータ化できるだろう。これらの説明変数と興行成績の関係を見て、影響の大きい変数を選び出せば質の高いモデル式ができることになる。
 
もちろん、インターネットやGoogleを使わずに映画を見に行く人もたくさんいる。しかし、そういう人たちの比率がどの映画でも変化しなければ、予測は当たる。比率が変化するととしても、そこに何らかのトレンドがあればその動き自体を組み込むことも可能だ。Googleを使って映画情報を探す人が毎年5%ずつ増えるなら、予測の際にそれを考慮すればいい。
 
実際には、映画のタイプによってモデル式を使いわけている可能性が高いだろう。恋愛ものなのかコメディなのか、シリーズか単発か、ストーリー重視か出演者重視か、ターゲットは若者か高齢者か、公開規模の大きい作品か小さい作品か。タイプの違いによって、Googleの利用率や出足の良し悪しに差が出るのは間違いない。この部分をうまく勘案できてこそ、精度の高い予測が可能になると考えられる。
 
Googleがいくら凄い会社だとしても、魔法使いではない。
このような分析の積み重ねによって、精度の高い予測を行なっているのだ。
 


データを使う人の資質が問われる!?


さて、こういう分析はデータを積み上げるほど精度が高まる。そうなれば、より早いタイミングでの予測も可能になるかも知れない。たとえば、公開1か月前の検索回数などから興行成績を予測できるようになれば、この分析モデルの価値は更に高まる。公開直前ではできることが限られるが、早い段階で予測がわかればいろいろな手を打つことが可能だからだ。実際に役立つといえるのは、このレベルになってからだろう。
 
このとき問われるのが、データを使う人の資質だ。
その映画の担当者のつもりになって、考えて見て欲しい。自分が深く関わった作品が、公開1か月前の予測で「失敗する」とわかったとして、それを信じて公開規模を縮小するなどの対応ができるだろうか。
 
多くの場合、「そんなデータは信用できない」、「これから巻き返す」となる。一度動きはじめた企画は、慣性がはたらくため途中でやめるのが難しいのだ。今まで使ったお金と手間が惜しくなり、更なる損失の可能性があっても、いさぎよく撤退するという判断ができない。だからこそ、誰が見ても失敗しそうな映画が大規模公開されたりすることになる。担当者の熱い思いは大切だが、それによって未然に防げた損失を発生させては本末転倒だろう。
 
正しい予測ができたとしても、それを使う人が変わらなければ不幸が起きる。
データをつくる側の説明力の不足もあるが、その結果を活用する個人や企業の意思決定方法が変わらなくてはどうにもならない。それを少しずつでも変えていくのが、データ活用の第一歩となる。誰もがもう少しデータを信じてくれるといいのだが・・・。

  1. コメントはまだありません。

  1. トラックバックはまだありません。

This blog is kept spam free by WP-SpamFree.