モンテカルロで大相撲、全勝優勝の確率は?


この記事の所要時間: 340秒 〜 440秒程度(2077文字)


中小企業診断士の佐々木孝です。
 
前回(力ずくで確率を算出するモンテカルロ法の魔力)紹介したモンテカルロ法(乱数を使ったシミュレーションで確率等の近似値を算出する方法)を使って少し遊んでみましょう。「遊ぶものなのか?」と思う人もいるでしょうが、データ好きの人間にとってモンテカルロ法は出来のいいオモチャのようなものです。
 
今回、まず簡単なところで大相撲を取り上げます。
勝率9割の力士はどのくらいの確率で全勝優勝するのか。
これをモンテカルロ法を使って考えてみました。
 

 


勝率9割の力士は約2割の確率で全勝優勝


想定勝率9割の力士を数式であらわすと、次のようになります。

 = if ( rand() < 0.9 , "勝ち" , "負け" )

rand関数は0以上1未満の乱数を返すので、この値が0.9未満である確率( rand() < 0.9 )は9割となります。if文は if ( 論理式 , 真の場合の値・数式 , 偽の場合の値・数式 ) というフォーマットですから、この論理式( rand() < 0.9 )が真の場合に“勝ち”とすることで、9割の確率で勝つ力士のシミュレーションが完成するわけです。これを15日分並べて、“勝ち”の数をかぞえれば1場所分の勝ち星となります。  
早速、1万場所分のシミュレーションを10回行なったところ、全勝優勝の回数は、

 2104回、2085回、2039回、2033回、1984回、
 2097回、2084回、1988回、2037回、2053回

となりました。全勝の回数は最小で1984回、最大で2104回。勝率9割の力士は約2割の確率で全勝優勝すると推測できます。
 
もちろん、こういう単純なモデルの場合は普通の確率計算も容易です。勝率9割の力士が15戦全勝する確率は 0.9の15乗 = 0.2059 = 20.59% となります。当然ながら、モンテカルロ法によるシミュレーションの結果とほぼ同じです。
 


勝ち癖、負け癖があるなら全勝優勝は43%に!


さて、ここまでの確率計算は各日の勝ち負けが「独立」だと仮定しています。1日目に勝とうと負けようと、2日目の想定勝率に変化はなく、同じ90%で計算しているのです。
 
しかし、現実はどうでしょう。実際の勝敗データにあたったわけではありませんが、前日勝てば翌日勝ちやすく、前日負ければ翌日負けやすいように思います。勝敗は体調の良し悪しや精神面の影響を受けるので、勝ち癖、負け癖があると考えた方が自然でしょう。そこで次に、この「前日の勝敗の翌日の勝敗への影響」を加味してみます。
 
これをシミュレーションするためには、1日1日想定勝率を変える必要があります。
1日目の想定勝率は90%で固定。
2日目以降は、仮に、

 ●前日勝った場合
  前日勝率 + (1 – 前日勝率) × 0.1
 ●前日負けた場合
  前日勝率 − (1 – 前日勝率) × 0.1

としみましょう。
 
勝てば少し想定勝率が上がり、負ければ少し想定勝率が下がることを数式化したわけです。上がり幅/下がり幅に根拠はありませんが、どうやっても想定勝率が10割を超えないようにちょっとした小細工をしました。この数式をあてはめると、2日目の想定勝率は1日目に勝ったら91%、負けたら89%。2連勝後の3日目は91.9%、3連勝後の4日目は92.71%といった勝率になります。
 
これで1万場所分のシミュレーションを行なうと、全勝優勝の回数は以下の結果となります。

 4373回、4362回、4356回、4335回、4441回、
 4432回、4380回、4271回、4353回、4400回

どうやら、勝ち癖、負け癖を考えると全勝優勝の確率は43%前後に倍増するようです。
 


モンテカルロ法なら「独立」でない確率が計算できる


上で計算した勝ち癖、負け癖を考えたモデルを、確率の数式計算で解くのは極めて困難でしょう。確率の問題の多くは、各事象の「独立」を仮定しないとなかなか解けません。それぞれを「独立」としないと、話がややこしくてどうにも手に負えなくなってしまうからです。しかし、これがモンテカルロ法なら比較的容易に計算できます。
 
こういうリアリティを加味した複雑な確率を求める場合に、モンテカルロ法は大いに役立ちます。そして、現実に存在する問題の多くは、確率論の問題よりもずっと複雑です。つまり、モンテカルロ法が活躍する場面は、これからもたくさん出現すると考えられるのです。

  1. コメントはまだありません。

  1. トラックバックはまだありません。

This blog is kept spam free by WP-SpamFree.