ロト6で学ぶ統計と分析「大数の法則」
どうも、くまごろうです。
こんなニュースをみました。
ロト6詐欺「番号教える」 50代女性、1億5千万被害 ― スポニチ Sponichi Annex 社会
1億5千万円払えちゃうのがすごいなあ、という関心と、なぜこういうのに引っかかっちゃうんだろう?という興味が湧いてきました。
前半の関心はさておき、後半の興味は統計とすごーく関係があるのです。
統計をすこしかじっていれば、こういうことにはひっかからなくなります。
ということで、今回はロト6の過去の出現数字を使って、ちょっと統計のお話をします。
何回も繰り返すと統計的な確率に近づいていく
大数の法則という言葉があります。
ちょっとウィキから引用します。
ある試行において事象が起きる確率(数学的確率、理論的確率などともいう)が p であり、その試行は、繰り返し行ったとしてもある回の試行が他の回の試行に影響を及ぼすことがない(独立試行)ものとする。このような前提条件の下で、その事象が起きる比率が試行回数を増やすにつれて近づく値(統計的確率あるいは経験的確率)は p である。つまり、各回の試行において各事象の起こる確率というものが、試行回数を重ねることで、各事象の出現回数によって捉えられるというのが大数の法則の主張するところである。
例えば「コイン投げ」、つまりゆがみも偏りもない"理想的なコイン"を投げて出る表裏を当てるゲームを行うとする。ここで、"理想的なコイン" とは「それを投げるとき、各回の試行において表が出る確率も裏が出る確率もともに 1/2 である」という確率モデルそのもののことである。このとき、コイン投げの試行回数を限りなく増やせば、表が出る回数と裏が出る回数の比率はどちらも 1/2 に近づく。実際にコイン投げをしたとき、(微視的に)一部分だけ見たときには出方が偏って見えることがあったとしても、全体として(巨視的に)見れば、試行結果というものは各事象の起きる確率によって支配されているのだ、ということもできる。
う、やばい・・・難しい。
ざっくりいうと、 コイン投げなら、何百回もやっていけば、裏が50%、表が50%出る、という状態に近づくよ、というのが大数の法則です。
ロト6にあてはめると、1つの数字が出る確率は・・・
ロト6はボーナス番号を含めて、43個数字から7個の数字が選ばれます。
つまり、1回の当選で43個中7個の数字が出現することになります。
出現率であらわすと7個/43個で約16%となります。
たとえば、「1」という数字を選んだ場合、10回に1回ちょいは出るかもね、という感じです。
では、ほんとうにそうなのか?順を追ってみていきましょう。
まずは統計的にものがいえる30回の試行時点での出現率です。
第1回から第30回:まだまだ大数にはほど遠く出っこみ引込みが激しい
このときには、まだまだ「出る数字」と「出ない数字」の差が激しいですね。
「出る」ほうでは13と35が飛び抜けています。30%近くだから、3回に1回の割合で出ていることになります。
いっぽう24は第30回目までの抽選で1度も出ていません。1回も出ていないってのも、なかなかすごいですね。
第1回から第100回:30回目までと比べると凸凹が小さくなる
100回の試行を経過して、数字の出現率は理論上の数字の16%に近づきつつあります。
それでも、13、28、37の出現率は高めです。13は30回目までも高い出現率だったので、このころまでかなり高い出現だったのですね。
一方35は出現率が16%に近づいてきています。
28、37は30回目までは目立っていなかったけど、その後、よく出るようになったのですね。
いっぽう、30回目までまったく出現しなかった24はまだほかの数字と比べると出現率が低いですね。
第1回から第500回:どの番号もだいぶ16%の出現率に近づいてきている
2000年10月5日の第1回抽選日から9年と半年ほど、ロト6は2010年6月10日に500回目を迎えます。
約10年かけて500回の試行の経て、どの番号の出現率も16%へ近づいて来ています。
それでもまだ30の出現率が高かったり、24は相変わらず出現率が低かったりしてます。そしてここにきて32の出現率が低くなってますね。
そして最近のキリの数字、800回目までの出現率をご紹介します。
第1回から第800回:大きな凸凹がなくなってきている
2013年9月30日、500回目から3年後に800回目の抽選日を迎えます。
週2回の抽選になったので、抽選回数がペースアップしてますね。
この時点でみていると、出現率が16%を大きく越えている数字は少なく、27が若干凸っとなっているかな、という感じですね。
いっぽう小さい方では24が相変わらず少ない出現率です。
でも24の出現率を基準に線を引くと、他にも1、3、9、32の出現率が近いことがわかります。だからこれまでのように24だけが突出した低い出現率ではなくなってきているのです。
結局のところ統計的なルールにおさまっていく=どの数字が出るかなんて出現率16%ということ以外わからない
冒頭の詐欺事件を起点に800回目までのロト6の番号出現率を見てきました。
最初は出現率のばらつきが大きく「比較的出やすい番号」があるようにみえました。
でも回を重ねるごとに、「43個の数字のうち、ボーナス数字を含めて7個の数字が抽選される」に基づいた16%という出現率に落ち着いていきます。
結局のところ、どの数字にも16%の確率で抽選されるだろう、くらいのことしかわからないのです。
だから「確実に次回の当選番号がわかる」などということは、あり得ないのです。
ちなみに・・・
こんなふうに大数の法則をブログで書いてみたり、データ分析を仕事の一部としているわたしですが、ロト6もロト7も買います。
出現率や組み合わせの当選率を考えたら、当たらないはずなんですが、なんでだか、買っちゃう。
人間って不思議だなぁとあらためて感じるのでしたぁ。
ではまた!
*1:ちょっと夢のあるいいかたをすれば、どの数字も出現する可能性は16%である!ともいえます。「その番号は出ないよ」ということもあり得ない。