Science

二項分布の性質(平均・分散・生成関数・ラプラスの極限定理)

二項分布の性質(平均・分散・生成関数・ラプラスの極限定理)

 

Yuma
Yuma
正規分布の次によく出てくる『二項分布』の性質をまとめてみました。

二項分布は、統計を利用する分野では必ず出てくる重要な確率分布の1つです。

私は、それ以上に二項分布の平均や分散をモーメント生成関数からエレガントに導出するのが良い練習になり、

二項分布』と『生成関数』について理解を深める良いきっかけになると思います。

モーメント生成関数?』という人は必ず下記を参考にしてください

特性関数・生成関数とは【確率分布の統計量を楽に計算しましょう】m次モーメントなどの統計量は容易に計算できない時があります。そんな時に役に立つのが特性関数とモーメント生成関数です。これらを用いて容易にm次モーメントを導出することが可能になります。詳しくは記事を参考にしてください...

 

この記事では、二項分布の性質を数式と図を使いながら解説していきます。

*(iphone・Androidの方へ)数式はスクロール可能です。

二項分布とは

試行の結果が排反な2つの事象のみで、一方の結果Aが出る確率がpの時、試行をN回行って、Aがn回出る確率は以下のように書けます

 

$$ p_{N}(n) = {}_{N} C_{n} p^{n} (1 – p)^{N-n} ~~~ (n = 0,1, \cdots N) $$

 

この確率分布を二項分布(ベルヌーイ分布)という。

排反な事象が2つしかない時というのは決してレアなケースではなく、『成功か失敗』しかない試行をN回すれば二項分布になる。

統計などの教科書で二項分布を\( B(n, p) \)または\(Bin(n, p ) \)と書くことがあります。

参考程度に覚えておいてください。

 

具体的にコインを100回投げた時の確率分布をPythonで図示したもを以下に示す。

このグラフを書くためのコードは下記に示します。

import numpy as np
from scipy.stats import binom
import matplotlib.pyplot as plt
%matplotlib inline

plt.rcParams["xtick.direction"] = "in"               
plt.rcParams["ytick.direction"] = "in" 
plt.rcParams["font.family"] = "Times New Roman" 

p = 0.5 #コインを投げて表がでる確率
n = 100 #コインを投げる試行の回数
x = range(int(n) + 1) #プロット範囲

binomial = binom.pmf(x, n, p)


#グラフを作成
fig = plt.figure()
ax = fig.add_subplot(111)
ax.plot(x, binomial, 'o')
ax.set_ylabel("Probability", fontsize = 16)
ax.set_xlabel("Number of face", fontsize = 16)

plt.show()
fig.savefig("binomial.png")

 

*試行回数や確率を変化させて遊んで見てください

 

Pythonによるグラフの書き方』を知りたい人は下記を参考にしてください

【15分】Pythonでグラフを作成する方法(matplotlib)Pythonでグラフを書くことが難しそうだと思っていませんか?実は、Pythonを使用したグラフ作成は、excelより便利で簡単です。この記事では、初心者でもグラフが書けるように丁寧にpythonのグラフの作成法を説明します。...

二項分布の全事象について

二項分布の全事象は1(確率の公理)になるはずですが、確認のために計算してみましょう。

$$ \sum_{n = 0}^{N} p_{N}(n) = \sum_{n = 0}^{N} {}_{N} C_{n} p^{n} (1 – p)^{N-n} $$

二項定理から

$$ \sum_{n = 0}^{N} {}_{N} C_{n} p^{n} (1 – p)^{N-n} = (p + 1 – p )^{N} = 1 $$

無事に確認することができました。

 

二項分布のモーメント生成関数

 

二項分布の平均と分散を求めるためにモーメント生成関数を計算していきましょう。

$$ M(\xi) = \sum_{n = 0}^{N} e^{\xi n} {}_{N} C_{n} p^{n} (1 – p)^{N-n} = \sum_{n = 0}^{N} {}_{N} C_{n} (p e^{\xi} )^{n} (1 – p)^{N-n} $$

二項定理を使うともっと綺麗にまとめることができます

$$ M(\xi) = (1 – p + p e^{\xi} )^{N} $$

モーメント生成関数』について詳しく知りたい人は下記を参考にしてください。

特性関数・生成関数とは【確率分布の統計量を楽に計算しましょう】m次モーメントなどの統計量は容易に計算できない時があります。そんな時に役に立つのが特性関数とモーメント生成関数です。これらを用いて容易にm次モーメントを導出することが可能になります。詳しくは記事を参考にしてください...

 

二項定理の平均と分散

次に、モーメント生成関数を用いて二項分布の平均と分散を求めていきます。

 

  1. 二項分布の平均
  2. 二項分布の分散

 

① 二項分布の平均

 

モーメント生成関数\( M(\xi) \)が求められているので平均を求めることは簡単です。

$$ \langle n \rangle = \left. \frac{d M(\xi)}{d \xi} \right|_{\xi = 0} $$

を計算すれば平均が出せます。

$$ \langle n \rangle = \left[ N p e^{\xi} (1 – p + p e^{xi} )^{N – 1} \right]_{\xi = 0} = Np $$

ゆえに二項分布の平均は \(Np\)になることがわかりました。

② 二項分布の分散

 

分散を計算するために\( \langle n^{2} \rangle \)も導出します。

$$  \langle n^{2} \rangle = \left. \frac{d^{2} M(\xi)}{d \xi^{2}} \right|_{\xi = 0} $$

同様に計算すると

$$ \langle n^{2} \rangle = Np + N (N-1) p^{2} $$

これらから分散を導出すると

$$ \langle ( n – \langle n \rangle )^{2} \rangle = \langle n^{2} \rangle – \langle  n \rangle^{2} = N p (1-p) $$

ゆえに分散は \( N p ( 1 – p ) \)と求まりました。

 

二項分布を正規分布で近似する(ド・モアブル – ラプラスの定理)

二項分布は、nが十分大きいと扱いにくいので扱いやすい正規分布で近似することがあります。

この近似を『ド・モアブル – ラプラスの定理』を言います

詳しくは示しませんが、二項分布 \( B(n, p) \)に従う確率変数について nが十分大きいときに以下の近似が成り立ちます。

$$ X \sim Bin(n, p) \rightarrow \frac{X – np}{\sqrt{n p (1 – p)} } \sim N(np, np(1-p) ) $$

スターリングの公式などを使って示すことができます

スターリングの公式とは以下の関係式です

$$ n ! \approx n^{n} e^{-n} \sqrt{2 \pi n} $$ 

 

参考資料(二項分布)

 

参考サイト

特性関数・生成関数とは【確率分布の統計量を楽に計算しましょう】m次モーメントなどの統計量は容易に計算できない時があります。そんな時に役に立つのが特性関数とモーメント生成関数です。これらを用いて容易にm次モーメントを導出することが可能になります。詳しくは記事を参考にしてください...

 

参考文献

まとめ

 

二項分布とは以下のように書ける確率分布です。

$$ p_{N}(n) = {}_{N} C_{n} p^{n} (1 – p)^{N-n} ~~~ (n = 0,1, \cdots N) $$

この確率分布の平均と分散はモーメント母関数により求めることができました。

  • モーメント母関数:\( ( 1 – p + p e^{\xi} )^{N} \)
  • 平均:\( Np \)
  • 分散:\( N p (1 – p) \) 

また、二項分布は正規分布に近似することが可能でした(ド・モアブル – ラプラスの定理)

 

より詳しく物理数学を学びたい人は下記を参考にしてください

確実に力がつく物理数学の参考書10選【東大生のオススメ】物理数学は物理を学ぶためには必要不可欠です。この記事では、私の経験から確実に力がつく物理数学の参考書を10冊に厳選して紹介しました。詳しい内容は記事を参考にしてください。...
ABOUT ME
努力のガリレオ
【運営者】 : 東大で理論物理を研究中(経歴)東京大学, TOEIC950点, NASA留学, カナダ滞在経験有り, 最優秀塾講師賞, オンライン英会話講師試験合格, ブログと独自コンテンツで収益6桁達成 【編集者】: イングリッシュアドバイザーとして勤務中(経歴)中学校教諭一種免許取得[英語],カナダ留学経験あり, TOEIC650点