Science

【測度論的確率論】確率変数と確率分布(勉強ノート)

【測度論的確率論】確率変数と確率分布(勉強ノート)

 

本記事では、(測度論的)確率論の基礎を簡単に説明します。

自分も勉強中のため必ずしも正しい情報が含まれているわけではないことを留意してください…

むしろ、間違えている部分がありましたら本記事のコメント欄にご指摘よろしくお願いします!

また、わかりやすさを求めるために本記事を更新していきます。

確率空間

 

確率とは何か?という問いは、意外と難しいと思います。

実際、色々な人に聞いてみると、聞く人によって意味が異なり数学的には扱いにくいです。

そのため、数学的に整備された『フィールド』を作ることで人によって揺らがない『確率』を定義をすることは重要だと考えられます。

実は、そのような定義を与えてくれるのが測度論的確率論です。

ここでは、そのような枠組みを与える理論を『サイコロ』を具体例として説明していきます。

標本空間と可測空間

 

確率を考えるためには、『サイコロの出た目』等の出来事の集合をまず考える必要があります。

このような出来事の集合を『標本空間\(\Omega\)』と呼び、この集合\(\Omega\)の要素\(\omega\)を『根元事象』と呼びます。

\(\Omega\)の部分集合全てが事象に対応し、部分集合全てをまとめた族を\(2^{\Omega}\)と表すことにします。

\(\mathcal{F} \in 2^{\Omega} \)に以下のような性質を要請するとき、\(\mathcal{F} \)をシグマ加法族といい、\( ( \Omega, \mathcal{F} ) \)を可測空間と呼ぶことにします。

定義 シグマ加法族, 可測空間

ある集合\(\Omega\)の部分集合族\( \mathcal{F} \in 2^{\Omega} \)が以下の条件を満たすとき、\(\mathcal{F}\)をシグマ加法族と呼び、\( ( \Omega, \mathcal{F} ) \)を可測空間と呼ぶ。

  • \( \Omega \in \mathcal{F} \)
  • \( A \in \mathcal{F} \rightarrow A^{c} = \Omega \backslash A \in \mathcal{F} \)
  • \( A_{1}, A_{2}, \ldots \in \mathcal{F} \Rightarrow \bigcup_{n=1}^{\infty} A_{n} \in \mathcal{F} \)

確率論で事象の集まりを考える場合は、シグマ加法族であることを仮定します。

サイコロの場合を具体的に考えてみます。

具体例1 : サイコロ

  • 根元事象 : \( \Omega = \{ 1, 2, 3, 4, 5, 6 \} \)
  • 偶数番目の事象に着目したシグマ加法族 : 
    \( \mathcal{F} = \{ \emptyset, \{2, 4, 6\}, \{1, 3, 5\}, \Omega \} \)

この具体例からわかるようにシグマ加法族は確率論を考える土台になります。

また、以下の命題が成り立ちます。

命題 : 

\(\mathcal{F}\)が集合\(\Omega\)上の\(\sigma\)-加法族ならば以下が成り立つ。

  • \(S \in \mathcal{F}\)
  • \(A, B \in \mathcal{F}\)ならば\(A\cup B, A\cap B, A \backslash B \in \mathcal{F}\)
  • \(A_{1}, \ldots \in \mathcal{F}\)ならば、\(\bigcap_{n=1}^{\infty} A_{n} \in \mathcal{F}\)

つまり、シグマ加法族であるためには、要素の余事象・和事象・積事象は全てシグマ加法族に含まれる必要があるということです。

 

 

生成されたシグマ加法族

 

ボレル集合族を定義するために、生成されたシグマ加法族をまず定義します。

定義 生成されたシグマ加法族

\(C\)を\(\Omega\)の部分集合族、\(\Omega\)上のシグマ加法族となるものを\(\Sigma_{\mathcal{C}}\)とし、\(\sigma(\mathcal{C})\)を以下で定義する。

$$\sigma(\{\mathcal{C}\}) = \bigcap_{\mathcal{F} \in \Sigma_{\mathcal{C}}} \mathcal{F}$$

この\(\Sigma\{\mathcal{C}\}\)を\(\mathcal{C}\)の生成する\(\Omega\)上の\(\sigma\)加法族という。

イメージ的には、数あるシグマ加法族の中で\(\mathcal{C}\)を含むようなもののみを考え、その共通部分を取り包含関係に関して最小のシグマ加法族を\(\mathcal{C}\)から生成されたシグマ加法族\(\sigma(\mathcal{C})\)といいます。

そのため、任意のシグマ加法族\(\mathcal{F} \in 2^{\Omega}\)に対して\(\sigma\{\mathcal{C}\} \subset \mathcal{F}\)となります。

 

ボレル集合族

 

皆さんに馴染みのある実数区間上の可測空間を構成するために以下のボレル集合族というシグマ加法族を定義します。

ボレル集合族

集合族\(\{ [a, b) \mid a, b \in \mathbb{R}, a <b\}\)の生成するシグマ加法族を\(\mathbb{R}\)上のボレル加法族といい\(\mathcal{B}(\mathbb{R})\)と表す。

また、\([-\infty, \infty] = \mathbb{R} \cup \{-\infty\} \cup \{\infty\}\)において\(\{[a, b);a, b \in \mathbb{R}, a < b \} \)の生成するシグマ加法属を\([- \infty, \infty]\)上のボレル加法族といい\(\mathcal{B}([-\infty, \infty])\)と表す。

このボレル集合族\(\mathcal{B}(\mathbb{R})\)は定義から必ず、\(\{[a, b) \mid a, b \in \mathbb{R}, a <b\} \)を含みます。

あくまでイメージですがボレル集合族の要素を具体的に書き出してみると、\(\mathcal{B}(\mathbb{R}) = \{\emptyset, [0.0001, 0.0002], [0.0001, 0.0003], \ldots,  \}\)のようにたくさんの区間が含まれているような集合です(ミスリーディングかもしれません…)

 

確率測度

 

次に漠然とした集合では、確率を扱いにくいので\(\mathcal{F} \)上の以下のような測度 \(P : \mathcal{F} \to [0, \infty] \)を考えます。

定義2 確率測度(確率分布)

\(\mathcal{F} \)上の写像\( P : \mathcal{F} \to [0, \infty] \)が以下の条件を満たすとき\( P \)を確率測度と呼ぶ

  • \( P(\Omega) = 1\)
  • \(P(\emptyset) = 0 \)
  • \(A_{1}, A_{2}, \ldots \in \mathcal{F}\)に対して、\(A_{1} \cap A_{2} \cap \cdots = 0 \Rightarrow P\left(\bigcup_{i} A_{i} \right) = \sum_{i} P(A_{i}) \) 

 

確率測度を定義することで、\( A \in \mathcal{F} \)を入力したときに実数値を『確率(重み)』と定義することでき、冒頭で述べた『確率の定義の揺れ』をなくすことができます。

また、\( (\Omega, \mathcal{F}, P) \)をセットにしたものを確率空間といいます。

確率測度に対して以下の性質が成り立ちます。

命題

  • \(P(A \cap A^{c}) = 0\)
  • \(P(A) = P(A \cap B) + P(A \cap B^{c})\)
  • \(P(A \cup B) = P(A) + P(B) – P(A \cap B)\)

 

 

確率変数とは

 

確率空間\( (\Omega, \mathcal{F}, P) \)の標本\( \omega \in \Omega \)に対して実数値を与えるような写像を確率変数といいます。

形式的に定義すると以下のようになります。

定義3 : 確率変数

確率空間\( (\Omega, \mathcal{F}, P) \)に対して、写像\( X : \Omega \to \mathbb{R} \)が以下の条件を満たすとき、\(X\)を確率変数という。

任意の\(B \in \mathcal{B}(\mathbb{R})\)に対して、\(X^{-1}(B) \in \mathcal{F}\)となる

 

つまり、確率変数は可測空間\(\Omega, \mathcal{F}\)を扱いやすい\(\mathbb{R}, \mathcal{B}(\mathbb{R})\)に変換する写像なのです。

このような変換を施した後は、確率測度への入力はある区間\((a, b]\)となり、扱いやすくなります(なぜ扱いやすいのかは、のちに確認します)

また、一つの\(\omega \in \Omega\)に対して\(X(\omega)= x\)なる\(X\)の値が定まります。

この\(x\)を『実現値』といい小文字で表すことが多いです。

また、実現値全体を\(\mathcal{X} = \{X(\omega) \mid \omega \in \Omega\}\)で表し、\(\mathcal{X}\)を\(X\)の標本空間といいます。

 

確率変数の具体例

 

数学的には、確率変数は根元事象\(\omega \in \Omega\)に対して実数値を対応させる関数\(X(\omega)\)であることがわかりました。

ここでは、もう少し具体的な例を使ってイメージをつけていきましょう。

確率変数の具体例

サイコロを振ったときに偶数ならばケーキを食べることができ、奇数ならばケーキを食べることができないというゲームを行います。

まず、ケーキを食べるという事象に1を割り振り、ケーキを食べれないという事象に-1を割り振ることにします。

ここで、確率変数\(X\)を一回のゲームでケーキを食べれるか食べれないかを表す確率変数とします。

このとき、標本空間\(\{1, 2, 3, 4, 5, 6\}\)に対して確率変数の値は以下のようになります。

\begin{align}X(1) &= X(3) = X(5) = -1 \\ X(2) &= X(4) = X(6) = 1 \end{align}

逆写像を考えるとケーキを食べれるか食べれないかに対して以下の関係が成り立ちます

$$X^{-1}(1) = \{2, 4, 6\} \subset \Omega, ~~~X^{-1}(-1) = \{1, 3, 5\} \subset \Omega$$

 

確率変数の生成するシグマ加法族

 

定義

確率変数\(X\)が与えられたとき、\(X\)の生成するシグマ加法族\(\sigma(X)\)は以下で定義される。

$$\sigma(X) = \sigma(\{\{X^{-1}((- \infty, r]\} \mid r \in \mathbb{R}\} )$$

確率変数\(X\)と\(Y\)が独立であるとき、それぞれの生成するシグマ加法族\(\sigma(X\)と\(\sigma(Y)\)は独立になります。

 

確率分布

 

確率分布は形式的に以下のように定義されます。

定義 : 確率分布

可測空間\(\mathbb{R}, \mathcal{B}(\mathbb{R})\)上の確率測度\(P_{X} : \mathbb{R} \to \mathbb{R}\)が以下を満たすとき\(P_{X}\)を確率分布という。

$$\forall B \in \mathcal{B}(\mathbb{R}),~~P_{X}(B) = P(X^{-1})B))$$

 

具体的に\(1, 2 \in \mathbb{R}\)のケースを考えると以下のようになります。

$$P_{X}((1, 2]) = P(X^{-1}((1, 2])) = P(\{\omega \in \Omega \mid X(\Omega) \in (1, 2])$$

つまり、確率変数\(X\)によって\(\Omega\)が変換され、その変換された要素が\((1, 2]\)の範囲に含まれる確率を表します。

一般的な確率論の教科書では、確率質量関数\(f_{X}(x)\)に対して以下のような省略記号が使われるので注意してください。

$$f_{X}(x) = P(X = x) = P_{X}((x, x]) = P(\{\omega \in \Omega \mid X(\omega) \in (x, x])$$

累積分布関数\(F_{X}(x)\)に対して、よく使われるのはが以下のような省略記号です。

$$F_{X}(x) = P(X \le x) = P_{X}((-\infty, x]) = P(\{\omega \in \Omega \mid X(\omega) \in (-\infty, x])$$

すなわち確率論で出てくるような記法は以下の命題と同じ意味であることがわかります。

  • \(X = x\) : 確率変数\(X\)の出力として\(x\)を得る
  • \(X \le x\) : 確率変数\(X\)の出力として\(x\)と等しい、またはそれより小さい値を得る

 

まとめ

 

本記事では、確率空間と確率変数についてまとめました。

勉強中のため随時更新していきます。

間違いがありましたらコメントよろしくお願いします。

ABOUT ME
努力のガリレオ
【運営者】 : 東大で理論物理を研究中(経歴)東京大学, TOEIC950点, NASA留学, カナダ滞在経験有り, 最優秀塾講師賞, オンライン英会話講師試験合格, ブログと独自コンテンツで収益6桁達成 【編集者】: イングリッシュアドバイザーとして勤務中(経歴)中学校教諭一種免許取得[英語],カナダ留学経験あり, TOEIC650点