Science

一変数確率分布関数の基本(確率分布を特徴つける7つの量)

一変数確率分布関数の基本(確率分布を特徴つける7つの量)

  

Yuma
Yuma
一変数確率分布関数の基本を説明していきます。

機械学習や統計学を勉強する上で一変数確率分布関数を特徴付ける量の理解は必要不可欠です。

この記事では、1変数関数を特徴つける量について解説していきます。

一変数確率分布関数を理解するための準備(確率変数とは)

一変数確率分布関数を理解するために確率変数について簡単に説明していきます。

確率変数とは、ある確率分布にしたがって値が定まるような変数のことです。

つまり、確率に従って色々な変数を取る変数のことです。

確率変数には2つの種類があります。

  • 離散変数
  • 連続変数

大文字\( X \)は確率変数、小文字\(x\)は確率の実現値を表すことが多いです。

 

確率変数① 離散型確率変数

 

離散型確率変数とは、とびとびの値を取る確率変数のことです。

よく使われる具体例はサイコロです

サイコロは1〜6の離散的な値しか取らず、その1〜6に確率1/6の重みがつけられている確率変数です。

また、確率変数の取る値と、その値を取るときの確率を対応させたものを確率分布と言います。

 

確率変数② 連続型確率変数

 

連続型確率変数とは、連続の値を取る確率変数です。

具体例としては、温度などが当てはまります。

温度の場合、10℃〜11℃の間には無数の値が存在します。

このように連続的な値を取るものが連続型確率変数です。

また、\(X\)が連続型確率変数のとき、試行結果が\(x\)と\(x + dx\)の間となる確率を\(p(x)\)おき\(p(x)\)を確率密度と言います。

つまり以下のように表すことができます。

$$ p(x) = p(X = x) $$

一変数確率分布を特徴つける量

ここからの解説は、連続型確率変数を使って解説していきます。

一変数確率分布を特徴つける量は以下の7つです

  1. 平均値(期待値)
  2. 偏差
  3. m次のモーメント
  4. 分散
  5. 標準偏差
  6. 歪度
  7. 尖度

以下詳しく説明していきます。

離散型確率変数で考えたい場合は、

$$ \int_{a}^{b} \cdots p(x)dx \rightarrow \sum_{n} \cdots p(x_n) $$

に変換して考えてください。

 

確率分布を特徴つける量① 平均値(期待値)

 

確率分布を特徴つける1つ目の量は『平均値(期待値)』です。

具体的には以下のように定義されます。

$$ \langle A(x) \rangle = \int A(x) p(x) dx $$

期待値は\( \mathbb{E}[A(X)] \)のように表記することも多いです

また期待値は以下の性質を満たします(簡単に証明できるので証明は省略します)

 

単に平均という場合は\( \langle x \rangle \) を表すことが多いです。

$$ \langle x \rangle = \int x p(x) dx $$

 

確率分布を特徴つける量② 偏差

 

確率分布を特徴つける2個目の量は『偏差』です

偏差は以下のように定義されます

$$ \Delta x = x – \langle x \rangle $$

 

確率分布を特徴つける量③ m次のモーメント

 

確率分布を特徴つける3個目の量は『m次( \(x = 0\)まわり ) のモーメント』です。

m次のモーメントは、\( A(x) = x^{m} \)の期待値のことで以下のように定義されます。

$$ v_{m} = \langle x^{m} \rangle = \int x^{m} p(x) dx $$

平均値\( \langle x \rangle \)周りで定義されるモーメントを『m次の中心モーメント』といい以下のように定義されます。

$$ \mu_{m} = \langle ( \Delta x )^{m} \rangle = \int (\Delta x)^{m} p(x) dx $$

*この定義から1次の中心モーメントは常に0となります。

*2次の中心モーメントは後述の分散になります。

 

確率分布を特徴つける量④ 分散

 

確率分布を特徴つける量の4つ目は『分散』です。

分散は以下のように定義されます。

$$ \mu_{2} = \langle (\Delta x )^{2} \rangle = v_{2} – v_{1}^{2} $$

上記のように、1次モーメントと2次モーメントで書くことが可能です。

 

確率分布を特徴つける量⑤ 標準偏差

 

確率分布を特徴つける5個目の量は『標準偏差』です。

標準偏差は、分散を\(x\)と同じ次元にした量で以下のように定義されます。

$$ \sigma = \sqrt{\langle (\Delta x )^{2} \rangle} $$ 

 

確率分布を特徴つける量⑥ 歪度

 

確率分布を特徴つける6個目の量は『歪度』です。

歪度は確率分布の歪みや非対称さを表す量で、標準偏差と3次の中心モーメントを用いて以下のように定義される

$$ \alpha_{3} = \frac{\mu_{3}}{\sigma^{3}} $$

確率分布を特徴つける量⑦ 尖度

 

確率分布を特徴つける7個目の量は『尖度』です。

尖度は、確率分布の鋭さを表す量で、標準偏差と4次の中心モーメントを用いて以下のように定義されます。

$$ \alpha_{4} = \frac{\mu_{4}}{\sigma^{4}} $$

 

参考文献

 

 

まとめ

 

一変数確率分布を特徴つける量についてまとめました。

もう一度簡単に振り返ります。

一変数確率分布を特徴つける量

  1. 平均値(期待値)
  2. 偏差
  3. m次のモーメント
  4. 分散
  5. 標準偏差
  6. 歪度
  7. 尖度

 

機械学習や統計力学・量子力学でもよく出てくる量なので説明できる状態にしておきましょう。

物理数学をもっと学びたい』という人は下記の教材がオススメです。

確実に力がつく物理数学の参考書10選【東大生のオススメ】物理数学は物理を学ぶためには必要不可欠です。この記事では、私の経験から確実に力がつく物理数学の参考書を10冊に厳選して紹介しました。詳しい内容は記事を参考にしてください。...
ABOUT ME
努力のガリレオ
【運営者】 : 東大で理論物理を研究中(経歴)東京大学, TOEIC950点, NASA留学, カナダ滞在経験有り, 最優秀塾講師賞, オンライン英会話講師試験合格, ブログと独自コンテンツで収益6桁達成 【編集者】: イングリッシュアドバイザーとして勤務中(経歴)中学校教諭一種免許取得[英語],カナダ留学経験あり, TOEIC650点