コインの裏表のように、何かを行ったときに起こる結果が\(2\)つしかない試行をベルヌーイ試行といい、この試行の結果を\(0\)と\(1\)で表した分布をベルヌーイ分布という。
例えば、サイコロを\(1\)回投げて\(1\)または\(2\)の目が出る場合の試行結果を\(1\), それ以外の試行結果を\(0\)とした場合の確率を表形式でまとめると、以下のようになる。
試行結果 | 確率 |
---|---|
\(0\) | \(P(X=0)=\displaystyle \frac{2}{3}≒0.667\) |
\(1\) | \(P(X=1)=\displaystyle \frac{1}{3}≒0.333\) |
合計 | \(\displaystyle \sum_{i=0}^{1}P(X=i)=\frac{2}{3} + \frac{1}{3}=1\) |
また、この分布をグラフにまとめた場合の、ソースコードと実行結果は、以下のようになる。
%matplotlib inline import numpy as np import matplotlib.pyplot as plt # サイコロを1回投げて1または2の目が出る場合の試行結果を1, # それ以外の試行結果を0とした場合の確率を棒グラフで描画 k_list_array = np.array([0, 1]) p_list_array = np.array([1.0/3, 2.0/3]) plt.bar(k_list_array, p_list_array) plt.title("bernoulli graph") plt.xlabel("k", size=14) plt.ylabel("p", size=14) plt.xticks(np.arange(0, 1.1, 1)) # x軸を0,1のみ表示する plt.show()
これを一般化し、試行結果が\(1\)となる確率を\(p\)とした場合の確率を表形式でまとめると、以下のようになる。
試行結果 | 確率 |
---|---|
\(0\) | \(P(X=0)=1-p\) |
\(1\) | \(P(X=1)=p\) |
合計 | \(\displaystyle \sum_{k=0}^{1}P(X=k)=(1-p)+p=1\) |
また、試行結果が\(1\)となる確率を\(p\)とした場合のベルヌーイ分布について、期待値\(E(X)\)と分散\(V(X)\)を計算した結果は、以下の通り。
\[
\begin{eqnarray}
E(X) &=& \displaystyle \sum_{k=1}^{n}p_kx_k = (1-p) \times 0 + p \times 1 = 0+p = p \\
V(X) &=& \displaystyle \sum_{k=1}^{n}p_k \left\{x_k-E(X) \right\}^2 = E(X^2) – \left\{E(X)\right\}^2 = \sum_{k=1}^{n}p_kx_k^2 – p^2 \\
&=& \left\{(1-p) \times 0^2 + p \times 1^2\right\} – p^2 =\left\{0 + p\right\} – p^2 = p – p^2 = p(1-p)
\end{eqnarray}
\]
以上より、試行結果が\(1\)となる確率を\(p\)とした場合のベルヌーイ分布について、期待値\(E(X)=p\)、分散\(V(X)=p(1-p)\)となる。
なお、上記で利用している期待値と分散の公式については、以下のサイトを参照のこと。
https://toketarou.com/expectation/
例えば、サイコロを\(1\)回投げて\(1\)または\(2\)の目が出る場合の試行結果を\(1\), それ以外の試行結果を\(0\)とした場合、ベルヌーイ分布の期待値\(E(X)\)と分散\(V(X)\)を計算した結果は、以下の通り。
\[
\begin{eqnarray}
E(X) &=& p = \displaystyle \frac{1}{3} ≒ 0.333 \\
V(X) &=& p(1-p) = \displaystyle \frac{1}{3} \times \left(1-\frac{1}{3}\right) = \displaystyle \frac{1}{3} \times \frac{2}{3} = \frac{2}{9} ≒ 0.222
\end{eqnarray}
\]
要点まとめ
- コインの裏表のように、何かを行ったときに起こる結果が\(2\)つしかない試行のことをベルヌーイ試行といい、この試行の結果を\(0\)と\(1\)で表した分布をベルヌーイ分布という。
- ベルヌーイ分布の試行結果が\(1\)となる確率を\(p\)とした場合、期待値\(E(X)=p\)、
分散\(V(X)=p(1-p)\)となる。