ポアソン分布のグラフを描画し期待値・分散を計算してみた｜ITエンジニアとして経験・学習したこと

互いに独立な\(n\)回のベルヌーイ試行(=コインの裏表のように、何かを行ったときに起こる結果が2つしかない試行)を行うときにちょうど\(k\)回成功する確率は、以下の式で表せる。

出所：統計WEB_二項分布

上記式で定義される二項分布は、\(n\)が十分大きい場合に確率の計算が難しくなるが、以下のポアソン分布に近似して計算することができる。

出所：統計WEB_ポアソン分布

例えば、ポアソン分布で\(λ=2\)の場合の確率を表形式でまとめると、以下のようになる。

\(k\)	確率
\(0\)	\(P(X=0)=\displaystyle \frac{e^{-2}2^0}{0!}=e^{-2}≒0.135\)
\(1\)	\(P(X=1)=\displaystyle \frac{e^{-2}2^1}{1!}=2e^{-2}≒0.271\)
\(2\)	\(P(X=2)=\displaystyle \frac{e^{-2}2^2}{2!}=2e^{-2}≒0.271\)
\(3\)	\(P(X=3)=\displaystyle \frac{e^{-2}2^3}{3!}=\frac{4}{3}e^{-2}≒0.180\)
\(4\)	\(P(X=4)=\displaystyle \frac{e^{-2}2^4}{4!}=\frac{2}{3}e^{-2}≒0.090\)
\(5\)	\(P(X=5)=\displaystyle \frac{e^{-2}2^5}{5!}=\frac{4}{15}e^{-2}≒0.036\)
\(6\)	\(P(X=6)=\displaystyle \frac{e^{-2}2^6}{6!}=\frac{4}{45}e^{-2}≒0.012\)
\(7\)	\(P(X=7)=\displaystyle \frac{e^{-2}2^7}{7!}=\frac{8}{315}e^{-2}≒0.0034\)
\(8\)	\(P(X=8)=\displaystyle \frac{e^{-2}2^8}{8!}=\frac{2}{315}e^{-2}≒0.00086\)
\(9\)	\(P(X=9)=\displaystyle \frac{e^{-2}2^9}{9!}=\frac{4}{2835}e^{-2}≒0.00019\)

また、この確率を計算しグラフにまとめた場合の、ソースコードと実行結果は、以下のようになる。

%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt

# n!(=1*2*･･･*n、nの階乗)を計算
def factorial(n):
    ret = 1
    for num in range(1, n + 1):
        ret = ret * num
    return ret

# ポアソン分布の計算
def poisson(k, lmd):
    return (np.e**(lmd*(-1)) * lmd**k) / factorial(k)

# ポアソン分布でλ=2の場合の確率をそれぞれ計算
lmd = 2
p_list = list()
for num in range(0, 10):
    p_list.append(poisson(num, lmd))

print("*** ポアソン分布でλ=2の場合の確率をそれぞれ計算した結果 ***")
print("k=0の確率 = " + str(p_list[0]))
print("k=1の確率 = " + str(p_list[1]))
print("k=2の確率 = " + str(p_list[2]))
print("k=3の確率 = " + str(p_list[3]))
print("k=4の確率 = " + str(p_list[4]))
print("k=5の確率 = " + str(p_list[5]))
print("k=6の確率 = " + str(p_list[6]))
print("k=7の確率 = " + str(p_list[7]))
print("k=8の確率 = " + str(p_list[8]))
print("k=9の確率 = " + str(p_list[9]))

# ポアソン分布でλ=2の場合の確率を棒グラフで描画
k_list_array = np.arange(10)
p_list_array = np.array(p_list)
plt.bar(k_list_array, p_list_array)
plt.title("poisson graph")
plt.xlabel("k", size=14)
plt.ylabel("p", size=14)
plt.show()

上記プログラムで、\(λ=1、λ=5、λ=9\)とした場合の実行結果は、それぞれ以下の通りで、\(λ\)に近い確率\(k\)が大きくなっていることが確認できる。

株式会社ベアフォスターホールディングスでスキルチェンジできました私はこれまで、Javaを中心としたシステム開発を行ってきましたが、将来的には、Pythonを利用したAI（人工知能）開発を行いたいと思う...

さらに、二項分布の確率変数\(P(X=k)={}_n \mathrm{ C }_kp^k(1-p)^{n-k}　(k=0,1,2,\cdots,n)\)において、\(np=λ\)(一定)・\(n→∞、p→0\)に近づけると、ポアソン分布の確率変数\(P(X=k)=\displaystyle \frac{e^{-λ}λ^k}{k!}　(k=0,1,2,\cdots)\)が導けることは、以下のように示すことができる。
\[
\begin{eqnarray}
\displaystyle \lim_{n \to \infty} {}_n \mathrm{ C }_kp^k(1-p)^{n-k}
&=& \displaystyle \lim_{n \to \infty} \frac{n!}{(n-k)!k!} \left( \frac{λ}{n} \right)^k \left( 1 – \frac{λ}{n} \right)^{n-k} \\
&=& \displaystyle \lim_{n \to \infty} \frac{n(n-1)(n-2) \cdots (n-k+1)}{k!} \times \frac{λ^k}{n^k} \times \left( 1 – \frac{λ}{n} \right)^{n-k} \\
&=& \displaystyle \lim_{n \to \infty} \frac{n(n-1)(n-2) \cdots (n-k+1)}{n^k} \times \frac{λ^k}{k!} \times \left( 1 – \frac{λ}{n} \right)^n \times \left( 1 – \frac{λ}{n} \right)^{-k} \\
&=& \displaystyle \lim_{n \to \infty} \frac{n}{n} \frac{n-1}{n} \frac{n-2}{n} \cdots \frac{n-k+1}{n}
\times \frac{λ^k}{k!} \times \left\{ 1 + \left( \frac{1}{- \displaystyle \frac{n}{λ}} \right) \right\}^{- \displaystyle \frac{n}{λ} \times (-λ)}
\times \left( 1 – \frac{λ}{n} \right)^{-k} \\
&=& 1 \times 1 \times 1 \times \cdots \times 1 \times \frac{λ^k}{k!} \times e^{-λ} \times 1 = \frac{e^{-λ}λ^k}{k!}
\end{eqnarray}
\]
なお、上記計算では、ネイピア数\(e\)の定義式\(e=\displaystyle \lim_{n \to \infty} \left( 1 + \frac{1}{n} \right)^n \)を利用している。

また、ポアソン分布の期待値\(E(X)\)と分散\(V(X)\)は、二項分布において\(np=λ\)(一定)・\(n→∞、p→0\)に近づけることで\(1-p→1\)に近づくため、以下のように計算できる。
\[
\begin{eqnarray}
E(X) &=& np=n \times \displaystyle \frac{λ}{n}=λ \\
V(X) &=& np(1-p)=np \times 1=np=n \times \displaystyle \frac{λ}{n}=λ
\end{eqnarray}
\]

要点まとめ

二項分布で\(n\)が十分大きい場合、確率の計算が難しくなるが、ポアソン分布に近似して計算することができる。
ポアソン分布の確率変数は、二項分布において\(np=λ\)とすると、\(P(X=k)=\displaystyle \frac{e^{-λ}λ^k}{k!}　(k=0,1,2,\cdots)\)と表せる。
ポアソン分布において、期待値\(E(X)=λ\)、分散\(V(X)=λ\)となる。