ポアソン分布とは?導出をわかりやすく解説

ポアソン分布はイベントの発生間隔が指数分布に従うと仮定したとき、一定の時間に発生するイベントの回数の分布を表現しています。この記事では、ポアソン分布の導出をわかりやすく解説します。

目次

ポアソン分布とは?導出をわかりやすく解説

まずポアソン分布が何であったかを思い出しておきましょう。

定義: ポアソン分布

\(0 \leq \lambda \)とする。非負整数値をとる確率変数\(X\)で、
\begin{align*} P(X = k) = \frac{\lambda^k e^{- \lambda}}{k!}\end{align*}
であるものを、パラメータ\(\lambda\)のポアソン分布に従うという。

ポアソン分布は、ある一定の期間や範囲内で起こる確率的な事象の回数が、平均してλ回起こるとき、k回起こる確率を表すものです。たとえば、1時間あたり平均5回のアクセスがあるウェブサイトに、1時間あたり10回のアクセスがある確率はいくらか、といった問いに答える際に利用されます。

ポアソン分布の導出

ポアソン分布が一体どこから導出されるのかを解説します。
結論から述べると、ポアソン分布はイベントの発生間隔が指数分布に従うと仮定したとき、一定の時間に発生するイベントの回数の分布を表現しています。

直前にイベントが発生してから、次にイベントが発生するまでの時間が指数分布に従うというのは、
すなわちイベントの発生が過去の経験や出来事に影響されないことを意味しています。
このことは、指数分布の無記憶性と対応しています。

定義: 無記憶性

連続型の確率分布に従う確率変数\(X\)は、任意の非負実数\(s, t \geq 0\) に対して、
\begin{align*} P(X > s + t \mid X > t) = P(X > s) \end{align*}
を満たす時に、無記憶性をもつという。


指数分布と無記憶性の関係については下記の記事を参考にしてください。

リンゴの木を想像してください。この木にはたくさんの実がついています。風が吹いたり、鳥が止まったりすることで、リンゴがぽとりと落ちることがあります。
しかし、一つのリンゴが落ちることで、次のリンゴが落ちる確率が高まるわけではありません。
従って、あるリンゴが落ちてから次のリンゴが落ちるまでの時間は指数分布に従うと考えるのはある程度自然です。

設定

さて、時刻\(0\)でイベントが発生した状況を考えます。そして、そこからイベントの発生を記録することにします。
イベントの発生時刻を\(0< t_1 < t_2 < \ldots, t_n\)と表記することにしましょう。
時刻\(T\)までにイベントが発生した回数を
\begin{align*} N(T) \end{align*}
で表記することにします。つまり、
\begin{align*} N(T) = \# \{ i \mid t_i \leq T \}\end{align*}
により\(N(T)\)を定めます。

最初に\(N(T) = 1\)である確率を求めてみましょう。
直前にイベントが発生してから次にイベントが発生するまでの時間が\(t_1\)である確率が指数分布に従い
\begin{align*} \lambda e^{- \lambda t_1} \end{align*}
であることを思い出しておきます。
1回目のイベントが時刻\(T\)までに発生し、2回目のイベントが時刻\(T\)以降に発生するので、その確率は
\begin{align*} \int_0^T \lambda e^{- \lambda x} \left( \int_{T – x}^\infty \lambda e^{- \lambda y} dy \right) dx \end{align*}
となります。つまり
\begin{align*} P(N(T) = 1) &=\int_0^T \lambda e^{- \lambda x} \left( \int_{T – x}^\infty \lambda e^{- \lambda y} dy \right) dx \\&= \int_0^T \lambda e^{- \lambda x} e^{- \lambda(T – x)} dx = \lambda T e^{- \lambda T} \end{align*}
と求めることができます。

最初に\(N(T) = 2\)である確率を求めてみましょう。
1, 2回目のイベントが時刻\(T\)までに発生し、3回目のイベントが時刻\(T\)以降に発生するので、その確率は
\begin{align*} \int_0^T \lambda e^{ – \lambda x} \left( \int_0^{T -x} \lambda e^{-\lambda y} \left( \int_{T – x -y}^\infty \lambda e^{- \lambda z} dz \right)dy \right) dx \end{align*}
となります。つまり、
\begin{align} P(N(T) = 2) &= \int_0^T \lambda e^{ – \lambda x} \left( \int_0^{T -x} \lambda e^{-\lambda y} \left( \int_{T – x -y} ^\infty \lambda e^{- \lambda z} dz \right)dy \right) dx \\&= \int_0^T \lambda e^{ – \lambda x} \left( \int_0^{T -x} \lambda e^{-\lambda y} e^{ – \lambda (T – x – y)} dy \right) dx \\&= \int_0^T \lambda e^{ – \lambda x} \left( \int_0^{T -x}\lambda e^{-\lambda(T-x)} dy \right) dx \\&= \int_0^T \lambda e^{ – \lambda x} \lambda e^{-\lambda(T-x)} (T-x)dx \\&= T^2 \lambda ^2 e^{- \lambda T} – \frac{1}{2} \lambda^2 e^{ – \lambda T} T^2 \\&= \frac{1}{2}\lambda^2 e^{ – \lambda T} T^2 \end{align}
と求めることができます。

同様の計算を考えることで、
\begin{align*} P(N(T) = n) = \frac{1}{n!}\lambda^n T^n e^{- \lambda T}\end{align*}
と求めることができます。

ここで、
\begin{align*} T = 1 \end{align*}
とすると、
\begin{align*} P(N(1) = n) = \frac{1}{n!}\lambda^n e^{- \lambda }\end{align*}
となります。これはまさしくポアソン分布に従うことを表しています。

つまり、

結論

発生間隔が指数分布に従うイベントについて、時刻\(1\)までにイベントが\(n\)回発生する確率が従う分布がポアソン分布だということがわかりました。

記事をシェアして話のネタにする

コメント

コメントする

目次