지수 분포


파라미터 λ를 수정해가며 다양한 경우의 지수 분포의 생김새에 대해 확인해보자.
지수분포에서 x 축에 있는 t가 갖는 것은 어떤 의미일까?
그리고 지수 분포의 형태가 의미하는 것을 설명할 수 있는가?

Prerequisites

지수 분포를 이해하기 위해선 아래의 내용에 대해 알고 오시는 것이 좋습니다.

지수 분포의 정의

지수분포의 확률밀도함수는

\[f(x;\lambda) = \begin{cases} \lambda e^{-\lambda x} & \text{ where } x\geq 0 \\[.5em] 0 & \text{ where } x \lt 0 \end{cases}\]

로 정의된다.

사건이 서로 독립적일 때, 일정 시간동안 발생하는 사건의 회수가 포아송 분포를 따른다면, 다음 사건이 일어날 때 까지 대기 시간은 지수 분포를 따른다.

지수 분포의 쓸모

지수 분포는 포아송 분포와 밀접한 관련이 있다.

포아송 분포가 어떤 것이었는지 다시 생각해보자.

포아송 분포는 단위 시간동안 어떤 사건이 평균적으로 $\lambda$회 발생한다고 했을 때, 단위시간동안 사건이 $k$번 일어날 확률에 대한 분포를 지칭하고 있다.

\[P(K=k) = \frac{\lambda^k e^{-\lambda}}{k!}\]

그럼, 여기서 우리가 생각해볼 수 있는 것은 이런 사건이 처음 일어나는 떄 까지 걸리는 시간이 $T$ 시간 이하일 확률은 얼마인지에 관한 문제이다.

이 문제는 산업에서 굉장히 중요한 질문일 수 있다. 가령, 드물게 환자가 오는 보건소에서 첫 번째 환자가 올 때 까지 걸리는 시간이 5시간 이하일 확률? 과 같은 문제에 대해 확률적으로 정확하게 접근할 수 있는 것이다.

그러니까, 다섯 시간 안에 첫번째 환자가 올까? 라는 질문에 대한 답이 될 수 있는 것이다.

아니면, 교통 사고에 대한 문제라던지, 첫 번째로 등록할 고객이 언제쯤 올 수 있을까? 라던지 등의 문제 말이다.

지수 분포의 유도

만약 위에서 설명한 분포가 있다고 하고 이 분포(즉, 확률밀도함수)를 $f(t)$라고 한다면 $T$ 단위시간에 첫 사건이 일어날 확률은 다음과 같이 구해지는 것이어야 한다.

\[Pr(0\leq t\leq T)=\int_{0}^{T}f(t)dt\]

한편, 포아송 분포를 이용해 위 문제를 풀기 위해선 여사건을 이용하는 것이 좋은 접근일 수 있다.

포아송 분포를 이용해 $T$ 단위시간동안 사건이 일어나지 않을 확률을 계산해서 전체 확률값(1)에서 빼주면 그 결과가 바로 $T$시간만에 해당 사건이 일어날 확률이기 때문이다.

즉, $P(K=0)$이 $T$번 일어날 확률은 $P(K=0)$을 $T$번 곱해서 계산할 수 있다.

\[\left(P(K=0)\right)^T\]

여기서 ${}^T$는 $T$승을 의미한다.

따라서, $T$ 시간만에 해당 사건이 일어날 확률은

\[1-(P(K=0))^T = 1-\left(\frac{\lambda^k e^{-\lambda}}{k!}\right)^T_{k=0} = 1-e^{-\lambda T}\]

이다.

다시 말하면,

그런데, 지수 분포라고 할 수 있을만한 확률밀도함수 $f(t)$를 이용해 계산한 확률은 식(2)와 같으므로,

\[\int_{0}^{T}f(t)dt = 1-e^{-\lambda T}\]

와 같은 관계를 갖는다.

따라서,

\[f(t) = \frac{d}{dt}(1-e^{-\lambda t}) = \lambda e^{-\lambda t}\]

와 같은 분포가 지수 분포이다.

지수 분포 예시 문제

문제 1.

어느 산골짜기 보건소에는 환자가 자주 오지 않아서 한산하다. 하루 평균 3명의 환자가 내원한다고 했을 때, 첫 번째 환자가 5시간안에 내원할 확률은?

문제 1의 Solution

하루 평균 3명의 환자가 내원한다고 했으니 1시간 마다 3/24명의 환자가 내원한다고 볼 수 있다.

따라서, 이 경우

\[f(t) = \frac{3}{24}\exp\left(-\frac{3}{24}t\right)\]

와 같은 지수분포를 따르는 경우이다.

따라서, 5시간 안에 첫 번째 환자가 내원할 확률은

\[\int_{0}^{5}\frac{3}{24}\exp\left(-\frac{3}{24}t\right)dt = \left[-\exp\left(-\frac{3}{24}t\right)\right]_0^5 = \exp(0) - \exp\left(-\frac{5}{8}\right) = 0.4674\]

즉, 46% 확률로 5시간 안에 첫 환자가 내원할 수 있다.