기하 분포


파라미터 p를 수정해가며 다양한 경우의 기하 분포의 생김새에 대해 확인해보자.
기하 분포에서 x 축에 있는 k가 갖는 것은 어떤 의미일까?
그리고 기하 분포의 형태가 의미하는 것을 설명할 수 있는가?

Prerequisites

기하 분포를 이해하기 위해선 아래의 내용에 대해 알고 오시는 것이 좋습니다.

기하 분포의 정의

기하 분포는 성공 혹은 실패의 두 가지 경우의 수로 구성된 시행을 연달아 수행 시 처음 성공할 때 까지 시도한 횟수 에 대한 분포이다.

성공 확률이 인 시행에 대해 번 시행 후 첫번째 성공을 얻을 확률은

여기서 이다.

여기서 잘 보면 확률값 의 수열은 를 매 항마다 계속해서 곱해나가는 수열이므로 등비 수열이 되는데,

등비 수열의 또 다른 이름이 기하 수열(geometric sequence)이다보니 이 분포는 기하 분포라는 이름을 얻었다.

기하 분포의 형태


그림 1. 다양한 p 값에 대한 기하 분포의 형태

기하 분포에서 보여주는 것은 성공 확률이 일 때 번째 처음으로 성공할 수 있는 확률을 의미한다.

예를 들어 그림 1에서 p = 0.8인 경우에 대해 첫 번째 시도에서 성공할 확률은 0.8이고, 두 번째 시도에서 성공할 확률은 한번 실패한 뒤 성공해야 하므로 0.2 * 0.8 = 0.16이다.

또, 세 번째 시도에서 성공할 확률은 0.2 * 0.2 * 0.8 = 0.032와 같다.

여기서 알 수 있는 것은 값이 클 수록 에서의 성공확률값도 당연히 크다는 것이다.

한가지 위로가 되는 점은 값이 크지 않은 경우 여러번 시도했을 때 값이 큰 경우보다 더 높은 확률로 첫 성공을 달성할 수 있다는 것이다.

기하 분포 문제 풀이

기하 분포는 생각 보다 문제가 와닿는 것들이 많고, 식 자체가 복잡하지 않다보니 문제 풀기에 어렵지는 않을 것 같다.

문제 1.

주사위가 1이 나올 때 까지 계속해서 던져보고 있다고 하자. 주사위가 6번째가 되어서야 1이 나올 확률을 계산하시오.

문제 1 Solution

주사위가 1이 나올 확률은 1/6이므로, 6번째에서 1이 나올 확률은 5번 동안 1이 나오지 않고, 6번째에서 1이 나오는 것과 동일하다.

따라서,

약 6.7%이다.

문제 2.

통과율이 극악이라 알려진 시험이 있다. 이 시험의 통과율은 20%라고 한다. 어떤 사람이 세 번 내에 이 시험을 통과할 확률은?

문제 2 Solution

이 문제에서는 1번에 합격할 확률 + 2번째에 합격할 확률 + 3번째에 합격할 확률을 모두 더해서 계산하면 된다.

따라서,

즉, 44.8%의 확률로 세번 안에 합격할 수 있다.