푸아송 분포

1 개요[ | ]

Poisson distribution
푸아송 분포, 포아송 분포
  • 단위시간 안에 어떤 사건이 몇 번 발생할 것인지를 표현하는 이산확률분포
  • 시메옹 드니 푸아송이 1838년 저서[1]에서 최초로 사용함
매개변수 λ > 0
확률질량 [math]\displaystyle{ \displaystyle{ \frac{\lambda^k}{k!}\cdot e^{-\lambda} } }[/math]
누적분포 [math]\displaystyle{ \displaystyle{ e^{-\lambda} \sum_{i=0}^{\lfloor k\rfloor} \frac{\lambda^i}{i!} = \frac{\Gamma(\lfloor k+1\rfloor, \lambda)}{\lfloor k\rfloor !} } }[/math]
평균 λ
분산 λ
k: 사건이 일어나는 횟수
λ: 사건이 일어날 횟수에 대한 기댓값

2 PMF[ | ]

Poisson pmf.svg

3 CDF[ | ]

Poisson cdf.svg

4 적용 사례[ | ]

다음과 같은 사건을 모델링할 때 유용하다.

  • 하룻동안 발생하는 출생자 수
  • 1킬로미터 도로에 있는 흠집의 수
  • 10시~11시에 응급실에 도착하는 환자 수
  • 일정 주어진 시간 동안에 도착한 고객의 수
  • 어떤 특정 진도 이상의 지진이 발생하는 수
  • 일정 주어진 생산시간 동안 발생하는 불량 수
  • 어떤 시간 동안 톨게이트를 통과하는 차량의 수
  • 1년간 지구에 떨어지는 1미터 이상의 운석의 수
  • 특정 시간동안 탐지기에 부딪치는 레이저 광자의 수
  • 어떤 페이지 하나를 완성하는 데 발생하는 오타의 발생률
  • 어떤 특정 량의 방사선을 DNA에 쬐였을 때 발생하는 돌연변이의 수
  • 어떤 특정 면적의 다양한 종류의 나무가 섞여 자라는 삼림에서 소나무의 수

5 가정 위배 사례[ | ]

  • 1분마다 학생 조합에 도착할 학생들의 수는 푸아송 분포를 따르지 않을 수 있다.
왜냐하면, 그 비율이 일정하지 않기 때문이다. (수업 중에는 그 비율이 낮고, 쉬는 시간에는 그 비율이 높을 것이다.) 또, 각 학생들의 도착 사건이 독립적이지 않다. (학생들은 그룹으로 이동하는 경향이 있다)
  • 매년 캘리포니아에서 진도 5의 지진 발생 수는 푸아송 분포를 따르지 않을 것이다.
왜냐하면 한 번의 지진이 그 다음 지진 발생 가능성에 영향을 주기 때문이다.
  • 집중 치료 병동의 환자들 중, 그 병동에서 보낼 날의 수는 푸아송 분포를 따르지 않을 것이다.
왜냐하면, 병동에서 하루도 지내지 않는 경우는 없기 때문이다. 이러한 경우 zero-truncated poisson distribution을 통한 모델링이 가능하다.
  • 한 번도 사건이 일어나지 않는 시간 간격의 수가 기본 푸아송 분포를 통해 예측된 것보다 더 많은 경우 (쉽게 생각하면 푸아송 분포에서 계산된 P(k=0)보다 더 높은 P(k=0)을 가지는 경우), zero-inflated 모델을 적용할 수 있다.

6 확률 계산 예시[ | ]

6.1 예시 1: 홍수[ | ]

어떤 강에서 100년간 평균 1번 홍수가 발생하고 포아송 분포를 따른다면...

[math]\displaystyle{ P(100년간\ 홍수\ k번) = \frac{λ^k e^{-λ}}{k!} = \frac{e^{-1}}{k!} }[/math]
[math]\displaystyle{ P(100년간\ 홍수\ 0번) = \frac{1^0 e^{-1}}{0!} = \frac{e^{-1}}{1} ≒ 0.367879 }[/math]
[math]\displaystyle{ P(100년간\ 홍수\ 1번) = \frac{1^1 e^{-1}}{1!} = \frac{e^{-1}}{1} ≒ 0.367879 }[/math]
[math]\displaystyle{ P(100년간\ 홍수\ 2번) = \frac{1^2 e^{-1}}{2!} = \frac{e^{-1}}{2} ≒ 0.183940 }[/math]

6.2 예시 2: 월드컵 골[ | ]

월드컵에서 한 경기 당 평균 2.5개 골이 발생하고 포아송 분포를 따른다면...

[math]\displaystyle{ P(한\ 경기에서\ k골) = \frac{λ^k e^{-λ}}{k!} = \frac{2.5^k e^{2.5}}{k!} }[/math]
[math]\displaystyle{ P(한\ 경기에서\ 0골) = \frac{2.5^0 e^{-2.5}}{0!} = \frac{e^{2.5}}{1} ≒ 0.082085 }[/math]
[math]\displaystyle{ P(한\ 경기에서\ 1골) = \frac{2.5^1 e^{-2.5}}{1!} = \frac{2.5 e^{2.5}}{1} ≒ 0.205212 }[/math]
[math]\displaystyle{ P(한\ 경기에서\ 2골) = \frac{2.5^2 e^{-2.5}}{2!} = \frac{6.25 e^{2.5}}{2} ≒ 0.256516 }[/math]

6.3 예시 3: 운석[ | ]

특정 크기 이상의 운석이 1년간 평균 3개 지구로 진입하고 포아송 분포를 따른다면...

[math]\displaystyle{ P(1년간\ 운석\ k개) = \frac{3^k e^{-λ}}{k!} = \frac{3^k e^3}{k!} }[/math]
[math]\displaystyle{ P(1년간\ 운석\ 0개) = \frac{3^0 e^{-3}}{0!} = \frac{e^{-3}}{1} ≒ 0.049787 }[/math]
[math]\displaystyle{ P(1년간\ 운석\ 1개) = \frac{3^1 e^{-3}}{1!} = \frac{3 e^{-3}}{1} ≒ 0.149361 }[/math]
[math]\displaystyle{ P(1년간\ 운석\ 2개) = \frac{3^2 e^{-3}}{2!} = \frac{9 e^{-3}}{2} ≒ 0.224042 }[/math]

7 같이 보기[ | ]

확률분포
이산확률분포 연속확률분포

8 참고[ | ]

  1. 《민사 사건과 형사 사건 재판에서의 확률에 관한 연구 및 일반적인 확률 계산 법칙에 대한 서문》(프랑스어: Probabilité des jugements en matière criminelle et en matière civile, précédées des règles générales du calcul des probabilitiés)
문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}