푸 아송 분포가 그 가능성을 알 수있는 이산 확률 분포, 즉, 큰 샘플 크기 내에서 그리고 소정 간격, 그 발생 확률 작은 이벤트 동안.
종종 다음 조건이 충족되는 한 이항 분포 대신 포아송 분포를 사용할 수 있습니다 : 큰 표본과 작은 확률.
그림 1. 다양한 매개 변수에 대한 푸 아송 분포 그래프. 출처 : Wikimedia Commons.
Siméon-Denis Poisson (1781-1840)은 예측할 수없는 사건에 대해 매우 유용한 그의 이름을 가진이 배포판을 만들었습니다. 푸아 송은 1837 년 잘못된 형법 발생 가능성에 대한 조사 결과를 발표했습니다.
나중에 다른 연구자들은 특정 공간에서 발견 할 수있는 별의 수나 병사가 말의 발차기로 죽을 확률과 같은 다른 영역의 분포를 조정했습니다.
공식 및 방정식
푸 아송 분포의 수학적 형태는 다음과 같습니다.
-μ (때때로 λ로 표시됨)는 분포의 평균 또는 모수입니다.
-오일러 번호 : e = 2.71828
-y = k를 얻을 확률은 P
-k는 성공 횟수 0, 1,2,3 …
-n은 테스트 또는 이벤트 수 (샘플 크기)
이름에서 알 수 있듯이 이산 확률 변수는 우연에 의존하며 0, 1, 2, 3, 4…, k와 같은 이산 값만 사용합니다.
분포의 평균은 다음과 같이 제공됩니다.
데이터의 산포를 측정하는 분산 σ는 또 다른 중요한 매개 변수입니다. 푸 아송 분포의 경우 다음과 같습니다.
σ = μ
Poisson은 n → ∞ 및 p → 0 일 때 평균 μ (기대 값이라고도 함)가 상수가되는 경향이 있다고 결정했습니다.
-고려되는 이벤트 또는 이벤트는 서로 독립적이며 무작위로 발생합니다.
-특정 기간 동안 특정 이벤트가 발생할 확률 P는 매우 작습니다 : P → 0.
-시간 간격에서 하나 이상의 이벤트가 발생할 확률은 0입니다.
-평균값은 다음과 같이 주어진 상수에 가깝습니다. μ = np (n은 샘플 크기)
-분산 σ가 μ와 같으므로 큰 값을 채택할수록 변동성도 커집니다.
-이벤트는 사용 된 시간 간격으로 균등하게 분배되어야합니다.
-이벤트 y의 가능한 값 세트는 0,1,2,3,4…입니다.
-포아송 분포를 따르는 i 변수의 합은 또 다른 포아송 변수입니다. 평균값은 이러한 변수의 평균값의 합입니다.
이항 분포와의 차이점
푸 아송 분포는 다음과 같은 중요한 측면에서 이항 분포와 다릅니다.
-이항 분포는 표본 크기 n과 확률 P의 영향을 받지만 포아송 분포는 평균 μ의 영향을받습니다.
-이항 분포에서 확률 변수 y의 가능한 값은 0,1,2,…, N이지만 포아송 분포에서는 이러한 값에 대한 상한이 없습니다.
예
Poisson은 처음에 그의 유명한 배포판을 법적 소송에 적용했지만 산업적 수준에서 그의 가장 초기 사용 중 하나는 맥주 양조였습니다. 이 과정에서 효모 배양은 발효에 사용됩니다.
효모는 시간이 지남에 따라 개체수가 변하는 살아있는 세포로 구성됩니다. 맥주 제조시에는 필요한 양을 더할 필요가 있으므로 단위 부피당 세포 수를 알아야합니다.
제 2 차 세계 대전 동안 포아송 분포는 독일군이 실제로 칼레에서 런던을 겨냥했는지 아니면 그냥 무작위로 발사했는지 확인하는 데 사용되었습니다. 이것은 연합군이 나치가 사용할 수있는 기술이 얼마나 좋은지 결정하는 데 중요했습니다.
실용적인 적용
푸 아송 분포의 응용은 항상 시간 또는 공간의 개수를 참조합니다. 그리고 발생 확률이 적기 때문에 "희귀 사건의 법칙"이라고도합니다.
다음은 이러한 범주 중 하나에 해당하는 이벤트 목록입니다.
-효모 세포의 성장과 같이 지수 함수 인 방사성 붕괴에 입자의 등록.
-특정 웹 사이트 방문 횟수.
-지불하거나 참석할 줄에 사람들이 도착 (대기열 이론).
-주어진 시간 간격 동안 도로의 특정 지점을 지나는 차량의 수.
그림 2. 포인트를 통과하는 자동차의 수는 대략 포아송 분포를 따릅니다. 출처 : Pixabay.
-방사선에 노출 된 후 특정 DNA 사슬에서 돌연변이가 발생했습니다.
-지름이 1m 이상인 운석의 수는 1 년에 떨어졌습니다.
-직물의 평방 미터당 결함.
-1 입방 센티미터의 혈액 세포의 양.
-전화 교환에 분당 전화.
-1kg의 케이크 반죽에 초콜릿 칩이 들어 있습니다.
-1 헥타르의 숲에서 특정 기생충에 감염된 나무의 수.
이러한 랜덤 변수는 일정 기간 (전화 교환기에 대한 분당 호출) 또는 지정된 공간 영역 (평방 미터당 패브릭 결함) 동안 이벤트가 발생하는 횟수를 나타냅니다.
이미 설정된 이러한 이벤트는 마지막 발생 이후 경과 된 시간과 무관합니다.
포아송 분포로 이항 분포 근사화
포아송 분포는 다음과 같은 경우 이항 분포에 대한 좋은 근사치입니다.
-샘플의 크기가 큽니다 : n ≥ 100
-확률 p가 작습니다 : p ≤ 0.1
-μ는 np ≤ 10의 순서입니다.
이러한 경우 이항 분포를 적용하기 어려울 수 있으므로 포아송 분포는 훌륭한 도구입니다.
해결 된 운동
연습 1
지진학 연구에 따르면 지난 100 년 동안 전 세계에 93 번의 큰 지진이 발생했으며 리히터 척도에서 최소 6.0 번의 대지진이 발생했습니다. 이 경우 푸 아송 분포가 적합한 모델이라고 가정합니다. 찾기:
a) 연간 평균 대규모 지진 발생.
b) P (y)가 무작위로 선택된 연도 동안 발생하는 지진의 확률이면 다음 확률을 찾으십시오.
P (2)보다 상당히 적습니다.
결과는 다음과 같습니다.
P (0) = 0.395, P (1) = 0.367, P (2) = 0.171, P (3) = 0.0529, P (4) = 0.0123, P (5) = 0.00229, P (6) = 0.000355, P (7) = 0.0000471.
예를 들어, 특정 연도에 큰 지진이 발생하지 않을 확률이 39.5 %라고 말할 수 있습니다. 또는 그해에 발생한 3 건의 대규모 지진 중 5.29 %가 발생했습니다.
솔루션 c)
c) 빈도를 분석하여 n = 100 년을 곱합니다.
39.5; 36.7; 17.1; 5.29; 1.23; 0.229; 0.0355 및 0.00471.
예를 들면 :
-39.5의 빈도는 100 년 중 39.5 번에 큰 지진이 발생하지 않았 음을 의미하며, 큰 지진이없는 47 년의 실제 결과에 매우 가깝다고 말할 수 있습니다.
다른 푸 아송 결과를 실제 결과와 비교해 보겠습니다.
-36.7의 값은 37 년 동안 1 회의 대지진이 있음을 의미합니다. 실제 결과는 31 년 동안 1 건의 대지진이 있었는데 이는 모델과 잘 어울리는 것입니다.
-17.1 년은 2 회의 큰 지진으로 예상되며, 가까운 가치 인 13 년 동안 실제로 2 회의 큰 지진이 발생한 것으로 알려져 있습니다.
따라서이 경우에는 푸 아송 모델이 허용됩니다.
연습 2
한 회사는 작동 시간이 100 시간에 도달하기 전에 고장난 구성 요소의 수가 푸 아송 분포를 따른다고 추정합니다. 해당 시간의 평균 실패 수가 8이면 다음 확률을 찾으십시오.
a) 구성 요소가 25 시간 내에 고장납니다.
b) 50 시간 내에 두 개 미만의 구성품 고장.
c) 125 시간 내에 최소 3 개의 구성 요소가 고장납니다.
해결책)
a) 100 시간 동안의 평균 고장은 8 개로 알려져 있으므로 25 시간 내에 1/4 고장, 즉 2 회의 고장이 예상됩니다. 이것은 μ 매개 변수가됩니다.
1 개의 구성 요소가 실패 할 확률이 요청되고, 랜덤 변수는 "25 시간 전에 실패한 구성 요소"이고 그 값은 y = 1입니다. 확률 함수를 대체하여 :
그러나 문제는 50 시간 내에 두 개 미만의 구성 요소가 고장날 확률이 아니라 정확히 두 구성 요소가 50 시간 내에 고장날 가능성이 아니므로 다음과 같은 확률을 추가해야합니다.
-실패하지 않음
-실패 만 1
이 경우 분포의 매개 변수 μ는 다음과 같습니다.
μ = 8 + 2 = 125 시간 동안 10 회 고장.
P (3 개 이상의 구성 요소 실패) = 1- P (0)-P (1)-P (2) =
참고 문헌
- MathWorks. 푸 아송 분포. 출처 : es.mathworks.com
- Mendenhall, W. 1981. 경영 및 경제 통계. 셋째. 판. Grupo Editorial Iberoamérica.
- Stat Trek. 자신에게 통계를 가르치십시오. 푸 아송 분포. 출처 : stattrek.com,
- Triola, M. 2012. 초등 통계. 11 일. 에드 피어슨 교육.
- Wikipedia. 푸 아송 분포. 출처 : en.wikipedia.org