초기 하 분포는 두 가지 결과 랜덤 화 실험에서 확률을 계산하기에 적합한 개별 통계적 함수이다. 이를 적용하는 데 필요한 조건은 인출이 대체되지 않고 확률이 일정하지 않은 소규모 인구라는 것입니다.
따라서 특정 특성의 결과 (참 또는 거짓)를 알기 위해 모집단의 요소를 선택하면 동일한 요소를 다시 선택할 수 없습니다.
그림 1. 이와 같은 볼트 모집단에는 확실히 결함이있는 표본이 있습니다. 출처 : Pixabay.
확실히, 이전 요소가 부정적인 결과를 가졌다면 선택한 다음 요소가 실제 결과를 얻을 가능성이 더 높습니다. 이는 샘플에서 요소가 추출 될 때 확률이 달라짐을 의미합니다.
초기 하 분포의 주요 응용 분야는 인구가 적은 프로세스의 품질 관리와 우연의 게임에서 확률 계산입니다.
초기 하 분포를 정의하는 수학 함수는 다음과 같은 세 가지 매개 변수로 구성됩니다.
-인구 요소 수 (N)
-샘플 크기 (m)
-연구 된 특성 (n)의 유리한 (또는 불리한) 결과가있는 전체 모집단의 이벤트 수.
공식 및 방정식
초기 하 분포의 공식은 x 특정 특성의 유리한 경우가 발생할 확률 P를 제공합니다. 조합 숫자를 기반으로 수학적으로 쓰는 방법은 다음과 같습니다.
이전 표현식 N에서 n과 m은 매개 변수이고 x는 변수 자체입니다.
-총 인구는 N입니다.
-전체 모집단에 대한 특정 이진 특성의 양성 결과 수는 n입니다.
-샘플의 원소 수량은 m입니다.
이 경우 X는 x 값을 취하는 랜덤 변수이고 P (x)는 연구 된 특성의 유리한 x 케이스의 발생 확률을 나타냅니다.
중요한 통계 변수
초기 하 분포에 대한 기타 통계 변수는 다음과 같습니다.
-평균 μ = m * n / N
-분산 σ ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1)
-분산의 제곱근 인 표준 편차 σ.
모델 및 속성
초기 하 분포 모델에 도달하기 위해, 우리는 크기 m의 표본에서 x 개의 유리한 케이스를 얻을 확률에서 시작합니다. 이 샘플에는 연구중인 속성을 준수하는 요소와 그렇지 않은 요소가 포함되어 있습니다.
n은 N 요소의 전체 모집단에서 유리한 사례의 수를 나타냅니다. 그런 다음 확률은 다음과 같이 계산됩니다.
위를 조합 숫자의 형태로 표현하면 다음과 같은 확률 분포 모델에 도달합니다.
초기 하 분포의 주요 특성
다음과 같습니다.
-모집단이 많더라도 표본은 항상 작아야합니다.
-샘플의 요소를 다시 모집단에 통합하지 않고 하나씩 추출합니다.
-연구 할 속성은 이진법입니다. 즉, 1 또는 0 또는 true 또는 false의 두 값만 사용할 수 있습니다.
각 요소 추출 단계에서 확률은 이전 결과에 따라 변경됩니다.
이항 분포를 사용한 근사
초기 하 분포의 또 다른 특성은 모집단 N이 크고 표본 m보다 10 배 이상 큰 경우 Bi로 표시되는 이항 분포로 근사 할 수 있다는 것입니다. 이 경우 다음과 같이 표시됩니다.
표본의 x = 3 개 나사에 결함이있을 확률은 P (500, 5, 60, 3) = 0.0129입니다.
부품의 경우 표본 60 개 중 x = 4 개 나사에 결함이있을 확률은 P (500, 5, 60; 4) = 0.0008입니다.
마지막으로 해당 표본의 x = 5 개 나사에 결함이있을 확률은 P (500, 5, 60; 5) = 0입니다.
그러나 해당 표본에 결함이있는 나사가 3 개 이상있을 확률을 알고 싶다면 다음을 추가하여 누적 확률을 얻어야합니다.
이 예는 학교, 기관 및 대학에서 널리 사용되는 무료 소프트웨어 인 GeoGebra를 사용하여 얻은 그림 2에 나와 있습니다.
그림 2. 초기 하 분포의 예. GeoGebra와 함께 F. Zapata가 작성했습니다.
예 2
스페인 덱 덱에는 40 장의 카드가 있으며, 그중 10 장에는 골드가 있고 나머지 30 장에는 없습니다. 7 장의 카드가 그 덱에서 무작위로 뽑혀지고 덱에 다시 통합되지 않는다고 가정합니다.
X가 7 장 뽑은 카드에있는 금의 수인 경우 7 장 뽑을 때 x 개의 금이있을 확률은 초기 하 분포 P (40,10,7; x)에 의해 제공됩니다.
다음과 같이 보자 : 7 장의 카드 드로우에서 4 개의 금을 가질 확률을 계산하기 위해 다음 값을 갖는 초기 하 분포의 공식을 사용합니다.
결과는 4.57 % 확률입니다.
그러나 4 장 이상의 카드를받을 확률을 알고 싶다면 다음을 추가해야합니다.
해결 된 운동
다음 연습 세트는이 기사에 제시된 개념을 설명하고 동화하기위한 것입니다. 독자가 해결책을보기 전에 스스로 해결하려고하는 것이 중요합니다.
연습 1
한 콘돔 공장은 특정 기계에서 생산되는 1000 개의 콘돔 중 5 개가 결함이 있음을 발견했습니다. 품질 관리를 위해 100 개의 콘돔이 무작위로 취해지며 결함이 하나 이상 있으면 로트가 거부됩니다. 대답:
a) 100 개를 많이 버릴 가능성은 무엇입니까?
b)이 품질 관리 기준이 효율적입니까?
해결책
이 경우 매우 큰 조합 숫자가 나타납니다. 적절한 소프트웨어 패키지가 없으면 계산이 어렵습니다.
그러나 그것은 큰 모집단이고 표본이 전체 모집단보다 10 배 작기 때문에 이항 분포에 의한 초기 하 분포의 근사를 사용할 수 있습니다.
위의 식에서 C (100, x)는 조합 숫자입니다. 그런 다음 둘 이상의 결함이있을 확률은 다음과 같이 계산됩니다.
초기 하 분포 : 0.4102를 적용하여 얻은 값과 비교하면 훌륭한 근사치입니다.
40 %의 확률로 100 개의 예방제를 폐기해야한다고 할 수 있는데, 이는 매우 효율적이지 않습니다.
그러나 품질 관리 프로세스에서 덜 까다 롭고 결함이 2 개 이상있는 경우에만 100 개 로트를 폐기하면 로트를 폐기 할 확률은 8 %로 떨어집니다.
연습 2
플라스틱 블록 기계는 10 개 중 하나가 변형되어 나오는 방식으로 작동합니다. 5 개 샘플에서 한 개만 결함이있을 가능성이 얼마나됩니까?
해결책
인구 : N = 10
모든 N에 대한 불량 수 n : n = 1
표본 크기 : m = 5
따라서 5 개의 샘플에서 블록이 변형 될 확률은 50 %입니다.
연습 3
젊은 고등학교 졸업생 모임에는 7 명의 신사 숙녀와 6 명의 신사가 있습니다. 여학생 중 4 명은 인문학, 3 명은 과학. 보이 그룹에서는 1 명은 인문학, 5 명은 과학. 다음을 계산하십시오.
a) 세 명의 소녀를 무작위로 선택 : 모두가 인문학을 공부할 가능성은 얼마나됩니까?
b) 친구 모임에 3 명의 참석자가 무작위로 선택되는 경우 : 성별에 관계없이 3 명이 과학을 모두 공부하거나 3 명 모두 인문학을 공부할 가능성은 무엇입니까?
c) 이제 무작위로 두 명의 친구를 선택하고 x를 무작위 변수 "인문학을 공부하는 사람들의 수"라고 부릅니다. 선택한 둘 사이에서 x의 평균 또는 기대 값과 분산 σ ^ 2를 결정합니다.
솔루션
지금 사용할 값은 다음과 같습니다.
-인구 : N = 14
-문자를 연구하는 수량 : n = 6 및
-샘플 크기 : m = 3.
-인문학을 공부하는 친구 수 : x
이에 따라 x = 3은 세 가지 인문학을 모두 공부한다는 것을 의미하지만 x = 0은 인문학을 공부하지 않음을 의미합니다. 세 가지 연구가 모두 동일 할 확률은 다음의 합계로 제공됩니다.
P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0.0560 + 0.1539 = 0.2099
그러면 무작위로 선정 된 3 명의 회의 참석자가 같은 것을 공부할 확률이 21 %입니다.
솔루션 c
여기에 다음과 같은 값이 있습니다.
N = 14 명의 총 친구 모집단, n = 6 인문학을 공부하는 모집단의 총 수, 표본 크기는 m = 2입니다.
희망은 :
E (x) = m * (n / N) = 2 * (6/14) = 0.8572
그리고 분산 :
σ (x) ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1) = 2 * (6/14) * (1-6 / 14) * ( 14-2) / (14-1) =
= 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) = 2 * (3/7) * (1-3 / 7) * (12) / ( 13) = 0.4521
참고 문헌
- 이산 확률 분포. 출처 : biplot.usal.es
- 통계와 확률. 초기 하 분포. 출처 : projectdescartes.org
- CDPYE-UGR. 초기 하 분포. 출처 : ugr.es
- Geogebra. 고전 지리학, 확률 미적분. geogebra.org에서 복구
- 쉽게 시도하십시오. 초기 하 분포 문제를 해결했습니다. 출처 : probafacil.com
- Minitab. 초기 하 분포. 출처 : support.minitab.com
- 비고 대학교. 주요 이산 분포. 출처 : anapg.webs.uvigo.es
- Vitutor. 통계 및 조합. 출처 : vitutor.net
- Weisstein, Eric W. Hypergeometric Distribution. 출처 : mathworld.wolfram.com
- Wikipedia. 초기 하 분포. 출처 : es.wikipedia.com