정규 분포 또는 가우스 분포를 확률 밀도 함수는 벨 형상을 일으킨다 차 및 음의 인수의 지수 함수에 의해 기술되는 연속 변수의 확률 분포이다.
정규 분포의 이름은이 분포가 주어진 그룹 또는 모집단에 일부 연속 랜덤 변수가 포함 된 가장 많은 상황에 적용되는 분포라는 사실에서 비롯됩니다.
그림 1. 정규 분포 N (x; μ, σ) 및 확률 밀도 f (s; μ, σ). (자신의 정교함)
정규 분포가 적용되는 예는 남성 또는 여성의 키, 신체적 규모의 변동 또는 지적 지수 또는 특정 제품의 소비 습관과 같은 측정 가능한 심리적 또는 사회 학적 특성입니다.
다른 한편으로, 그것은 가우스 분포 또는 가우스 종이라고 불립니다. 왜냐하면 1800 년에 천문학적 측정의 통계적 오류를 설명하기 위해 그것을 사용하여 그의 발견으로 인정받은 것은이 독일 수학적 천재이기 때문입니다.
그러나이 통계 분포는 이전에 1733 년에 Abraham de Moivre와 같은 프랑스 출신의 다른 위대한 수학자에 의해 발표되었다고합니다.
공식
매개 변수 μ 및 σ를 사용하는 연속 변수 x의 정규 분포 함수는 다음과 같이 표시됩니다.
N (x; μ, σ)
다음과 같이 명시 적으로 작성됩니다.
N (x; μ, σ) = ∫ -∞ x f (s; μ, σ) ds
여기서 f (u; μ, σ)는 확률 밀도 함수입니다.
f (s; μ, σ) = (1 / (σ√ (2π)) Exp (-s 2 / (2σ 2 ))
확률 밀도 함수에서 지수 함수를 곱하는 상수를 정규화 상수라고하며 다음과 같은 방식으로 선택되었습니다.
N (+ ∞, μ, σ) = 1
앞의 식은 랜덤 변수 x가 -∞과 + ∞ 사이에있을 확률이 1, 즉 100 % 확률임을 보장합니다.
매개 변수 μ는 연속 랜덤 변수 x의 산술 평균이고 σ는 동일한 변수의 표준 편차 또는 분산의 제곱근입니다. μ = 0 및 σ = 1 인 경우 표준 정규 분포 또는 일반 정규 분포가 있습니다.
N (x; μ = 0, σ = 1)
정규 분포의 특성
1- 확률 통계 변수가 확률 밀도 f (s; μ, σ)의 정규 분포를 따르는 경우 대부분의 데이터는 평균값 μ 주위에 그룹화되고 그 주위에 흩어져 있습니다. 데이터의 ⅔는 μ-σ와 μ + σ 사이에 있습니다.
2- 표준 편차 σ는 항상 양수입니다.
3- 밀도 함수 f의 모양은 벨의 모양과 유사하므로이 함수를 종종 가우시안 벨 또는 가우스 함수라고합니다.
4- 가우스 분포에서 평균, 중앙값 및 최빈값이 일치합니다.
5- 확률 밀도 함수의 변곡점은 정확하게 μ-σ 및 μ + σ에 있습니다.
6- 함수 f는 평균값 μ를 통과하는 축에 대해 대칭이며 x ⟶ + ∞ 및 x ⟶ -∞에 대해 점근 적으로 0을 갖습니다.
7- σ 값이 높을수록 평균값 주변의 데이터 분산, 노이즈 또는 거리가 커집니다. 즉, σ가 높을수록 종 모양이 더 열려 있습니다. 반면에 σ가 작 으면 주사위가 평균에 가깝고 종의 모양이 더 닫혀 있거나 뾰족하다는 것을 나타냅니다.
8- 분포 함수 N (x; μ, σ)은 랜덤 변수가 x보다 작거나 같을 확률을 나타냅니다. 예를 들어, 그림 1 (위)에서 변수 x가 1.5보다 작거나 같을 확률 P는 84 %이고 확률 밀도 함수 f (x; μ, σ) 아래 영역에 해당합니다. -∞ ~ x.
신뢰 구간
9- 데이터가 정규 분포를 따르는 경우 이들 중 68.26 %는 μ-σ와 μ + σ 사이에 있습니다.
정규 분포를 따르는 데이터의 10 ~ 95.44 %는 μ-2σ와 μ + 2σ 사이에 있습니다.
정규 분포를 따르는 데이터의 11-99.74 %는 μ-3σ와 μ + 3σ 사이에 있습니다.
12- 확률 변수 x가 분포 N (x; μ, σ)을 따르는 경우 변수
z = (x-μ) / σ는 표준 정규 분포 N (z; 0.1)을 따릅니다.
변수 x를 z로 변경하는 것을 표준화 또는 입력이라고하며 비표준 정규 분포를 따르는 데이터에 표준 분포의 표를 적용 할 때 매우 유용합니다.
정규 분포의 응용
정규 분포를 적용하려면 확률 밀도의 적분 계산을 거쳐야합니다. 이는 분석적 관점에서 볼 때 쉽지 않으며 수치 계산을 허용하는 컴퓨터 프로그램이 항상있는 것은 아닙니다. 이를 위해 정규화 또는 표준화 값 테이블이 사용되며, 이는 μ = 0 및 σ = 1의 경우 정규 분포에 지나지 않습니다.
표준화 된 정규 분포표 (1/2 부)
표준화 된 정규 분포표 (2/2 부)
이 표에는 음수 값이 포함되어 있지 않습니다. 그러나 가우스 확률 밀도 함수의 대칭 속성을 사용하여 해당 값을 얻을 수 있습니다. 아래에 표시된 해결 된 연습은 이러한 경우 표의 사용을 나타냅니다.
예
평균 10과 표준 편차 2의 정규 분포를 따르는 임의 데이터 x 세트가 있다고 가정합니다. 다음과 같은 확률을 찾아야합니다.
a) 랜덤 변수 x는 8보다 작거나 같습니다.
b) 10보다 작거나 같습니다.
c) 변수 x는 12 미만입니다.
d) x- 값이 8과 12 사이에있을 확률.
해결책:
a) 첫 번째 질문에 답하려면 다음을 계산하면됩니다.
N (x; μ, σ)
x = 8, μ = 10 및 σ = 2. 우리는 이것이 기본 함수에 분석적 솔루션이없는 적분이라는 것을 알고 있지만 솔루션은 오류 함수 erf (x)의 함수로 표현됩니다.
반면에 GeoGebra와 같은 많은 계산기, 스프레드 시트 및 컴퓨터 프로그램이 수행하는 것과 같은 숫자 형식의 적분을 풀 수있는 가능성이 있습니다. 다음 그림은 첫 번째 경우에 해당하는 수치 솔루션을 보여줍니다.
그림 2. 확률 밀도 f (x; μ, σ). 음영 영역은 P (x ≤ 8)를 나타냅니다. (자신의 정교함)
답은 x가 8 미만일 확률은 다음과 같습니다.
P (x ≤ 8) = N (x = 8, μ = 10, σ = 2) = 0.1587
b)이 경우 랜덤 변수 x가 평균보다 낮을 확률을 찾으려고합니다.이 경우에는 10의 가치가 있습니다. 데이터의 절반이 아래에 있다는 것을 알고 있으므로 답은 계산이 필요하지 않습니다. 평균 및 나머지 절반은 평균 이상입니다. 따라서 대답은 다음과 같습니다.
P (x ≤ 10) = N (x = 10, μ = 10, σ = 2) = 0.5
c)이 질문에 답하려면 N (x = 12; μ = 10, σ = 2)을 계산해야합니다. 이는 통계 기능이있는 계산기 나 GeoGebra와 같은 소프트웨어를 통해 수행 할 수 있습니다.
그림 3. 확률 밀도 f (x; μ, σ). 음영 영역은 P (x ≤ 12)를 나타냅니다. (자신의 정교함)
파트 c에 대한 답은 그림 3에서 볼 수 있으며 다음과 같습니다.
P (x ≤ 12) = N (x = 12; μ = 10, σ = 2) = 0.8413.
d) 랜덤 변수 x가 8과 12 사이에있을 확률을 찾기 위해 다음과 같이 파트 a와 c의 결과를 사용할 수 있습니다.
P (8 ≤ x ≤ 12) = P (x ≤ 12)-P (x ≤ 8) = 0.8413-0.1587 = 0.6826 = 68.26 %.
운동이 해결됨
회사 주식의 평균 가격은 $ 25이고 표준 편차는 $ 4입니다. 다음과 같은 확률을 결정하십시오.
a) 행동 비용이 $ 20 미만입니다.
b) 비용이 $ 30 이상입니다.
c) 가격은 $ 20에서 $ 30 사이입니다.
표준 정규 분포표를 사용하여 답을 찾으십시오.
해결책:
테이블을 사용하려면 정규화되거나 형식화 된 z 변수에 전달해야합니다.
정규화 된 변수에서 $ 20는 z = ($ 20-$ 25) / $ 4 = -5/4 = -1.25와 같습니다.
정규화 된 변수에서 $ 30은 z = ($ 30-$ 25) / $ 4 = +5/4 = +1.25와 같습니다.
a) $ 20은 정규화 된 변수에서 -1.25와 같지만 테이블에 음수 값이 없으므로 0.8944의 값을 산출하는 +1.25 값을 찾습니다.
이 값에서 0.5를 빼면 결과는 0과 1.25 사이의 영역이되지만 -1.25와 0 사이의 영역과 대칭 적으로 동일합니다. 빼기 결과는 0.8944입니다. 0.5 = 0.3944는 -1.25와 0 사이의 영역입니다.
그러나 -∞에서 -1.25까지의 영역은 0.5-0.3944 = 0.1056이 될 것입니다. 따라서 주식이 $ 20 미만일 확률은 10.56 %라고 결론지었습니다.
b) 형식화 된 변수 z의 $ 30은 1.25입니다. 이 값에 대해 표에는 -∞에서 +1.25까지의 영역에 해당하는 0.8944가 표시됩니다. +1.25에서 + ∞ 사이의 영역은 (1-0.8944) = 0.1056입니다. 즉, 주가가 $ 30 이상일 확률은 10.56 %입니다.
c) 행동의 비용이 $ 20에서 $ 30 사이 일 확률은 다음과 같이 계산됩니다.
100 % -10.56 %-10.56 % = 78.88 %
참고 문헌
- 통계와 확률. 정규 분포. 출처 : projectdescartes.org
- Geogebra. 고전 지리학, 확률 미적분. geogebra.org에서 복구
- MathWorks. 가우스 분포. 출처 : es.mathworks.com
- Mendenhall, W. 1981. 경영 및 경제 통계. 셋째. 판. Grupo Editorial Iberoamérica.
- Stat Trek. 자신에게 통계를 가르치십시오. 푸 아송 분포. 출처 : stattrek.com,
- Triola, M. 2012. 초등 통계. 11 일. 에드 피어슨 교육.
- 비고 대학교. 주요 연속 분포. 출처 : anapg.webs.uvigo.es
- Wikipedia. 정규 분포. 출처 : es.wikipedia.org