샘플링 오류 : 공식 및 방정식, 계산, 예 - DUDAS

통계 의 표본 추출 오차 또는 표본 추출 오차는 표본의 평균값과 전체 모집단의 평균값 간의 차이입니다. 아이디어를 설명하기 위해 한 도시의 총 인구가 100 만 명이라고 가정 해 보겠습니다.이 중 평균 신발 크기는 1,000 명에 대한 무작위 표본이 필요합니다.

표본에서 나오는 평균 크기가 전체 모집단의 크기와 반드시 일치하지는 않지만 표본이 편향되지 않은 경우 값이 가까워 야합니다. 표본의 평균값과 전체 모집단의이 차이가 표본 오차입니다.

그림 1. 표본은 전체 모집단의 하위 집합이므로 표본 평균에는 오차 한계가 있습니다. 출처 : F. Zapata.

전체 모집단의 평균값은 일반적으로 알려져 있지 않지만이 오류를 줄이는 기술과이 기사에서 논의 할 샘플링 오류 한계를 추정하는 공식이 있습니다.

공식 및 방정식

크기 N의 모집단에서 측정 가능한 특정 특성 x의 평균값을 알고 싶지만 N이 큰 숫자이기 때문에 전체 모집단에 대한 연구를 수행하는 것이 불가능한 경우 크기 n <

샘플의 평균값은 다음과 같이 표시됩니다. 전체 인구의 평균값은 그리스 문자 μ (mu 또는 miu 읽기)로 표시됩니다.

전체 모집단 N에서 m 개의 샘플을 가져 왔다고 가정합니다. 1>, 2>, 3>,….m>.

이 평균 값은 서로 동일하지 않으며 모두 모집단 평균 값 μ 주변에 있습니다. 샘플링 오차 한계 E는 평균값의 예상 분리를 나타냅니다. 신뢰 수준 γ (감마)라고하는 지정된 백분율 내에서 모집단 평균 값 μ에 상대적입니다.

크기 n 표본의 표준 오차 한계 ε는 다음과 같습니다.

ε = σ / √n

여기서 σ는 다음 공식을 사용하여 계산되는 표준 편차 (분산의 제곱근)입니다.

σ = √

표준 오차 한계 ε의 의미는 다음과 같습니다.

평균값 크기 n의 표본에 의해 얻은 값은 구간 ( -ε, + ε) 신뢰 수준 68.3 %.

샘플링 오류 계산 방법

이전 섹션에서는 크기가 n 인 표본의 표준 오차 한계를 찾는 공식이 제공되었으며, 여기서 standard라는 단어는 신뢰도가 68 % 인 오차 한계임을 나타냅니다.

이는 동일한 크기 n의 샘플을 많이 채취하면 68 %가 평균값을 제공함을 나타냅니다. 범위 안에서 .

68-95-99.7 규칙이라는 간단한 규칙이 있습니다.이 한계는 1⋅ ε, 2이므로 신뢰 수준 68 %, 95 % 및 99.7 %에 대한 샘플링 오류 한계 E를 쉽게 찾을 수 있습니다. ⋅ ε 및 3⋅ ε.

자신감 수준

신뢰 수준 γ가 위의 항목 중 하나가 아닌 경우 샘플링 오류는 표준 편차 σ에 계수 Zγ를 곱한 값이며 다음 절차를 통해 구합니다.

1.- 먼저 유의 수준 α가 결정되며, 이는 다음 관계를 통해 신뢰 수준 γ에서 계산됩니다. α = 1-γ

2.- 그런 다음 1-α / 2 = (1 + γ) / 2 값을 계산해야합니다.이 값은 -∞와 Zγ 사이에 누적 된 정규 주파수에 해당하며, 정규 분포 또는 가우스 분포 유형 F (z)에서 정의됩니다. 그림 2에서 볼 수 있습니다.

3.- 방정식 F (Zγ) = 1-α / 2는 정규 분포 (누적) F 표를 사용하거나 역 가우스 함수 F ^-1 을 갖는 컴퓨터 응용 프로그램을 사용하여 해결 됩니다.

후자의 경우 다음이 있습니다.

Zγ = G ^-1 (1-α / 2).

4.- 마지막으로이 공식은 신뢰도 수준이 γ 인 샘플링 오류에 적용됩니다.

E = Zγ ⋅ (σ / √n)

그림 2. 정규 분포 표. 출처 : Wikimedia Commons.

예

-예 1

100 명의 신생아 표본의 평균 체중에서 표준 오차 한계를 계산합니다. 평균 체중의 계산은 다음과 같습니다.= 3,100kg, 표준 편차 σ = 1,500kg.

해결책

표준 오차 한계는 ε = σ / √n = (1,500kg) / √100 = 0.15kg입니다. 이는 이러한 데이터를 통해 신생아 68 %의 체중이 2,950kg에서 3.25kg 사이임을 추론 할 수 있음을 의미합니다.

-예 2

평균 체중이 3,100kg이고 표준 편차 σ = 1,500kg 인 경우 95 % 신뢰 수준으로 오차 E의 표본 추출 한계와 신생아 100 명의 체중 범위를 결정합니다.

해결책

규칙 68이 적용되는 경우 95; 99.7 → 1⋅ ε; 2⋅ ε; 3⋅ ε, 우리는 :

E = 2⋅ε = 2⋅0.15 kg = 0.30 kg

즉, 신생아의 95 %는 체중이 2,800kg에서 3,400kg 사이입니다.

-예 3

99.7 %의 신뢰 마진으로 실시 예 1에서 신생아의 체중 범위를 결정합니다.

해결책

99.7 % 신뢰도를 갖는 샘플링 오류는 3σ / √n이며,이 예에서는 E = 3 * 0.15 kg = 0.45 kg입니다. 여기에서 신생아의 99.7 %는 2,650kg에서 3,550kg 사이의 체중을 갖게됩니다.

-예제 4

신뢰 수준 75 %에 대한 인자 Zγ를 결정합니다. 예제 1에 제시된 경우에 대해이 신뢰도 수준으로 샘플링 오차 한계를 결정합니다.

해결책

신뢰 수준은 γ = 75 % = 0.75이며 관계 γ = (1-α)를 통해 유의 수준 α와 관련되어 있으므로 유의 수준은 α = 1-0.75 = 0입니다. , 25.

즉, -∞와 Zγ 사이의 누적 정규 확률은 다음과 같습니다.

P (Z ≤ Zγ) = 1-0.125 = 0.875

이는 그림 3에 표시된대로 1.1503의 Zγ 값에 해당합니다.

그림 3. 신뢰 수준 75 %에 해당하는 Zγ 계수의 결정. 출처 : F. Zapata through Geogebra.

즉, 샘플링 오류는 E = Zγ ⋅ (σ / √n) = 1.15 ⋅ (σ / √n)입니다.

예제 1의 데이터에 적용하면 다음과 같은 오류가 발생합니다.

E = 1.15 * 0.15kg = 0.17kg

신뢰 수준이 75 %입니다.

-운동 5

Z _{α / 2} = 2.4 인 경우 신뢰 수준은 얼마입니까?

해결책

P (Z ≤ Z _{α / 2} ) = 1-α / 2

P (Z ≤ 2.4) = 1-α / 2 = 0.9918 → α / 2 = 1-0.9918 = 0.0082 → α = 0.0164

유의 수준은 다음과 같습니다.

α = 0.0164 = 1.64 %

마지막으로 신뢰 수준은 다음과 같습니다.

1- α = 1-0.0164 = 100 %-1.64 % = 98.36 %

참고 문헌

Canavos, G. 1988. 확률 및 통계 : 응용 프로그램 및 방법. McGraw Hill.
Devore, J. 2012. 공학 및 과학에 대한 확률 및 통계. 8 일. 판. Cengage.
Levin, R. 1988. 관리자를위한 통계. 2 위. 판. 프렌 티스 홀.
Sudman, S. 1982. 질문하기 : 설문지 디자인에 대한 실용적인 가이드. 샌프란시스코. 조시베이스.
Walpole, R. 2007. 공학 및 과학을위한 확률 및 통계. 피어슨.
Wonnacott, TH 및 RJ Wonnacott. 1990. 입문 통계. 5 Ed. Wiley
Wikipedia. 샘플링 오류. 출처 : en.wikipedia.com
Wikipedia. 오차 한계. 출처 : en.wikipedia.com

샘플링 오류 : 공식 및 방정식, 계산, 예 - DUDAS - 2026