할당량 샘플링 : 방법, 장점, 단점, 예 - DUDAS

할당량 샘플링 비이고 - 쿼터를 할당하는 샘플 계층에서 데이터를 취할 확률 방법. 할당량은 전체 모집단에 대해이 계층이 나타내는 비율에 비례해야하며 할당량의 합은 표본 크기와 같아야합니다.

연구원은 어떤 그룹이나 계층이 될 것인지 결정하는 사람입니다. 예를 들어, 그는 인구를 남성과 여성으로 나눌 수 있습니다. 계층의 또 다른 예는 연령대 (예 : 18 ~ 25 세, 26 ~ 40 세, 40 세 이상)이며, 연령대는 젊음, 노인, 노인으로 분류 할 수 있습니다.

그림 1. 샘플링 할당량은 전체 인구의 차이에 따라 분류됩니다. 출처 : Pixabay.

전체 인구 중 각 계층을 나타내는 비율을 미리 아는 것이 매우 편리합니다. 그런 다음 통계적으로 유의 한 표본 크기가 선택되고 전체 모집단에 대한 각 계층의 백분율에 비례 할당량이 할당됩니다. 계층 당 할당량의 합계는 샘플의 총 크기와 같아야합니다.

마지막으로 각 계층에 할당 된 할당량 데이터를 가져와 할당량을 완료하는 첫 번째 요소를 선택합니다.

이 샘플링 방법이 확률 적이 지 않은 것으로 간주되는 것은 요소를 선택하는 이러한 비 무작위적인 방법 때문입니다.

할당량별로 샘플링하는 단계

1 단계

전체 인구를 몇 가지 공통된 특징을 가진 계층 또는 그룹으로 분할합니다. 이 특성은 연구를 수행하는 통계 연구자가 미리 결정합니다.

2 단계

이전 단계에서 선택한 각 계층 또는 그룹을 나타내는 전체 인구 비율을 결정합니다.

3 단계

통계 과학의 기준 및 방법론에 따라 통계적으로 유의 한 표본 크기를 추정합니다.

4 단계

각 계층에 대한 요소 또는 할당량의 수를 계산하여 각 계층이 전체 모집단 및 표본의 전체 크기에 대해 나타내는 백분율에 비례하도록합니다.

5 단계

각 계층에 해당하는 할당량을 완료 할 때까지 각 계층의 요소 데이터를 가져옵니다.

실제 사례

도시의 지하철 서비스에 대한 만족도를 알고 싶다고 가정 해 보겠습니다. 2000 명의 인구를 대상으로 한 이전 연구에 따르면 사용자의 50 %는 16 ~ 21 세, 40 %는 21 ~ 55 세의 성인, 10 %만이 55 세 이상입니다.

이 연구의 결과를 활용하여 사용자의 연령에 따라 세분화되거나 계층화됩니다.

-청년 : 50 %

-성인 : 40 %

-노인 : 10 %

예산이 제한되어 있으므로 작지만 통계적으로 유의미한 표본에 연구를 적용해야합니다. 200 명의 표본 크기를 선택하여 총 200 명에게 만족도 조사를 적용합니다.

이제 각 세그먼트 또는 계층에 대한 설문 조사의 할당량 또는 수를 결정해야합니다. 이는 표본의 크기와 계층 당 백분율에 비례해야합니다.

계층 당 할당량

계층 당 조사 수에 대한 할당량은 다음과 같습니다.

청소년 : 200 * 50 % = 200 * (50/100) = 100 개의 설문 조사

성인 : 200 * 40 % = 200 * (40/100) = 80 개 설문 조사

노인 : 200 * 10 % = 200 * (10/100) = 설문 조사 20 개

그림 2. 연령층에 따른 200 명 표본의 할당량. 출처 : F. Zapata.

수수료의 합계는 샘플 크기, 즉 적용될 총 설문 조사 수와 같아야합니다. 그런 다음 각 계층에 대한 할당량이 충족 될 때까지 설문 조사가 통과됩니다.

이전 데이터에 따르면 소수 계층이 연구에서 제외 될 가능성이 매우 높기 때문에이 방법이 모든 설문 조사를 수행하여 나타나는 첫 200 명에게 전달하는 것보다 훨씬 낫다는 점에 유의하는 것이 중요합니다.

적용 가능성, 장점 및 단점

적용 할 수있는 방법을 위해서는 연구 목적에 따라 계층 형성에 대한 기준이 필요합니다.

할당량 샘플링은 계층 또는 세그먼트에 따라 특정 캠페인을 지시하기 위해 섹터 별 선호도, 차이점 또는 특성을 알고 싶을 때 적합합니다.

그것의 사용은 또한 어떤 이유로 소수 집단의 특성이나 관심사를 아는 것이 흥미 롭거나 연구에서 제외하고 싶지 않을 때 유용합니다.

적용하려면 전체 인구에 대해 각 계층의 가중치 또는 중요성을 알고 있어야합니다. 이 지식이 신뢰할 수있는 것이 매우 중요합니다. 그렇지 않으면 잘못된 결과가 얻어집니다.

이점

-일반적으로 계층 당 비용이 적기 때문에 학습 시간을 단축합니다.

-데이터 분석을 단순화합니다.

-연구가 전체 모집단의 작지만 잘 대표되는 표본에 적용되므로 비용을 최소화합니다.

단점

-지층이 선험적으로 정의됨에 따라 인구의 특정 부문이 연구에서 제외 될 수 있습니다.

-제한된 수의 지층을 설정함으로써 연구에서 세부 사항이 손실 될 수 있습니다.

-일부 계층을 제거하거나 다른 계층의 일부로 통합함으로써 연구에서 잘못된 결론을 도출 할 수 있습니다.

-최대 샘플링 오차를 추정 할 수 없습니다.

간단한 적용 예

우리는 2000 명의 인구에서 불안 수준에 대한 통계적 연구를하고 싶습니다.

연구를 지휘하는 연구원은 연령과 성별에 따라 결과의 차이를 찾아야한다고 직감했다. 이러한 이유로 그는 First_Age, Second_Age 및 Third_Age로 표시된 세 가지 연령층을 형성하기로 결정합니다. 성별 구분과 관련하여 남성과 여성의 두 가지 일반적인 유형이 정의됩니다.

First_Age는 18 ~ 25 세, Second_Age는 26 ~ 50 세, 마지막으로 Third_Age는 50 ~ 80 세입니다.

전체 인구의 데이터를 분석하려면 다음이 필요합니다.

인구의 45 %가 First_Age에 속합니다.

40 %는 Second_Age에 있습니다.

마지막으로 연구 모집단의 15 %만이 제 3 시대에 속합니다.

여기에 자세히 설명되어 있지 않은 적절한 방법론을 사용하여 300 명의 표본이 통계적으로 유의 한 것으로 결정됩니다.

연령별 할당량 결정

다음 단계는 연령 세그먼트에 해당하는 할당량을 찾는 것입니다. 다음과 같이 수행됩니다.

First_Age : 300 * 45 % = 300 * 45/100 = 135

Second_Age : 300 * 40 % = 300 * 40/100 = 120

Third_Age : 300 * 15 % = 300 * 15/100 = 45

할당량의 합계가 샘플의 총 크기를 제공한다는 것이 확인되었습니다.

연령 및 성별에 따른 할당량 결정

지금까지 인구의 성별 세그먼트는 고려되지 않았으며이 세그먼트에 대해 이미 여성과 남성의 두 계층이 정의되어 있습니다. 다시 한 번 전체 모집단의 데이터를 분석해야 다음 정보가 생성됩니다.

전체 인구의 -60 %가 여성입니다.

-한편, 연구 대상 인구의 40 %는 남성에 속합니다.

성별에 따른 인구 분포에 관한 이전 비율은 연령을 고려하지 않는다는 점에 유의하는 것이 중요합니다.

더 이상 정보를 사용할 수 없다는 점을 감안할 때, 이러한 성별 비율이이 연구를 위해 정의 된 3 개 연령층에 균등하게 분포되어 있다고 가정합니다. 이러한 고려 사항을 고려하여 이제 연령 및 성별별로 할당량을 설정합니다. 이는 이제 6 개의 하위 계층이 있음을 의미합니다.

S1 = First_Age 및 여성 : 135 * 60 % = 135 * 60/100 = 81

S2 = First_Age 및 남성 : 135 * 40 % = 135 * 40/100 = 54

S3 = Second_Age 및 여성 : 120 * 60 % = 120 * 60/100 = 72

S4 = Second_Age 및 남성 : 120 * 40 % = 120 * 40/100 = 48

S5 = Third_Age 및 여성 : 45 * 60 % = 45 * 60/100 = 27

S6 = Third_Age 및 남성 : 45 * 40 % = 45 * 40/100 = 18

설문 조사 적용 및 결과 연구

6 개 세그먼트와 해당 할당량이 설정되면 이미 계산 된 할당량에 따라 적용될 300 개의 설문 조사가 준비됩니다.

설문 조사는 다음과 같이 적용되며 81 개의 설문 조사에 참여하고 S1 부문의 선착순 81 명을 인터뷰합니다. 그런 다음 나머지 5 개 세그먼트에 대해서도 동일한 방식으로 수행됩니다.

연구 순서는 다음과 같습니다.

-설문 조사 결과를 분석하여 세그먼트별로 결과를 분석합니다.

-세그먼트별로 결과를 비교합니다.

-마지막으로 이러한 결과의 원인을 설명하는 가설을 개발하십시오.

계층화 된 무작위 샘플링과의 차이

할당량 샘플링을 적용하는 예에서 가장 먼저 할 일은 할당량을 설정 한 다음 연구를 수행하는 것입니다. 물론 이러한 할당량은 전체 인구에 대한 이전 통계 정보를 기반으로했기 때문에 전혀 변덕스럽지 않습니다.

연구 모집단에 대한 사전 정보가없는 경우 절차를 반대로하는 것이 좋습니다. 즉, 먼저 표본 크기를 정의하고 표본 크기가 설정되면 다음에서 설문 조사를 적용하는 것이 좋습니다. 무작위로.

무작위성을 보장하는 한 가지 방법은 무작위 번호 생성기를 사용하고 직원 번호가 무작위 생성기와 일치하는 직원을 조사하는 것입니다.

데이터를 사용할 수 있고 연구의 목적이 연령 및 성별 계층에 따라 불안 수준을 확인하는 것이므로 이전에 정의한 6 개 범주에 따라 데이터를 분리합니다. 그러나 사전 비용을 설정하지 않고.

이러한 이유로 계층화 된 무작위 샘플링 방법이 확률 적 방법으로 간주됩니다. 이전에 설정된 할당량에 의한 샘플링은 그렇지 않습니다.

그러나 인구 통계에 근거한 정보로 쿼터를 설정한다면 쿼터 샘플링 방법은 대략 확률 적이라고 할 수있다.

제안 된 운동

다음 연습이 제안됩니다.

중등 학교에서 과학 공부와 인문학 공부 사이의 선호도에 대한 설문 조사를하고 싶습니다.

학업 연도에 따라 학교에 총 1000 명의 학생이 5 단계로 분류되어 있다고 가정합니다. 1 학년 350 명, 2 학년 300 명, 3 학년 200 명, 4 학년 100 명, 5 학년 50 명으로 알려졌다. 또한 학교 학생의 55 %가 남학생이고 45 %가 여학생 인 것으로 알려져 있습니다.

연구 연도 및 성별 세그먼트에 따라 적용 할 설문 조사 수를 알기 위해 계층 별 계층 및 할당량을 결정합니다. 또한 표본이 전체 학생 인구의 10 %라고 가정합니다.

참고 문헌

Berenson, M. 1985. 관리 및 경제학, 개념 및 응용을위한 통계. 편집 Interamericana.
통계. 할당량 샘플링. 출처 : encyclopediaeconomica.com.
통계. 견본 추출. 출처 : Estadistica.mat.uson.mx.
탐색 가능. 할당량 샘플링. 출처 : explorable.com.
Moore, D. 2005. 응용 기본 통계. 2 위. 판.
넷 퀘스트. 확률 샘플링 : 계층화 된 샘플링. 출처 : netquest.com.
Wikipedia. 통계적 샘플링. 출처 : en.wikipedia.org

할당량 샘플링 : 방법, 장점, 단점, 예 - DUDAS - 2026