- 중요한 고려 사항
- 계층화 된 샘플링이란 무엇입니까?
- 계층화 된 샘플링을 수행하는 프로세스
- 종류
- 비례 계층화 샘플링
- 균일 한 계층화 된 샘플링
- 장점과 단점
- -장점
- 주요 기능 수집
- 더 높은 통계 정밀도
- 더 작은 샘플 크기
- -단점
- 지층 찾기 어려움
- 구성의 복잡성
- 예
- 지층 생성
- 참고 문헌
층화 추출법 또는 층화 층들로 알려진 작은 서브 그룹으로 분할 인구 포함하는 샘플링 방법이다. 차례로 이러한 계층은 소득 또는 교육 수준과 같은 구성원의 공통된 속성 또는 특성을 기반으로 형성됩니다.
모집단의 모든 구성원을 동일한 것으로 취급하고 동일한 확률로 모집단에서 그룹 간의 차이를 강조하는 데 사용됩니다.
출처 : needpix.com
목표는 샘플링 오류를 줄여 샘플의 정밀도를 향상시키는 것입니다. 단순 모집단 표본의 산술 평균보다 변동성이 적은 가중 평균을 생성 할 수 있습니다.
층화는 표본을 추출하기 전에 모집단 구성원을 동종 하위 집합으로 분할하는 과정입니다. 계층을 통해 인구 분포가 정의됩니다.
즉, 집단적으로 완전하고 상호 배타적이어야하므로 단일 계층이 인구의 각 요소에 할당되어야합니다. 그런 다음 체계적이거나 단순한 샘플링이 각 계층 내에서 적용됩니다.
중요한 고려 사항
레이어가 나란히 배치되어서는 안된다는 점에 유의해야합니다. 하위 그룹이 겹치면 일부 사람들은 주제로 선택 될 가능성이 더 커집니다. 이것은 샘플링 프로토 타입으로서 계층화 된 샘플링의 개념을 완전히 둔화시킵니다.
연구자가 다른 지층 내에서 단순 샘플링을 사용해야하는 것도 마찬가지로 중요합니다.
계층화 된 샘플링에 사용되는 가장 일반적인 계층은 연령, 성별, 사회 경제적 지위, 종교, 국적 및 교육 수준입니다.
계층화 된 샘플링이란 무엇입니까?
유사한 특성을 가진 개체 그룹에 대한 분석을 완료 할 때 조사자는 모집단 크기가 너무 커서 조사를 완료 할 수 없음을 발견 할 수 있습니다.
시간과 돈을 절약하기 위해 인구에서 소그룹을 선택하여보다 실현 가능한 관점을 취할 수 있습니다. 이 작은 그룹을 전체 모집단을 나타내는 데 사용되는 모집단의 하위 집합 인 표본 크기라고합니다.
모집단의 샘플은 여러 가지 방법으로 선택할 수 있으며 그중 하나는 계층화 된 샘플링입니다. 여기에는 전체 인구를 지층이라고하는 동종 그룹으로 나누는 작업이 포함됩니다. 그런 다음 각 계층에서 무작위 샘플이 선택됩니다.
계층화 된 샘플링을 수행하는 프로세스
-구성원이 공유하는 속성과 특성에 따라 인구를 하위 그룹 또는 더 작은 계층으로 나눕니다.
-지층의 크기에 비례하는 숫자로 각 지층에서 무작위 표본을 추출합니다.
-무작위 표본을 형성하기 위해 계층의 하위 집합을 그룹화합니다.
-분석을 수행하십시오.
예를 들어, 2018 년 졸업 후 3 개월 이내에 취업 제안을받은 비즈니스 학생의 수를 알고 싶어했던 연구원을 생각해보십시오. 그들은 곧 그해에 거의 20 만 명의 비즈니스 졸업생이 있다는 것을 알게 될 것입니다.
5,000 명의 졸업생을 무작위로 추출하여 설문 조사를 실시 할 수 있습니다. 더 좋은 방법은 모집단을 지층으로 나누고 해당 지층에서 무작위 표본을 추출 할 수 있다는 것입니다.
이렇게하려면 연령, 인종, 국적 또는 직업적 배경을 기반으로 인구 그룹을 만듭니다.
전체 모집단에 대한 지층의 크기에 비례하여 각 지층에서 무작위 표본을 가져옵니다. 이러한 하위 집합은 함께 그룹화되어 샘플을 형성합니다.
종류
비례 계층화 샘플링
이 유형에서 각 계층의 표본 크기는 전체 모집단과 비교할 때 계층의 모집단 크기에 비례합니다. 이는 각 계층의 샘플링 속도가 동일 함을 의미합니다.
계층을 정의하기 위해 개인의 특성을 선택하면 결과 하위 그룹의 크기가 다른 경우가 많습니다.
예를 들어, 우리는 흡연하는 멕시코 인구의 비율을 연구하고자하는데, 흡연 습관은 연령에 따라 크게 다를 수 있다고 믿기 때문에 연령이 계층화에 좋은 기준이 될 것으로 결정되었습니다. 세 가지 계층이 정의됩니다.
-20 세 미만.
-20 ~ 44 세
-44 세 이상.
멕시코의 인구가이 세 계층으로 나뉘어지면 세 그룹의 크기가 같을 것으로 예상되지 않습니다. 실제로 실제 데이터는 다음을 확인합니다.
-Stratum 1 : 4240 만 (41.0 %).
-Stratum 2 : 3,760 만 (36.3 %).
-Stratum 3 : 2,350 만 (22.7 %).
비례 계층화 된 표본 추출을 사용하는 경우 표본은 모집단과 동일한 비율을 유지하는 계층으로 구성되어야합니다. 1,000 명의 개인 표본을 만들려면 표본 크기가 다음과 같아야합니다.
인구 내 지층의 상대적 비율에 따라 결정되는 더 작은 인구를 모으는 것과 매우 유사합니다.
균일 한 계층화 된 샘플링
이 유형에서는 모집단 내 계층의 가중치에 관계없이 정의 된 모든 계층에 동일한 표본 크기가 할당됩니다.
이전 예제를 사용하는 균일 한 계층화 된 샘플링은 각 계층에 대해 다음 샘플을 생성합니다.
이 방법은 더 관련성이 높은 계층과 동일한 수준의 중요도를 부여하여 모집단에서 가중치가 적은 계층에 유리합니다.
이것은 샘플의 전반적인 효과를 감소 시키지만 각 계층의 개별 특성을 더 정확하게 연구 할 수 있도록합니다.
이 예에서 계층 3 (44 이상)의 모집단에 대한 구체적인 설명을 작성하려는 경우 다음에서 얻은 227 단위 표본 대신 333 단위 표본을 사용하여 표본 추출 오류를 줄일 수 있습니다. 비례 계층화 샘플링.
장점과 단점
계층화 된 샘플링은 다양한 속성을 가진 모집단에 적합하지만 하위 그룹을 형성 할 수없는 경우 효과적이지 않습니다.
-장점
주요 기능 수집
계층화 된 샘플링의 주요 이점은 샘플에서 모집단의 주요 특성을 수집한다는 것입니다.
가중 평균과 마찬가지로이 샘플링 방법은 전체 모집단에 비례하는 표본의 특성을 생성합니다.
더 높은 통계 정밀도
계층화는 단순 샘플링 방법보다 추정에 오류가 적습니다. 계층 간의 차이가 클수록 정밀도가 더 커집니다.
단순 샘플링과 비교할 때 더 높은 통계적 정밀도가 있습니다. 이는 전체 모집단에서 발생하는 변동과 비교할 때 부분 군 내 변동성이 낮기 때문입니다.
더 작은 샘플 크기
이 기술은 통계 정확도가 높기 때문에 더 작은 샘플 크기가 필요하므로 연구자들의 많은 노력, 비용 및 시간을 절약 할 수 있습니다.
-단점
안타깝게도이 연구 방법은 모든 연구에서 사용할 수 없습니다. 이 방법의 단점은 올바르게 사용하려면 여러 조건을 충족해야한다는 것입니다.
지층 찾기 어려움
가장 큰 단점은 연구에 적합한 계층을 식별하는 것이 어려울 수 있다는 것입니다. 또한 전체 모집단의 완전하고 명확한 목록을 찾는 것은 어려울 수 있습니다.
구성의 복잡성
두 번째 단점은 단순 샘플링에 비해 결과를 구성하고 분석하는 것이 더 복잡하다는 것입니다.
연구원은 연구 모집단의 각 구성원을 식별하고이를 하나의 하위 모집단으로 만 분류해야합니다. 결과적으로 계층화 된 샘플링은 연구자가 모집단의 각 구성원을 자신있게 하위 그룹으로 분류 할 수없는 경우 불리합니다.
여러 하위 그룹에 속하는 주제가있는 경우 병치가 문제가 될 수 있습니다. 단순 샘플링을 수행 할 때 여러 하위 그룹에있는 항목이 선택 될 가능성이 더 높습니다. 결과는 인구에 대한 잘못된 표현 또는 부정확 한 반영 일 수 있습니다.
대학생, 졸업생, 남성 및 여성과 같은 예는 명확하게 정의 된 그룹이므로 쉽게 만들 수 있습니다.
그러나 다른 상황에서는 훨씬 더 어려울 수 있습니다. 인종, 민족 또는 종교와 같은 특징을 통합하는 것을 상상할 수 있습니다. 분류 프로세스가 더 어려워 져 계층화 된 샘플링이 비효율적 인 방법이됩니다.
예
연구팀이 미국 대학생의 평균 학점을 결정하려고한다고 가정 해 보겠습니다.
연구팀은 2 천 1 백만 대학생들로부터이 데이터를 수집하는 데 명백한 어려움을 겪고 있습니다. 따라서 4,000 명의 학생 만 사용하여 모집단에서 표본을 추출하기로 결정했습니다.
팀은 샘플 참가자의 다양한 특성을 살펴보고 평균 학점과 학생의 전문화 사이에 차이가 있는지 궁금합니다.
샘플에서 560 명의 학생이 영어 학생, 1,135 명의 과학, 800 명의 컴퓨터 과학, 1,090 명의 공학 및 415 명의 수학이 발견되었습니다.
팀은 표본 계층이 모집단 표본에 비례하는 비례 계층화 된 표본 추출을 사용하려고합니다.
지층 생성
이를 위해 팀은 미국 대학생의 통계를 조사하고 영어 12 %, 과학 28 %, 컴퓨터 과학 24 %, 공학 21 %, 15 %를 전문으로하는 학생들의 공식 비율을 찾습니다. 수학에서.
따라서 계층화 된 샘플링 프로세스에서 5 개의 계층이 생성됩니다. 팀은 모집단 계층이 표본 계층에 비례하는지 확인해야합니다. 그러나 그는 비율이 같지 않다는 것을 발견했습니다.
따라서 팀은 4,000 명의 학생 모집단을 다시 샘플링해야하지만 이번에는 영어 학습자 480 명 (12 %), 과학 1,120 명 (28 %), 컴퓨터 과학 960 명 (24 %), 840 명 ( 21 %) 공학과 600 (15 %) 수학.
이를 통해 우리는 미국의 대학생을 더 잘 표현할 수있는 비례 계층화 된 대학생 표본을 보유하고 있습니다.
연구원은 특정 계층을 강조하고, 미국 대학생의 다양한 연구를 관찰하고, 다른 학점 평균을 관찰 할 수 있습니다.
참고 문헌
- 아담 헤이즈 (2019). 계층화 된 랜덤 샘플링. 출처 : investopedia.com.
- 무료 백과 사전, Wikipedia (2019). 층화 샘플링. 출처 : en.wikipedia.org.
- 익스플로러 블 (2019). 계층화 된 샘플링 방법. 출처 : explorable.com.
- Survey Gizmo (2019). 계층화 된 샘플링이란 무엇이며 언제 사용됩니까? 출처 : surveygizmo.com.
- Ashley Crossman (2019). 층화 된 샘플 이해 및 제조 방법. Thought Co. 출처 : thoughtco.com.
- 카를로스 오초아 (2017). 무작위 샘플링 : 계층화 된 샘플링. 출처 : netquest.com.