Tukey에 검사 목적이 다른 처리를 실시 여러 샘플의 분산 분석에서 개별 수단을 비교하는 방식이다.
1949 년 John.W. Tukey를 사용하면 얻은 결과가 크게 다른지 여부를 식별 할 수 있습니다. Tukey의 정직 유의 차 검정 (Tukey의 HSD 검정)이라고도합니다.
그림 1. Tukey 테스트를 통해 동일한 특성을 가진 세 개 이상의 그룹에 적용된 세 개 이상의 서로 다른 처리 간의 결과 차이가 유의하고 정직하게 평균 값이 다른지 여부를 식별 할 수 있습니다.
동일한 수의 샘플에 적용되는 3 가지 이상의 다른 처리를 비교하는 실험에서는 결과가 현저하게 다른지 여부를 식별 할 필요가 있습니다.
모든 통계 샘플의 크기가 각 처리에 대해 동일 할 때 실험이 균형을 이룬다 고합니다. 각 처리마다 샘플의 크기가 다른 경우 불균형 실험을합니다.
때로는 분산 분석 (ANOVA)으로는 여러 샘플에 적용된 여러 처리 (또는 실험)를 비교하여 귀무 가설 (Ho : "모든 처리가 동일 함")을 충족하는지 또는 반대로, 대립 가설을 충족합니다 (Ha : "적어도 하나의 치료법이 다릅니다").
Tukey의 검정은 고유하지 않으며 표본 평균을 비교하는 검정이 더 많이 있지만 가장 잘 알려져 있고 적용되는 검정 중 하나입니다.
Tukey 비교기 및 테이블
이 테스트를 적용 할 때 Tukey 비교기라는 값 w가 계산되며 정의는 다음과 같습니다.
w = q √ (MSE / r)
요인 q가 다른 수의 처리 또는 실험에 대한 q 값의 행으로 구성된 테이블 (Tukey 's Table)에서 얻은 경우. 열은 다양한 자유도에 대한 요인 q의 값을 나타냅니다. 일반적으로 사용 가능한 테이블은 0.05와 0.01의 상대적 중요성을 갖습니다.
이 공식에서 제곱근 안에는 반복 횟수를 나타내는 r로 나눈 MSE 계수 (평균 오차 제곱)가 나타납니다. MSE는 일반적으로 분산 분석 (ANOVA)에서 얻은 숫자입니다.
두 평균값의 차이가 w (Tukey comparator) 값을 초과하면 서로 다른 평균이라고 결론 지지만 차이가 Tukey 수보다 작 으면 통계적으로 동일한 평균값을 가진 두 샘플입니다. .
숫자 w는 HSD (Honestly Significant Difference) 숫자라고도합니다.
이 단일 비교 번호는 각 처리의 테스트에 적용되는 샘플 수가 각 처리에서 동일한 경우 적용될 수 있습니다.
불균형 실험
어떤 이유로 비교 될 각 처리에서 샘플의 크기가 다른 경우 위에서 설명한 절차가 약간 다르며 Tukey-Kramer 테스트라고합니다.
이제 비교기 번호 w가 각 처리 i, j 쌍에 대해 얻어집니다.
w (i, j) = q √ (½ MSE / (ri + rj))
이 공식에서 계수 q는 Tukey의 표에서 얻습니다. 이 계수 q는 처리 횟수와 오류의 자유도에 따라 다릅니다. r i 는 치료 i의 반복 횟수이고 r j 는 치료 j의 반복 횟수입니다.
사례 사례
토끼 육종가는 토끼 비육 식품의 네 가지 브랜드 중 가장 효과적인 것을 알려주는 신뢰할 수있는 통계 연구를 수행하려고합니다. 연구를 위해 그는 1 개월 반 된 6 마리의 토끼로 4 개의 그룹을 구성했으며 그때까지 같은 먹이 조건을 가졌다.
그 이유는 그룹 A1과 A4에서는 토끼 중 한 마리가 곤충에 물 렸고 다른 경우에는 사망이 아마도 선천적 결함의 원인 이었기 때문에 음식에 기인하지 않은 원인으로 인해 사망했기 때문입니다. 따라서 그룹이 불균형 한 다음 Tukey-Kramer 테스트를 적용해야합니다.
운동이 해결됨
계산이 너무 길어지지 않도록 균형 잡힌 실험 사례가 해결 된 연습으로 간주됩니다. 다음은 데이터로 간주됩니다.
이 경우 네 가지 다른 치료법에 해당하는 네 그룹이 있습니다. 그러나 우리는 모든 그룹이 동일한 수의 데이터를 가지고 있으므로 균형 잡힌 사례입니다.
ANOVA 분석을 수행하기 위해 Libreoffice 스프레드 시트에 통합 된 도구가 사용되었습니다. Excel과 같은 다른 스프레드 시트에는 데이터 분석을 위해이 도구가 통합되어 있습니다. 다음은 분산 분석 (ANOVA)을 수행 한 후 생성 된 요약 테이블입니다.
분산 분석에서 P 값도 얻습니다. 예에서는 유의 수준 0.05보다 훨씬 낮은 2.24E-6으로 귀무 가설을 기각합니다. 모든 처리가 동일합니다.
즉, 치료 중 일부는 평균값이 다르지만 Tukey 검정을 사용하여 통계적 관점에서 유의하고 정직하게 다른 (HSD)이 무엇인지 알아야합니다.
Wo를 찾으려면 HSD 번호도 알려져 있으므로 오류 MSE의 평균 제곱을 찾아야합니다. ANOVA 분석에서 그룹 내의 제곱합은 SS = 0.2입니다. 그룹 내 자유도의 수는 df = 16이며 다음 데이터를 사용하여 MSE를 찾을 수 있습니다.
MSE = SS / df = 0.2 / 16 = 0.0125
또한 표를 사용하여 Tukey의 인수 q를 찾아야합니다. ANOVA 분석은 그룹 내에서 16 개의 자유도를 산출했기 때문에 비교할 4 개의 그룹 또는 처리에 해당하는 4 열과 16 행이 검색됩니다. 이로 인해 q의 값은 다음과 같습니다. q = 4.33은 0.05의 유의성 또는 95 %의 신뢰도에 해당합니다. 마지막으로 "정직하게 유의미한 차이"에 대한 값이 발견되었습니다.
w = HSD = q √ (MSE / r) = 4.33 √ (0.0125 / 5) = 0.2165
정직하게 다른 그룹이나 치료가 무엇인지 알려면 각 치료의 평균 값을 알아야합니다.
또한 다음 표에 표시된 치료 쌍의 평균 값 간의 차이를 알아야합니다.
결과 극대화 측면에서 가장 좋은 치료법은 통계적 관점과 무관 한 T1 또는 T3이라고 결론 지었다. T1과 T3 중에서 선택하려면 여기에 제시된 분석 이외의 다른 요소를 찾아야합니다. 예 : 가격, 가용성 등
참고 문헌
- Cochran William과 Cox Gertrude. 1974. 실험적인 디자인. 타작. 멕시코. 세 번째 재판. 661p.
- Snedecor, GW 및 Cochran, WG 1980. 통계 방법. Seventh Ed. Iowa, The Iowa State University Press. 507p.
- Steel, RGD 및 Torrie, JH 1980. 통계의 원리 및 절차 : 생체 인식 접근 (2nd Ed.). McGraw-Hill, 뉴욕. 629p.
- Tukey, JW 1949. 분산 분석에서 개별 평균 비교. 생체 인식, 5 : 99-114.
- Wikipedia. Tukey의 테스트. 출처 : en.wikipedia.com