자유도 통계는 임의의 벡터의 독립적 인 구성 요소의 수입니다. 벡터에 n 개의 성분이 있고 해당 성분과 관련된 p 개의 선형 방정식이있는 경우 자유도는 np입니다.
자유도의 개념은 이론 역학에서도 나타나며, 대략적으로 입자가 이동하는 공간의 크기에서 결합 수를 뺀 값과 동일합니다.

그림 1. 진자는 2 차원으로 움직이지만 반경이 L 인 호를 따라 움직여야하므로 자유도는 1 개뿐입니다. 출처 : F. Zapata.
이 기사에서는 통계에 적용되는 자유도의 개념에 대해 설명하지만 기계적인 예는 기하학적 형태로 시각화하기가 더 쉽습니다.
자유도 유형
적용되는 컨텍스트에 따라 자유도 수를 계산하는 방법은 다를 수 있지만 기본 아이디어는 항상 동일합니다. 총 치수에서 제한 수를 뺀 것입니다.
기계식 케이스
수직 xy 평면 (2 차원)에서 움직이는 줄 (진자)에 연결된 진동 입자를 고려해 보겠습니다. 그러나 입자는 코드의 길이와 같은 반경의 원주에서 강제로 이동합니다.
입자는 해당 곡선에서만 이동할 수 있으므로 자유도의 수는 1입니다. 이것은 그림 1에서 볼 수 있습니다.
자유도 수를 계산하는 방법은 치수 수에서 구속 수를 뺀 차이를 사용하는 것입니다.
자유도 : = 2 (치수)-1 (합자) = 1
결과에 도달 할 수있는 또 다른 설명은 다음과 같습니다.
-우리는 2 차원에서의 위치가 좌표 (x, y)의 점으로 표현된다는 것을 알고 있습니다.
-그러나 점은 변수 x의 주어진 값에 대해 원주 방정식 (x 2 + y 2 = L 2 )을 따라야 하므로 변수 y는 상기 방정식 또는 제한에 의해 결정됩니다.
이런 식으로 변수 중 하나만 독립적이고 시스템은 하나의 자유도를 갖습니다.
임의의 값 집합에서
개념의 의미를 설명하기 위해 벡터가
X = (X 1 , X 2 , …, X의 N )
n 개의 정규 분포 된 랜덤 값의 샘플을 나타냅니다. 이 경우 랜덤 벡터 x 에는 n 개의 독립 성분이 있으므로 x 는 n 개의 자유도를 갖는다 고합니다.
이제 잔차 의 벡터 r 을 생성하겠습니다.
R =는 (X 1 -
어디
그래서 합계
(X 1 -
벡터 r 의 n-1 구성 요소를 알고 있으면 제한 방정식이 알려지지 않은 구성 요소를 결정하기 때문에 잔기 의 벡터 r 요소에서 제한 (또는 결합)을 나타내는 방정식입니다 .
따라서 제한이있는 차원 n 의 벡터 r 은 다음과 같습니다.
∑ (x 나는 -
자유도는 (n-1)입니다.
다시 자유도 계산은 다음과 같습니다.
자유도 : = n (치수)-1 (제약 조건) = n-1
예
분산 및 자유도
분산 s 2 는 n 데이터 표본의 편차 (또는 잔차) 제곱의 평균으로 정의됩니다.
s 2 = ( r • r ) / (n-1)
여기서 r 은 잔차의 벡터입니다. r = (x1-
s 2 = ∑ (x 나는 -
어쨌든 잔차 제곱의 평균을 계산할 때 이전 섹션에서 논의한 바와 같이 벡터 r 의 자유도 수 는 ( n-1).
분산 계산을 위해 (n-1) 대신 n으로 나눈 경우 결과는 50 미만의 n 값에 대해 매우 중요한 편향을 갖게됩니다.
문헌에서 분산 공식은 모집단의 분산과 관련하여 (n-1) 대신 제수 n과 함께 나타납니다.
그러나 벡터 r로 표현되는 잔차의 랜덤 변수 집합 은 차원이 n이지만 자유도는 (n-1)입니다. 그러나 데이터 수가 충분히 크면 (n> 500) 두 수식이 모두 동일한 결과로 수렴됩니다.
계산기와 스프레드 시트는 분산의 두 가지 버전과 표준 편차 (분산의 제곱근)를 제공합니다.
여기에 제시된 분석의 관점에서 볼 때, 편향된 결과를 피하기 위해 분산 또는 표준 편차를 계산해야 할 때마다 항상 (n-1) 버전을 선택하는 것이 좋습니다.
카이 제곱 분포에서
연속 랜덤 변수의 일부 확률 분포는 자유도라는 매개 변수에 따라 달라지며, 이것이 카이 제곱 분포 (χ 2 )의 경우입니다.
이 매개 변수의 이름은이 분포가 적용되는 기본 랜덤 벡터의 자유도에서 정확하게 비롯됩니다.
크기 n의 표본을 가져 오는 g 모집단이 있다고 가정합니다.
X 1 = (x1 1 , x1 2 ,… ..x1 n )
X2 = (x2 1 , x2 2 ,… ..x2 n )
….
X j = (xj 1 , xj 2 ,… ..xj n )
….
Xg = (xg 1 , xg 2 ,… ..xg n )
평균이있는 모집단 j
표준화되거나 정규화 된 변수 zj i 는 다음과 같이 정의됩니다.
ZJ 난 XJ (= I -
벡터 Zj 는 다음과 같이 정의됩니다.
Zj = ( zj 1 , zj 2 ,…, zj i ,…, zj n ) 표준 정규 분포 N (0,1)을 따릅니다.
따라서 변수 :
Q = ((z1 1 ^ 2 + z2 1 ^ 2 +…. + Zg 1 ^ 2),…., (Z1 n ^ 2 + z2 n ^ 2 +…. + Zg n ^ 2))
자유도가 g 인 카이 제곱 분포라고 하는 χ 2 (g) 분포를 따릅니다 .
가설 검정에서 (해결 된 예 포함)
특정 랜덤 데이터 세트를 기반으로 가설을 검정하려면 카이 제곱 검정을 적용하기 위해 자유도 g 수를 알아야합니다.

그림 2. 아이스크림 맛의 선호도와 고객의 성별간에 관계가 있습니까? 출처 : F. Zapata.
예를 들어, 특정 아이스크림 가게에서 남성과 여성의 초콜릿이나 딸기 아이스크림 선호도에 대해 수집 된 데이터를 분석합니다. 남성과 여성이 딸기 또는 초콜릿을 선택하는 빈도는 그림 2에 요약되어 있습니다.
먼저, 행의 합계에 열의 합계를 곱하고 합계 데이터로 나눈 예상 빈도 표를 계산합니다. 결과는 다음 그림에 나와 있습니다.

그림 3. 관찰 된 주파수 (그림 2에서 파란색 값)를 기반으로 한 예상 주파수 계산. 출처 : F. Zapata.
그런 다음 카이 제곱은 다음 공식을 사용하여 (데이터에서) 계산됩니다.
χ 2 = ∑ (F o -F e ) 2 / F e
여기서 F o 는 관찰 된 주파수 (그림 2)이고 F e 는 예상 주파수 (그림 3)입니다. 합계는 모든 행과 열에 적용되며이 예에서는 4 개의 항을 제공합니다.
작업을 수행하면 다음을 얻을 수 있습니다.
χ 2 = 0.2043.
이제 자유도 g에 따라 달라지는 이론적 카이 제곱과 비교할 필요가 있습니다.
우리의 경우이 숫자는 다음과 같이 결정됩니다.
g = (행 수-1) (# 열-1) = (2-1) (2-1) = 1 * 1 = 1.
이 예에서 자유도 g는 1입니다.
유의 수준이 1 % 인 귀무 가설 (H0 : TASTE와 GENDER 사이의 상관 관계 없음)을 확인하거나 기각하려는 경우 이론적 카이-제곱 값은 자유도 g = 1로 계산됩니다.
누적 된 빈도 (1-0.01) = 0.99, 즉 99 %가되는 값을 찾습니다. 이 값 (표에서 얻을 수 있음)은 6,636입니다.
이론적 Chi가 계산 된 값을 초과하면 귀무 가설이 검증됩니다.
즉, 수집 된 데이터에서 변수 TASTE와 GENDER 사이에 관계가 관찰되지 않습니다.
참고 문헌
- Minitab. 자유도는 얼마입니까? 출처 : support.minitab.com.
- 무어, 데이비드. (2009) 기본 적용 통계. Antoni Bosch 편집자.
- 리, 제니퍼. 통계 모델에서 자유도를 계산하는 방법. 출처 : geniolandia.com
- Wikipedia. 자유도 (통계). 출처 : es.wikipedia.com
- Wikipedia. 자유도 (물리적). 출처 : es.wikipedia.com
