그룹화 된 데이터의 중앙 경향 대책 등 그들 중에서도 수집 된 데이터의 평균이 무엇인지, 근접한다 가치 것과 공급 된 데이터, 그룹의 특정 동작을 설명하는 통계가 사용된다.
많은 양의 데이터를 수집 할 때 더 나은 순서를 갖도록 그룹화하여 특정 중심 경향 측정을 계산할 수있는 것이 유용합니다.

중심 경향의 가장 널리 사용되는 척도 중에는 산술 평균, 중앙값 및 모드가 있습니다. 이 숫자는 특정 실험에서 수집 된 데이터에 대한 특정 특성을 나타냅니다.
이러한 측정 값을 사용하려면 먼저 데이터 세트를 그룹화하는 방법을 알아야합니다.
그룹화 된 데이터
데이터를 그룹화하려면 먼저 데이터의 가장 높은 값에서 가장 낮은 값을 뺀 데이터 범위를 계산해야합니다.
그런 다음 데이터를 그룹화하려는 클래스 수인 숫자 "k"가 선택됩니다.
범위는 그룹화 할 클래스의 진폭을 얻기 위해 "k"로 나뉩니다. 이 숫자는 C = R / k입니다.
마지막으로 그룹화가 시작되어 얻은 데이터의 가장 낮은 값보다 작은 숫자가 선택됩니다.
이 숫자는 일등석의 하한이 될 것입니다. 여기에 C가 추가됩니다. 얻은 값은 첫 번째 클래스의 상한이 될 것입니다.
그런 다음이 값에 C를 더하여 두 번째 클래스의 상한값을 얻습니다. 이런 식으로 우리는 마지막 클래스의 상한을 얻기 위해 진행합니다.
데이터를 그룹화 한 후 평균, 중앙값 및 최빈값을 계산할 수 있습니다.
산술 평균, 중앙값 및 최빈값이 계산되는 방법을 설명하기 위해 예제를 진행합니다.
예

따라서 데이터를 그룹화하면 다음과 같은 테이블이 생성됩니다.

중심 경향의 3 가지 주요 척도
이제 산술 평균, 중앙값 및 최빈값을 계산할 것입니다. 위의 예는이 절차를 설명하는 데 사용됩니다.
1- 산술 평균
산술 평균은 각 주파수에 간격의 평균을 곱하는 것으로 구성됩니다. 그런 다음 이러한 모든 결과가 추가되고 마지막으로 총 데이터로 나뉩니다.
앞의 예를 사용하면 산술 평균이 다음과 같음을 얻을 수 있습니다.
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5.11111
이는 표에있는 데이터의 평균값이 5.11111임을 나타냅니다.
2- 미디엄
데이터 세트의 중앙값을 계산하기 위해 먼저 모든 데이터를 최소에서 최대로 정렬합니다. 두 가지 경우가 발생할 수 있습니다.
-데이터의 개수가 홀수이면 중앙값은 중앙에있는 데이터입니다.
-데이터 수가 짝수이면 중앙값은 중앙에있는 두 데이터의 평균입니다.
그룹화 된 데이터의 경우 중앙값 계산은 다음과 같이 수행됩니다.
-N / 2가 계산됩니다. 여기서 N은 전체 데이터입니다.
-누적 주파수 (주파수의 합)가 N / 2보다 큰 첫 번째 구간을 검색하고이 구간의 하한을 Li라고합니다.
중앙값은 다음 공식으로 제공됩니다.
Me = Li + (Ls-Li) * (N / 2-Li 이전에 누적 된 주파수) / [Li, Ls)의 주파수
Ls는 위에서 언급 한 간격의 상한입니다.
이전 데이터 테이블을 사용하는 경우 N / 2 = 18/2 = 9입니다. 누적 된 주파수는 4, 8, 14 및 18입니다 (테이블의 각 행에 대해 하나씩).
따라서 누적 빈도가 N / 2 = 9보다 크므로 세 번째 간격을 선택해야합니다.
따라서 Li = 5 및 Ls = 7입니다. 위에서 설명한 공식을 적용하려면 다음을 수행해야합니다.
나 = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5.3333.
3- 패션
모드는 그룹화 된 모든 데이터 중에서 가장 높은 빈도를 갖는 값입니다. 즉, 초기 데이터 세트에서 가장 많이 반복되는 값입니다.
매우 많은 양의 데이터가있는 경우 다음 공식을 사용하여 그룹화 된 데이터의 최빈값을 계산합니다.
Mo = Li + (Ls-Li) * (Li의 주파수-L의 주파수 (i-1)) / ((Li의 주파수-L의 주파수 (i-1)) + (Li의 주파수-L의 주파수 ( 나는 + 1)))
간격 [Li, Ls)은 가장 높은 주파수가 발견되는 간격입니다. 이 기사에서 만든 예의 경우 모드는 다음과 같이 지정됩니다.
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
모드에 대한 근사값을 얻는 데 사용되는 또 다른 공식은 다음과 같습니다.
Mo = Li + (Ls-Li) * (주파수 L (i + 1)) / (주파수 L (i-1) + 주파수 L (i + 1)).
이 공식을 사용하면 계정은 다음과 같습니다.
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
참고 문헌
- Bellhouse, DR (2011). Abraham De Moivre : 고전적 확률과 그 적용을위한 무대 설정. CRC Press.
- Cifuentes, JF (2002). 확률 이론 소개. 콜롬비아 국립 대학교.
- Daston, L. (1995). 계몽주의의 고전적 확률. 프린스턴 대학 출판부.
- Larson, HJ (1978). 확률 이론 및 통계적 추론을 소개합니다. 편집 Limusa.
- Martel, PJ 및 Vegas, FJ (1996). 확률 및 수학적 통계 : 임상 실습 및 건강 관리에 적용. Díaz de Santos 에디션.
- Vázquez, AL 및 Ortiz, FJ (2005). 변동성을 측정, 설명 및 제어하는 통계적 방법. Ed. 칸타 브리아 대학교.
- 바스케스, SG (2009). 대학 접근을위한 수학 매뉴얼. 편집 Centro de Estudios Ramon Areces SA.
