R에서 다중 집단의 등분산 검정이 가능한 Bartlett 검정을 알아본다.
개요
등분산 검정중 하나인 Bartlett 검정은 집단간 분산이 같은지 다른지 여부를 알아볼 때 사용하기도 하고 독립 2표본 t-검정 또는 일원분산분석(one-way ANOVA) 실시 전에 가정 때문에 확인하는 용도로 사용하기도 한다. 그리고 Bartlett 검정은 두 집단 뿐만 아니라 세 집단 이상에서도 사용할 수 있으며 표본이 정규성을 보일때만 사용할 수 있다.
검정 통계량 계산
- 검정통계량: $s^{2}_{i}$는 i번째 집단의 분산, $N$은 총 표본 크기, $n_{i}$는 i번째 집단의 표본 크기, $k$는 집단의 수, $s^{2}_{p}$는 합동 분산(pooled variance)이다.$$ T = \frac{(N-k)\ln{s^{2}_{p}} - \sum_{i=1}^{k} (N_{i} - 1) \ln{s^{2}_{i}}}{1 + (1/(3(k-1)))((\sum_{i=1}^{k}{1/(N_{i} - 1))} - 1/(N-k))} $$
참고로 $s^{2}_{p}$으로 표기된 합동 분산(pooled variance)은 다음과 같이 정의된다.
$$
s^{2}_{p} = \sum_{i=1}^{k}\frac{(N_{i} - 1)}{(N-k)}s^{2}_{i}
$$
가설
- 귀무가설($H_0$): 집단간 분산이 같다.
- 대립가설($H_1$): 적어도 두 집단간 분산이 다르다.