브라이틱스(Brightics)에서 분산분석(ANOVA) 실시 이후
Statistics
※ 본 내용은 Load
함수 블럭에서 bike.csv 파일을 불러온 후에 진행한다.
※ bike.csv 다운받기 [클릭]
개요
분산분석(ANOVA)실시 후 귀무가설을 기각하여 대립가설을 채택할 때 어떤 집단간 평균이 유의미하게 다른지 확인할 때 사후검정을 할 수 있다. Tukey’s HSD, Duncan’s MRT, Scheffe’s test 이렇게 세 가지 사후검정이 있는데 여기에서 알아볼 검정은 Tukey 방법이다.
설정
Tukey's Range Test
블럭의 설정 창은 다음과 같다.
Response Columns 에는 종속변수를 지정한다.
Factor Column 에는 독립변수를 지정한다.
결과
다음 결과는 정기권 이용자의 자전거 대여 수 인 registered 변수를 종속변수로 하고 계절 정보인 season 변수를 독립변수로 한 결과이다.
season 이 1인 경우의 registered 값과 season 이 2인 경우의 registered 값의 평균 차이(meandiff)는 66.9509이고 해당 값의 95%신뢰 하한은 56.6141, 95%신뢰 상한은 77.2605이다. 그리고 유의수준 5% 기준으로 귀무가설을 기각(reject == True)하여 두 집단간 평균이 유의하게 차이가 난다는 것을 알 수 있다. 반면 season 이 2인 경우의 registered 값과 season 이 4인 경우의 registered 값은 평균 차이가 2.6029만큼 나며 귀무가설을 기각하지 못하여(reject == False) 두 집단간 평균이 유의하게 차이가 난다고 보기 어렵다고 해석할 수 있다.