Br) 통계 - 이원 분산분석

Br) 통계 - 이원 분산분석

브라이틱스(Brightics)에서 2개 이상의 요인간 평균 차이를 알아보는 이원 분산분석(Two-way ANOVA)를 실시할 수 있는 Two Way ANOVA를 알아본다.


Statistics

※ 본 내용은 Load 함수 블럭에서 bike.csv 파일을 불러온 후에 진행한다.
bike.csv 다운받기 [클릭]
사전 준비


개요

이원 분산분석(Two-way ANOVA)은 두 독립변수간의 상호작용 효과의 통계적 유의미성을 검증하기 위한 방법이며 이원 분산분석을 실시하기 위해서는 집단간 비교를 위해서 (연속형)종속변수 1개, (범주형)독립변수 2개가 필요. 일원 분산분석과 비교했을 때 이원 분산분석은 독립변수가 2개이기 때문에 각 요인(변수)간 교호작용 효과(interaction effect)를 확인할 수 있다.


이론

일원 분산분석은 한 독립변수(처치변수)가 종속변수(결과변수)에 영향을 미치는 것이었다면, 이원 분산분석은 한 독립변수가 다른 독립변수의 수준에 따라 영향을 얼마나 미치는지 알아보는 분석 방법이다. 그래서 각각의 독립변수와 종속변수의 관계도 확인하지만 독립변수간 교호작용 효과(interaction effect)가 있는지 알아본다.

가정

독립성: 각 독립변수 집단은 상호 독립이다.
정규성: 종속변수의 모집단 분포가 정규분포여야 한다.
등분산성: 독립변수에 따른 종속변수 각 집단의 모분산(population variance)이 서로 같아야 한다.

정규성을 만족하지 못하는 경우 비모수 검정인 Friedman test이 있다.

위 가정과 관련해서는 다음의 게시글을 참고하도록 한다.
정규성 검정 보러가기
등분산 검정(Bartlett’s test) 보러가기
등분산 검정(Lavene’s test) 보러가기


통계량 계산

가설 - 주 효과(main effect)

- 귀무가설($𝐻_0$): 전체 집단간 평균이 같다.
- 대립가설($𝐻_1$): 적어도 하나의 집단간 평균은 다르다.

가설 - 교호작용 효과(interaction effect)

- 귀무가설($𝐻_0$): 요인간 교호작용이 없다.
- 대립가설($𝐻_1$): 요인간 교호작용이 있다.


설정

Two Way ANOVA 블럭의 설정 창은 다음과 같다.
Two Way ANOVA 블럭 설정 창

Response Columns 에는 종속변수를 지정한다.
종속변수의 지정

Factor Column 에는 독립변수를 지정한다.
독립변수의 지정


결과

종속변수를 정기권 이용자의 자전거 대여 수(registered)로 하고 독립변수를 계절(season)과 날씨(weather)로 설정한 결과는 다음과 같다.
결과

계절과 날씨의 주 효과는 p-value가 유의수준 5%(0.05) 기준 보다 낮음으로 계절과 날씨에 따라 정기권 이용자의 자전거 대여 수는 유의미하게 차이가 있다고 할 수 있다. 그리고 계절과 날씨간 교호작용 효과의 p-value 또한 유의수준 5%(0.05) 기준 보다 낮음으로 계절과 날씨간 교호작용 효과가 있다고 할 수 있다.

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×