Br) 통계 - 카이제곱 검정

Br) 통계 - 카이제곱 검정

브라이틱스(Brightics)에서 2개 이상의 명목형 변수간 독립성 검정을 실시할 수 있는 Chi-square Test of Independence를 알아본다.
※ Chi-square(X) Chi-squared(O)


Statistics

※ 본 내용은 Load 함수 블럭에서 financial_info_10k_persons.csv 파일을 불러온 후에 진행한다.
financial_info_10k_persons.csv 다운받기 [클릭]
사전 준비


개요

브라이틱스(Brightics)에서 2개 이상의 명목형 변수간 독립성 검정을 위해서 Chi-square Test of Independence 함수 블럭을 사용할 수 있다. 독립성 검정의 경우 두 명목형 변수를 입력받긴 하나 좀 더 들어간다면, 두 명목형 변수를 사용하여 산출하는 빈도표가 그 기반이 되겠다. 그런데 Chi-square Test of Independence 함수 블럭의 경우 그 결과 표에서 빈도표를 제공하지 않기 때문에 Cross Table 함수 블럭을 사용하여 먼저 그 내용을 확인하면 더욱 좋다.

Cross Table 포스팅 바로가기 -> [클릭]

이론

통계량 계산

연속성 수정


설정

Chi-square Test of Independence 블럭의 설정 창은 다음과 같다.
Chi-square Test of Independence 블럭 설정 창

Feature Columns 에는 종속변수를 지정한다.
종속변수의 지정

Label Column 에는 독립변수를 지정한다.
결과


결과

다음은 이탈여부(is_attrited)를 종속변수로 넣고 성별(Gender)과 카드 등급(Card)을 독립변수로 넣은 결과이다.
결과

독립변수가 성별의 경우 검정통계량은 15.08, p-value는 0.0001이 나왔다. 이는 유의수준 5% 기준(0.05) 귀무가설을 기각하고 대립가설을 채택하여 이탈여부는 성별과 독립이 아니고 연관이 있다는 것을 알 수 있다. 다음으로 카드 등급이 독립변수인 경우는 검정통계량이 2.996, p-value는 0.392가 나왔다. 이는 유의수준 5% 기준(0.05) 귀무가설을 기각하지 못하여 이탈여부는 카드 등급과 독립이며 연관이 없다는 것을 알 수 있다.

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×