브라이틱스(Brightics)에서 2개 이상의 명목형 변수간 독립성 검정을 실시할 수 있는 Chi-square Test of Independence
를 알아본다.
※ Chi-square(X) Chi-squared(O)
Statistics
※ 본 내용은 Load
함수 블럭에서 financial_info_10k_persons.csv 파일을 불러온 후에 진행한다.
※ financial_info_10k_persons.csv 다운받기 [클릭]
개요
브라이틱스(Brightics)에서 2개 이상의 명목형 변수간 독립성 검정을 위해서 Chi-square Test of Independence
함수 블럭을 사용할 수 있다. 독립성 검정의 경우 두 명목형 변수를 입력받긴 하나 좀 더 들어간다면, 두 명목형 변수를 사용하여 산출하는 빈도표가 그 기반이 되겠다. 그런데 Chi-square Test of Independence
함수 블럭의 경우 그 결과 표에서 빈도표를 제공하지 않기 때문에 Cross Table
함수 블럭을 사용하여 먼저 그 내용을 확인하면 더욱 좋다.
※ Cross Table
포스팅 바로가기 -> [클릭]
이론
통계량 계산
연속성 수정
설정
Chi-square Test of Independence
블럭의 설정 창은 다음과 같다.
Feature Columns 에는 종속변수를 지정한다.
Label Column 에는 독립변수를 지정한다.
결과
다음은 이탈여부(is_attrited)를 종속변수로 넣고 성별(Gender)과 카드 등급(Card)을 독립변수로 넣은 결과이다.
독립변수가 성별의 경우 검정통계량은 15.08, p-value는 0.0001이 나왔다. 이는 유의수준 5% 기준(0.05) 귀무가설을 기각하고 대립가설을 채택하여 이탈여부는 성별과 독립이 아니고 연관이 있다는 것을 알 수 있다. 다음으로 카드 등급이 독립변수인 경우는 검정통계량이 2.996, p-value는 0.392가 나왔다. 이는 유의수준 5% 기준(0.05) 귀무가설을 기각하지 못하여 이탈여부는 카드 등급과 독립이며 연관이 없다는 것을 알 수 있다.