브라이틱스(Brightics)에서 변수의 결측치를 제거할 때 사용하는 Delete Missing Data
을 알아본다.
Transform Pre-Processing Missing
※ 본 내용은 Load
함수 블럭에서 iris_missing.csv 파일을 불러온 후에 진행한다.
※ iris_missing.csv 다운받기 [클릭]
개요
Delete Missing Data
블럭은 특정 변수에 null 이라고 표기된 결측값을 제거한다. 하지만 빈칸이나 한 칸 띄어쓰기 등 null이 아닌 결측 표현은 Filter
블럭을 사용하여 해당 row를 제거하여야 한다.
※ Filter
포스팅 바로가기 -> [클릭]
설정
Delete Missing Data
블럭의 설정 창은 다음과 같다.
Input Columns 의 아래 네모 상자를 클릭하면 결측치를 처리할 수치형 변수의 목록이 오른쪽에 뜬다. 결측 처리 대상 변수를 선택하여 분석을 진행한다.
결과
상기 설정으로 실행한 결과는 다음과 같다. Sepal_Width 변수의 결측치가 제거되어 row 개수가 150에서 137로 감소한 것을 알 수 있다.