브라이틱스(Brightics)에서 분석에 사용할 신규 변수를 만들 때 사용하는 Add Column
을 알아본다.
Extraction Pre-Processing
※ 본 내용은 Load
함수 블럭에서 sample_iris.csv 파일을 불러온 후에 진행한다.
개요
브라이틱스에서 신규 변수를 만들 수 있는 블럭은 Add Column
이외에도 Add Function Column
, Add Function Columns
, Query Executor
가 있다. 그 중에서 가장 쉽고 간단하게 만들 수 있는 것이 Add Column
블럭이 되겠다. 엑셀의 if()
함수를 써봤다면 이 블럭을 사용하는데 무리가 없을 것이다.
※ Add Function Column
포스팅 바로가기 -> [클릭]
※ Add Function Columns
포스팅 바로가기 -> [클릭]
※ Query Executor
포스팅 바로가기 -> [클릭]
설정
Add Column
블럭의 설정창은 다음과 같다.
Add Column 아래 사각 영역을 누르면 다음과 같은 상세 설정 창이 나온다.
신규 변수를 만들기 위한 문법은 SQLite와 Python 두 방식이 있으나 SQLite 방식 사용을 권장한다.
다음은 species 변수의 값이 ‘setosa’인 경우 값이 1, 그 이외에는 0인 is_setosa 라는 신규 변수를 생성하는 예시이다. 그리고 기본적으로 New Column Type이 문자형(String)으로 되어있는데 이를 숫자형(Number)로 변경해주었다.
위와 같이 숫자 결과값을 내는 경우는 되도록이면 숫자형으로 설정하는 것을 권장한다. 일관된 규칙 기반으로 분석을 해야 나중에 실수하는 일이 적고 디버깅도 상대적으로 빠르다.
결과
위 절차대로 is_setosa 변수를 새로 만든 결과는 다음과 같다.