Br) 함수 블럭 - Time Series Decomposition

Br) 함수 블럭 - Time Series Decomposition

브라이틱스(Brightics)에서 시계열 분해를 할 수 있는 Time Series Decomposition를 알아본다.


Extraction Time Series EDA Pre-Processing

※ 본 내용은 Load 함수 블럭에서 seoul_subway.csv 파일을 불러온 후에 진행한다.
seoul_subway.csv 다운받기 [클릭]
사전 준비


개요

고전 시계열 분해의 경우 가법모형(Addictive Model)과 승법모형(Multiplicative Model)로 나뉜다. 시계열 데이터의 특성을 참고하여 어떤 모형을 기반으로 시계열 분해를 할지 설정할 수 있는데 Time Series Decomposition 블럭으로 해당 절차를 수행할 수 있다.


설정

Time Series Decomposition 블럭의 설정 창은 다음과 같다.
Time Series Decomposition 블럭 설정 창

- Input Column: 시계열 분해를 실시할 변수명을 지정하며 수치형 변수만 선택 가능
- Frequency: 시계열 데이터의 주기
- Model Type: 시계열 분해 방법을 설정한다. 가법모형은 “Additive”, 승법모형은 “Multiplicative” 이다.
- Filteration: 추세의 구성요소를 필터링하기 위한 계수를 지정한다.
- Two-sided: “True”가 기본값이며, 중심이동평균과 같이 시계열 분해 연산을 한다. “False”로 설정하는 경우 특정 시점의 데이터와 과거의 값을 기반으로 연산한다.
- Extrapolate Trend: 기본값이 0이며, 0 보다 큰 값을 입력할 경우 양측(Two-sided 옵션이 “False”일 경우 단축) 마지막 데이터를 기준으로 결측치에 선형 최소 제곱 기반 외삽을 실시. 시계열 데이터의 주기와 동일하게 설정하는 경우 해당 주기와 가장 가까운 시점의 값을 사용.
- Group By: 시계열 분해를 실시할 때 값을 구분하는 변수 설정


결과

승하차총승객수 변수를 시계열 분해한 결과는 다음과 같으며, 추가 설정으로는 Frequency “7”, Model Type “Addictive”, Two-sided “True”, Group By에는 노선명 변수를 지정하였다.
시계열 분해 결과

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×