머신러닝에서의 회귀모델의 평가(Evaluation, Scoring)를 위한 종속변수 평가지표에 대해 알아본다.
머신러닝에서의 분류모델의 평가(Evaluation, Scoring)를 위한 종속변수 평가지표에 대해 알아본다.
sklearn 라이브러리의 train_test_split() 함수를 사용하지 않고 Holdout Test를 위해 데이터를 분할하는 다양한 방법을 알아보자.
train_test_split()
sklearn과 Pandas 라이브러리를 활용하여 범주형 변수를 원핫 인코딩(One-Hot Encoding)을 실시하는 방법에 대해 알아본다.
sklearn 라이브러리의 정규화 클래스를 사용하여 데이터를 정규화(normalization) 하는 방법에 대해 알아본다.
sklearn 라이브러리의 train_test_split() 함수를 사용하여 데이터세트를 분할하는 방법에 대해 알아본다.
머신러닝을 모델링을 할 때 데이터 전처리가 끝난 이후 꼭 하는 것이 있다. 바로 학습(train) 데이터세트와 평가(test) 데이터세트 분리이다. 7:3인지? 8:2인지? 그리고 validation set은 또 무엇인지 알아보도록 하자.
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
287
카테고리
55
태그
639
Python / TextMining
Update your browser to view this website correctly. Update my browser now
×