지도학습 모델의 독립변수 중요도를 확인하기 위해 사용하는 Drop Column Importance에 대해 알아본다.
지도학습 모델의 독립변수 중요도를 확인하기 위해 사용하는 Permutation Importance에 대해 알아본다.
sklearn 라이브러리의 k-NN 클래스 사용시 발생하는 특수한 에러 해결 방법을 다룬다.
머신러닝에서의 회귀모델의 평가(Evaluation, Scoring)를 위한 종속변수 평가지표에 대해 알아본다.
머신러닝에서의 분류모델의 평가(Evaluation, Scoring)를 위한 종속변수 평가지표에 대해 알아본다.
sklearn 라이브러리의 train_test_split() 함수를 사용하지 않고 Holdout Test를 위해 데이터를 분할하는 다양한 방법을 알아보자.
train_test_split()
sklearn과 Pandas 라이브러리를 활용하여 범주형 변수를 원핫 인코딩(One-Hot Encoding)을 실시하는 방법에 대해 알아본다.
sklearn 라이브러리의 정규화 클래스를 사용하여 데이터를 정규화(normalization) 하는 방법에 대해 알아본다.
sklearn 라이브러리의 train_test_split() 함수를 사용하여 데이터세트를 분할하는 방법에 대해 알아본다.
Scikit Learn 1버전 정식출시와 관련하여 라이브러리의 업데이트(업그레이드)와 특정 버전 지정 설치에 대해 알아본다.
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
246
카테고리
44
태그
541
Excel-Py / Basic
Python / preprocessing
Python / ML
Update your browser to view this website correctly. Update my browser now
×