Scikit-learn 라이브러리를 사용해서 k-means 군집분석을 실시할 때 발생하는 에러를 해결한 경험을 공유한다.
지도학습 모델의 독립변수 중요도를 확인하기 위해 사용하는 Drop Column Importance에 대해 알아본다.
지도학습 모델의 독립변수 중요도를 확인하기 위해 사용하는 Permutation Importance에 대해 알아본다.
sklearn 라이브러리의 k-NN 클래스 사용시 발생하는 특수한 에러 해결 방법을 다룬다.
머신러닝에서의 회귀모델의 평가(Evaluation, Scoring)를 위한 종속변수 평가지표에 대해 알아본다.
머신러닝에서의 분류모델의 평가(Evaluation, Scoring)를 위한 종속변수 평가지표에 대해 알아본다.
sklearn 라이브러리의 train_test_split() 함수를 사용하지 않고 Holdout Test를 위해 데이터를 분할하는 다양한 방법을 알아보자.
train_test_split()
sklearn과 Pandas 라이브러리를 활용하여 범주형 변수를 원핫 인코딩(One-Hot Encoding)을 실시하는 방법에 대해 알아본다.
sklearn 라이브러리의 정규화 클래스를 사용하여 데이터를 정규화(normalization) 하는 방법에 대해 알아본다.
sklearn 라이브러리의 train_test_split() 함수를 사용하여 데이터세트를 분할하는 방법에 대해 알아본다.
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
290
카테고리
55
태그
644
Python / TextMining
Python / preprocessing
Update your browser to view this website correctly. Update my browser now
×