머신러닝에서의 분류모델의 평가(Evaluation, Scoring)를 위한 종속변수 평가지표에 대해 알아본다.
sklearn 라이브러리의 train_test_split() 함수를 사용하지 않고 Holdout Test를 위해 데이터를 분할하는 다양한 방법을 알아보자.
train_test_split()
sklearn과 Pandas 라이브러리를 활용하여 범주형 변수를 원핫 인코딩(One-Hot Encoding)을 실시하는 방법에 대해 알아본다.
sklearn 라이브러리의 정규화 클래스를 사용하여 데이터를 정규화(normalization) 하는 방법에 대해 알아본다.
sklearn 라이브러리의 train_test_split() 함수를 사용하여 데이터세트를 분할하는 방법에 대해 알아본다.
머신러닝기법 중 k-Means 클러스터링 기법 학습 과정을 R의 기본 그래프로 구현한 사례를 소개하고자 한다.
브라이틱스(Brightics)에서 주성분 분석(PCA, Principal component analysis)을 하는 방법을 알아본다.
브라이틱스(Brightics)에서 연관규칙 분석(Association Rules)을 하는 방법을 알아본다.
브라이틱스(Brightics)에서 의사결정나무(Decision Tree)를 실시하는 방법을 알아본다.
브라이틱스(Brightics)에서 k-최근접 이웃(KNN, k-Nearest Neighbor)을 실시하는 방법을 알아본다.
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
287
카테고리
55
태그
639
Python / TextMining
Update your browser to view this website correctly. Update my browser now
×