파이썬으로 기술통계 중 모양 통계량의 계산에 대해 알아보자.
이산확률분포인 이항 분포(二項 分布, Binomial Distribution)에 대해 알아본다.
이산확률분포인 베르누이 분포(Bernoulli Distribution)에 대해 알아본다.
머신러닝에서의 회귀모델의 평가(Evaluation, Scoring)를 위한 종속변수 평가지표에 대해 알아본다.
두 변수간의 선형관계. 즉, 선형성(linearity)을 알아보는 상관분석에 대해 알아보자.
머신러닝에서의 분류모델의 평가(Evaluation, Scoring)를 위한 종속변수 평가지표에 대해 알아본다.
Python 기반 데이터분석시 객체 및 변수명을 일관성 있게 짓는 법을 알아보도록 한다.
sklearn 라이브러리의 train_test_split() 함수를 사용하지 않고 Holdout Test를 위해 데이터를 분할하는 다양한 방법을 알아보자.
train_test_split()
sklearn과 Pandas 라이브러리를 활용하여 범주형 변수를 원핫 인코딩(One-Hot Encoding)을 실시하는 방법에 대해 알아본다.
Pandas 객체에 결측치를 처리하는 다양한 패턴을 알아본다. 여기서는 .groupby()메서드와 NumPy의 where() 함수를 활용한 결측치 대치 방법을 다룬다.
.groupby()
where()
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
287
카테고리
55
태그
639
Python / TextMining
Update your browser to view this website correctly. Update my browser now
×