Python 기반 데이터분석시 객체 및 변수명을 일관성 있게 짓는 법을 알아보도록 한다.
R기반 데이터분석시 객체 및 변수명을 일관성 있게 짓는 법을 알아보도록 한다.
sklearn 라이브러리의 train_test_split() 함수를 사용하지 않고 Holdout Test를 위해 데이터를 분할하는 다양한 방법을 알아보자.
train_test_split()
sklearn과 Pandas 라이브러리를 활용하여 범주형 변수를 원핫 인코딩(One-Hot Encoding)을 실시하는 방법에 대해 알아본다.
Pandas 객체에 결측치를 처리하는 다양한 패턴을 알아본다. 여기서는 .groupby()메서드와 NumPy의 where() 함수를 활용한 결측치 대치 방법을 다룬다.
.groupby()
where()
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
288
카테고리
55
태그
641
Python / preprocessing
Python / TextMining
Update your browser to view this website correctly. Update my browser now
×