R기반 데이터분석시 객체 및 변수명을 일관성 있게 짓는 법을 알아보도록 한다.
sklearn 라이브러리의 train_test_split() 함수를 사용하지 않고 Holdout Test를 위해 데이터를 분할하는 다양한 방법을 알아보자.
train_test_split()
sklearn과 Pandas 라이브러리를 활용하여 범주형 변수를 원핫 인코딩(One-Hot Encoding)을 실시하는 방법에 대해 알아본다.
Pandas 객체에 결측치를 처리하는 다양한 패턴을 알아본다. 여기서는 .groupby()메서드와 NumPy의 where() 함수를 활용한 결측치 대치 방법을 다룬다.
.groupby()
where()
플레이어가 뽑은 카드와 대진표 정보를 매칭하여 어떤 플레이어가 예선을 통과하여 본선 경기로 진출하는지 알아보자.
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
302
카테고리
57
태그
668
Python / GIS
Python / Etc
Python / Crawling
Update your browser to view this website correctly. Update my browser now
×