sklearn과 Pandas 라이브러리를 활용하여 범주형 변수를 원핫 인코딩(One-Hot Encoding)을 실시하는 방법에 대해 알아본다.
Pandas 객체에 결측치를 처리하는 다양한 패턴을 알아본다. 여기서는 .groupby()메서드와 NumPy의 where() 함수를 활용한 결측치 대치 방법을 다룬다.
.groupby()
where()
플레이어가 뽑은 카드와 대진표 정보를 매칭하여 어떤 플레이어가 예선을 통과하여 본선 경기로 진출하는지 알아보자.
sklearn 라이브러리의 정규화 클래스를 사용하여 데이터를 정규화(normalization) 하는 방법에 대해 알아본다.
sklearn 라이브러리의 train_test_split() 함수를 사용하여 데이터세트를 분할하는 방법에 대해 알아본다.
train_test_split()
파이썬으로 기술통계 중 변이 통계량의 계산에 대해 알아보자.
데이터프레임의 변수(column)별 데이터타입 확인은 중요하다. 그리고 변수 개수가 매우 많은 경우는 어떻게 처리할 수 있을까? 이와 관련해서 알아보도록 하자.
한 주의 시작 기준 요일이 월요일이 아닌 경우 주수(週數)를 세는 방법을 알아본다.
파이썬으로 기술통계 중 위치 통계량의 계산에 대해 알아보자.
파이썬으로 조건부 확률(Conditional Probability)을 계산하는 방법을 알아보자.
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
290
카테고리
55
태그
644
Python / TextMining
Python / preprocessing
Update your browser to view this website correctly. Update my browser now
×