두 집단의 평균을 비교하는 t-검정 중에서 단일표본 t-검정에 대해 알아보자.
Scikit-learn 라이브러리를 사용해서 k-means 군집분석을 실시할 때 발생하는 에러를 해결한 경험을 공유한다.
주어진 자료가 정규분포를 따르는지 확인하는 정규성 검정(Normality Test)에 대해 알아보자.
Pandas 객체에 결측치를 처리하는 다양한 패턴을 알아본다. 여기서는 데이터프레임 객체의 다중 변수의 결측치를 한 번에 대치하는 방법을 알아본다.
반복적으로 같은 형식으로 생산되는 여러 값을 이어붙이는 방법을 알아본다.
지도학습 모델의 독립변수 중요도를 확인하기 위해 사용하는 Drop Column Importance에 대해 알아본다.
지도학습 모델의 독립변수 중요도를 확인하기 위해 사용하는 Permutation Importance에 대해 알아본다.
이산확률분포인 기하 분포(幾何分布, geometric distribution)에 대해 알아본다.
sklearn 라이브러리의 k-NN 클래스 사용시 발생하는 특수한 에러 해결 방법을 다룬다.
이산확률분포인 포아송 분포(Poisson Distribution)에 대해 알아본다.
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
287
카테고리
55
태그
639
Python / TextMining
Update your browser to view this website correctly. Update my browser now
×