특정 사용자 모두가 구매한 물품 목록을 뽑아보려 한다. 필터링을 어떻게 활용하는지 알아보자.
데이터를 다루다 보면 시간데이터 처리는 필수적이다. 기본 함수를 활용한 시간데이터 생성 및 변환을 알아보자.
A 공장에서 사용하는 인쇄 장비의 인쇄물 중 불량이 확인되었다. 보다 상세한 내용을 확인하기 위해 몇 번 카트리지에서 문제가 발생했는지 알기 위해 코드를 작성해보자.
매출 DB에서 프로모션 대상 상품을 구매한 고객을 찾아내고자 한다. R을 활용해서 어떻게 해결할 수 있는지 알아보자.
고객 구매 데이터에서 가장 비싼 상품순으로 n개를 뽑아내려면 어떻게 할까? 고객의 구매력 평가를 위해 구매물품의 평균을 구하는 것 보다 구매한 비싼 물건을 살펴보는 것이 유용할때가 있다.
데이터 전처리시 발생할 수 있는 중복 변수를 확인하는 방법을 알아보자.
대부분의 지리 데이터 처리는 WGS84 좌표계를 기준으로 한다. 한국 지도는 보통 TM좌표계를 사용하는데 이를 WGS84 좌표계로 변환하는 실습을 해본다.
실제 지도상의 위치간 거리는 유클리드 거리로 계산하면 안된다. 그 이유와 계산방법을 서울 2호선 지하철역 데이터와 함께 알아보자.
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
287
카테고리
55
태그
639
Python / TextMining
Update your browser to view this website correctly. Update my browser now
×