실제 지도상의 위치간 거리는 유클리드 거리로 계산하면 안된다. 그 이유와 계산방법을 서울 2호선 지하철역 데이터와 함께 알아보자.
지도상에 특정 지점을 표기하기 위해서는 위경도 좌표가 필요하다. 이를 위해서는 한글 또는 영문 주소를 위경도 좌표로 변환해야 하는데 Google Map API를 활용하여 변환하는 방법을 알아보자.
군집분석, 추천시스템 등 각 데이터간 거리를 측정하는 경우 정규화(normalization) 전처리를 사전에 하는 것이 좋다. 이와 관련해서 알아보자.
게임에서 유저가 어떤 케릭터를 골랐을까? 주어진 데이터 정제 실습을 초급/중급/고급 으로 나누어 알아보자.
데이터프레임의 특정 변수에 있는 텍스트를 분리하는 다양한 방법을 초급/중급/고급 으로 나누어서 알아본다.
데이터프레임의 row기준으로 정렬하는 예제는 많지만 column인 변수 기준으로 정렬하는 예제는 많지 않다. 변수가 많은 경우 한 번에 처리하는 방법을 초급/중급/고급 으로 나누어서 알아보자.
데이터프레임을 다룰 때 특정 속성을 가지는 변수를 원하는 속성으로 변환하고 싶을때는 코드를 어떻게 작성해야 할까? 초급/중급/고급으로 나누어서 살펴보도록 하자.
R에서 데이터프레임 객체에서 원하는 변수를 솎아내는 방법을 간단한 코드부터 고급 응용까지 알아본다.
이전 결측치 처리 포스팅에서 결측치를 살펴보는데 중점을 뒀다면, 이번에는 조금 더 난이도도 올리고 현실적인 내용을 다루고자 한다.
데이터 분석을 하다 보면 많은 수의 파일을 한 번에 모아서 분석해야 할 때가 있다. 이 때 사용하기 좋은 코드를 소개하고자 한다.
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
287
카테고리
55
태그
639
Python / TextMining
Update your browser to view this website correctly. Update my browser now
×