엑셀에서 R로 넘어가는 일은 언제나 어렵다. 전처리 엑셀 시리즈에서는 공공데이터등 각종 엑셀파일을 깔끔하게 R로 정리하는 사례를 소개하고자 한다. 그 첫 번째는 농작물별 생산지 정보가 되겠다.
데이터 분석을 본격적으로 실시하기 전에 결측치 처리는 꼭 실시해야 한다.관련 함수와 그 활용 방법을 알아보고자 한다.
데이터 전처리 중 데이터 구조를 바꾸는 것은 참 어렵다. 피벗(pivot), 피보팅(pivoting)이라는 단어가 있긴 하지만 좀 더 광의로 접근하자면 데이터 재구조화에 가깝다. 반복문, apply() 함수는 물론이고 reshape2 패키지도 사용하지 않은 날것의 코드로 해결한 경험을 공유한다.
apply()
2020년 4월 24일자로 R이 4.0.0으로 업데이트 되면서 Rtools 또한 40 버전이 정식으로 나왔고 이를 업데이트 해야 한다. Rtools40을 설치했을 때 제대로 인식을 하지 못하는 문제가 발생하는데 이와 관련하여 해결 방법을 알아보도록 한다.
2020년 4월 24일(금)에 “Arbor Day”라는 이름의 R 4.0.0 이 배포되었다. 어떤 사항이 바뀌었는지 알아보도록 하자.
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
288
카테고리
55
태그
641
Python / preprocessing
Python / TextMining
Update your browser to view this website correctly. Update my browser now
×