데이터 분석을 하다 보면 많은 수의 파일을 한 번에 모아서 분석해야 할 때가 있다. 이 때 사용하기 좋은 코드를 소개하고자 한다.
엑셀에서 R로 넘어가는 일은 언제나 어렵다. 전처리 엑셀 시리즈에서는 공공데이터등 각종 엑셀파일을 깔끔하게 R로 정리하는 사례를 소개하고자 한다. 그 첫 번째는 농작물별 생산지 정보가 되겠다.
데이터 분석을 본격적으로 실시하기 전에 결측치 처리는 꼭 실시해야 한다.관련 함수와 그 활용 방법을 알아보고자 한다.
데이터 전처리 중 데이터 구조를 바꾸는 것은 참 어렵다. 피벗(pivot), 피보팅(pivoting)이라는 단어가 있긴 하지만 좀 더 광의로 접근하자면 데이터 재구조화에 가깝다. 반복문, apply() 함수는 물론이고 reshape2 패키지도 사용하지 않은 날것의 코드로 해결한 경험을 공유한다.
apply()
2020년 4월 24일자로 R이 4.0.0으로 업데이트 되면서 Rtools 또한 40 버전이 정식으로 나왔고 이를 업데이트 해야 한다. Rtools40을 설치했을 때 제대로 인식을 하지 못하는 문제가 발생하는데 이와 관련하여 해결 방법을 알아보도록 한다.
2020년 4월 24일(금)에 “Arbor Day”라는 이름의 R 4.0.0 이 배포되었다. 어떤 사항이 바뀌었는지 알아보도록 하자.
패키지를 불러오다 보면 설치가 제대로 안될때가 있고, 잘 쓰던 함수가 안될때도 있다. 이와 관련해서 어떤 문제가 발생할 수 있고 어떻게 대처하는지 알아보자.
언제까지 R의 기본 함수만 사용할 수 없다. 기본 기능 이외에도 새로운 알고리즘을 사용하거나, 다른 언어를 끌어와서 사용하거나, 이쁜 그래프를 그리고 싶다면 패키지(Package)를 사용할줄 알아야 한다. 패키지를 모른다면 R 기능의 1%도 못쓸테니 꼭 알아두자.
행렬은 1차원 부터 n차원 까지 고차원의 데이터 표현이 가능하다. 그래서 보통 3차원 이상의 정보를 담고 있는 이미지 데이터 조작에도 많이 활용되기도 하고 각종 머신러닝 알고리즘 구현에 근간이 되는 행렬 연산을 지원하는 matrix 객체를 알아보도록 하자.
1차원 백터 내부 원소의 원인모를 복제? 그것은 바로 벡터 리사이클링(vector recycling)이 원인이다. 어떤 상황에서 어떻게 동작하는지 알아보도록 하자.
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
287
카테고리
55
태그
639
Python / TextMining
Update your browser to view this website correctly. Update my browser now
×