R의 기본 1차원 벡터는 Python의 기본 객체인 리스트와 다르게 객체의 모든 원소에 일괄 연산이 가능하다. 물론 이것과 대응되는 Python의 객체는 NumPy라이브러리의 array가 있긴 하다. 보다 편리한 연산 기능을 지원하는 R 기본 1차원 벡터 연산을 알아보도록 하겠다.
이전 포스팅에서 알아본 1차원 벡터를 조작하는 다양한 방법을 알아보도록 하자.
R에는 많은 종류의 객체가 있다. 벡터(vector), 행렬(matrix), 데이터프레임(data.frame)등 다양하다. 그 중에서 데이터를 다루는데 있어 가장 기본이 된다고 할 수 있는 c() 함수로 만드는 1차원 벡터를 알아보도록 하겠다.
c()
머신러닝을 모델링을 할 때 데이터 전처리가 끝난 이후 꼭 하는 것이 있다. 바로 학습(train) 데이터세트와 평가(test) 데이터세트 분리이다. 7:3인지? 8:2인지? 그리고 validation set은 또 무엇인지 알아보도록 하자.
분석을 하다 보면 생성한 다루고 있는 객체의 크기를 알아야 할 때가 있다. 특히나 RAM 용량이 작은 머신으로 분석할 경우 이는 더욱더 중요해진다. 이와 관련해서 알아보자.
파일을 다루다 보면 다양한 상황에 직면한다.
R을 사용하는 목적은 제각각이겠지만 기존에 SAS, SPSS, Stata를 사용하던 사람도 있을 것이다. 이런 분들이 겪는 문제가 또 파일을 읽는 것인데 getwd() 함수를 어찌 알아서 경로를 잡고 파일을 위치 시켜도 read.csv() 함수만 연신 입력하고 짜증내는 사람을 많이 보았다. 그래서 이번 포스팅은 haven, imager 패키지를 소개하고자 한다.
getwd()
read.csv()
여러 코로나 바이러스 정보 제공 웹사이트 중에서 국제적으로 유명한 사이트가 몇 개 있지만 그 중 하나인 Johns Hopkins의 코로나 바이러스 현황 대시보드를 소개하고자 한다.
R에는 함수가 어마어마하게 많다. 패키지가 15000개가 넘는데 그 안에 있는 함수는 얼마나 많을까? 아무튼 R 뿐만 아니라 코드를 작성한다면 반드시 알고 넘어가야 하는 것이 함수 관련 문법이다.
R을 처음 접하면 정말 많은 부분에서 막히게 된다. 그 중 하나가 당췌 함수 이름도 모르겠고, 함수 이름을 알더라도 기능 파악을 못해서 어려움을 겪는다. 이번에는 R의 도움말과 검색엔진을 잘 활용하는 방법을 알아보도록 하겠다.
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
290
카테고리
55
태그
644
Python / TextMining
Python / preprocessing
Update your browser to view this website correctly. Update my browser now
×