R의 기본 1차원 벡터는 Python의 기본 객체인 리스트와 다르게 객체의 모든 원소에 일괄 연산이 가능하다. 물론 이것과 대응되는 Python의 객체는 NumPy라이브러리의 array가 있긴 하다. 보다 편리한 연산 기능을 지원하는 R 기본 1차원 벡터 연산을 알아보도록 하겠다.
이전 포스팅에서 알아본 1차원 벡터를 조작하는 다양한 방법을 알아보도록 하자.
R에는 많은 종류의 객체가 있다. 벡터(vector), 행렬(matrix), 데이터프레임(data.frame)등 다양하다. 그 중에서 데이터를 다루는데 있어 가장 기본이 된다고 할 수 있는 c() 함수로 만드는 1차원 벡터를 알아보도록 하겠다.
c()
머신러닝을 모델링을 할 때 데이터 전처리가 끝난 이후 꼭 하는 것이 있다. 바로 학습(train) 데이터세트와 평가(test) 데이터세트 분리이다. 7:3인지? 8:2인지? 그리고 validation set은 또 무엇인지 알아보도록 하자.
분석을 하다 보면 생성한 다루고 있는 객체의 크기를 알아야 할 때가 있다. 특히나 RAM 용량이 작은 머신으로 분석할 경우 이는 더욱더 중요해진다. 이와 관련해서 알아보자.
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
287
카테고리
55
태그
639
Python / TextMining
Update your browser to view this website correctly. Update my browser now
×