보고서를 작성하다 보면 표를 그리기 마련이다. 다양한 패키지가 많지만 특별히 RStudio에서 공개하였고 HTML기반으로 출력이 나오고 하니 Shiny와의 궁합도 충분히 기대해볼만 하다. 그래서 향후 R의 table 작성에 표준이 될것만 같은 패키지 gt를 알아보고자 한다.
R의 기본 1차원 벡터는 Python의 기본 객체인 리스트와 다르게 객체의 모든 원소에 일괄 연산이 가능하다. 물론 이것과 대응되는 Python의 객체는 NumPy라이브러리의 array가 있긴 하다. 보다 편리한 연산 기능을 지원하는 R 기본 1차원 벡터 연산을 알아보도록 하겠다.
이전 포스팅에서 알아본 1차원 벡터를 조작하는 다양한 방법을 알아보도록 하자.
R에는 많은 종류의 객체가 있다. 벡터(vector), 행렬(matrix), 데이터프레임(data.frame)등 다양하다. 그 중에서 데이터를 다루는데 있어 가장 기본이 된다고 할 수 있는 c() 함수로 만드는 1차원 벡터를 알아보도록 하겠다.
c()
머신러닝을 모델링을 할 때 데이터 전처리가 끝난 이후 꼭 하는 것이 있다. 바로 학습(train) 데이터세트와 평가(test) 데이터세트 분리이다. 7:3인지? 8:2인지? 그리고 validation set은 또 무엇인지 알아보도록 하자.
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
288
카테고리
55
태그
641
Python / preprocessing
Python / TextMining
Update your browser to view this website correctly. Update my browser now
×