R에는 많은 종류의 객체가 있다. 벡터(vector), 행렬(matrix), 데이터프레임(data.frame)등 다양하다. 그 중에서 데이터를 다루는데 있어 가장 기본이 된다고 할 수 있는 c() 함수로 만드는 1차원 벡터를 알아보도록 하겠다.
c()
머신러닝을 모델링을 할 때 데이터 전처리가 끝난 이후 꼭 하는 것이 있다. 바로 학습(train) 데이터세트와 평가(test) 데이터세트 분리이다. 7:3인지? 8:2인지? 그리고 validation set은 또 무엇인지 알아보도록 하자.
분석을 하다 보면 생성한 다루고 있는 객체의 크기를 알아야 할 때가 있다. 특히나 RAM 용량이 작은 머신으로 분석할 경우 이는 더욱더 중요해진다. 이와 관련해서 알아보자.
kaggle 노트북을 처음 접하는 경우 환경이 낮설기도 하고 조작에 애를 먹는 경우가 많다. 그런 분을 위해 kaggle 노트북 단축키를 소개하고자 한다.
파일을 다루다 보면 다양한 상황에 직면한다.
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
300
카테고리
56
태그
662
Python / Etc
Python / Crawling
Update your browser to view this website correctly. Update my browser now
×