R의 기본 1차원 벡터는 Python의 기본 객체인 리스트와 다르게 객체의 모든 원소에 일괄 연산이 가능하다. 물론 이것과 대응되는 Python의 객체는 NumPy라이브러리의 array가 있긴 하다. 보다 편리한 연산 기능을 지원하는 R 기본 1차원 벡터 연산을 알아보도록 하겠다.
이전 포스팅에서 알아본 1차원 벡터를 조작하는 다양한 방법을 알아보도록 하자.
R에는 많은 종류의 객체가 있다. 벡터(vector), 행렬(matrix), 데이터프레임(data.frame)등 다양하다. 그 중에서 데이터를 다루는데 있어 가장 기본이 된다고 할 수 있는 c() 함수로 만드는 1차원 벡터를 알아보도록 하겠다.
c()
파일을 다루다 보면 다양한 상황에 직면한다.
R을 사용하는 목적은 제각각이겠지만 기존에 SAS, SPSS, Stata를 사용하던 사람도 있을 것이다. 이런 분들이 겪는 문제가 또 파일을 읽는 것인데 getwd() 함수를 어찌 알아서 경로를 잡고 파일을 위치 시켜도 read.csv() 함수만 연신 입력하고 짜증내는 사람을 많이 보았다. 그래서 이번 포스팅은 haven, imager 패키지를 소개하고자 한다.
getwd()
read.csv()
R에는 함수가 어마어마하게 많다. 패키지가 15000개가 넘는데 그 안에 있는 함수는 얼마나 많을까? 아무튼 R 뿐만 아니라 코드를 작성한다면 반드시 알고 넘어가야 하는 것이 함수 관련 문법이다.
R을 처음 접하면 정말 많은 부분에서 막히게 된다. 그 중 하나가 당췌 함수 이름도 모르겠고, 함수 이름을 알더라도 기능 파악을 못해서 어려움을 겪는다. 이번에는 R의 도움말과 검색엔진을 잘 활용하는 방법을 알아보도록 하겠다.
이번에는 csv 이외의 형식을 가진 파일에 대해서 알아보도록 하겠다. csv 이외에 접하게 되는 파일은 JSON, XML, TSV 등 다양하다. 이 외의 통계 프로그램 전용 파일과 이미지 파일 등은 다음 포스팅에서 다룰 예정이다. 그럼 다양한 파일 종류와 그에 맞는 패키지를 소개하고자 한다.
일단 뭘 하더라도 파일을 읽어와야 분석을 하던 그래프를 그리던 할 것이다. 당연히 되겠지… 하면서 덤비지만 정작 내가 사용한 코드는 동작하지 않는걸… 그러다보면 자연스레 엑셀을 켜게 되는 자신을 발견하게 된다. 그래도 엑셀에서 되면 그나마 다행인데 엑셀에서 지원하지 않는 분석 기법이나 그래프가 필요하다면 다시 좌절하게 된다. 그럼 기본함수 부터 패키지 활용까지 알아보도록 하자.
데이터 분석을 한다. 라고 하면 R과 Python 중에서 많은 고민을 한다.간단하게 말해서 통계와 시각화에 집중을 한다면 R을, 딥러닝과 업무자동화에 집중하고 싶다면 Python을 선택하는 것이 좋다.
R
Python
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
288
카테고리
55
태그
641
Python / preprocessing
Python / TextMining
Update your browser to view this website correctly. Update my browser now
×