R에는 함수가 어마어마하게 많다. 패키지가 15000개가 넘는데 그 안에 있는 함수는 얼마나 많을까? 아무튼 R 뿐만 아니라 코드를 작성한다면 반드시 알고 넘어가야 하는 것이 함수 관련 문법이다.
R을 처음 접하면 정말 많은 부분에서 막히게 된다. 그 중 하나가 당췌 함수 이름도 모르겠고, 함수 이름을 알더라도 기능 파악을 못해서 어려움을 겪는다. 이번에는 R의 도움말과 검색엔진을 잘 활용하는 방법을 알아보도록 하겠다.
이번에는 csv 이외의 형식을 가진 파일에 대해서 알아보도록 하겠다. csv 이외에 접하게 되는 파일은 JSON, XML, TSV 등 다양하다. 이 외의 통계 프로그램 전용 파일과 이미지 파일 등은 다음 포스팅에서 다룰 예정이다. 그럼 다양한 파일 종류와 그에 맞는 패키지를 소개하고자 한다.
일단 뭘 하더라도 파일을 읽어와야 분석을 하던 그래프를 그리던 할 것이다. 당연히 되겠지… 하면서 덤비지만 정작 내가 사용한 코드는 동작하지 않는걸… 그러다보면 자연스레 엑셀을 켜게 되는 자신을 발견하게 된다. 그래도 엑셀에서 되면 그나마 다행인데 엑셀에서 지원하지 않는 분석 기법이나 그래프가 필요하다면 다시 좌절하게 된다. 그럼 기본함수 부터 패키지 활용까지 알아보도록 하자.
데이터 분석을 한다. 라고 하면 R과 Python 중에서 많은 고민을 한다.간단하게 말해서 통계와 시각화에 집중을 한다면 R을, 딥러닝과 업무자동화에 집중하고 싶다면 Python을 선택하는 것이 좋다.
R
Python
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
290
카테고리
55
태그
644
Python / TextMining
Python / preprocessing
Update your browser to view this website correctly. Update my browser now
×