R을 사용하는 목적은 제각각이겠지만 기존에 SAS, SPSS, Stata를 사용하던 사람도 있을 것이다. 이런 분들이 겪는 문제가 또 파일을 읽는 것인데 getwd()
함수를 어찌 알아서 경로를 잡고 파일을 위치 시켜도 read.csv()
함수만 연신 입력하고 짜증내는 사람을 많이 보았다. 그래서 이번 포스팅은 haven, imager 패키지를 소개하고자 한다.
haven
이 패키지는 여기에서 공식 메뉴얼을 제공하고 있는데 해당 링크를 눌러보면 알겠지만 Tidyverse 패키지 그룹 중 하나이다. 비슷한 패키지로 foriegn이 있다. 사실 foriegn 패키지가 다룰 수 있는 파일 종류는 더 많긴 하지만 그래도 Tidyverse에서 관리하는 패키지이기도 하고 관련 패키지와 호환이 좋기 때문에 우선적으로 소개하였다. 두 패키지가 다룰 수 있는 파일은 다음과 같다.
- haven: SAS, SPSS, Stata
- foriegn: SAS, SPSS, Stata, Minitab, Weka, Octave, Epi Info, S, Systat
foriegn 패키지의 경우 지원하는 파일 형식이 많아서 시스템에 적용하려면 조금 무겁기에 되도록이면 SAS, SPSS, Stata관련 파일을 다룰 경우 haven 패키지를, 그 이외의 파일을 다룰경우엔 foriegn 패키지를 권장한다. forign 패키지의 자세한 내용은 공식 메뉴얼을 참조하자.
그리고 조금 더 전문적으로 다루고 싶다면, Stata 전용 패키지인 readstata13, SAS 전용 패키지인 sas7dbat을 알아보도록 하자.
imager
통계 프로그램 관련 패키지를 소개하기엔 너무 짧아서 imager 패키지도 살짝 소개하고자 한다. 예전의 R은 이미지 파일을 읽을 때 각 이미지 확장자(사실은 압축 형식)에 맞는 패키지를 사용해야 했다. 예를 들어서 png, jpeg 같은 패키지가 있다. 워낙 패키지가 많다보니 앞에서 소개한 통계 소프트웨어 관련 패키지 처럼 각각 전문화된 패키지가 먼저 만들어지고 향후 여러 패키지의 기능을 하나로 묶는 패키지가 등장하게 되는데 imager 패키지도 그런 친절한 패키지라고 할 수 있겠다.
먼저 빵먹는 고양이 사진을 불러와보자.
1 | library("imager") |
※ 사진 출처: https://www.boredpanda.com/why-cats-eat-bread-explained
파일 형식에 관계없이 이미지를 읽을 수 있어서 매우 편하고 load.dir()
함수를 사용할 경우 특정 폴더에 들어있는 이미지를 한 번에 전부 읽을 수 있다. 게다가 load.video()
함수는 무려 동영상 파일도 읽을 수 있으니 관심있는 사람은 imager 패키지의 비네트(vignette)를 보도록 하자.
<파일 입출력 시리즈>
R 파일 입출력 - 1
R 파일 입출력 - 2
R 파일 입출력 - 3
R 파일 입출력 - 4