etc) 빅분기 실기대비 - Py 라이브러리 분석

etc) 빅분기 실기대비 - Py 라이브러리 분석

빅데이터 분석기사(빅분기) 실기시험에서 제공되는 환경의 Python 라이브러리 목록을 알아보자.


개요

Kdata에서 2021년 4월 19일자 “제2회 빅데이터분석기사 실기 안내” 게시물로 공지한바에 따르면 시험 환경에서 Python 라이브러리는 총 39개가 설치되어있다고 한다. 물론 이 내용은 향후 바뀔 수 있으나 보통 큰 문제가 없지 않는한 1년 단위로 바뀌고 큰 변경을 없기 때문에 최초 공지에 있는 라이브러리 목록을 기준으로 알아보아도 되겠다. 그리고 모든 라이브러리가 시험에 중요한 라이브러리는 아니다. 특정 라이브러리의 의존라이브러리 같은 사소한 라이브러리는 최대한 제외하고 알아보자.

분석 라이브러리

목록

scipy: 통계 및 기타
scikit-learn: 머신러닝
xgboost: XGBoost

상세

scipy

t-검정, 일원분산분석 등 간단한 통계 검정을 포함하여 기타 분석을 위해 사용하는 라이브러리

scikit-learn

거의 대부분의 머신러닝 모델링을 위한 라이브러리

xgboost

XGBoost를 위한 라이브러리

데이터 전처리 라이브러리

목록

numpy: 행렬기반의 다양한 수치연산
pandas: 전반적인 데이터 전처리 및 분석

상세

파이썬 데이터 분석에서 numpypandas는 너무 기본적인 라이브러리라 별도 언급을 하지 않겠다.

시각화 라이브러리

목록

matplotlib: 파이썬 기본 시각화 라이브러리

상세

matplotlib

Seaborn 또는 plotly가 없어서 다행이긴 한데 시험 환경을 고려해볼 때 그린 그래프를 확인할 수 없기 때문에 넘어가도록 한다.

웹 라이브러리

목록

requests: 특정 웹사이트 접근, 파일 다운로드 등
urllib3: 특정 웹사이트 접근, 파일 다운로드 등
selenium: 웹 테스팅 및 크롤링
beautifulsoup4: XML문서 파싱

상세

requestsurllib3의 경우 상호 호환이 가능하기 때문에 필요시 둘 중 하나만 숙지하면 되겠다.

총평

텍스트마이닝, 연관규칙분석, 시계열 분해는 출제가 되지 않을 것으로 보인다. 시험 환경에서 R에는 없는 Selenium이 있는데 분명 별도로 설치한것으로 보이나 headless 브라우저를 사용할 것이 아니라면 쓸 이유도 없고, 시험 환경을 고려했을 때 거의 사용이 불가능할 것으로 판단된다. 그리고 언급하지 않은 라이브러리 중 freedesktop 서비스를 이용하는 라이브러리와 각종 보안 관련 라이브러리가 많이 있었는데 출제 관계자가 시험 문제 출제를 위한 환경 구성을 제대로 하지 않고, 본인이 재택근무를 위해서 구성해놓은 환경에 있는 라이브러리 목록을 그대로 제출한 것으로 보인다.

종합적인 내용은 etc) 빅분기 - 실기시험 준비 포스팅에서 다루니 참고하도록 하자.

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×