텍스트마이닝을 하기 위한 전처리 과정 중 하나인 정규표현식에 대해 알아본다. 정규표현식은 텍스트 데이터를 다루는데 있어 매우 유용한 도구이다. 여기서는 Pandas 객체 기반 정규표현식을 활용한 텍스트 처리의 개념과 관련 메서드를 알아본다.
Pandas 객체에 결측치를 처리하는 다양한 패턴을 알아본다. 여기서는 Pandas의 표준 결측표기가 아닌 결측치가 데이터프레임 객체의 다중 변수에 흩어져 있을 때 해당 결측치가 있는 행을 삭제하는 방법을 알아본다.
크롤링한 소스코드를 정제하는 BeatifulSoup를 활용하여 특정 태그에 접근하고자 할 때 사용할 수 있는 .find() 메서드 시리즈를 알아본다.
.find()
크롤링한 소스코드를 정제하는 BeatifulSoup를 활용하여 웹페이지의 표를 정제하는 방법을 알아본다.
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
287
카테고리
55
태그
639
Python / TextMining
Update your browser to view this website correctly. Update my browser now
×