데이터를 전처리하다 보면 금액 데이터를 처리해야 하는 경우가 종종 있다. 이를 어떻게 효율적으로 처리하는지 알아보고자 한다.
Pandas 객체 기반 정규표현식을 활용해서 여러 종류의 괄호와 괄호 내부의 문자열을 처리하는 여러 방법에 대해 알아본다.
Pandas 객체 기반 정규표현식을 활용해서 공백을 처리하는 여러 방법에 대해 알아본다.
Pandas 객체 기반 정규표현식을 활용할 때 사용하는 메타문자 중 대괄호에 대해 알아본다.
Pandas 객체 기반 정규표현식을 활용할 때 정규표현식 패턴이 반복되는 사례를 알아본다.
Pandas 객체 기반 정규표현식을 활용할 때 2개 이상의 정규표현식 패턴을 조합하는 사례를 알아본다.
텍스트마이닝을 하기 위한 전처리 과정 중 하나인 정규표현식에 대해 알아본다. 정규표현식은 텍스트 데이터를 다루는데 있어 매우 유용한 도구이다. 여기서는 Pandas 객체 기반 정규표현식을 활용한 텍스트 처리의 개념과 관련 메서드를 알아본다.
Pandas 객체에 결측치를 처리하는 다양한 패턴을 알아본다. 여기서는 Pandas의 표준 결측표기가 아닌 결측치가 데이터프레임 객체의 다중 변수에 흩어져 있을 때 해당 결측치가 있는 행을 삭제하는 방법을 알아본다.
크롤링한 소스코드를 정제하는 BeatifulSoup를 활용하여 특정 태그에 접근하고자 할 때 사용할 수 있는 .find() 메서드 시리즈를 알아본다.
.find()
Data Doctor
Diagnose and Treat via Data.
Seoul, Korea
포스트
288
카테고리
55
태그
641
Python / preprocessing
Python / TextMining
Update your browser to view this website correctly. Update my browser now
×