데이터를 다루다보면 값이 중구난방으로 뒤섞여있어 별도로 정렬이 필요할 때가 있다. 특히 큰 데이터를 다루다보면 모든 데이터를 살펴보기가 어렵기 때문에 오름차순 또는 내림차순으로 정렬해서 살펴보기도 한다. 이런 맥락적인 사유 말고도 Pandas 객체를 다룸에 있어 시계열 분석, 그래프 시각화 등 원하는 작업의 특수성 때문에 정렬이 필요한 경우도 있다.
실습
Pandas 객체의 정렬은 크게 인덱스 기준 정렬과 변수 기준 정렬이 있으며 해당 작업은 각각 .sort_index() 메서드와 .sort_values() 메서드로 실시한다. 각 정렬 대상이 되는 인덱스 또는 변수는 내림차순이나 오름차순을 “ascending” 인자로 지정할 수 있다.
시리즈(Series)
실습을 위해 시리즈 객체를 준비한다.
1 2 3 4 5 6 7 8
ser = pd.Series([100, 300, 200, 400], index = [3, 2, 0, 1]) ser ## 3 100 ## 2 300 ## 0 200 ## 1 400 ## dtype: int64
먼저 인덱스 기준으로 정렬을 해본다. “ascending” 인자의 기본값은 True로 되어있어 별도로 값을 지정하지 않는 경우 오름차순으로 대상을 정렬한다.