본문 바로가기
python

Python Pandas 엑셀 데이터 순서 정리(sort_values())

by WeRun 2022. 8. 6.

Excel 데이터를 불러와서 정렬을 해서 보고 싶다면 sort_values()함수를 쓰면됩니다.

DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last', ignore_index=False, key=None)

 

parameter

by: 정렬 기준이될 "행" 또는 "열"입니다.

axis: 0 or 1 (0은 열을 기준으로 행이 정렬되고 1은 행을 기준으로 열이 정렬합니다.)

ascending: True: 오름차순 False: 내림차순

na_position: first or last NaN(Null)값의 위치입니다.

inplace: True: 저장, False: 화면에 표시만(정렬 후 정렬 결과를 원본에 저장 할 지 여부를 나타냅니다.)

ignore_index: True: 기존 인덱스를 무시합니다.

kind: 알고리즘 모드로 quicksort, mergesort, heapsort, stable가 사용가능하며 기본값은 quicksort입니다.

key: 정렬방식으로 함수를 사용할 수 있습니다.

 

1) by

sort_values 함수를 쓸때 많은 Parameter들 중 by는 꼭 넣어야할 항목입니다.

아래와 같이 4일동안 반에서 떠든 학생을 나열한 표입니다.

by parameter에 '1일'을 넣으면 1일을 기준으로 전체 행의 순서가 바뀌는 것을 확인할 수 있습니다(가나다라 순서)

2) axis

다음 파라미터의 axis 의 기본값이 0 이므로 열을 기준으로 행을 정렬하였고, 아래와 같이 axis가 1이면 행을 기준으로 열정렬합니다. 이때 by에 들어가는 값은 가~마 사이의 값이어야 합니다.

3) ascending

다음 파라미터는 오름차순여부 인데요 ascending 파라미터가 True면 낮은 순서에서 높은 순서로 정렬하고 False이면 높은순서에서 낮은 순서로 정렬합니다.

4) na_position

표를 보면 NaN 즉 아무것도 입력되있지 않은 항목이 있습니다. 이부분은 맨 위에 표시할건지 또는 맨 아래 표시할건지를 나태냅니다.

5) inplace

정렬 후 정렬 결과를 원본에 저장 할 지 여부를 나타냅니다.

6) ignore_index

기존에 설정되어있던 인덱스(가~마)를 무시하고 새로운 인덱스(0~)를 부여합니다.

끝~