Pandas 활용3 - 인덱스 옵션, 정렬하기, 중복 제거, 갯수 확인

반응형

# 판다스 외부 모듈 호출하기

import pandas
  • import가 되지 않을 경우
    • 명령 프롬프트에서 pip install pandas 입력
    • 주피터 노트북일 경우 !pip install pandas 코드 실행

 

# 인덱스 설정(set_index)하기, 초기화)(reset_index)하기

  • 특정 항목 인덱스 설정하기 (set_index)
    • df.set_index('인덱스 기준 항목', inplace=True) : inplace가 True면 원본 데이터 바로 값 적용

학생 이름을 인덱스로 설정

 

  • 인덱스 초기화하기 (reset_index)
    df.reset_index() : 인덱스 초기화, 0부터 다시 넘버링

 


# 데이터프레임 정렬하기 (sort)

  • 칼럼 정렬 (sort_values)
    • df.sort_values('칼럼명', ascending=True) : 기본은 오름차순(True), False=내림차순

 

  • 인덱스 정렬 (sort_index)
    • df.sort_index() : 기본은 오름차순, ascending 사용하여 내림차순으로 변경 가능


# 중복 제거(unique), 갯수 확인하기(nunique)

  • 중복 제거 값 확인하기
    • df['칼럼명'].unique() : 중복되는 값들을 제거하고 중복되지 않는 값만 출력
  • 중복 제거 값의 개수 확인하기
    • df['칼럼명'].nunique() : 중복되는 값들을 제거하고 중복되지 않는 값의 개수를 출력

 

# 갯수 확인, 카운트 (value_counts, count)

  • 특정 값 별로 확인 (value_counts)
    • df.value_counts() : 특정 값이 중복 존재시 중복 값들을 함께 나열
  • 전체 항목 갯수 확인 (count)
    • df.count() : 전체 칼럼의 갯수 출력

반응형