반응형
# 판다스 외부 모듈 호출하기
import pandas
- import가 되지 않을 경우
- 명령 프롬프트에서 pip install pandas 입력
- 주피터 노트북일 경우 !pip install pandas 코드 실행
# 인덱스 설정(set_index)하기, 초기화)(reset_index)하기
- 특정 항목 인덱스 설정하기 (set_index)
- df.set_index('인덱스 기준 항목', inplace=True) : inplace가 True면 원본 데이터 바로 값 적용
- 인덱스 초기화하기 (reset_index)
df.reset_index() : 인덱스 초기화, 0부터 다시 넘버링
# 데이터프레임 정렬하기 (sort)
- 칼럼 정렬 (sort_values)
- df.sort_values('칼럼명', ascending=True) : 기본은 오름차순(True), False=내림차순
- 인덱스 정렬 (sort_index)
- df.sort_index() : 기본은 오름차순, ascending 사용하여 내림차순으로 변경 가능
# 중복 제거(unique), 갯수 확인하기(nunique)
- 중복 제거 값 확인하기
- df['칼럼명'].unique() : 중복되는 값들을 제거하고 중복되지 않는 값만 출력
- 중복 제거 값의 개수 확인하기
- df['칼럼명'].nunique() : 중복되는 값들을 제거하고 중복되지 않는 값의 개수를 출력
# 갯수 확인, 카운트 (value_counts, count)
- 특정 값 별로 확인 (value_counts)
- df.value_counts() : 특정 값이 중복 존재시 중복 값들을 함께 나열
- 전체 항목 갯수 확인 (count)
- df.count() : 전체 칼럼의 갯수 출력
반응형