반응형
반응형
# 판다스 외부 모듈 호출하기 import pandas import가 되지 않을 경우 명령 프롬프트에서 pip install pandas 입력 주피터 노트북일 경우 !pip install pandas 코드 실행 # 문자열 변경하기 (예시 3개만, 문자열 함수와 비슷함) df.str. 문자열함수 특정 문자 변경하기 (replace) df.str.replace('바꿀문자', '대체문자') 해당 문자 찾기 (contains) df.str.contains("찾을문자") 문자열 최대 길이 확인 (len) df.str.len() df.str. 문자열함수 예시를 통해서 이해해보기 기존 데이터 프레임 1. 기존 데이터프레임에서 새로운 인덱스(마켓2)와 값(사과=30, 바나나=40, 키위=50)을 추가해보기 2. NaN..
# 판다스 외부 모듈 호출하기 import pandas import가 되지 않을 경우 명령 프롬프트에서 pip install pandas 입력 주피터 노트북일 경우 !pip install pandas 코드 실행 # 인덱스 설정(set_index)하기, 초기화)(reset_index)하기 특정 항목 인덱스 설정하기 (set_index) df.set_index('인덱스 기준 항목', inplace=True) : inplace가 True면 원본 데이터 바로 값 적용 인덱스 초기화하기 (reset_index) df.reset_index() : 인덱스 초기화, 0부터 다시 넘버링 # 데이터프레임 정렬하기 (sort) 칼럼 정렬 (sort_values) df.sort_values('칼럼명', ascending=Tr..
# 판다스 외부 모듈 호출하기 import pandas import가 되지 않을 경우 명령 프롬프트에서 pip install pandas 입력 주피터 노트북일 경우 !pip install pandas 코드 실행 # 판다스 데이터프레임 엑세스하기 (이하 데이터프레임 'df'로 서술) 직접 접근하기 : df['칼럼명'] 인덱스와 컬럼으로 접근하기 : df.loc['인덱스명', '칼럼명'] 여러 데이터를 부를 땐 슬라이싱으로 범위를 지정 슬라이싱 할 때 주의점 : 번호로 할때는 끝나는 숫자 전까지이지만, 문자열일 경우는 해당 문자열까지 포함 인덱스의 번호로 접근하기 : df.iloc['인덱스의번호', '칼럼의번호'] 다른 언어의 배열 접근법과 비슷 # 데이터프레임 항목 추가하기 직접 추가하기 > df[값] =..
판다스란? 파이썬 언어로 제작된 데이터 조작과 분석을 위한 소프트웨어 라이브러리 (외부 모듈) 리스트의 기능을 확장시켜 기존보다 더욱 다양한 데이터 조작, 가공 판다스의 특징 기본적인 통계 데이터 제공 없는 수치(NaN=Not a Number) 자동 처리 데이터셋 재구조화 통합 인덱싱을 활용한 데이터 조작 판다스의 기본 개념 시리즈(Series)란? 1차원 형태를 갖는 배열 데이터프레임(DataFrame)이란? 2차원 형태를 갖는 배열 판다스 외부 모듈 호출하기 import pandas import가 되지 않을 경우 명령 프롬프트에서 pip install pandas 입력 주피터 노트북일 경우 !pip install pandas 코드 실행 데이터 생성하기 시리즈 생성하기 pandas.Series(data..
Numpy 외부 모듈(라이브러리)을 활용해보자 - 3 # 넘파이 외부 모듈 호출하기 import numpy as np # 넘파이 모듈 호출, 편의상 np로 사용 # 넘파이를 이용하여 배열 다루기 배열 데이터 추출하기 (Slicing) array[시작값:끝값] : 배열 array의 시작값부터 끝값 이전까지의 데이터 추출 다차원 배열 또한 같은 방식으로 데이터 추출 가능 x = numpy.random.randint(1,10, 5) # 1차원 배열 1~9 난수 5개 >>> array([5, 9, 5, 4, 9]) # 2번째에서 3번째자리까지의 데이터 추출하기 # 인덱스는 0부터 시작이며, 끝 값 설정은 끝 값 까지가 아닌 이전 값 까지 유효 # 즉, 슬라이싱에서의 [1:3]은 1(0부터시작이므로 2번째), 3..
Numpy 외부 모듈(라이브러리)을 활용해보자 - 2 # 넘파이 외부 모듈 호출하기 import numpy as np # 넘파이 모듈 호출, 편의상 np로 사용 # 넘파이를 이용하여 배열 다루기 배열 데이터 접근하기 (Accessing) array[n] : 배열 array의 n번째 인덱스의 값 가져오기 다차원 배열 또한 같은 방식으로 데이터 접근 가능 # 1차원 배열 데이터 접근하기 x = numpy.arange(1, 6) >>> array([1, 2, 3, 4, 5]) # 1차원 배열 생성 x[4] >>> 5 # 배열에서 5번째의 값 (인덱스는 0부터 시작이므로 4+1) x[-1] >>> 5 # 배열에서 마지막 값 # 다차원 배열 데이터 접근하기 x = numpy.arange(2, 33, 2).resh..