반응형
# 피처 스케일링 (Feature Scaling) / 전처리
- 서로 다른 변수의 값 범위를 일정한 수준으로 맞추는 작업
- 주로 표준화(standardization)와 정규화(normalization) 사용
# 표준화와 정규화 모듈 호출하기
from sklearn.preprocessing import StandardScaler, MinMaxScaler
# 표준화 (Standardization)
- 필요에 따라 정규분포 분산과 표준편차를 표준에 맞게 통일 시키는 것
- 평균이 0, 분산이 1인 가우시안 정규분포를 가진 값으로 변환
표준화하기
- StandardScaler : 표준화를 하기 위한 필요 함수
- .fit_transform(data) : 필요한 피처 스케일링을 하기 위한 데이터의 값 변환
s_scaler = StandardScaler() # 표준화 함수 호출
s_scaled1 = s_scaler.fit_transform(crime_data) # 표준화 된 값 저장
# 정규화 (Normalization)
- 최대값과 최소값을 계산하여 0과 1사이의 값으로 변환
- 음수값 존재시 -1과 1사이의 값으로 변환
정규화하기
- MinMaxScaler() : 정규화를 하기 위한 필요 함수
- .fit_transform(data) : 필요한 피처 스케일링을 하기 위한 데이터의 값 변환
n_scaler = MinMaxScaler() # 정규화 함수 호출
n_scaled1 = n_scaler.fit_transform(crime_data) # 정규화 된 값 저장
# 피처 스케일링한 값 되돌리기
- 표준화/정규화가 진행 된 값을 원래의 값으로 복구
- .inverse_transform(데이터) : 피처 스케일링된 데이터를 원래의 값으로 복구
반응형