피처 스케일링(Feature Scaling) - 표쥰화(Standardization)/정규화(Normalization)/값 복구(inverse_transform)

반응형

# 피처 스케일링 (Feature Scaling) / 전처리

  • 서로 다른 변수의 값 범위를 일정한 수준으로 맞추는 작업
  • 주로 표준화(standardization)와 정규화(normalization) 사용

 

# 표준화와 정규화 모듈 호출하기

from sklearn.preprocessing import StandardScaler, MinMaxScaler

 

# 표준화 (Standardization)

  • 필요에 따라 정규분포 분산과 표준편차를 표준에 맞게 통일 시키는 것
  • 평균이 0, 분산이 1인 가우시안 정규분포를 가진 값으로 변환

 

표준화하기

  • StandardScaler : 표준화를 하기 위한 필요 함수
  • .fit_transform(data) : 필요한 피처 스케일링을 하기 위한 데이터의 값 변환
s_scaler = StandardScaler() # 표준화 함수 호출
s_scaled1 = s_scaler.fit_transform(crime_data) # 표준화 된 값 저장

표준화된 값으로 변환

 

# 정규화 (Normalization)

  • 최대값과 최소값을 계산하여 0과 1사이의 값으로 변환
  • 음수값 존재시 -1과 1사이의 값으로 변환

 

정규화하기

  • MinMaxScaler() : 정규화를 하기 위한 필요 함수
  • .fit_transform(data) : 필요한 피처 스케일링을 하기 위한 데이터의 값 변환
n_scaler = MinMaxScaler() # 정규화 함수 호출
n_scaled1 = n_scaler.fit_transform(crime_data) # 정규화 된 값 저장

 

# 피처 스케일링한 값 되돌리기

  • 표준화/정규화가 진행 된 값을 원래의 값으로 복구
  • .inverse_transform(데이터) : 피처 스케일링된 데이터를 원래의 값으로 복구

반응형