Tensorflow - epochs와 batch_size

epochs

  • 전체 데이터셋을 몇 번 반복 학습할지 설정
    • 예) epochs=100 : 서로 다른 값 100개의 가중치로 반복 학습을 진행하여 모델의 성능을 향상시킴

batch_size

  • N개의 샘플로 테스트하여 가중치를 갱신할지를 설정
  • 배치 사이즈가 클수록 많은 데이터를 저장해두어야 하므로 용량이 커짐
  • 배치 사이즈가 작을수록 학습률은 높지만 가중치 갱신률이 높아져서 시간이 오래 걸림
    • 예 ) epochs=100, batch_size=100 : 모두 예측한 뒤 실제 값과 비교 후 가중치 갱신
      예 ) epochs=100, batch_size=50 : 반절을 예측한 뒤 실제 값과 비교 후 가중치 갱신, 나머지 다시 예측

사용 방법

  • 모델링 학습시 메소드에 넣어줌
model.fit(X_train, y_train, epochs=20, batch_size=10)