빅데이터 결과 해석 - 모형 평가 및 개선 - 최종모델 선정

반응형

 

평가 지표에 대한 자세한 더 포스팅 확인하기

2023.03.22 - [이론/빅데이터 분석 기사] - 빅데이터 결과 해석 - 모형 평가 및 개선 - 평가 지표


회귀모델에 대한 주요 성능평가지표

  • SSE(Sum Squared Error) : 제곱의 합, 실제값과 예측값의 차이를 제곱하여 더한 값

  • 결정계수 R² : 회귀모델이 실제값에 대해 얼마나 잘 적합하는지에 대한 비율

  • MAE(Mean Absolute Error) : 실제값과 예측값 차이의 절대값을 합한 평균간

  • MAPE(Mean Absolute Percentage Error) : MAE를 퍼센트로 변환한 값


분류모델에 대한 주요 성능평가지표

<오차행렬 표>

  • True Positive(TP) : 실제 True인 답을 True라고 예측(정답)
  • False Positive(FP) : 실제 False인 답을 True라고 예측(오답)
  • False Negative(FN) : 실제 True인 답을 False라고 예측(오답)
  • True Negative(TN) : 실제 False인 답을 False라고 예측(정답)
  • 정확도(Accuracy) : 실제 데이터와 예측 데이터를 비교하여 같은 지 판단

  • 정밀도(Precision) : Positive로 예측한 대상 중 실제와 예측 값이 일치하는 비율

  • 재현율(Recall) : 실제 Positive인 대상 중 실제와 예측 값이 일치하는 비율


비지도학습 모델에 대한 주요 성능평가지표

  • 군집분석
    • 군집타당성지표(clustering Validity Index)로 군집 간 분산과 군집 내 분산
    • 고려사항
      • 군집 간 거리
      • 군집의 지름
      • 군집의 분산 등
  • 연관분석
    • 연관규칙에서 지지도와 신뢰도가 모두 최소한도보다 높은 것으로 평가
    • 일반적으로 최소 지지도를 정한 뒤 이에 대한 이하를 버리고 그 중 신뢰도가 어느정도 높은 결과들을 가져옴

2023.03.18 - [이론/빅데이터 분석 기사] - 빅데이터 모델링 - 분석기법 - 연관성분석(Association Rule Learning)


참고

반응형