빅데이터 모델링 - 고급 분석기법 - 비모수 통계

반응형

 

모수(매개변수, 파라미터, Parameter) 정의

  • 수학과 통계학에서 어떠한 시스템이나 함수의 특정한 설징을 나타내는 변수
  • 일반적으로 θ라고 표현, 다른 표시는 각각 독특한 뜻을 지님
  • 함수의 수치를 정해진 변역에서 구하거나 시스템의 반응을 결정할 때, 독립변수는 변하지만 매개변수는 일정
  • 다른 매개변수를 이용해 함수의 다른 수치를 다시 구하거나 시스템의 다른 반응 확인 가능

비모수 통계(Non-Parametric Statistics) 개념

  • 통계학에서 모수에 대한 가정을 전제로 하지 않고 모집단의 형태에 관계없이 주어진 데이터에서 직접 확률을 계산하여 통계학적 검정을 하는 분석
  • 상대적으로 모수 통계는 데이터의 분포를 알거나 모수(평균이나 분산) 등을 안다고 가정하고 통계적 검정 및 추론을 하는 것

비모수 통계법 사용조건

  • 자료가 나타내는 모집단의 형상이 정규분포가 아닐 때
  • 자료가 나타내는 현상이 정규분포로 적절히 변환되지 못할 때
  • 자료의 표본(Sample)이 적을 때
  • 자료들이 서로 독립적일 때
  • 변인의 척도가 명명척도나 서열척도일 때
    • 명명척도(범주형척도) : 분류를 위한 척도
    • 서열척도 : 명명척도에서 서열(우열)적 정보를 가지는 숫자 포함 척도

비모수 통계 특징

  • 가정을 만족시키지 못한 상태에서 그대로 모수 통계분석을 함으로써 발생할 수 있는 오류 최소화
  • 질적척도로 측정된 자료 분석 가능
  • 비교적 신속하고 쉽게 통계량을 구할 수 있음
  • 결과에 대한 해석 및 이해 또한 쉬움
  • 많은 표본을 추출하기 어려운 경우 적합

비모수적 통계 검정법

  • 부호검정
    • 관측치들 간에 같다 혹은 크거나 작다라는 주장이 사실인지 아닌지를 검정
  • 윌콕슨(Wilcoxon) 부호순위 검정
    • 크거나 작음을 나타내는 부호 뿐만 아니라 관측치 간 차이의 크기 순위까지 고려하여 검정
  • 만 위트니(Mann-Whitney) 검정
    • 두 집단 간의 중심위치를 비교하기 위하여 사용하는 검정 방법
  • 크루스칼-왈리스 검정
    • 3개 이상 집단의 중앙값 차이 검정

참고

반응형