반응형
분석 절차
- 데이터 분석의 시발점이 되는 문제 인식에서부터 시작하여 데이터를 확보하고 분석하여 결과를 도출 및 제시하는 단계까지의 일반적인 과정을 정형화한 프로세스
분석 절차의 특징
- 데이터 분석을 수행하기 위한 기본적인 과정 명시
- 분석 방법론을 구성하는 최소 요건
- 상황에 따라 단계를 추가할 수도 있으며 생략 가능
일반적인 분석 절차
- 문제 인식
- 문제를 인식하고 분석 목적 명확히 정의
- 분석 주제는 가설 형태 또는 결과 해석 중심
- 연구 조사
- 문제해결을 위한 각종 문헌 조사, 조사 내용을 바탕으로 문제에 대한 해결 방안 정의
- 중요한 요인이나 변수 파악
- 모델링 (모형화)
- 복잡한 문제를 논리적이면서도 단순화하는 과정
- 많은 변수가 포함된 현실 문제를 특징적 변수로 정의
- 문제들 변수들 간의 관계로 정의
- 데이터 수집
- 데이터 수집 또는 변수를 측정하는 과정
- 기존 데이터 활용이 불가능한 경우 추가적인 데이터 수집 고려
- 데이터 분석
- 수집된 데이터로부터 인사이트 발굴, 변수들간의 관계 분석
- 분석 결과 제시
- 변수들 간 인과관계나 상관관계를 포함한 분석 결과 제시 및 공유
- 표, 그림, 차트, 그래프 등을 활용하여 시각화
분석 절차 적용 시 고려사항
- 통계 기반의 전통적 데이터 분석을 위한 고려사항
- 문제에 대한 구체적 정의
- 필요 데이터 보유
- 분석 역량
- 문제에 대한 구체적 정의가 없을 경우의 고려사항
- 인사이트 발굴 : 데이터 마이닝 기반으로 데이터 분석
- 개선 결과 : 일단 데이터 분석을 시도한 후 결과를 확인해 가면서 반복적으로 개선 결과 도출
- 데이터 분석 절차 정의 : 수집 > 저장 > 처리 > 분석 > 시각화 > 이용 > 폐기
작업 계획
- 분석 절차에 따라 데이터 분석 업무를 수행하기 위한 전반적인 작업 내용들을 세부적으로 정의하는 과정
분석 작업 계획 수립
단계 | 내용 |
프로젝트 소요비용 배분 |
- 주어진 시스템 및 데이터 환경 고려하여 현실성 있는 계획이 되도록 프로젝트 일정 수립 - 사전에 작성해 놓은 데이터 분석목표정의서의 내용 모두 반영 |
프로젝트 작업분할구조 수립 |
- 데이터 분석목표정의서와 프로젝트 소요비용 배분 계획을 참고하여 데이터 분석 절차에 맞게 수립 |
프로젝트 업무 분장 계획 및 배분 |
- 배분된 인건비를 기준으로 단계별 인원 투입 계획 |
분석 작업 계획 수립을 위한 작업분할구조(WBS)
단계 | 내용 |
데이터 분석과제 정의 |
- 데이터 분석목표정의서를 기준으로 프로젝트 전체 일정에 맞춰 사전에 준비 - 각 단계별 필요 산출물과 보고서 작성 시기, 세부 일정 등 정리 |
데이터 준비 및 탐색 |
- 데이터 엔지니어가 데이터를 수집하고 정리하는 일정 수립 - 데이터 분석가가 분석에 필요한 데이터들로부터 변수 후보를 탐색하고 최종 산출물 도출 일정 수립 - 데이터 분석 가설을 세우고 유의미한 검정을 수행하는 일정 포함 |
데이터 분석 모델링 및 검증 |
- 실행방법 및 절차를 구분하고 검증하는 내용과 수행일정을 상세하게 수립 - 데이터 분석 모델링 작업이 1회 이상 수행되므로 검증일정을 고려하여 세부일정 수립 |
산출물 정리 | - 데이터 분석 단계별 산출물을 정리하고 모델링 과정에서 개발된 분석 스크립트를 최종 산출물로 정리 - 전체 일정에서 산출물 정리 과정 필수 포함 |
분석목표정의서
- 문제의 개선방향에 맞는 현실적인 분석목표 수립하고 필요한 데이터에 대한 정보나 분석 타당성 검토 및 성과측정 방법 등을 정리한 정의서
분석목표정의서 구성요소
- 원천 데이터 조사
- 데이터 정보
- 데이터 축적 기간, 획득 주기, 테이블 스키마, 메타 데이터 확인
- 데이터 수집 난이도
- 데이터 수집 및 정제 과정, 시기와 방법 확인
- 데이터 수집 난이도가 높을 경우 데이터 활용 재고
- 데이터 정보
- 분석 방안 및 적용 가능성 판단
- 개선 목표와 현시점의 분석 목표 간 차이 고려하여 분석 목표를 조정하거나 상황에 따라 우선순위 조정
- 분석 목표에 부합한 데이터 분석 기법일지라도 현재 적합한 분석 환경이 구축되지 않았다면 분석 목표 조정
- 성과평가 기준
- 정성적 평가
- 분석 기법이나 기술의 활용 가능성 평가
- 신규 데이터나 외부 데이터의 활용 가능성 평가
- 세분화나 군집화를 통해 집단 선정
- 이 외 관련 시스템별 정성적 요소 평가
- 정량적 평가
- 기존 방법 대비 효과의 증감 비율 평가
- 유효한 가설의 수나 목표 대비 증감 비율 평가
- 데이터 모델의 정확도 평가
- 기타 분석 특성에 따른 자체 KPI에 의한 성과 측정
- 정성적 평가
분석목표정의서 작성방법
- 분석 목적을 설정하고 달성하기 위한 세부 목표 수립
- 필요한 데이터를 정의하고 분석 방법과 데이터 수집 및 분석 난이도, 수행 주기, 분석 결과에 대한 검증 기준 설계
- 도메인 이슈 도출을 통한 개선방향을 토대로 목표 수준 정리
참고
반응형