반응형
분석 작업
- 분석 작업 계획을 수립하기 위해 데이터 처리 프로세스에 대한 이해 필요
- 데이터 처리 영역과 데이터 분석 영역으로 분류
데이터 처리 프로세스
데이터 처리 영역
- 데이터 분석을 위한 기초 데이터를 정의하고 수집 및 저장, 분석하기 수월하도록 물리적인 환경을 제공하는 영역
단계 | 내용 |
데이터 소스 | - 기업 내 각 부서나 서비스별 적재되고 있는 내부 데이터 - 다른 기업이나 공공 데이터 등 외부 데이터 |
데이터 수집 | - 사용자로부터 데이터를 직접 입력 - 로그수집기, 크롤링, 센서네트워크 등 |
데이터 저장 | - 데이터를 유형별로 나눠 최적의 설계를 하여 데이터 스토리지에 저장 |
데이터 처리 | - 저장된 대용량의 데이터를 신속하고 정확하게 처리하기 위해 실시간 처리 및 분산 처리 등 시도 |
데이터 분석 영역
- 저장되어 있는 데이터 추출
- 분석 목적과 방법에 맞게 가공
- 데이터 분석 직접 수행
- 결과 표현
데이터 분석 - NCS(국가직무능력표준)
구분 | 내용 |
도메인 이슈 도출 | - 분석 대상 과제 현황을 파악하고 개선과제 정의 - 문제의 주요 이슈별로 개선방향 도출, 개선방안 수립, 빅데이터 요건 정의서 작성 |
분석목표 수립 | - 빅데이터 요건 정의서를 토대로 개선방향에 맞는 현실적인 분석목표 수립 - 데이터 관련 정보, 분석 타당성 검토, 성과측정 방법 등을 포함한 분석목표정의서 작성 |
프로젝트 계획 수립 |
- 사전에 책정된 자원과 예산, 기간 등을 고려하여 분석 프로젝트 계획 수립 - 분석목표정의서, 프로젝트 소요비용 배분계획을 바탕으로 작업분할구조도(WBS) 작성 |
보유 데이터 자산 확인 |
- 분석목표와 프로젝트 계획을 기반으로 현재 보유 중인 데이터의 품질이나 규모, 유형등을 확인하고 법률적 이슈나 제약사항 등 검토 |
데이터 표현
구분 | 내용 |
빅데이터 분석 결과 시각화 |
- 다양한 분석 및 시각화 도구를 활용하여 분석 결과 시각화 |
참고
반응형