반응형
반응형
연속균등분포(Continuous Uniform Distribution) 연속확률분포로, 분포가 특정 범위 내에서 균등하게 나타나 있는 경우를 지칭 연속확률분포 : 확률변수가 취할 수 있는 값의 수가 무한한 확률분포 두 개의 매개변수 a, b를 받으며, 이 때 [a,b] 범위에서 균등한 확률을 가짐 보통 기호로 U(a,b)로 표시 예시) 어떤 마을버스는 정류장에서 정확히 5분 간격으로 출발한다. 한 학생이 정류장에 임의로 도착하여 버스가 발차할 때까지 기다리는 평균 시간과 3분 이상 기다릴 확률을 구하라. X : 학생이 도착한 시간 지수분포(Exponential Distribution) 사건이 서로 독립적일 때, 일정 시간 동안 발생하는 사건의 횟수가 포아송분포를 따른다면, 다음 사건이 일어날 때까지의 대..
분석 모니터링 필요성 주변 환경과 데이터의 변화를 빅데이터 분석 모델에 지속적으로 반영하기 위함 분석 모형을 지속적으로 모니터링하고 리모델링 빅데이터 분석이 끝나면 각 현업부서에서 분석 결과를 활용, 이때 이전에 수립한 활용방안이 계획대로 잘 수행되고 있는지 모니터링 분석 서비스의 안정적인 운영과 현행화된 데이터의 수집, 저장, 관리, 분석 결과의 활용 및 성과 공유 등을 위해 유지관리 필요 조직의 담당자는 과제 종료 이후 제공되는 서비스 내용을 기반으로 유지관리 체크리스트를 활용하여 세부 유지관리 사항을 구체화하여 점검 분석 모니터링 대상 빅데이터 분석은 한 번에 끝나는 프로젝트가 아니라 지속적인 모니터링과 유지관리가 매우 중요 조직은 모니터링 및 유지관리를 위한 목표를 수립하고 필요한 활동을 도출한 ..
분석결과 적용과 성과평가 실제 업무에 적용하는 방법 및 활용 방안 모색 빅데이터 분석 결과 활용 시 기대되는 성과를 조직 내에서 충분히 공유 실무자들에게 분석 결과에 대한 전반적인 내용을 이해시킴 분석모델 리모델링 반영 실무자가 분석 결과를 업무에 어떻게 적용하였는지 확인하고 개선해야할 사항 존재 시 프로젝트 성과 평가서 작성 분석기획단계에서 설정된 기준에 따라 프로젝트 성과를 전량적, 정성적으로 평가 성과를 측정할 항목 선정, 항목에 따라 측정식, 측정주체, 기간, 주기 결정 계획된 성과 측정 방법에 따라 성과를 측정하고 예상 성과지표와 비교 실제 성과가 목표치보다 부족하면 먼저 목표치 설정에 문제가 없는지 파악, 문제가 없다면 분석 과제의 개선사항 검토 성과 평가를 문서화하고 관련 부서 및 조직과 공..
분석결과 활용 계획 수립 개요 빅데이터 분석 결과를 어떻게 업무에 반영할 것인지에 대한 액션 플랜을 만들고 업무 성과를 지속적으로 모니터링 할 수 있는 방안 수립 활용 계획의 경우 분석 목표를 설정할 때 함께 고려 분석 모델 결과가 어느정도 완성되면 구체화된 활용 계획을 수립하고 적용 빅데이터 분석 모델을 성공적으로 도입하더라도 지속적인 모니터링과 분석 결과를 현업에서 적극 활용 빅데이터 관련 정보화 부서와 현업 부서 구성원의 분석 및 활용에 대한 이해를 제고하기 위해 내/외부 교육 훈련 방안 수립 기관 내외부에서 지속적으로 활용하고 발전시킬 수 있도록 기관간 데이터 연계, 데이터 통합, 분석 결과 활용 내용을 포함한 확산 계획도 고려하여 방안 수립 분석결과 활용 시나리오 개발 빅데이터 분석 과제를 계획..
빅데이터 분석 방법론 정의 데이터마이닝을 위한 방법론을 프로젝트 특성에 맞추어 적용하는 것 대표적으로 CRISP-DM, SEMMA, KDD 등 빅데이터 분석 방법론 참조모델 적용 프로세스 한국데이터산업진흥원에서 제시한 빅데이터 분석 프로젝트를 위한 참조모델 각 프로젝트의 상황에 맞추어 적용 할 수 있음 분석기획(Planning) 분석하려는 비즈니스 이해하고 분석 목표와 범위 설정하는 단계 비즈니스 이해 및 범위 설정, 프로젝트 정의 및 계획 수립, 프로젝트 위험계획 수립 등의 작업 수행 데이터 준비(Preparing) 프로젝트에 필요한 데이터의 범위와 요건을 정의하고 기준에 맞도록 데이터를 수집, 가공, 준비하는 단계 필요데이터 정의, 데이터 스토어 설계, 데이터 수집 및 정합성 점검 등의 작업 수행 데..
공간 시각화 정의 장소나 지역에 따른 데이터의 분포를 표현한 것 실제 지도나 지도모양의 다이어그램을 배경으로 데이터의 위치를 시각화 정보 표현 : 위치와 거리 또는 색상을 이용하여 정보 표현 정확한 투영(projection) 필요 지형코드화(Geocoding) 래스터 이미지를 고쳐 실세계 지도 투영이나 좌표계에 일치시키는 처리 과정 래스터 이미지 : 작은 점을 무수히 여러 번 찍어 만들어낸 이미지, 비트맵 이미지와 같은 의미 위도와 경도를 활용하여 지도상의 위치 표현 매핑(Mapping) 좌표값을 가진 데이터를 다양한 방법으로 지도에 표시 예시1) 생태조사 데이터 : 특정 식물이나 동물이 서식하는 장소 나열 예시2) 인구분포 데이터 : 시/군/구에 따른 인구 집중도 표현 단계구분도(Choropleth M..