빅데이터 - 분석 기획 - 빅데이터의 이해 - 데이터 산업의 이해와 구조

반응형

 

데이터 산업의 진화

  • 데이터 산업은 데이터 처리 - 통합 - 분석 - 연결 - 권리 시대로 진화하고 있음
  • 데이터 통합 시대까지 데이터의 역할은 거래를 정확하게 기록하고 거래의 자동화를 지원하는 것
  • 데이터 분석 시대부터는 분석 수준이 향상되면서 데이터 자원을 활용

데이터 처리 시대 (1970~1980)

  • 컴퓨터 프로그래밍 언어를 이용하여 대규모 데이터를 빠르고 정확하게 처리
  • 결과는 파일 형태로 보관
  • 기업들은 EDPS를 도입하여 급여 계산, 회계 전표 처리 등의 업무에 적용
  • 데이터는 업무 처리의 대상으로 새로운 가치를 제공하지 않음

* EDPS(Electronic Data Processing System) : 전자 정보 처리 시스템, 전자 장치를 이용하여 조직의 행정 및 경영 기능을 보조하는 자료를 처리하는 시스템


데이터 통합 시대 (1990~2000)

  • 데이터 처리가 여러 업무에 적용되면서 전사적으로 데이터 일관성을 확보하기가 어려워짐
  • 데이터 모델링과 데이터베이스 관리 시스템 등장
  • 데이터 조회와 보고서 산출, 원인 분석 등을 위해 데이터 웨어하우스 도입

* 데이터 모델링 : 통합된 데이터를 일관성 있게 관리하기 위한 데이터베이스 설계 기법


데이터 분석 시대 (2010~)

  • 대부분 업무에 정보기술 적용
  • 모바일 기기 보급, 공정센서 확대, 소셜 네트워크 이용 확산 등으로 인해 데이터 폭발적 증가
  • 대규모 데이터를 보관하고 관리할 수 있는 하둡, 스파크 등의 빅데이터 기술 등장
  • 데이터를 학습하여 전문가보다도 정확한 의사결정을 빠르게 내릴 수 있는 인공지능 기술 상용화
  • 데이터를 분석하여 사실의 인과관계를 밝히고 업무에 적용하는 사례를 통해 의사결정의 연관성과 기민성의 효율 증가 증명
  • 데이터 소비자의 역할과 활용 역량을 높이기 위한 데이터 리터러시 프로그램의 중요성 증가

* 아파치 하둡 : 일반 상용 서버로 구성된 클러스터에서 사용할 수 있는 분산 파일 시스템과 대용량의 자료를 처리할 수 있는 분산 처리 시스템을 지원하는 자바 오픈 소스 프레임워크

* 데이터 리터러시(Data Literacy) : 데이터를 읽고 그 의미를 파악하는 해독 능력


 

데이터 연결 시대 (2018~)

  • 기업 또는 기관, 사람, 사물 등 모든 것이 항상 그리고 동시에 둘 이상의 방식으로 연결되어 데이터 교환
  • 디지털 경제의 주축 세력인 디지털 원주민은 융합된 서비스를 요구
  • 데이터 경제의 데이터 연결을 강조하는 의미에서 오픈 API 경제라는 용어가 사용
  • 오픈 API 제공 수 및 접속 수, 오픈 API로 연결된 외부 실체 수 등이 기업의 지속가능성과 성장성을 확인하는 지표

* 데이터 연결 : 연결은 네트워크로 만들고, 네트워크는 새로운 플랫폼 비즈니스 모델을 탄생

* 오픈 API(Open API) : 특정 서비스를 제공하는 업체가 자신들의 서비스에 접근할 수 있도록 그 방법을 외부에 공개한 것


데이터 권리 시대 (현재~)

  • 개인이 자신의 데이터를 자신을 위해서 사용
  • 자신의 데이터에 대한 권리를 보유하고 있으며 스스로 행사할 수 있어야 한다는 마이데이터 등장
  • 데이터 권리를 개인이 갖게 된다는 것은 산업이 데이터를 중심으로 재편될 수 있음을 의미
    • 데이터는 기본적으로 거래 행위의 부산물이였고, 기업들은 개인과 거래를 하는 과정에서 개인의 데이터를 필요
    • 개인의 데이터를 관리해주는 서비스와 필요한 수요자에게 데이터를 매매하는 서비스 등장의 가능성
    • 개인은 스스로 데이터를 만들고 비즈니스 모델을 구상
    • 기존 기업들은 개인 데이터 사용에 제약을 받고, 고객 접점을 점차 상실
  • 데이터의 공정한 사용 보장, 데이터 독점을 유발할 수 있는 경제독점 방지하여야 함

* 마이 데이터(My Data) : 개인 데이터의 활용처와 활용범위 등에 대한 정보주체의 능동적인 의사결정을 지원, 개인정보 자기결정권 보장

데이터 연결과 데이터 권리는 개인 데이터가 완전하게 보호되며, 개인은 자신의 데이터를 완전하게 통제 할 수 있다는 믿음이 보편화되어야 함


데이터 산업의 구조

인프라 영역

  • 데이터 수집, 저장, 분석, 관리 등의 기능을 담당
  • 컴퓨터나 네트워크 장비 및 스토리지 같은 하드웨어 영역 존재
  • 데이터를 관리하고 분석하기 위한 소프트웨어 영역 존재

서비스 영역

  • 데이터를 활용하기 위한 교육이나 컨설팅 또는 솔루션 제공
  • 데이터 그 자체를 제공하거나 이를 가공한 정보 제공
  • 데이터를 처리하는 역할을 담당

참고

 

반응형