빅데이터 - 분석 기획 - 빅데이터의 이해 - 데이터

반응형

 

Data

데이터란?

  • 추론과 추정의 근거를 이루는 사실
  • 현실 세계에서 관찰하거나 측정하여 수집한 사실
  • 과거 관념적이고 추상적인 개념에서 기술적이며 사실적인 의미로 변화

데이터의 특징

  • 상호적 특성 : 다른 객체와의 상호관계 속에 더 큰 가치 부여
  • 존재적 특성 : 객관적 사실
  • 당위적 특성 : 추론, 추정, 예측, 전망을 위한 근거

데이터의 구분

  정량적 데이터
(Quantitative Data)
정성적 데이터
(Qualitative Data)
정의 주로 숫자로 이루어진 데이터
예시) 11시 12분
함축적 의미를 지닌 문자와 같은 텍스트로 구성된 데이터
예시) 서버리스에 배포함
유형 정형 데이터, 반정형 데이터 비정형 데이터
특징 여러 요소의 결합으로 의미 부여 객체 하나가 함축된 의미를 내포
관점 주로 객관적 주로 주관적
형태 데이터베이스, 엑셀 시트 등 웹 로그, 텍스트 파일 등
위치 DBMS, 로컬 시스템 등 내부 웹사이트, 모바일 플랫폼 등 외부
분석 통계 분석 시 용이 통계 분석 시 어려움

데이터의 유형

  정형 데이터
(Structured Data)
반정형 데이터
(Semi-structured Data)
비정형 데이터
(Unstructured Data)
형식과 구조 정해진 형식과 구조에 맞게 저장 형식과 구조가 비교적 유연,
스키마 정보를 데이터와 함께 제공
형식과 주고자 유연,
구조가 정해지지 않음
연산 가능 불가능 불가능
형태 관계형 데이터베이스의 컬럼 등 JSON, XML, HTML 등 동영상, 이미지, 음성 등

근원에 따른 분류

  가역 데이터 (Reversible Data) 불가역 데이터 (Irreversible Data)
의존성 원본 데이터 그 자체 원본 데이터와 독립된 새 객체
환원성(추적성) 가능 (비가공 데이터) 불가능 (가공 데이터)
원본과의 관계 1:1의 관계 (동일) 1대N, N대1 또는 M대N의 관계 (독립)
원본의 수정 수정사항 반영 수정사항 반영 불가
처리과정 탐색 결합
활용분야 데이터 마트, 데이터 웨어하우스 데이터 전처리, 프로파일 구성

* 데이터 마트 : 데이터 웨어하우스 환경에서 정의된 접근 계층으로, 데이터를 꺼내 사용자에게 제공하는 역할

* 데이터 웨어하우스 : 데이터를 효율적으로 저장하여 보고서, 대시보드 및 분석도구를 강화하여 사용자에게 신속하게 결과를 제공하는 시스템

 


데이터의 기능

  • 데이터의 기능을 활용하려면 데이터를 기반으로 한 암묵지와 형식지의 상호작용이 중요
  암묵지
(= Tacit Knowledge)
형식지 (=명시지)
(Explicit Knowledge)
정의 학습과 경험을 바탕으로 겉으로 드러나지 않는 지식 혹은 노하우 문서나 매뉴얼 등을 통해 외부적으로 표출되어 여러 사람에게 공유될 수 있는 지식
형태 외부에 표출되지 않은 무형의 지식 형상화된 유형의 지식
전달과 공유 어려움 쉬움

 

<명시지와 암묵지의 이해를 위한 이미지>


지식창조 메커니즘

  • 공통화(Socialization) : 서로의 경험이나 인식을 공유, 한 차원 높은 암묵지로 발전
  • 표출화(Externalization) : 암묵지가 구체화되어 외부(형식지)로 표현
  • 연결화(Combination) : 형식지를 재분류하여 체계화
  • 내면화(Internalization) : 전달받은 형식지를 다시 개인의 것으로 체화

<지식창조 메커니즘>


가치창출 프로세스

지혜 (Wisdom)  축적된 지식을 통해 근본적인 원리를 이해하고 아이디어를 결합하여 도출한 창의적 산물
예시) 다른 상품도 온라인 구매가 오프라인보다 저렴할 것이다.
지식 (Knowledge)  상호 연결된 정보를 구조화하여 유의미한 정보로 분류하고 개인적인 경험을 결합시켜 내재화한 고유의 결과물
예시) 오프라인보다 온라인이 더 저렴하니 온라인을 이용하겠다.
정보 (Information)  데이터를 가공하거나 처리하여 데이터 간 관계를 분석하고 의미 도출
단, 항상 유용하진 않음
예시) 오프라인보다 온라인 쇼핑이 더 저렴하다.
데이터 (Data)  현실 세계에서 관찰하거나 측정하여 수집한 사실이나 값
개별 데이터로는 의미가 중요하지 않은 객관적 사실
예시) 오프라인이 온라인보다 약 10%가량 더 비싸다.

<지식 피라미드>


참고

2023 이기적 빅데이터 분석기사 필기 도서

네이버 지식백과 - 암묵지

반응형