반응형
반응형
분포 시각화 정의 데이터의 분포를 시각적으로 표현하는 기법 특정 변수의 값들이 어떻게 분포되어 있는지를 파악하기 위해 사용 비율로 영역을 표현하는 경우(원 그래프 등), 각 영역을 모두 합치면 1 또는 100%가 되는 특징을 가짐 분포 데이터의 시각화는 최대, 최소, 전체분포를 나타내는 그래프로 표현 전체의 관점에서 각 부분이 차지하는 정보를 시각화 히스토그램, 파이차트, 도넛차트, 누적연속그래프, 트리맵 등 히스토그램(Histogram) 막대 그래프의 일종 세로축(y축) 데이터의 분포 정도를 표현 가로축(x축) 특정 변수의 구간 폭을 표현 데이터셋 안에서 특정 변수의 값이 어떻게 분포되어 있는지를 파악해야 하는 경우(도수분포) 주로 사용 도수분포표 : 데이터 값의 다양한 산출 분포를 보여주는 목록이나 ..
시간 시각화 정의 시간에 따른 데이터의 변화를 표현하는 것 일정기간에 걸쳐 진행되는 변화와 트렌드를 추적하는데 주로 사용 주로 데이터의 경향성(트렌드, trend)을 파악 시간 데이터는 특정 시점의 값을 표현하는 이산형과 변화하는 값을 표현하는 연속형으로 구분 이산형(분절형) 특정 시점 또는 특정 시간의 구간 값 표현 도구 : 막대 그래프, 누적 막대 그래프, 묶은 막대 그래프, 점 그래프 연속형 어떤 구간에서 지속적으로 변화하는 값을 표현 도구 : 꺾은 선 그래프, 계단 그래프, 추세선 시간데이터의 전후 관계를 분석하는 것이 핵심 막대 그래프 데이터의 값을 길이로 표현한 막대를 배치함으로써 상대적인 차이를 한눈에 알아보도록 표현하는 방법 시간축(가로축, x축) 주로 시간 순서대로 정렬된 특정 시점을 표..
정보 시각화(Information Visualization) 방대한 양의 정보를 한 번에 사용자가 보고 이해할 수 있도록 직관적으로 표현하는 방법에 중심을 둠 수치정보 뿐만 아니라 텍스트나 지형정보 같은 비수치 정보까지 포함 시각화 표현의 차이 데이터 시각화 : 그래픽을 이용해 정보를 명확하게 표현하는 것을 강조 정보 시각화 : 큰 범위의 집합에 대한 시각적 표현 방법을 강조 데이터 시각화에서 한단계 더 정보 형태의 가공 과정을 거침 정보 시각화 활용 카토그램(Cartogram, 지도도표) 분기도(Cladogram) 개념도(Concept Map) 계통도(Dendrogram, 덴드로그램) 네트워크 다이어그램(Network Diagram) 트리맵(Tree Map) 하이퍼볼릭 트리(Hyperbolic Tree..
데이터 시각화 정의 분석된 결과를 해석하는 대표적인 방법 데이터 값을 시각적 속성으로 변환하고 이를 그래프로 표현하는 과정 데이터 사이의 관계를 대표할 수 있는 특징을 도표나 차트 등으로 표현 시각화를 통해 데이터의 의미를 명확하게 표현하고 효율적으로 전달하는 것을 목적으로 하는 것 즉, 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정과 기법을 의미 고려사항 기능적인 측면 : 데이터의 의미를 정확하게 표현하여야 함 심미적인 측면 : 사람이 쉽게 인지하고 직관적으로 이해할 수 있어야 함 데이터 시각화 특성 자료로부터 정보를 습득하는 시간을 절감하고 데이터에 대한 즉각적인 판단 가능 데이터의 특징과 패턴, 추세를 직관적으로 제공하여 데이터의 의미에 대한 이해를 효과적으로 도움 하..
회귀 모델 변수들 간의 관계 분석을 위해 히트맵(Heat Map)과 산점도(Scatter Plot)를 활용 회귀 모델에서의 시각화 표현 여러가지 변수들을 동시에 비교 시각화 전체에서 식별되는 부분에 대한 수치 시각화 정도를 표현하는 비교 시곽화 각기 다른 변수들과의 관계를 표현하는 관계 시각화 2022.05.02 - [Programming/Python] - Python - Matplotlib 활용 - 표, 그래프 만들기(통계/원형/히스토그램/산점도/회귀/상관관계/열분포도) 분류 모델 SVM(서포트 벡터 머신) 산점도와 구분선을 통한 비교시각화 기법 활용 범위와 영역 구분 KNN 비교시각화의 평행좌표계 변수들과의 연광성 및 그룹데이터의 경향성 파악 2022.05.09 - [Programming/Machin..
분석모델 해석 분석모델 해석은 이전에 포스팅한 이론의 내용과 중복되는 부분이 많으므로 자세한 내용은 아래의 포스팅을 확인해주세요. 2023.03.22 - [이론/빅데이터 분석 기사] - 빅데이터 결과 해석 - 모형 평가 및 개선 - 평가 지표 2023.03.18 - [이론/빅데이터 분석 기사] - 빅데이터 모델링 - 분석기법 - 연관성분석(Association Rule Learning) 회귀 모델 회귀 모델의 평가를 위한 지표는 일반적으로 잔차, 결정계수 등이 있음 잔차 회귀모델로 실제 값과 예측 값의 차이를 의미하는 것 패턴이나 추세가 있어서는 안 됨 결정계수 추정된 회귀식이 변동을 얼마나 잘 설명했는가에 대한 지표 값이 1에 가까울수록 실제 관측값이 회귀선상에 정확히 일치함을 의미 분류 모델 각각의 ..