본문 바로가기
Daily Review

올바른 데이터에 대한 올바른 차트

by data-analyst-luke 2022. 9. 11.
반응형

이 게시물에서는 다양한 유형의 차트를 분석하여 데이터 시각화 및 분석의 맥락에서 차트를 사용하는 방법과 경우를 이해합니다.

 

이 게시물은 데이터 과학의 몇 가지 기본 개념을 분석한 이전 게시물과 연결된 것으로 간주할 수 있습니다.

https://medium.com/@entango/some-basic-concepts-in-data-analysis-data-science-part1-213b4a129d3d

 

Some basic concepts in Data Analysis & Data Science — Part1

As I approached the world of data science I encountered some basic concepts that every beginner should know. These concepts constitute a…

medium.com

 

다양한 유형의 그래프 사이에서 방향을 지정하는 데 사용할 예시적인 다이어그램부터 시작하겠습니다.

차트 유형

 

우리가 구별해야 하는 주요 차이점은 시각화의 목적과 관련이 있으며 4가지 계열을 식별할 수 있습니다.
1. 비교 : 데이터 세트의 데이터를 서로 비교하는 목적
2. 분포 : 데이터 세트의 데이터 분포를 나타내는 목적
3 . 구성 : 데이터세트 내 데이터의 구성을 나타내는 목적
4. 관계 : 데이터세트 내 데이터의 관계를 나타내는 목적

 

  1. 비교

비교 차트는 다음과 같이 나눌 수 있습니다.

항목 간 비교 : 목적은 데이터 세트에서 데이터를 서로 비교하는 것입니다. 이러한 유형의 시각화에는 다음을 사용할 수 있습니다.

  • 막대 차트(세로 또는 가로)
  • 차트가 포함된 표(단순 또는 피벗)
  • 가변 너비 세로 막대형 차트(막대 너비가 나타낼 데이터 값에 따라 달라지는 특정 유형의 가로 막대형 차트)

 

예: 항목 간의 비교

포함된 차트가 있는 막대 차트 및 표

 

데이터 테이블은 다른 그래프보다 더 상세하고 광범위한 방식으로 데이터를 반환할 수 있으므로 보고서의 목적이 분석 유형일 때 확실히 더 유용합니다.

 

시간에 따른 비교 : 목적은 시간에 따른 데이터를 비교하는 것입니다. 이러한 유형의 시각화에는 다음을 사용할 수 있습니다.

  • 원형 영역 차트(또는 순환 데이터의 경우 방사형 차트)
  • 라인 차트
  • 막대 차트(세로)

 

예: 시간 경과에 따른 비교

꺾은선형 차트 및 원형 영역(또는 극좌표) 차트

 

원형 영역 차트는 순환 데이터를 나타내며 동일한 값의 모든 요소(예: 1월 대 7월)에 대해 비교가 이루어집니다. 반면에 시간 기반(월) 꺾은선형 차트는 주어진 연도 내에서만 의미가 있습니다.

 

2. 유통

분포 차트는 다음과 같이 나눌 수 있습니다.

단일 변수 의 분포 : 목적은 적은 수 또는 많은 데이터 포인트를 사용하여 단일 변수의 분포를 나타내는 것입니다. 이러한 유형의 시각화에는 다음을 사용할 수 있습니다.

  • 막대 차트(세로)
  • 라인 차트

 

예: 단일 변수의 분포

막대 차트 및 꺾은선형 차트

 

두 변수 의 분포 : 목적은 적거나 많은 데이터 포인트를 사용하여 두 변수의 분포를 나타내는 것입니다. 이러한 유형의 시각화에는 다음을 사용할 수 있습니다.

  • 산포도

 

예: 두 변수의 분포

 

3. 구성

구성 차트는 다음과 같이 나눌 수 있습니다.

시간에 따른 구성 변화 : 데이터셋의 구성을 시간에 따라 표현/분석하는 것이 목적입니다. 이러한 유형의 시각화에는 다음을 사용할 수 있습니다.

  • 누적 막대 차트(표준 또는 100%)
  • 누적 영역 차트(표준 또는 100%)

 

예시:

누적 막대 차트 및 누적 영역 차트

 

정적 구성 : 목적은 데이터 세트의 정적 구성을 표현/분석하는 것입니다. 정적 구성의 추가 분류는 다음 하위 범주를 식별하는 것으로 구성됩니다.

  • 전체의 단일 몫
  • 합계에 대한 누적 또는 빼기
  • 구성 요소의 구성 요소 총 누적 및 절대 차이

 

이러한 유형의 시각화에는 다음을 사용할 수 있습니다.

  • 파이 차트(전체의 단일 공유)
  • 폭포 차트(합계에 대한 누적/빼기용)
  • 누적 막대 차트(구성 요소의 구성 요소용)
  • 트리 맵 차트(총 누적 및 절대차)

 

예시:

파이 차트 및 트리 맵 차트

 

4. 관계

관계 차트는 다음과 같이 나눌 수 있습니다.

두 변수 간의 관계 : 목적은 두 변수 간의 관계를 표현/분석하는 것입니다.

3개 이상의 변수 간의 관계 : 목적은 3개 이상의 변수 간의 관계를 표현/분석하는 것입니다.

 

예시:

산점도 차트

 

결론

이 게시물을 통해 사용 가능한 데이터를 기반으로 어떤 차트를 언제 사용해야 하는지에 대한 유용한 정보를 얻었기를 바랍니다.

반응형

댓글