Tableau를 사용한 지 너무 오래된 것 같아, 복습 겸 강좌를 듣고 있습니다.
네이버 커넥트 재단 boostcourse 중 '데이터 시각화를 위한 태블로 (강승일)'을 참고하고 있습니다.
평소 파이썬으로 EDA에 활용하는 시각화들을 태블로에서 간단히 구현하는 방법을 정리해보려고 합니다.
이번 포스팅에서는 범주형 변수와 수치형 변수 사이의 관계를 파악하기 위한 시각화에 대해 소개하겠습니다.
한 가지 방식이지만 머신러닝의 회귀(Regression) 문제에서 가장 많이 시도하는 EDA인 것 같습니다.
1. 박스 플랏
태블로에서 범주형과 수치형을 선택하면 default로 막대그래프가 추천됩니다.
하지만, 막대 그래프의 경우 평균, 빈도수 등 한 가지 통계량밖에 볼 수 없어서 분포를 확인하기 어렵습니다.
따라서 막대 그래프는 포함하지 않았습니다.
시각화에 사용한 기능 정리 ⬇️
더보기
- 변수 선택 : City Name, Sale Price
- 분석 - 박스 플롯 - 셀별
- 축 편집 - 범위 조절
제가 생각할 때 범주형-수치형 변수 사이의 관계를 파악하기에 가장 적합한 시각화라고 생각합니다.
한 번에 평균과 중앙값, 사분위수, 이상치 여부 등을 모두 파악할 수 있기 때문에 정말 만능입니다.
하지만 이상치 처리가 따로 되지 않기 때문에 축 편집을 통해 시각화의 범위를 조정해 줬습니다.
이번에는 짧지만 범주형과 수치형 변수 사이의 관계를 파악할 수 있는 박스 플랏에 대해 소개했습니다.
다음 포스팅에서는 수치형과 수치형 변수 사이의 관계 파악을 위한 시각화 기법들을 소개하겠습니다.
'공부 > Tableau' 카테고리의 다른 글
2024 KOBIS 박스오피스 데이터 분석 대시보드 (0) | 2025.01.21 |
---|---|
Basic EDA with Tableau - 변수간 관계 확인 (수치형-수치형) (0) | 2025.01.14 |
Basic EDA with Tableau - 변수간 관계 확인 (범주형-범주형) (0) | 2025.01.14 |
Basic EDA with Tableau - 변수 분포 확인 (수치형) (0) | 2025.01.10 |
Basic EDA with Tableau - 변수 분포 확인 (범주형) (0) | 2025.01.08 |