Tableau를 사용한 지 너무 오래된 것 같아, 복습 겸 강좌를 듣고 있습니다.
네이버 커넥트 재단 boostcourse 중 '데이터 시각화를 위한 태블로 (강승일)'을 참고하고 있습니다.
평소 파이썬으로 EDA에 활용하는 시각화들을 태블로에서 간단히 구현하는 방법을 정리해보려고 합니다.
바로 EDA에 관한 내용을 정리하려다가, 중간중간 데이터 타입 변경 등의 내용을 이야기해야 할 것 같아서 설치와 데이터 불러오기부터 적어야겠다고 생각했습니다.
본 포스팅에서는 태블로 설치, 환경 설정, 데이터 불러오기 등 EDA를 하기 위한 준비 과정을 짧게 담아보려고 합니다.
태블로 설치하기
대부분의 유료 소프트웨어처럼 태블로도 가격에 따라 기능이 달라집니다.
하지만 저는 복습 + 간단한 EDA 활용을 위해 태블로를 사용하기 때문에 무료 버전을 사용할 겁니다.
무료 버전인 Tableau Public을 사용하기 위해 '태블로 퍼블릭'을 검색해 들어갑니다.
상단 탭 중 '만들기' > 'Tableau Desktop Public Edition 다운로드'를 클릭합니다.
클릭한 뒤 양식에 맞춰 입력하고 다운로드를 하고 설치 파일을 풀면 됩니다.
글을 쓰다 보니 점점 귀찮아집니다...
언어는 한국어를 설정할 수 있고, 설치 파일을 실행해 클릭클릭 하다 보면 대충 설치가 끝날 겁니다. (파이팅입니다.)
데이터 열기
기본적으로 태블로에서 데이터를 관리하는 위치는 '내 Tableau 리포지토리 - 데이터 원본'폴더입니다.
물론 다른 경로에 있는 데이터도 찾아 들어가면 읽을 수 있는 것 같습니다.
그래도 시각화할 데이터를 한 곳에 모아두면 좋으니 default 경로에 넣어두도록 합시다.
태블로에서는 다양한 데이터를 열어볼 수 있습니다.
이 글을 보는 분이라면 대부분 엑셀파일, 텍스트파일, Json파일 중 하나를 사용하실 것 같습니다.
파일 확장자가 엑셀(.xlsx), Json(.json)이 아니면 대부분(csv, tsv 등등) 텍스트 파일을 선택하시면 됩니다.
데이터 타입 설정
태블로에서는 기본적으로 데이터 분석이나 시각화를 하다가 중간에도 데이터 타입을 설정할 수 있습니다.
하지만, 처음 데이터를 열면 데이터에 어떤 값이 들어있는지, 데이터 타입은 잘 설정되어있는지는 미리 확인하는 습관을 들이는 게 좋은 것 같습니다.
태블로에서 데이터 타입은 기본적으로 두 가지 큰 분류가 있습니다.
차원 : 차트를 나눠 보는 기준이 되는 변수 (범주형 변수)
측정값 : 차트의 내용이 되는 변수 (수치형 변수)
날짜형 변수의 경우 연/월/일별 집계를 볼 경우 차원, 연속적인 값의 변화를 볼 경우 측정값으로 설정할 수 있습니다.
차원은 파란색, 측정값은 초록색으로 표현됩니다.
범주형 변수는 Abc, 날짜는 달력, 수치형은 #, 지리정보는 지구본 등으로 표현됩니다.
타입을 변경하고 싶다면, 위의 그림에서 왼쪽에 보이는 '필드' 정보에서 유형을 클릭해 원하는 타입으로 설정하면 됩니다.
간단하게 태블로를 설치하고 데이터를 열어 타입을 변경하는 방법에 대해 정리해 보았습니다.
다음 포스팅에서는 본격적인 EDA 내용을 소개하도록 하겠습니다.
'공부 > Tableau' 카테고리의 다른 글
Basic EDA with Tableau - 변수간 관계 확인 (수치형-수치형) (0) | 2025.01.14 |
---|---|
Basic EDA with Tableau - 변수간 관계 확인 (범주형-수치형) (0) | 2025.01.14 |
Basic EDA with Tableau - 변수간 관계 확인 (범주형-범주형) (0) | 2025.01.14 |
Basic EDA with Tableau - 변수 분포 확인 (수치형) (0) | 2025.01.10 |
Basic EDA with Tableau - 변수 분포 확인 (범주형) (0) | 2025.01.08 |