tableau4 2024 KOBIS 박스오피스 데이터 분석 대시보드 태블로에서는 시트를 모아서 대시보드를 제작할 수 있습니다.대시보드를 통해 전달하고자 하는 내용을 한눈에 들어오도록 정리할 수 있고, 클릭, 마우스오버 등을 통해 동적으로 데이터를 살펴볼 수 있기 때문에 아주 편리합니다.이번 포스팅에서는 실제 데이터를 활용해 동적 대시보드를 제작한 내용을 소개하도록 하겠습니다.데이터 소스는 문화 빅데이터 플랫폼 - 'KOBIS 박스오피스 영화정보(한국문화정보원)' 입니다.데이터는 21년 1월부터 24년 11월까지 다운로드할 수 있지만, 21년 6월 ~ 23년 10월까지는 데이터에 결측이 너무 많아서 2024년 데이터만 활용했습니다. (데이터가 온전했다면 전년 대비 성장률 등의 정보도 확인할 수 있었을 것 같은데 아쉽습니다.) 데이터 전처리먼저, 한 달 단위로 데이터 파일이.. 2025. 1. 21. Basic EDA with Tableau - 변수 분포 확인 (수치형) Tableau를 사용한 지 너무 오래된 것 같아, 복습 겸 강좌를 듣고 있습니다.네이버 커넥트 재단 boostcourse 중 '데이터 시각화를 위한 태블로 (강승일)'을 참고하고 있습니다.평소 파이썬으로 EDA에 활용하는 시각화들을 태블로에서 간단히 구현하는 방법을 정리해보려고 합니다. 범주형 변수의 경우 값이 잘 못 들어가거나 관측치가 부족한 고유값을 쉽게 확인할 수 있습니다.하지만 수치형 변수의 경우 연속적인 범위에 분포했기 때문에 값을 눈으로 봐서는 쉽게 구분하기 어렵습니다.데이터 타입이나 변수의 특징에 따라 변수값의 가능한 범위도 고려해야 하고, 데이터의 분포를 고려해 이상치 여부를 판단해야 하는 경우도 발생합니다.이번 포스팅에는 위의 문제들을 해결할 수 있도록 단일 수치형 변수의 기본적인 시각화.. 2025. 1. 10. Basic EDA with Tableau - 변수 분포 확인 (범주형) Tableau를 사용한 지 너무 오래된 것 같아, 복습 겸 강좌를 듣고 있습니다.네이버 커넥트 재단 boostcourse 중 '데이터 시각화를 위한 태블로 (강승일)'을 참고하고 있습니다. 평소 파이썬으로 EDA에 활용하는 시각화들을 태블로에서 간단히 구현하는 방법을 정리해보려고 합니다. 저는 EDA를 할 때 기본적으로 5가지를 확인합니다. (일반적인 지도학습 기준)변수 분포 확인 (범주형)변수 분포 확인 (수치형)변수 간 관계 확인 (범주형-범주형)변수 간 관계 확인 (수치형-수치형) 변수 간 관계 확인 (범주형-수치형)특히, 독립변수에 따른 종속 변수의 분포는 필수로 확인하는 편입니다.따라서 위 내용을 태블로로 확인하는 방법에 대해 총 5개 정도 포스팅을 진행할 계획입니다.이번 시간에는 첫 단계로 범.. 2025. 1. 8. Basic EDA with Tableau - 태블로 시작하기 Tableau를 사용한 지 너무 오래된 것 같아, 복습 겸 강좌를 듣고 있습니다.네이버 커넥트 재단 boostcourse 중 '데이터 시각화를 위한 태블로 (강승일)'을 참고하고 있습니다. 평소 파이썬으로 EDA에 활용하는 시각화들을 태블로에서 간단히 구현하는 방법을 정리해보려고 합니다. 바로 EDA에 관한 내용을 정리하려다가, 중간중간 데이터 타입 변경 등의 내용을 이야기해야 할 것 같아서 설치와 데이터 불러오기부터 적어야겠다고 생각했습니다.본 포스팅에서는 태블로 설치, 환경 설정, 데이터 불러오기 등 EDA를 하기 위한 준비 과정을 짧게 담아보려고 합니다. 태블로 설치하기대부분의 유료 소프트웨어처럼 태블로도 가격에 따라 기능이 달라집니다.하지만 저는 복습 + 간단한 EDA 활용을 위해 태블로를 사용하.. 2025. 1. 8. 이전 1 다음