이번주는 파이썬 프로젝트를 진행하였다.
우리 조는 관광데이터를 바탕으로 [양양군의 성공사례를 대조하여 영덕군의 데이터 분석해 관광 활성화 전략] 을 진행하기로 하였다. 프로젝트 주제는 좋다고 강사님께 좋은 피드벡도 받음!
먼저, 팀원끼리 자료 주제를 정리한 다음에 어떤 데이터를 접근할 것인지 정리.
데이터 검색을 해보니,
한국관광 데이터랩(한국관광공사)
양양군 스마트관광도시(양양군)
관광지식정보시스템(문화체육관광부)
위와 같은 좋은 데이터 자료들이 많이 있었고, 또 카드 소비데이터와 티맵 목적지 데이터, SNS 언급량도 함께 가져와 각자 할당량을 정해 어떤 데이터를 정리할 것인지 정하였다.
내가 맡은 부분은 방문객 성비, 연령, 거주지 등을 정리한 데이터였다.
먼저, cvs로 받은 데이터를 쥬피터 노트북에 불러와 데이터 전처리를 진행하기로 하였다.
1. numpy와 Pandas를 정리하여 자료 불러와 정리
2. 컬럼 정리 ex) df3.columns=["방문자연령","남성비율","여성비율"]
3. 그룹화하여 sum 정리
4. 오름 차순 정리
생각보다 데이터가 단순하여 그렇게 정리할 자료는 많지는 않았다.
그 다음에는 데이터 시각화.
사실 이부분은 그냥 엑셀이 너무 편한데 왜 파이썬으로 하는지 모르겠으나, 그래도 파이썬 프로젝트이니 해야겠지..
from matplotlib import pyplot as plt
import numpy as np
%matplotlib inline
아래와 같이 멧플로립 불러와서, 그래프 종류, 차트이름, 축이름, 색등을 정리해 데이터를 시각화 하였다.
이를 통해, 각자 정리된 파일을 정리하여 각 파일의 연관성을 찾고 각자의 영향관계를 대입하여 상관 분석까지 정리하여 데이터 시각화 정리
'Connect to opportunity > 패스트캠퍼스 데이터부트캠프' 카테고리의 다른 글
데이터부트캠프 11기_ SQL프로젝트 후기 (2) | 2023.12.27 |
---|---|
패스트캠퍼스 데이터부트캠프_7주차 (1) | 2023.12.07 |
패스트캠퍼스 데이터부트캠프_4주차 (0) | 2023.11.17 |
패스트캠퍼스 데이터부트캠프_2주차 (0) | 2023.11.03 |
패스트캠퍼스 데이터부트캠프_1주차 (0) | 2023.10.24 |