본문 바로가기

Connect to opportunity13

패스트캠퍼스 데이터 부트캠프_ 테블로 두번째 이번주는 저번주에 이어, 테블로 두번째 시간을 가지게 되었다. 이제 조금 더 상위 개념으로 나아가기 전에, 강사님이 대시보드를 보여주시면 그걸 따라서 똑같이 만들어 보는 작업을 거쳤다. 미약하나마 처음 진행해본 대시보드 (사이즈가 작아서 다 깨짐;;;) 그 다음으로는 테블로의 진행 순서를 따라 여러 필터를 적용해보는 과정을 거쳤다. 먼저, 필터 및 계산 식에 따라 진행되는 순서는 아래 표와 같다. 필터는 크게 어려운 건 없고, 좌측 탭에 필터 탭을 활용해, 필터 보기를 바꾸어 보면 자동으로 거기에 맞는 수치로 변환하는 태블로의 모습을 살펴 볼 수 있다. 그림과 같이 변환하는 테블로 차트 모습으로 각 지역별에 따른 상위 고객의 매출 변동읗 확인할 수 있다. 다음으로는 이중축을 그리는 방법에 대해 배웠다. .. 2024. 1. 4.
패스트캠퍼스 데이터 부트캠프_ 태블로 시작 SQL 프로젝트를 마치고 태블로를 시작하게 되었다. 태블로 시작에 앞서, 태블로 설치를 하였다. 우리는 테블로 데스크탑 프로페셔널을 다운로드 하여 사용하는데, 아무래도 유료 제품이기 때문에 2주간의 기간 동안 강의를 진행한다고 하였다. 테블로는 여러가지 형식이 있는데, 아래와 같이 태블로 제품의 형식을 알려주었다. 많이 사용하는 프로와 퍼블릭의 차이는 아래와 같다는 것이 있다. 태블로를 하는 이유는 데이터를 시각화하여 명료하게 의견 전달을 하는 데 큰 목적이 있는데 태블로의 기본적인 툴을 배우고 분석하는 과정을 아래와 같이 진행하였다. 일단, 테블로는 잘 정제된 데이터를 불러와야 시각화를 할 수가 있는데 불러오는 과정은 아래와 같다. 해당 탭에서 연결된 데이터에 대한 정보 (필드, 행, 컬럼) 에 대한 .. 2023. 12. 28.
데이터부트캠프 11기_ SQL프로젝트 후기 지난 2주의 기간 동안 데이터 부트캠프 중, SQL 프로젝트를 진행하였다. 세가지의 과제 중에 골라 프로젝트를 진행할 수 있었는데, 한번 남들이 하지 않았던 자료를 사용해보고 싶었고, 무엇보다 주제도 online cosmetic shop 내, 고객 행동 분석이였기 때문에 주제도 끌려서 선택하게 되었다. 해당 과제는 아래와 같이 9개의 컬럼으로 심플하게 구성되어 있지만, 5개월 간의 view, cart, purchase 등을 이룬 여러 활동 과정이 있었기 때문에, 데이터 파일이 커서 파이썬으로 돌리는 특장점이 있었다. 무엇보다 어떤 사이트인지 어느 배경을 가졌는지 데이터에 대한 배경 지식이 전무하였기 때문에 해당 지식에 대한 백그라운드 지식이 간절하였다. 다들 팀원간의 서치를 통해, 사이트가 러시아의 한 .. 2023. 12. 27.
패스트캠퍼스 데이터부트캠프_7주차 이번주는 드디어 파이썬을 끝내고, SQL 로 넘어갔다. 파이썬을 하고 SQL을 하면 정말 쉽다고 하는데, 초반에는 수식을 배우는 것은 쉬웠지만, 점차 갈수록 서브, 상관 커리 등 중급으로 가는 것은 정말 어려움.. 먼저, SQL 문법의 기초들을 쭉 다졌다. 무엇보다 그냥 수식만 하는게 아니라 강사님이 다양한 raw data를 가지고 와서 조정하는게 흥미로웠다. 먼저, 데이터를 다루는데 있어 데이터를 습득하는 것이 가장 중요한데 아래와 같이 데이터에 대한 정의를 이해하고 가야 편해진다. 또한 스키마 (schema)라는 데이터를 저장하는 SQL 의 저장형식도 습득 후, 이제 본격적인 데이터 생성 편집 수식 정리. 1. 데이터베이스 생성 mysql> CREATE DATABASE dbname; 2. 데이터베이스.. 2023. 12. 7.
패스트캠퍼스 데이터부트캠프_5주차 이번주는 파이썬 프로젝트를 진행하였다. 우리 조는 관광데이터를 바탕으로 [양양군의 성공사례를 대조하여 영덕군의 데이터 분석해 관광 활성화 전략] 을 진행하기로 하였다. 프로젝트 주제는 좋다고 강사님께 좋은 피드벡도 받음! 먼저, 팀원끼리 자료 주제를 정리한 다음에 어떤 데이터를 접근할 것인지 정리. 데이터 검색을 해보니, 한국관광 데이터랩(한국관광공사) 양양군 스마트관광도시(양양군) 관광지식정보시스템(문화체육관광부) 위와 같은 좋은 데이터 자료들이 많이 있었고, 또 카드 소비데이터와 티맵 목적지 데이터, SNS 언급량도 함께 가져와 각자 할당량을 정해 어떤 데이터를 정리할 것인지 정하였다. 내가 맡은 부분은 방문객 성비, 연령, 거주지 등을 정리한 데이터였다. 먼저, cvs로 받은 데이터를 쥬피터 노트북.. 2023. 11. 24.
패스트캠퍼스 데이터부트캠프_4주차 파이썬 강의 #리스트에 추가하기 a=[10,20,30] a.append(500) a len(a) #for 문으로 작성해보기 a=[] for i in range(10): a.append(i) print(a) #while 문으로 작성해보기 a=[] i=0 while i 큰 값은 i > biggest 로 #리스트에서 특정 요소만 뽑아내기 a=['alpha','bravo','charlie','delta','echo','foxtrot','golf','hotel','india'] #내가 한거 b = [list(map(len[a]==5),a)] b =[s for s in a if len(s)==5] print(b) #이차원 리스트 정리 a= [[10,20],[30,40],[50,60]] a[0][0]#0행, 0열 찾.. 2023. 11. 17.