데이터분석 #데이터분석부트캠프 #패스트캠퍼스 #패스트캠퍼스부트캠프 #패스트캠퍼스데이터분석부트캠프4 패스트캠퍼스 데이터 부트캠프_ 태블로 시작 SQL 프로젝트를 마치고 태블로를 시작하게 되었다. 태블로 시작에 앞서, 태블로 설치를 하였다. 우리는 테블로 데스크탑 프로페셔널을 다운로드 하여 사용하는데, 아무래도 유료 제품이기 때문에 2주간의 기간 동안 강의를 진행한다고 하였다. 테블로는 여러가지 형식이 있는데, 아래와 같이 태블로 제품의 형식을 알려주었다. 많이 사용하는 프로와 퍼블릭의 차이는 아래와 같다는 것이 있다. 태블로를 하는 이유는 데이터를 시각화하여 명료하게 의견 전달을 하는 데 큰 목적이 있는데 태블로의 기본적인 툴을 배우고 분석하는 과정을 아래와 같이 진행하였다. 일단, 테블로는 잘 정제된 데이터를 불러와야 시각화를 할 수가 있는데 불러오는 과정은 아래와 같다. 해당 탭에서 연결된 데이터에 대한 정보 (필드, 행, 컬럼) 에 대한 .. 2023. 12. 28. 패스트캠퍼스 데이터부트캠프_7주차 이번주는 드디어 파이썬을 끝내고, SQL 로 넘어갔다. 파이썬을 하고 SQL을 하면 정말 쉽다고 하는데, 초반에는 수식을 배우는 것은 쉬웠지만, 점차 갈수록 서브, 상관 커리 등 중급으로 가는 것은 정말 어려움.. 먼저, SQL 문법의 기초들을 쭉 다졌다. 무엇보다 그냥 수식만 하는게 아니라 강사님이 다양한 raw data를 가지고 와서 조정하는게 흥미로웠다. 먼저, 데이터를 다루는데 있어 데이터를 습득하는 것이 가장 중요한데 아래와 같이 데이터에 대한 정의를 이해하고 가야 편해진다. 또한 스키마 (schema)라는 데이터를 저장하는 SQL 의 저장형식도 습득 후, 이제 본격적인 데이터 생성 편집 수식 정리. 1. 데이터베이스 생성 mysql> CREATE DATABASE dbname; 2. 데이터베이스.. 2023. 12. 7. 패스트캠퍼스 데이터부트캠프_3주차 이번주는 드디어, 파이썬에 입문하였다. 시작할때부터 가장 걱정이 많은 파이썬인데... 지금 4번째 강의를 들은 상태로는 아직도 모르겠다... 일단 첫번째 시간에는 파이썬의 자료형 데이터에 대해 배웠는데, 내용은 아래와 같다. 모든 것을 처리할 수 있는 것을 자료(data)인데, 이 자료는 문자(str), 숫자(n : int(정수)와 float(소수))로 나뉜다. 불(boolean) 인 참 거짓의 종류가 있다. 따음표도 중요한데 "(큰따옴표)나 '(작은따옴표)로 문자를 묶어줄 수가 있습니다. 숫자의 연산자는 +, -, *, // . % =는 나머지를 구하는 연산자 파이썬 조건문은 == 같다/ !=다르다/ 크다/ =크거나 같다 논리 연산자 not 아니다 : and 그리고: 양쪽 변이 모두 참일.. 2023. 11. 10. 패스트캠퍼스 데이터부트캠프_2주차 이번주는 통계 관련 내용을 주로 배운 주 이다. 개념적인 부분이라 어렵기는 하였는데, 막상 데이터 분석에서 가장 중요한 부분이라고 생각한다. P-Value 0.05보다 크냐 작냐 기 귀무 가설 : 영향을 주지 않는다. 종속 가설: 회귀분석 (Regression) Y= aX + b (Y는 종속변수 : 우리가 알고 싶은 변수, X는 독립변수: 우리가 알고 있는 변수) 결정계수는 0-1까지만 나옴. -> 1에 가까울 수록 종속/독립 변수와의 관계를 잘 설명한다. Y절편은 B값을, X1값은 a(기울기)를 뜻함. 다중 선형 회귀 분석 ex) 매출액을 보고자 할때, 매출액(Y)에 영향을 주는 여러 독립변수를 여러 개로 두어 매출액과의 관계를 파악해보겠다. -> 조정된 결정 계수로 결론 짓는다. 시계열 데이터 분석 .. 2023. 11. 3. 이전 1 다음