본문 바로가기
Connect to opportunity/패스트캠퍼스 데이터부트캠프

패스트캠퍼스 데이터부트캠프_2주차

by 캘리걸 2023. 11. 3.

이번주는 통계 관련 내용을 주로 배운 주 이다.

개념적인 부분이라 어렵기는 하였는데, 막상 데이터 분석에서 가장 중요한 부분이라고 생각한다. 

 

 

P-Value 0.05보다 크냐 작냐 기

 

귀무 가설 : 영향을 주지 않는다. 

종속 가설: 

 

 

 

회귀분석 (Regression) 

Y= aX + b (Y는 종속변수 : 우리가 알고 싶은 변수, X는 독립변수: 우리가 알고 있는 변수) 

결정계수는 0-1까지만 나옴. -> 1에 가까울 수록 종속/독립 변수와의 관계를 잘 설명한다. 

Y절편은 B값을, X1값은 a(기울기)를 뜻함. 

 

다중 선형 회귀 분석

ex) 매출액을 보고자 할때, 매출액(Y)에 영향을 주는 여러 독립변수를 여러 개로 두어 매출액과의 관계를 파악해보겠다. 

 -> 조정된 결정 계수로 결론 짓는다. 

 

시계열 데이터 분석 : 시간의 흐름에 따라 발생된 데이터를 분석하는 기법 

단순 지수 평활법 (Single Exponential Smoothing)  

 

머신러닝 

강화학습 (Reinforcement Learning) : 

 

 

데이터 시각화 :

 

목적: 시각적으로 효과적인 정보전달을 위해

막대차트, 콤보차트 

대시보드 시각화 - 피벗테이블에 대시보드를 넣어서 변동되는 차트 만들기