본문 바로가기

전체 글

(34)
회귀 분석 모델 성능 평가방법 - R²(결정계수),MSE, MAE, RMES, MAPE 설명 및 공식 R²(결정계수) 란? 우리가 만든 모델(선형 회귀 계수)이 얼마나 성능이 좋은가를 확인하기 위해서 사용되는 지표로써 우리의 모델이 종속변수를 얼마나 잘 설명 하는지를 얘기함 우리가 왼쪽과 같은 데이터를 가지고 오른쪽의 선형회귀모델선을 하나 만들었다고 가정 하였을때 R²는 실제 종속변수 Y값의 분산과 비하여 우리가 만든 회귀모델 값들의 분산이 얼마나 Y값의 분산과 유사한지를 판단한다고 볼 수 있다. 즉 분산을 통하여 Y값들과 모델이 얼마나 유사한가를 보는것이다. 각각의 용어들의 정의와 식은 아래와 같다. ​ 위에서 이야기 하였듣이 Y값분산 대비 우리가 만든 모델의 분산이 얼마나 유사한지를 보기 때문에 R² = SSR/SST = 1 - SSE/SST와 같게 되는 것이다. R²의 특징 및 유의점 R²는 위에서..
회귀 분석(1) - "선형 회귀분석과 SSE(최소제곱)" 설명 기울기 절편 구하는 공식 회귀 분석이란? 회귀 분석이란 독립 변수를 가지고 종속 변수를 예측 하고 종속 변수에 대한 독립 변수의 영향을 측정, 설명 하는데 사용 된다. 예시로 독립 변수와 종속 변수 회귀분석 알아보기 키가 160~ 175 사이 남자에 대한 키와 몸무게라는 데이터가 있다고 가정 해보자. 키와 몸무게는 통상적으로 상관관계가 있다고 가정 하였을때, 키가 있기 때문에 몸무게가 존재 한다고 생각하여 독립 변수를 키로 지정하고 종속 변수는 몸무게로 지정하였다. 우리가 가진 데이터로 175 보다 크거나 160 보다 작은 사람은 몸무게를 예측 할때 사용 하는것이 회귀 분석이라고 생각 하고 이때 키라는 독립 변수를 통하여 몸무게라는 종속 변수를 설명 할 수 있다. 선형 회귀 분석 선형 회귀 분석이란 내가 가진 데이터내에서 이 데..
표본 추출의 방법들의 설명과 예시(단순 임의 추출, 층화 표본 추출, 계통 추출, 군집 추출) 표본 추출 이란? 표본 추출이란 우리가 모집단 전체에 대해서 통계 자료를 작성하기 위해선 시간과 비용이 많이 들 수 밖에 없다. 그러한 이유로 여러가지 표본들을 추출하여 모집단의 평균과 표준편차 등등을 추정하게 되는데 이때. 모집단에서 데이터를 가져오는 방법을 표본 추출 이라고 하고 단순 임의 추출, 층화 표본 추출, 계통 추출, 군집 추출등 이 있다. 예시로 보는 표본 추출 방법 1.전국의 고등학생들의 평균 키를 알아보기 위해 전국의 학교 리스트가 있고, 각 학교에 요청하여 학생들의 키를 조사 할 수 있게 되었는데, 시간과 비용이 너무 많이 들 것을 걱정하여 N개의 학교를 조사 하기로 하였을때 표본 추출 방법별 차이는 아래와 같다. 단순 임의 추출 전체 중에 랜덤한 N개를 선택 한다. 층화 표본 추출 ..