전체 글 (34) 썸네일형 리스트형 선형회귀 분석 - statsmodels ols, OLS sklearn LinearRegression 차이 및 예시 Statsmodels의 ols, OLS의 사용 예시와 sklearn LinearRegression의 차이를 다룬 포스팅입니다. statsmodels.api 의 OLS와 formula.ols statsmodels의 ols와 OLS 또한 선형 회귀모델의 최소제곱법을 활용한 모델이다. 아래부터는 각 모델의 예시 코드 및 과정입니다. import pandas as pd import statsmodels.api as sm from statsmodels.formula.api import ols from sklearn.linear_model import LinearRegression train = pd.read_csv('bmi-dataset/BMI_Dataset_train.csv') test = pd.read_csv.. 연속확률분포(3)-지수분포 지수 분포란? 지수 분포란 특정 사건이 포아송 분포를 따르고 있을 때, 사건이 일어날때 까지의 대기시간을 나타낸다. 즉, 특정 단위시간에 평균 n회 일어나는 사건이 있을 때, 다음 사건이 일어날 때까지 대기 시간은 지수분포를 따른다. 이 분포를 활용하여 우리는 사건이 발생할때 까지의 걸리는 시간이 특정 시간 이하일 확률을 알 수 있다. 예를 들어 하루에 평균 n잔의 커피를 구매한다고 하였을때 사건이 발생하는 t 까지의 걸리는 시간이 T이하일 확률을 지수 분포를 통하여서 알 수 있다. 하루 평균 2잔의 커피를 마실때 커피를 마실때 까지의 걸리는 기간이 T 이하일 확률을 알고 싶다고 할 때 T를 3일 이라고 가정한다면, 하룻동안 커피를 마시지 않을 확률을 포아송 분포의 수식에 대입하여 13.5 %란 값을 얻.. Python 코드로 MSE, RMSE, MAE 구하기 이전 포스팅에서 Sklearn을 활용하여 선형 회귀 분석 모델을 만들고 R²(결정 계수)를 확인 하였는데 모델 평가 방법중 MSE, RMES, MAE 를 각각 확인 하는 방법을 적은 포스팅 입니다. 모델 평가 방법들을 각각 Sklearn 에서 제공하는 함수들을 이용하는 방법과 Sklearn 방법 이외에 직접 계산하는 방법을 각각 적어 두었습니다. MSE from sklearn.metrics import mean_squared_error skmse = mean_squared_error(y_pred=test['Likes_pred'], y_true = test['Likes']) my_mse = sum(list((test['Likes'] - test['Likes_pred'])**2))/len(test) skms.. 이전 1 2 3 4 5 6 7 ··· 12 다음