본문 바로가기

전체 글

(34)
점 추정과 점 추정 조건, 구간 추정과 신뢰 구간 의미 ■ 점추정 점 추정은 우리가 구한 표본중 기대값, 추정량의 추정치가 특정한 값으로 딱 찍어서 하나의 값을 추정 하는 만큼 오차가 발생할 확률이 높다. 그래서 우리는 이를 최소화 하기 위해서 점 추정을 구할때 몇가지의 조건 들을 가지는데 그 조건들은 아래와 같다. 불편 추정량(Unbiased) 오차가 없다로 해석하여 표본의 추정량이 모수의 값과 오차가 없다고 해석하였고 결론으로 표본의 기대값 = 모수의 통계량이다. ex) 모집단의 평균 - 표본의평균 = 0 생각 해보면 점추정은 하나의 점을 추정하는 방법이므로 모수의 통계량과 같아야 되는건 점추정 조건에 당연한거라고 생각 할 수 있다. 일치 추정량 표본의 크기가 커질수록 오차의 범위가 줄어든다는 뜻 우리가 모집단에 포함되어있는 표본을 뽑을때 표본을 많이 뽑..
확률 변수, 확률 분포, 확률 분포 함수 확률 변수 : 표본공간 각각의 원소를 실수로 대응한 값을 말하며 이산 확률 변수와 연속 확률 변수로 나뉜다. 확률 분포 : 각각의 확률 변수들이 나올수 있는 확률을 대응 시켜 표시하는것 ex) 주사위를 던졌을때 각각의 숫자가 나올 경우의 수 -> 확률 변수 주사위를 던졌을때 각각의 확률 변수가 나올 확률 -> 확률 분포 상태 공간 S : 주사위 눈1~6이 나오는 1~6의 확률 변수를 가진다. 확률 변수 1 2 3 4 5 6 확률 분포 1/6 1/6 1/6 1/6 1/6 1/6 이산 확률 변수 정수로 이루어진 변수들로 성공 횟수, 주사위의 눈의 수 등등 정수들로 이루어져 있고 유한한(셀 수 있는) 상태공간S에 변수들이 존재 한다. 연속 확률 변수 실수로 이루어져 있는 변수들로 시간, 키, 거리 등 정수가 ..
Data Scaling(Min-max, Standard, Robust) 데이터 전처리에서 값의 범위를 조정할 때 사용 하는 3가지 Scaling 에 대한 정리 입니다. ​ Min-Max Scaler : 값의 범위를 0~1 사이의 값으로 변경하는 방법 ex) 1,2,3,4,5,6,7,8,9,10 위 와 같이 값이 1~10까지 가진 데이터가 있을때 데이터를 0~1의 사이값을 가지게 하는 방법 공식) x-min/max-min ​ 예시에서 min → 1, max → 10, x → 내가 MinMax Scaler 를 하고자 하는 값 8의 Min-Max Scaler : (8 - 1) / (10 - 1) = 7/9 = 0.777... 1의 Min-Max Scaler : (1 - 1) / (10 - 1) = 0 10의 Min-Max Scaler : (10 - 1) / (10 - 1) = 1..