중앙값과 분위수 IQR을 이용한 이상치 판별
중앙값 이란? 중앙값이란 하나의 집단에서 작은 수부터 큰수를 순서대로 나열 하였을때 중앙에 위치되어 있는 수를 얘기한다. 집단 A : 1,2,3,4,5 집단 B : 3,4,5,6,7,8 이처럼 집단 A가 있고 집단 B가 있을때 A는 5개의 수가 있고 B에는 6개의 수가 있다. A의 중앙값은 중앙에 위치한 3이 중앙값이고 B의 중앙값은 가운데 위치해 있는 5와 6의 평균인 5.5가 된다. 우리가 주로 하나의 집단에서 대표되는 값으로 특정 집단의 평균을 많이 사용하는데 평균은 모집단에서 가지고 있는 데이터의 수와 최대값과 최소값의 영향을 많이 받기 때문에 이때 평균을 대신 하여서 중앙값을 사용하는 경우가 있다. EX) A 집단의 나이는 각각 25,30,35,40,70 일때 평균은 40세가 되는데 이는 70으..