본문 바로가기

카테고리 없음

연속확률 분포(1) - 정규 분포와 표준 정규 분포(Z분포)

정규 분포란?

 

정규 분포란 연속확률 분포중 하나를 이야기 하며 연속확률은 표로 나타내기에는 한계가 있어 그래프로 표시 한다.

분포의 그래프가 정규의 형태(좌우 대칭)일때 정규 분포라고 이야기 한다.

 

위의 그림을 남성 평균 키의 정규 분포 라고 가정을 해보자.

위 그림은 170을 기준으로 좌우가 균형을 이루고 있어 평균이 170이고 표준편차가 5인 정규 분포이다.

정규 분포의 표현 방식으로 표현을 하면 이와 같이 표현 할 수 있다.

 

 

 

정규 분포의 특징

  1. 정규 분포는 좌우 대칭의 종 모양의 형태를 가진다.
  2. 그래프밑면 면적의 합은 1이고 평균을 중심으로 0.5씩 차지한다.
  3. 변수의 범위는 -∞ ~ ∞ 이다.(위의 그래프를 자세히 보면 그래프의 끝이 바닥면(0)과 닺지 않는다.)
  4. 그래프의 형태와 위치는 평균과 분산 혹은 표준편차로 정해 진다.
  5. σ 의 범위에 68.25%, 2σ의 범위에 95.44%, 3σ의 범위에 99.8%정도의 데이터가 존재한다.

 

연속 확률 분포란 이전 글에서 설명 하였듣이 연속된 확률을 이야기 하고 정확히 맞출 수 있는 확률은 0에 근사하기 때문에 우리는 범위를 가지고 우리가 맞출수 있는 확률을 이야기 한다.

아래의 예시를 통해서 좀더 자세히 알 수 있습니다.

 

정규 분포 그래프에서 표준편차가 중요한 이유와 설명

위의 그래프가 모집단이라고 하였을 때, 나와 이웃인 남성의 키가 170.0일 확률은 0에 근사 한다.

그래서 표준편차를 알고 있고, 이를 통하여 165~175라는 사이에 있을 확률값은 1표준편차사이에 값이 있을 확률인 68.25%가 된다. 즉, 165 ~ 175 사이에 68%가, 160 ~ 180 사이에 있을 확률이 95.4% 155 ~ 185 사이에 있을 확률은 99.8%가 된다는 이야기 이다.

이처럼 정규분포를 이루고 있는 하나의 집단에서 우리가 선택한 값이 특정 범위 안에 포함될 확률을 구할 때 사용 된다.

 

 

표정규 분포란?

표준 정규 분포란 Z분포라고도 이야기 하며 Z(0,1)인 정규 분포를 이야기 한다.

즉 평균이 0이고 표준편차와 분산이 1이란 이야기이다.

정규 분포를 Standard scaling 시킨다고 생각하면 된다.

정규 분포의 그래프 평균을 170을 0으로 각각의 표준편차의 값들을 X-평균/표준편차를 하면 아래의 그래프로 바뀌게 된다.

 

 

 

표준정규 분포의 특징

1.정규분포를 표준화(Standard Scaling) 시킨 분포이다.

2.모든 연속확률 그래프를 표준화(Standard Scaling) 시킨다고 하여서 표준정규 분포,

Z분포가 되는 것이 아니라 정규 분포를 표준화 시켜야지 표준정규분포(Z분포)가 된다는 것을 유의 하여야 된다.

3. 정규 분포의 -1.96 ~ 1.96 사이에 95%의 데이터가 존재한다.

즉 표준편차의 1.96 사이값안에 있을 확률이 95% 라고 할 수 있다.