본문 바로가기
확률과 통계/3. 통계

[모듈식 확률과 통계] 3.통계 (23) 정규분포의 표준화(왜 하는건가?)

by bigpicture 2019. 10. 31.
반응형

 [확률과통계]-[3.통계]-[①확률분포]-[(23) 정규분포의 표준화(왜 하는건가?)]


정규분포의 표준화(왜 하는건가?)


아래와 같은 정규분포가 있습니다. 



위에 표시된 부분의 넓이는 아래와 확률로 표현됩니다. 



정규분포는 평균값과, 표준편차의 값에 상관없이 위 넓이가 일정합니다. 


숫자를 넣어 설명하면, 아래 두 넓이가 같다는 것입니다. 평균으로 부터 표준편차만큼 떨어진 곳 까지의 넓이가 같다는 것입니다. 


   


 표준편차에 상수배를 해도 위 성질은 계속 성립합니다. 



숫자를 넣어 설명하면, 아래 두 넓이가 같다는 것입니다. 평균으로 부터 표준편차의 a배 만큼 떨어진 곳 까지의 넓이가 같다는 것입니다. 



표준정규분포도 정규분포의 일종이므로, 위 넓이를 표준정규분포에 표시하면 아래와 같습니다. 



이 원리를 이용하면, 모든 정규분포에서 구해지는 확률(넓이)를 표준정규분포로 구할 수 있다는 말입니다. 평균에서 부터 표준편차의 몇배만큼 떨어져 있는지를 구하면 됩니다. 


예를들어 아래 넓이를 계산해 봅시다. 



평균이 5이고, 표준편차가 2입니다. 9는 평균 5로 부터 표준편차의 2배인 4만큼 떨어져 있는 것입니다. 아래와 같이 바꿔 쓸 수 있습니다. 



표준정규분포에서 P(0≤Z≤2) 의 넓이는 표준정규분포표를 이용해서 구할 수 있습니다. 표준정규분포표를 구해놓은 이유입니다. 위 원리를 이용하면, 어떤 평균과 표준편차를 갖는 정규분포인지 상관 없이 확률을 구할 수 있습니다. 이때 필요한 것이 표준정규분포표입니다. 


위 원리를 일반화시킨 것이 '표준화'입니다. 표준화는 정규분포에 표시된 X값 사이의 확률과, 같은 확률이 나오게 하는 표준정규분포 상의 Z값을 구하는 것이라고 이해할 수 있습니다. 그렇다면 X를 Z로 어떻게 변형할까요. 


먼저 평균을 0으로 만들어줘야 합니다. 따라서 X값에서 평균을 빼야합니다. 



위 예시에서는 μ 부터 μ+2σ 인 구간이  0 부터 2σ 로 바뀌게 되었습니다. 이제는 어떻게 하면 될까요? 표준편차에 몇배인지를 구해야 합니다. 따라서 표준편차로 나눠주면 됩니다. 



따라서 표준화 공식은 아래와 같습니다. 



위 공식에 대입하여 표준정규분포 상의 값을 구해도 됩니다. 더 좋은 방법은 평균에서 표준편차에 몇배 만큼 떨어져 있는가를 직접 구해보는 것입니다. 원리를 이용해서 구하는 방법입니다. 

반응형

댓글