본문 바로가기
확률과 통계/3. 통계

[모듈식 확률과 통계] 3.통계 (12) 이항분포의 분산과 표준편차

by bigpicture 2019. 10. 9.
반응형

[확률과통계]-[3.통계]-[①확률분포]-[(12) 이항분포의 분산과 표준편차]


이항분포의 분산과 표준편차


확률변수 X가 이항분포를 따른다고 해봅시다. 시행횟수는 n번이고, 사건 발생확률이 p라면 기호로는 아래와 같이 나타냅니다. 


X~B(n,p)


위와 같은 이항분포를 따르는 확률변수 X의 분산과 표준편차는 아래와 같습니다. 



유도해봅시다.


아래와 같이 n개의 확률변수가 있다고 해봅시다. 



확률변수 X의 분산은 아래와 같이 구합니다. 변량 뺴기 평균의 제곱의 평균입니다. 



시그마 형태로 표현하면 아래와 같습니다. 



또다른 방법으로는 아래와 같이 구할 수도 있습니다. 



시그마 형태로 표현하면 아래와 같습니다. 



기호로 표현하면 아래와 같습니다. 



위 식에 이항분포의 확률변수와 확률을 대입하면 아래와 같습니다. 이항분포의 확률변수는 0부터 n까지의 값을 갖습니다. 



아래와 같이 변형합시다. x가 0일때는 값이 0이므로 아래와 같이 시그마의 시작을 1으로 바꿀 수 있습니다. 



p와 n은 시그마에 독립적이므로 아래와 같이 꺼내줄 수 있습니다. x는 약분됩니다. 



이제 치환을 하겠습니다. n-1을 m로, x-1을 r로 치환합시다. 



이번에는 n-1에서 x-1을 뺍시다. n-x가 나오고, 이 값은 m-r과 같습니다. 치환합시다. 구간도 아래와 같이 바꿔줍니다. x도 1+r로 바꿔줍니다. 



1+r을 전개합시다. 



조합 표현으로 바꿉시다. 



파란식은 평균을 유도할 때 이야기했듯, 시행횟수가 m이고 사건 발생확률이 p인 이항분포의 전체 확률 합입니다. 따라서 값이 1입니다. 빨간식은 시행횟수가 m이고 사건 발생확률이 p인 이항분포의 평균입니다. 따라서 mp입니다. 정리해봅시다. 



m 대신 n-1을 넣고 계산합시다. 






반응형

댓글