본문 바로가기
확률과 통계/3. 통계

[모듈식 확률과 통계] 3.통계 (15) 확률밀도함수

by bigpicture 2019. 10. 17.
반응형

[확률과통계]-[3.통계]-[①확률분포]-[(15) 확률밀도함수]


확률밀도함수


확률분포를 나타내는 함수를 확률분포함수라고 부릅니다. 확률변수의 종류에 따라 확률분포함수를 부르는 용어가 달라집니다. 이산확률변수의 확률분포함수를 '확률질량함수'라고 불렀었는데요. 연속확률변수의 확률분포함수를 '확률밀도함수'라고 부릅니다. 


- 이산확률변수 → 확률질량함수

- 연속확률변수 → 확률밀도함수


확률질량함수는 함수값이 곧 확률인 함수였습니다. 예를들어 동전을 던지는 시행의 확률질량함수를 그려보면 아래와 같습니다. 



확률밀도함수는 함수 값이 확률이 아니라, 어떤 구간의 넓이가 확률인 함수입니다. 예시를 통해 이해해봅시다. 시계가 하나 있고, 시침을 튕겨서 돌린다고 해봅시다. 이때 시침이 멈추는 위치의 각도를 12시를 기준으로 X라고 합시다. 3시에 멈추면 X는 90이 되는 것입니다. 이때 시침이 3시에 멈출 확률이 얼마일까요? 360도를 n개로 나눴을 때 90도는 그 중 하나이므로 확률은 아래와 같습니다. 



360도는 무수히 많은 개수로 나눌 수 있기 때문에 n은 무한대로 가고, 시침이 3에 멈출 확률은 0으로 수렴합니다. 만약 y축을 확률로 하고 그래프를 그리면 아래와 같은 그래프가 그려질 것입니다. 



모든 확률변수 X의 확률값이 0이 되는 넌센스가 발생합니다. 무한의 장난입니다. 각각은 0인데, 확률의 총합은 항상1이므로 전부 더하면 1이 나와야 합니다. 이해가 되지 않는 이상한 상황입니다.


이번에는 이렇게 생각해봅시다. 시계의 시침을 툭 하고 튕겼을 때, 시침이 12시~3시 사이에 멈출 확률은 얼마일까요? 전체가 전체 면적의 1/4에 해당되므로, 확률이 1/4가 됩니다. 12시~6시 사이에 멈출 확률은 어떨까요? 1/2가 됩니다. 어떤 확률변수 X의 확률은 0에 수렴하지만 '구간'의 확률은 구할 수 있게된 것입니다. 이러한 원리에 착안하여 확률밀도함수를 생각해냈습니다. 아래와 같은 함수를 한번 봅시다. 



위에서 우리가 찾아낸 확률들이 넓이를 이용하여 구할 수 있게 만든 함수입니다. 예를들어 시침이 12시~3시 사이에 멈출 확률을 구한다면 아래와 같습니다. (3시는 90도 입니다.) 



함수값이 확률은 아니고, 넓이가 확률이 되는 함수입니다. 위와 같은 함수를 정의하면 연속확률변수의 확률을 그래프로 나타낼 수 있습니다. 이런 함수를 '확률밀도함수'라고 합니다.

반응형

댓글