본문 바로가기
반응형

확률과 통계38

[5분 고등수학] 이항분포의 분산,표준편차 유도하기 지난 글에서 이항분포의 평균을 구해봤는데요. 오늘은 분산을 구해보겠습니다. 확률변수 X가 이항분포 B(n,p)를 따른다고 합시다. 확률변수 X의 분산은 아래와 같이 구할 수 있습니다. $V\left(X\right)=E\left({X}^2\right)-{\left\{{E\left(X\right)}\right\}}^2$ 이항분포의 평균은 np이므로 아래와 같이 변형됩니다. $V\left(X\right)=E\left({X}^2\right)-{\left(np\right)}^2$ x제곱의 평균을 시그마형태로 쓰면 아래와 같습니다. $V\left(X\right)=\sum _{x=0}^n\left\{{{x}^2\cdot _n{C}_x\cdot {p}^x\cdot {\left(1-p\right)}^{n-x}}\righ.. 2022. 3. 11.
[5분 고등수학] 이항분포의 평균 유도하기 이항분포의 평균, 분산, 표준편차를 유도해봅시다. 이항분포는 기호로 B(n,p) 로 표현합니다. n은 시행횟수고, p는 사건 발생 확률입니다. 이항분포의 확률을 수식으로 표현하면 아래와 같습니다. $P\left(X=x\right)=_n{C}_x{p}^x{\left({1-p}\right)}^{n-x}$ 1-p는 q로 나타냅니다. $P\left(X=x\right)=_n{C}_x{p}^x{q}^{n-x}$ 이항분포의 평균, 분산, 표준편차는 아래와 같습니다. $E\left(X\right)=np$ $V\left(X\right)=npq$ $\sigma \left(X\right)=\sqrt{npq}$ 먼저 평균을 유도해보겠습니다. 평균은 아래와 같이 계산합니다. $E\left(X\right)=\sum _{x=0}^.. 2022. 3. 10.
[5분 고등수학] 이항분포 이해하기 이항분포는 영어로 binomial distribution 이구요. 이항분포에서 '이'라는 단어는 둘(이)입니다. 항이 두개인 분포라는 말입니다. 항이 둘이라는 것은 확률이 '어떤 사건의 발생' '발생하지 않음'두가지로만 나뉜다는 말입니다. 독립시행의 기억을 떠올려봅시다. 1회 시행에서 사건 A가 일어날 확률이 P이고, n번의 독립시행에서 사건 A가 r회 일어날 확률은 아래와 같습니다. $_n{C}_r{p}^r{\left({1-p}\right)}^{n-r}$ ​ 이때 r을 확률변수 X로 놓으면 확률 분포는 아래와 같습니다. $P\left(X=x\right)=_n{C}_x{p}^x{q}^{n-x}$ ​ 이번에는 표로 나타내봅시다. X 0 1 ... n 합 $P(X=x)$ ${n}C_{0}p^{0}q^{n}$.. 2022. 3. 8.
[5분 고등수학] 시행, 표본공간, 사건 용어의 의미를 영어단어와 함께 이해해봅시다. 1. 시행 시행은 영어로 trial 또는 experiment라고 합니다. 위키피디아에서 가져온 시행의 뜻은 아래와 같습니다. "In probability theory, an experiment or tial is any procedure that can be infinitely repeated and has a well-defined set of possible outcomes" 확률이론에서, 시행은 무한히 반복될 수 있고 잘 정의된 집합을 결과로 가질 수 있는 과정 혹은 절차이다" 따라서 시행은 두가지 조건을 만족해야 합니다. 1) 무한히 반복될 수 있음 2) 잘 정의된 집합을 결과로 가져야 함 2. 표본공간 표본공간은 영어로 sample space라고 합니.. 2022. 2. 24.
[5분 고등수학] 중복조합의 직관적 이해 중복조합은 n개 중에서 중복을 허락하여 r개를 택하는 경우의 수 입니다. 예를들어 a,b,c 라는 세개의 문자가 있다고 해봅시다. 중복을 허락하여 5개를 택하는 경우를 써봅시다. abbcc abccc abbbc ... aaaaa bbbbb cccccc 등이 있을 것입니다. 이 모든 경우가 몇가지인지 구하는 것이 중복조합입니다. 위와 같은 상황은 중복조합으로 아래와 같이 나타냅니다. $_3{H}_5$ n개 중에서 중복을 허락하여 r개를 뽑는 경우의 수는 아래와 같이 나타냅니다. $_n{H}_r$n​Hr​​ 직접 세려고 하면 너무 많은데요. 놀랍게도, 이 중복조합을 계산하는 식을 사람들이 발견했습니다. 그 식을 발견해가는 과정을 말씀드리겠습니다. 위 경우를 예로들어봅시다. 아래와 같이 문자와 문자 사이에 칸.. 2022. 2. 16.
[5분 고등수학] 조합 관련 공식의 직관적 이해 조합과 관련된 두 가지 공식을 유도하고, 이해해볼겁니다. 첫번째 공식은 아래와 같습니다. $_n{C}_r=_n{C}_{n-r}$ 먼저 수학적으로 증명해봅시다. 팩토리얼 식으로 양변을 전개하면 아래와 같습니다. $\frac{n!}{\left(n-r\right)!r!}=\frac{n!}{r!\left(n-r\right)!}$ 양변이 같다는 것을 쉽게 알 수 있습니다. 이번에는 간단한 예제를 이용해서 직관적으로 이해해봅시다. 농구선수 8명이 있는데요. 이 중에서 선발로 뛸 5명을 뽑아야 하는 상황입니다. 가장 먼저 떠오르는 생각은 8명중 5명을 조합으로 뽑는 것입니다. $_8{C}_5$ 이 상황을 다른 관점으로 생각해봅시다. 8명 중에 5명을 뽑는다고 생각하는게 아니라, 3명을 남긴다고 생각하는 겁니다. 벤치.. 2022. 2. 14.
[모듈식 확률과 통계] 3.통계 (33) 모평균의 신뢰구간 [확률과통계]-[3.통계]-[②통계적 추정]-[(33) 모평균의 신뢰구간] 모평균의 신뢰구간 모집단이 있습니다. 모집단의 평균과 분산은 아래와 같습니다. 이 모집단에서 표본을 뽑았습니다. 한가지 조건을 설정하겠습니다. 모집단이 정규분포를 따르거나, 중심극한정리가 성립할 만큼 표본이 충분히 큰 상황이라고 해봅시다. 모집단이 정규분포를 따른다 → 표본평균이 정규분포를 따른다.표본의 크기가 충분히 크다 → 표본평균이 정규분포를 따른다. 따라서 우리가 뽑은 표본평균은 아래와 같은 정규분포를 따릅니다. 그래프는 아래와 같습니다. 만약 우리가 표본을 뽑는다면, 우리가 뽑은 표본의 평균은 위 분포를 따를 것입니다. 매번 뽑을 때마다 위치는 달라지겠지만, 위 분포를 따릅니다. 우리는 우리가 뽑은 표본평균이 속할 확률이.. 2019. 11. 19.
[모듈식 확률과 통계] 3.통계 (32) 모평균의 추정 [확률과통계]-[3.통계]-[②통계적 추정]-[(32) 모평균의 추정] 모평균의 추정 모집단에서 표본을 추출하는 이유는 표본이 궁금해서가 아니라, 모집단이 궁금하기 때문입니다. 따라서 우리는 추출한 표본을 이용하여 모집단의 특성을 최대한 추측할 것입니다. 모집단의 특성 중에는 모집단의 통계량이 있습니다. 모집단의 통계량은 모수라고 합니다. 모집단의 통계량 (모수) : 모집단의 평균, 분산, 표준편차 등 이렇게 표본을 이용하여 모집단의 특성들을 추측하는 것을 추정이라고 합니다. 고등학교 과정에서는 모집단의 평균만을 추정합니다. 추정에는 '점추정'과 '구간 추정' 두가지가 있습니다. 점추정은 모집단의 통계량을 하나의 값으로 추정하는 것이고, 구간 추정은 어떤 범위 사이에 있다고 추정하는 것입니다. 우리는 이.. 2019. 11. 18.
[모듈식 확률과 통계] 3.통계 (31) 표본평균의 분포 [확률과통계]-[3.통계]-[②통계적 추정]-[(31) 표본평균의 분포] 표본평균의 분포 지난 글에서 표본평균들의 평균이 모평균과 같고, 표본평균들의 분산은 모집단의 분산을 표본의 크기로 나눈 것과 같다는 것을 배웠습니다. 만약 모집단이 정규분포를 따른다면, 표본평균의 분포는 항상 정규분포를 따릅니다. 고등학교 과정에서는 알려져있다라고 배우는데 증명은 가능합니다. 증명이 준비되면 링크로 달겠습니다. 모집단이 정규분포를 따르지 않더라도, 표본의 크기가 충분히 크면 표본평균의 분포를 정규분포에 근사시킬 수 있습니다. n이 커질 수록 표본평균의 분포는 정규분포에 가까워져 갑니다. 이 성질은 통계학에서 가장 중요한 성질 중 하나입니다. '중심 극한정리'라고 부르는데 증명이 궁금하신 분들을 위해 링크를 달아놓겠습.. 2019. 11. 14.
[모듈식 확률과 통계] 3.통계 (30) 표본평균의 통계량 (평균, 분산, 표준편차) [확률과통계]-[3.통계]-[②통계적 추정]-[(30) 표본평균의 통계량 (평균, 분산, 표준편차)] 표본평균의 통계량 (평균, 분산, 표준편차) 모집단에서 크기 n인 표본을 여러개 뽑았다고 해봅시다. 적당히 k개라고 합시다. 위첨자를 뽑은 표본의 번호, 아래첨자를 표본의 원소번호라고 합시다. 첫번째 표본은 아래와 같이 표현됩니다. 두번째 표본은 아래와 같이 표현됩니다. 이런 표본이 k개 있는 것입니다. 각 표본의 평균을 구하면 아래와 같습니다. 이제 이 표본 평균들의 평균을 구할겁니다. 헷갈리시면 않됩니다. 표본평균이 아니라. 표본평균들을 가지고 '다시'평균을 구한겁니다. 표본은 시간만 있다면 무수히 많이 뽑을 수 있습니다. 따라서 표본평균의 평균을 구할 때, k를 무한대로 보내야합니다. 놀랍게도, 표.. 2019. 11. 13.
[모듈식 확률과 통계] 3.통계 (29) 표본의 통계량 (평균, 분산, 표준편차) [확률과통계]-[3.통계]-[②통계적 추정]-[(29) 표본의 통계량 (평균, 분산, 표준편차)] 표본의 통계량 (평균, 분산, 표준편차) 모집단에서 표본을 뽑는 상황을 생각해봅시다. 크기가 n인 표본을 뽑았고, 아래와 같다고 합시다. 이 표본의 평균은 아래와 같이 나타냅니다. 표본평균이라고 부릅니다. 분산은 아래와 같이 나타냅니다. 표본분산이라고 부릅니다. n-1로 나누는 이유는 표본분산을 불편추정량으로 만들기 위함인데, 이유가 궁금하신 분들은 다음 링크를 참고하시면 됩니다. (https://www.youtube.com/watch?v=faVIwae-wkw&t=3s) 표분편차는 아래와 같이 구하고, 표본표준편차라고 부릅니다. 2019. 11. 12.
[모듈식 확률과 통계] 3.통계 (26) 모집단과 표본추출 [확률과통계]-[3.통계]-[②통계적 추정]-[(26) 모집단과 표본추출] 모집단과 표본추출 지난 글에서 대한민국 40대 이상 인구 중에서 너튜버 '보겸'을 아는 사람이 몇 %인지 알고 싶은 상황을 가정했습니다. 비용과 시간 등의 문제로 40대 인구 전체를 조사할 수 없으니, 일부를 뽑아서 조사했다고 했습니다. 이 예시에서 대한민국 40대 이상 인구 전체를 '모집단'이라고 합니다. 어떤 조사를 하려고 했을 때, 대상이 되는 전체집단이 '모집단'입니다. 전체집단에서 일부를 뽑았다고 했는데, 이를 '표본'이라고 합니다. 어떤 조사를 하기 위해 모집단에서 일부를 뽑은 것을 표본이라고 합니다. 이렇게 모집단에서 표본을 뽑는 행위를 '표본추출'이라고 합니다. 또 우리가 뽑은 자료의 수(위 경우에는 사람의 수)를 .. 2019. 11. 4.
[모듈식 확률과 통계] 3.통계 (23) 정규분포의 표준화(왜 하는건가?) [확률과통계]-[3.통계]-[①확률분포]-[(23) 정규분포의 표준화(왜 하는건가?)] 정규분포의 표준화(왜 하는건가?) 아래와 같은 정규분포가 있습니다. 위에 표시된 부분의 넓이는 아래와 확률로 표현됩니다. 정규분포는 평균값과, 표준편차의 값에 상관없이 위 넓이가 일정합니다. 숫자를 넣어 설명하면, 아래 두 넓이가 같다는 것입니다. 평균으로 부터 표준편차만큼 떨어진 곳 까지의 넓이가 같다는 것입니다. 표준편차에 상수배를 해도 위 성질은 계속 성립합니다. 숫자를 넣어 설명하면, 아래 두 넓이가 같다는 것입니다. 평균으로 부터 표준편차의 a배 만큼 떨어진 곳 까지의 넓이가 같다는 것입니다. 표준정규분포도 정규분포의 일종이므로, 위 넓이를 표준정규분포에 표시하면 아래와 같습니다. 이 원리를 이용하면, 모든 .. 2019. 10. 31.
[모듈식 확률과 통계] 3.통계 (22) 표준정규분포표 사용법 [확률과통계]-[3.통계]-[①확률분포]-[(22) 표준정규분포표 사용법] 표준정규분포표 사용법 표준정규분포 함수는 아래와 같습니다. 그래프로 그리면 아래와 같습니다. 표준정규분포와 x축이 이루는 넓이는 1이고, 0으로 중심으로 대칭입니다. 따라서 0이하의 넓이와 이상의 넓이는 0.5가 됩니다. 이번에는 a를 기준으로 둘로 나눠봅시다. 확률변수 Z가 a이상일 클 확률은 표준정규분포표에 구해져 있지 않습니다. 그러나 0부터 a 사이일 확률은 구해져 있습니다. 따라서 0부터 무한대까지의 확률에서, 0부터 a까지의 확률을 빼면 0부터 a까지의 확률이 나옵니다. 확률변수 Z가 a 이하일 확률은 0이하일 확률과 0이상 a이하일 확률 두개로 나눠서 생각할 수 있습니다. 0 이하일 확률은 0.5 이므로, 0.5와 0.. 2019. 10. 29.
[모듈식 확률과 통계] 3.통계 (21) 표준정규분포표 [확률과통계]-[3.통계]-[①확률분포]-[(21) 표준정규분포표] 표준정규분포표 표준정규분포 함수는 아래와 같습니다. 그래프로 그리면 아래와 같습니다. 아래의 넓이를 봅시다. 이 넓이는 확률입니다. 아래의 확률을 나타냅니다. 이 확률을 표로 구해놓은 것이 표준정규분포표입니다. a를 바꿔가면서 값을 구해놓은 것이죠. 아래 방향으로는 a가 0.1씩 증가하고, 오른쪽으로는 0.01씩 증가합니다. 예를들어 a가 0.15일 때의 확률은, 0.0596 입니다. 이 값을 왜 구해놓을 걸까요? 모든 정규분포의 확률을 이 표 하나로 구할 수가 있습니다. '표준화'를 이용하면 되는데요. 이후에 설명하겠습니다. 2019. 10. 27.
[모듈식 확률과 통계] 3.통계 (19) 정규분포의 확률밀도함수 (성질) [확률과통계]-[3.통계]-[①확률분포]-[(19) 정규분포의 확률밀도함수 (성질)] 정규분포의 확률밀도함수 (성질) 정규분포는 아래와 같은 확률밀도함수를 갖는 확률변수 X의 확률분포였습니다. 지난 글에서 그린 그래프는 아래와 같았습니다. 오늘은 성질을 알아봅시다. 위 그래프에서 알 수 있는 정규분포의 확률밀도함수의 성질은 두가지 입니다. 1) x =m 에 대하여 대칭이다. 2) x축을 점근선으로 갖는다. 또 확률밀도함수이기 때문에 전체 넓이기 1이라는 성질도 같습니다. 3) 곡선과 x축 사이의 넓이가 1이다. 이번에는 표준편차인 σ 의 영향을 생각해봅시다. σ 가 커지면 꼭지점이 아래로 낮아집니다. 전체 넓이가 1로 유지되어야 하기 때문에 아래와 같이 펑퍼짐해집니다. 4) σ 가 커지면, 곡선의 높이는.. 2019. 10. 24.
[모듈식 확률과 통계] 3.통계 (17) 정규분포 (+유도과정 영상) [확률과통계]-[3.통계]-[①확률분포]-[(17) 정규분포] 정규분포 정규분포는 아래와 같은 확률밀도함수를 갖는 확률변수 X의 확률분포입니다. m은 확률변수 X의 평균이고, σ 는 표준편차입니다. 함수를 잘 뜯어보면 지수함수입니다. 밑이 e(자연상수)인 지수함수입니다. 갑자기 복잡한 모양의 함수가 왜 등장했나 궁금하실텐데요. 이 정규분포는 사회의 여러 현상들을 설명하는 함수입니다. 예를 들어 전국민 키를 조사해서 분포를 그려보면, 정규분포와 같은 모양으로 그려집니다. 키 뿐만 아니라 몸무게나 다른 여러 사회 현상 자료들로 그래프를 그려보면 정규분포와 같은 모양을 하는 경우가 많습니다. 어떤 현상을 수학적으로 표현할 수 있다는 것에는 굉장한 유익이 있습니다. 정규분포는 사회현상을 수학적으로 표현할 수 있.. 2019. 10. 22.
[모듈식 확률과 통계] 3.통계 (15) 확률밀도함수 [확률과통계]-[3.통계]-[①확률분포]-[(15) 확률밀도함수] 확률밀도함수 확률분포를 나타내는 함수를 확률분포함수라고 부릅니다. 확률변수의 종류에 따라 확률분포함수를 부르는 용어가 달라집니다. 이산확률변수의 확률분포함수를 '확률질량함수'라고 불렀었는데요. 연속확률변수의 확률분포함수를 '확률밀도함수'라고 부릅니다. - 이산확률변수 → 확률질량함수- 연속확률변수 → 확률밀도함수 확률질량함수는 함수값이 곧 확률인 함수였습니다. 예를들어 동전을 던지는 시행의 확률질량함수를 그려보면 아래와 같습니다. 확률밀도함수는 함수 값이 확률이 아니라, 어떤 구간의 넓이가 확률인 함수입니다. 예시를 통해 이해해봅시다. 시계가 하나 있고, 시침을 튕겨서 돌린다고 해봅시다. 이때 시침이 멈추는 위치의 각도를 12시를 기준으로.. 2019. 10. 17.
[모듈식 확률과 통계] 3.통계 (14) 연속확률변수 [확률과통계]-[3.통계]-[①확률분포]-[(14) 연속확률변수] 연속확률변수 확률변수는 두가지가 있습니다. - 이산확률변수- 연속확률변수 이산확률변수는 지난강의에서 배웠습니다. 오늘은 연속확률변수를 배워봅시다. 이산확률변수는 "셀 수 있는 변수"였습니다. 셀 수 있다는 말이 "개수가 유한하다"는 말이 아니라는 것을 이미 배웠습니다. 개수가 무한해도 이산확률변수가 될 수 있습니다. 확률변수가 모든 자연수집합이라면, 개수가 무한하지만 셀 수 있습니다. 셀 수 있다는 것은 전체가 몇개인지 말 할 수 있다는게 아니라, 1-2-3-4-5....이렇게 순서대로 카운트 할 수 있다는 것입니다. 그렇다면 연속확률변수는 무엇일까요? 먼저 떠오르는 말은 "셀 수 없는 변수"일 것입니다. 셀 수 없다는 말도 맞는데, 셀 .. 2019. 10. 16.
[모듈식 확률과 통계] 3.통계 (11) 이항분포의 평균 [확률과통계]-[3.통계]-[①확률분포]-[(11) 이항분포의 평균] 이항분포의 평균 확률변수 X가 이항분포를 따른다고 해봅시다. 시행횟수는 n번이고, 사건 발생확률이 p라면 기호로는 아래와 같이 나타냅니다. X~B(n,p) 위와 같은 이항분포를 따르는 확률변수 X의 평균은 np 가 됩니다. 유도해봅시다. 아래와 같이 n개의 확률변수가 있다고 해봅시다. 확률변수 X의 평균은 아래와 같이 구합니다. 시그마의 형태로 나타내면 아래와 같습니다. 위 식에 이항분포의 확률변수와 확률을 대입하면 아래와 같습니다. 이항분포의 확률변수는 0부터 n까지의 값을 갖습니다. 조합을 팩토리얼 형태로 나타냅시다. x가 0일때는 값이 0이므로 아래와 같이 시그마의 시작을 1으로 바꿀 수 있습니다. 아래와 같이 변형합시다. p와 .. 2019. 10. 8.
[모듈식 확률과 통계] 3.통계 (10) 이항분포 [확률과통계]-[3.통계]-[①확률분포]-[(10) 이항분포] 이항분포 시행을 1번 했을 때, 어떤 사건이 일어날 확률을 p라고 합시다. 이때 이 사건이 일어나지 않을 확률은 (1-p)입니다. 이러한 시행을 n번 했다고 해봅시다. 사건이 발생한 횟수를 X라고 놓는다면, 사건이 X번 발생할 확률은 P(X)라고 놓을 수 있습니다. 예를들어 P(3)은 n번 시행에서 사건이 3번 발생할 확률인 것입니다. P(0)부터 계산해봅시다. P(0)는 n번의 시행에서 사건이 0번 발생한 확률입니다. 따라서 확률은 아래와 같습니다. P(1)은 n번의 시행에서 사건이 1번 발생한 확률입니다. 1번이라는 사건은 첫번째 시행에서 발생할 수도 있고, 두번째 시행에서 발생할 수도 있고, ... , n번째 시행에서 발생할 수도 있습니.. 2019. 10. 7.
[모듈식 확률과 통계] 3.통계 (9) 이산확률변수 aX+b의 분산과 표준편차 [확률과통계]-[3.통계]-[①확률분포]-[(9) 이산확률변수 aX+b의 분산과 표준편차] 이산확률변수 aX+b의 분산과 표준편차 이산확률변수 X의 분산을 V(X)라고 했을 때, aX+b의 분산은 아래와 같습니다. (a와 b는 상수입니다.) 증명해봅시다. 이산확률변수 X와, 각 변수에 해당하는 확률값을 표로 나타내면 아래와 같습니다. 이산확률변수 X의 개수는 n개라고 가정하겠습니다. aX+b의 분산을 구하면 아래와 같습니다. (m을 X의 평균이라고 놓겠습니다.) 우변의 괄호 안을 계산하면 아래와 같습니다. 아래와 같이 변형할 수 있습니다. a제곱으로 묶어줍시다. 빨간 부분은 X의 분산입니다. 따라서 아래와 같이 쓸 수 있습니다. 표준편차는 분산에 루트를 씌운 것이므로 아래와 같습니다. 2019. 10. 6.
[모듈식 확률과 통계] 3.통계 (8) 이산확률변수 aX+b의 평균 [확률과통계]-[3.통계]-[①확률분포]-[(8) 이산확률변수 aX+b의 평균] 이산확률변수 aX+b의 평균 이산확률변수 X의 평균을 E(X)라고 했을 때, aX+b의 평균은 아래와 같습니다. (a와 b는 상수입니다.) 증명해봅시다. 이산확률변수 X와, 각 변수에 해당하는 확률값을 표로 나타내면 아래와 같습니다. 이산확률변수 X의 개수는 n개라고 가정하겠습니다. aX+b의 평균을 구하면 아래와 같습니다. 우변을 전개합시다. 아래와 같이 묶어줍시다. 빨간식은 평균이고 파란식은 1이므로 아래와 같이 변형됩니다. 2019. 9. 27.
[모듈식 확률과 통계] 3.통계 (7) 이산확률변수 X의 분산과 표준편차 [확률과통계]-[3.통계]-[①확률분포]-[(7) 이산확률변수 X의 분산과 표준편차] 이산확률변수 X의 분산과 표준편차 ▣ X의 분산 이산확률변수 X와, 각 변수에 해당하는 확률값을 표로 나타내면 아래와 같습니다. 이산확률변수 X의 개수는 n개라고 가정하겠습니다. X의 분산을 구해봅시다. 분산은 영어로 variance 이기 때문에, X의 분산은 첫글자를 따서 아래와 같이 나타냅니다. 분산은 편차의 제곱의 평균(기댓값)입니다. 따라서 아래와 같이 나타낼 수 있습니다. 지난시간에 배운 기댓값 계산법을 이용하면 아래와 같이 구합니다. 분산은 변량의 제곱의 평균에서 평균의 제곱을 빼는 방법으로도 구할 수 있습니다. 분산의 정의를 이용하여 유도해보겠습니다. 위 전개합시다. 같은 차수의 항끼리 모아줍시다. 빨간항은.. 2019. 9. 27.
[모듈식 확률과 통계] 3.통계 (6)이산확률변수의 기댓값(평균) + 직관적 이해 [확률과통계]-[3.통계]-[①확률분포]-[(6)이산확률변수의 기댓값(평균)] 이산확률변수의 기댓값(평균) + 직관적 이해 이산확률변수 X와, 각 변수에 해당하는 확률값을 표로 나타내면 아래와 같습니다. 이산확률변수 X의 개수는 n개라고 가정하겠습니다. X의 평균은 아래와 같이 구합니다. 평균은 기댓값이라고도 부르는데, 평균은 X를 확률변수로 갖는 사건이 발생했을 때 기대할 수 있는 값이기 때문입니다. 각 변수에 확률을 곱해서 더한 값이 기댓값이라는 것을 직관적으로 이해하기 위해 두가지 시도를 해봅시다. 1) 동전 예시 동전을 던져서 앞면이 나오면 1000원, 뒷면이 나오면 10원을 받기로 했습니다. 얼마를 기대할 수 있을까요? 앞면이 나올 확률이 50%니까 앞면에 500원, 뒷면이 나올 확률이 50%니.. 2019. 9. 25.
[모듈식 확률과 통계] 3.통계 (5)확률질량함수의 성질 [확률과통계]-[3.통계]-[①확률분포]-[(5)확률질량함수의 성질] 확률질량함수의 성질 이산확률변수 X의 분포를 나타내는 함수가 확률질량함수입니다. 기호로는 아래와 같이 나타냅니다. 확률질량함수에는 세가지 성질이 있습니다. 확률은 0이상 1이하의 값을 같습니다. 확률의 합은 1입니다. 확률변수의 범위를 지정하여 확률을 나타낼 수도 있습니다. 2019. 9. 22.
[모듈식 확률과 통계] 3.통계 (4)확률질량함수 [확률과통계]-[3.통계]-[①확률분포]-[(4)확률질량함수] 확률질량함수 확률분포를 나타내는 함수를 확률분포함수라고 부릅니다. 확률변수의 종류에 따라 확률분포함수를 부르는 용어가 달라집니다. 이산확률변수의 확률분포함수를 '확률질량함수'라고 부릅니다. 용어가 다른 이유는 함수가 갖는 값의 의미가 다르기 때문입니다. 확률질량함수에서 함수값은 '확률'입니다. 확률질량함수는 기호로 아래와 같이 나타냅니다. 확률질량함수에 '질량'이라는 용어가 붙어있는 이유는 확률밀도함수와 구별해주기 위함입니다. 이산확률변수의 확률분포와 연속확률변수의 확률분포를 구별할 때, '질량'과 '밀도'라는 개념이 효과적이기 때문에 통계와 무관하지만 사용하게된 용어입니다. 질량과 밀도라는 용어사용에 대해서는 확률밀도함수를 설명하는 글에서 .. 2019. 9. 22.
[모듈식 확률과 통계] 3.통계 (1)확률변수 [확률과통계]-[3.통계]-[①확률분포]-[(1)확률변수] 확률변수 각 변수에 대응되는 확률을 갖는 변수를 '확률변수'라고 합니다. 이때 변수들은 어떤 시행에서 표본 공간의 원소입니다. 쉽게 말하면, 어떤 시행을 할 때 발생하는 사건들이 변수인 것입니다. 변수가 곧 확률이라는 말이 아닙니다. 변수도 값을 갖고, 그 값에 해당하는 확률도 갖습니다. 예를 들어 동전을 세번 던질 때 앞면이 나오는 횟수를 확률변수라고 한다면, 이 확률변수는 0,1,2,3 세가지 값을 가질 수 있습니다. 확률 변수는 X로 나타냅니다. X={0,1,2,3} 각각의 확률은 아래와 같습니다. X가 0일 때의 확률 = 1/8X가 1일 때의 확률 = 3/8X가 2일 때의 확률 = 3/8X가 3일 때의 확률 =1/8 기호로는 아래와 같이 .. 2019. 9. 10.
[모듈식 확률과 통계] 2.확률 (19)독립시행의 확률 [확률과통계]-[2.확률]-[②조건부확률]-[(19)독립시행의 확률] 독립시행의 확률 어떤 사건 A가 일어날 확률이 p일 때, 이 시행을 n번 반복한다고 해봅시다. 이때, 사건 A가 발생하는 횟수가 r일 확률은 아래와 같습니다. 예시를 통해 이해해봅시다. 어떤 농구선수의 자유투 성공률이 0.7(70%)라고 합시다. 공을 4번 던질 때, 자유투를 2번 성공할 확률을 구해봅시다. 성공을 O, 실패를 X라고 한다면 아래와 같은 경우가 있습니다. OOXXOXOXOXXOXOOXXOXOXXOO 위 여섯가지 경우는 4개 중 2개를 선택하는 경우와 같습니다. 총 4번의 시행 중, 사건의 발생 횟수인 2개를 선택하는 것과 같습니다. 따라서 확률은 아래와 같습니다. 2019. 9. 8.
[모듈식 확률과 통계] 2.확률 (18)독립시행 무엇인가 [확률과통계]-[2.확률]-[②조건부확률]-[(18)독립시행 무엇인가] 독립시행 무엇인가 독립시행은 동일한 시행을 반복할 때, 각 시행들이 서로 독립인 시행을 말합니다. 각 시행의 결과가 다른 시행의 결과에 영향을 주지 않는다는 것입니다. 영향을 주지 않는다는 것을 확률적으로 이해해봅시다. 사건 A가 있고 발생할 확률이 p라고 해봅시다. n번의 시행을 하는 동안 각 시행에서 A가 발생할 확률이 p가 되는 것이 독립시행입니다. 예를들면 동전던지기가 있습니다. 동전을 한번 던질 때 앞면이 나올 확률이 0.5라는 것은, 이전의 시행에서 어떤 면이 나왔는지에 영향을 받지 않습니다. 매번 던질 때마다 0.5라는 확률로 발생합니다. 2019. 9. 4.
반응형