본문 바로가기
반응형

확률과 통계/3. 통계33

[모듈식 확률과 통계] 3.통계 (33) 모평균의 신뢰구간 [확률과통계]-[3.통계]-[②통계적 추정]-[(33) 모평균의 신뢰구간] 모평균의 신뢰구간 모집단이 있습니다. 모집단의 평균과 분산은 아래와 같습니다. 이 모집단에서 표본을 뽑았습니다. 한가지 조건을 설정하겠습니다. 모집단이 정규분포를 따르거나, 중심극한정리가 성립할 만큼 표본이 충분히 큰 상황이라고 해봅시다. 모집단이 정규분포를 따른다 → 표본평균이 정규분포를 따른다.표본의 크기가 충분히 크다 → 표본평균이 정규분포를 따른다. 따라서 우리가 뽑은 표본평균은 아래와 같은 정규분포를 따릅니다. 그래프는 아래와 같습니다. 만약 우리가 표본을 뽑는다면, 우리가 뽑은 표본의 평균은 위 분포를 따를 것입니다. 매번 뽑을 때마다 위치는 달라지겠지만, 위 분포를 따릅니다. 우리는 우리가 뽑은 표본평균이 속할 확률이.. 2019. 11. 19.
[모듈식 확률과 통계] 3.통계 (32) 모평균의 추정 [확률과통계]-[3.통계]-[②통계적 추정]-[(32) 모평균의 추정] 모평균의 추정 모집단에서 표본을 추출하는 이유는 표본이 궁금해서가 아니라, 모집단이 궁금하기 때문입니다. 따라서 우리는 추출한 표본을 이용하여 모집단의 특성을 최대한 추측할 것입니다. 모집단의 특성 중에는 모집단의 통계량이 있습니다. 모집단의 통계량은 모수라고 합니다. 모집단의 통계량 (모수) : 모집단의 평균, 분산, 표준편차 등 이렇게 표본을 이용하여 모집단의 특성들을 추측하는 것을 추정이라고 합니다. 고등학교 과정에서는 모집단의 평균만을 추정합니다. 추정에는 '점추정'과 '구간 추정' 두가지가 있습니다. 점추정은 모집단의 통계량을 하나의 값으로 추정하는 것이고, 구간 추정은 어떤 범위 사이에 있다고 추정하는 것입니다. 우리는 이.. 2019. 11. 18.
[모듈식 확률과 통계] 3.통계 (31) 표본평균의 분포 [확률과통계]-[3.통계]-[②통계적 추정]-[(31) 표본평균의 분포] 표본평균의 분포 지난 글에서 표본평균들의 평균이 모평균과 같고, 표본평균들의 분산은 모집단의 분산을 표본의 크기로 나눈 것과 같다는 것을 배웠습니다. 만약 모집단이 정규분포를 따른다면, 표본평균의 분포는 항상 정규분포를 따릅니다. 고등학교 과정에서는 알려져있다라고 배우는데 증명은 가능합니다. 증명이 준비되면 링크로 달겠습니다. 모집단이 정규분포를 따르지 않더라도, 표본의 크기가 충분히 크면 표본평균의 분포를 정규분포에 근사시킬 수 있습니다. n이 커질 수록 표본평균의 분포는 정규분포에 가까워져 갑니다. 이 성질은 통계학에서 가장 중요한 성질 중 하나입니다. '중심 극한정리'라고 부르는데 증명이 궁금하신 분들을 위해 링크를 달아놓겠습.. 2019. 11. 14.
[모듈식 확률과 통계] 3.통계 (30) 표본평균의 통계량 (평균, 분산, 표준편차) [확률과통계]-[3.통계]-[②통계적 추정]-[(30) 표본평균의 통계량 (평균, 분산, 표준편차)] 표본평균의 통계량 (평균, 분산, 표준편차) 모집단에서 크기 n인 표본을 여러개 뽑았다고 해봅시다. 적당히 k개라고 합시다. 위첨자를 뽑은 표본의 번호, 아래첨자를 표본의 원소번호라고 합시다. 첫번째 표본은 아래와 같이 표현됩니다. 두번째 표본은 아래와 같이 표현됩니다. 이런 표본이 k개 있는 것입니다. 각 표본의 평균을 구하면 아래와 같습니다. 이제 이 표본 평균들의 평균을 구할겁니다. 헷갈리시면 않됩니다. 표본평균이 아니라. 표본평균들을 가지고 '다시'평균을 구한겁니다. 표본은 시간만 있다면 무수히 많이 뽑을 수 있습니다. 따라서 표본평균의 평균을 구할 때, k를 무한대로 보내야합니다. 놀랍게도, 표.. 2019. 11. 13.
[모듈식 확률과 통계] 3.통계 (29) 표본의 통계량 (평균, 분산, 표준편차) [확률과통계]-[3.통계]-[②통계적 추정]-[(29) 표본의 통계량 (평균, 분산, 표준편차)] 표본의 통계량 (평균, 분산, 표준편차) 모집단에서 표본을 뽑는 상황을 생각해봅시다. 크기가 n인 표본을 뽑았고, 아래와 같다고 합시다. 이 표본의 평균은 아래와 같이 나타냅니다. 표본평균이라고 부릅니다. 분산은 아래와 같이 나타냅니다. 표본분산이라고 부릅니다. n-1로 나누는 이유는 표본분산을 불편추정량으로 만들기 위함인데, 이유가 궁금하신 분들은 다음 링크를 참고하시면 됩니다. (https://www.youtube.com/watch?v=faVIwae-wkw&t=3s) 표분편차는 아래와 같이 구하고, 표본표준편차라고 부릅니다. 2019. 11. 12.
[모듈식 확률과 통계] 3.통계 (28) 모집단의 통계량 (평균, 분산, 표준편차) [확률과통계]-[3.통계]-[②통계적 추정]-[(28) 모집단의 통계량 (평균, 분산, 표준편차)] 모집단의 통계량 (평균, 분산, 표준편차) 조사하려는 대상이 되는 전체집단을 모집단이라고 불렀습니다. 모집단에서 조사하려는 특성이 있을 것입니다. 대한민국 국민이 모집단이라면, 조사하려는 특성은 키, 몸무게, 발사이즈 등이 있습니다. 이와 같은 특성들을 확률변수로 나타낼 수 있습니다. 이 확률변수를 X라고 놓읍시다. 확률변수 X의 평균,분산,표준편차를 구할 수 있을 것입니다. 특별히 모집단의 특성을 나타내는 확률변수일 때는, 앞에 '모'라는 말을 붙여줍니다. 모평균모분산모표준편차 기호로는 아래와 같이 나타냅니다. 모평균 m모분산 σ²모표준편차 σ 평균 m 대신 그리스어 μ를 사용하기도 합니다. 2019. 11. 7.
[모듈식 확률과 통계] 3.통계 (27) 임의추출 (복원추출, 비복원추출) [확률과통계]-[3.통계]-[②통계적 추정]-[(27) 임의추출 (복원추출, 비복원추출)] 임의추출 (복원추출, 비복원추출) 모집단에서 표본을 뽑는 것을 '추출'이라고 합니다. 표본을 추출할 때, 각 표본들을 동일한 확률로 뽑는 것이 중요한 상황들이 있습니다. 로또 번호를 추첨한다고 할 때, 번호마다 뽑힐 확률이 다르다면 '번호 맞추기'가 아니라 사기가 될 것입니다. 또 설문 조사를 할 때, 설문조사를 하는 설문조사를 하는 사람이 본인 스타일만 골라서 설문조사를 한다면 공정한 설문이 되지 않을 것입니다. 모집단에 속하는 표본 혹은 대상을 같은 확률로 추출하는 것을 '임의추출'이라고 합니다. 임의추출은 무작위추출이라고도 부른다. 임의추출에는 두 가지가 있습니다. 로또 번호를 추첨할 때, 뽑힌 공을 다시 넣.. 2019. 11. 6.
[모듈식 확률과 통계] 3.통계 (26) 모집단과 표본추출 [확률과통계]-[3.통계]-[②통계적 추정]-[(26) 모집단과 표본추출] 모집단과 표본추출 지난 글에서 대한민국 40대 이상 인구 중에서 너튜버 '보겸'을 아는 사람이 몇 %인지 알고 싶은 상황을 가정했습니다. 비용과 시간 등의 문제로 40대 인구 전체를 조사할 수 없으니, 일부를 뽑아서 조사했다고 했습니다. 이 예시에서 대한민국 40대 이상 인구 전체를 '모집단'이라고 합니다. 어떤 조사를 하려고 했을 때, 대상이 되는 전체집단이 '모집단'입니다. 전체집단에서 일부를 뽑았다고 했는데, 이를 '표본'이라고 합니다. 어떤 조사를 하기 위해 모집단에서 일부를 뽑은 것을 표본이라고 합니다. 이렇게 모집단에서 표본을 뽑는 행위를 '표본추출'이라고 합니다. 또 우리가 뽑은 자료의 수(위 경우에는 사람의 수)를 .. 2019. 11. 4.
[모듈식 확률과 통계] 3.통계 (25) 통계 조사 (전수조사, 표본조사) [확률과통계]-[3.통계]-[②통계적 추정]-[(25) 통계 조사 (전수조사, 표본조사)] 통계 조사 (전수조사, 표본조사) 어떤 집단의 어떤 특성을 조사하고 싶은 상황입니다. 예를 들면 대한민국 40대 이상 인구 중에서 너튜버 '보겸'을 아는 사람이 몇 %인지 알고 싶었습니다. 돈과 시간이 아주 많은 사람이라면 대한민국의 40대 이상인 모든 사람을 찾아가서 물어볼 수 있겠죠. 이런 방식의 조사를 '전수조사'라고 합니다. 보통 전수조사는 하기 어렵습니다. 40대 이상의 인구를 어떻게 다 조사할까요. 못해요. 그래서 전체 집단 중일부을 뽑습니다. 40대 이상인 사람을 임의로 500명 정도 뽑습니다. 그리고 보겸을 아냐고 물어봐요. 예를들어 100명이 안다고 대답했다면 20%가 알고 있는 것이죠. 이렇게 전.. 2019. 11. 3.
[모듈식 확률과 통계] 3.통계 (24) 이항분포를 정규분포로 근사 (굳이 왜 하나?) [확률과통계]-[3.통계]-[①확률분포]-[(24) 이항분포와 정규분포와의 관계] 이항분포를 정규분포로 근사 (굳이 왜 하나?) 시행횟수가 n 이고, 사건 발생확률이 p인 이항분포를 따르는 확률변수 X의 분포함수는 아래와 같습니다. n이 충분히 클 때, 이항분포를 정규분포로 근사할 수 있습니다. n이 무한대로 가면 이항분포는 정규분포가 됩니다. 고등학교 과정에서 증명을 하지는 않지만, 증명이 궁금하신 분들을 위해 링크를 걸어놓겠습니다. https://hsm-edu.tistory.com/62 이항분포를 정규분포로 근사해봅시다. 확률분포 X가 이항분포를 따른다면 아래와 같은 기호로 표현할 수 있습니다. 위 이항분포의 평균은 np, 분산은 npq 입니다. n이 충분히 크다면 이항분포는 아래와 같은 정규분포를 .. 2019. 11. 1.
[모듈식 확률과 통계] 3.통계 (23) 정규분포의 표준화(왜 하는건가?) [확률과통계]-[3.통계]-[①확률분포]-[(23) 정규분포의 표준화(왜 하는건가?)] 정규분포의 표준화(왜 하는건가?) 아래와 같은 정규분포가 있습니다. 위에 표시된 부분의 넓이는 아래와 확률로 표현됩니다. 정규분포는 평균값과, 표준편차의 값에 상관없이 위 넓이가 일정합니다. 숫자를 넣어 설명하면, 아래 두 넓이가 같다는 것입니다. 평균으로 부터 표준편차만큼 떨어진 곳 까지의 넓이가 같다는 것입니다. 표준편차에 상수배를 해도 위 성질은 계속 성립합니다. 숫자를 넣어 설명하면, 아래 두 넓이가 같다는 것입니다. 평균으로 부터 표준편차의 a배 만큼 떨어진 곳 까지의 넓이가 같다는 것입니다. 표준정규분포도 정규분포의 일종이므로, 위 넓이를 표준정규분포에 표시하면 아래와 같습니다. 이 원리를 이용하면, 모든 .. 2019. 10. 31.
[모듈식 확률과 통계] 3.통계 (22) 표준정규분포표 사용법 [확률과통계]-[3.통계]-[①확률분포]-[(22) 표준정규분포표 사용법] 표준정규분포표 사용법 표준정규분포 함수는 아래와 같습니다. 그래프로 그리면 아래와 같습니다. 표준정규분포와 x축이 이루는 넓이는 1이고, 0으로 중심으로 대칭입니다. 따라서 0이하의 넓이와 이상의 넓이는 0.5가 됩니다. 이번에는 a를 기준으로 둘로 나눠봅시다. 확률변수 Z가 a이상일 클 확률은 표준정규분포표에 구해져 있지 않습니다. 그러나 0부터 a 사이일 확률은 구해져 있습니다. 따라서 0부터 무한대까지의 확률에서, 0부터 a까지의 확률을 빼면 0부터 a까지의 확률이 나옵니다. 확률변수 Z가 a 이하일 확률은 0이하일 확률과 0이상 a이하일 확률 두개로 나눠서 생각할 수 있습니다. 0 이하일 확률은 0.5 이므로, 0.5와 0.. 2019. 10. 29.
[모듈식 확률과 통계] 3.통계 (21) 표준정규분포표 [확률과통계]-[3.통계]-[①확률분포]-[(21) 표준정규분포표] 표준정규분포표 표준정규분포 함수는 아래와 같습니다. 그래프로 그리면 아래와 같습니다. 아래의 넓이를 봅시다. 이 넓이는 확률입니다. 아래의 확률을 나타냅니다. 이 확률을 표로 구해놓은 것이 표준정규분포표입니다. a를 바꿔가면서 값을 구해놓은 것이죠. 아래 방향으로는 a가 0.1씩 증가하고, 오른쪽으로는 0.01씩 증가합니다. 예를들어 a가 0.15일 때의 확률은, 0.0596 입니다. 이 값을 왜 구해놓을 걸까요? 모든 정규분포의 확률을 이 표 하나로 구할 수가 있습니다. '표준화'를 이용하면 되는데요. 이후에 설명하겠습니다. 2019. 10. 27.
[모듈식 확률과 통계] 3.통계 (20) 표준정규분포 [확률과통계]-[3.통계]-[①확률분포]-[(20) 표준정규분포] 표준정규분포 아래와 같은 정규분포함수가 있습니다. m이 평균이고, σ 가 표준편차였습니다. m이 0이고, σ 가 1인 정규분포도 있을 것입니다. 이런 정규분포를 '표준정규분포'라고 합니다. 확률밀도함수는 아래와 같고, 보통 표준정규분포의 확률변수는 Z로 나타냅니다. 그래프는 아래와 같습니다. 2019. 10. 25.
[모듈식 확률과 통계] 3.통계 (19) 정규분포의 확률밀도함수 (성질) [확률과통계]-[3.통계]-[①확률분포]-[(19) 정규분포의 확률밀도함수 (성질)] 정규분포의 확률밀도함수 (성질) 정규분포는 아래와 같은 확률밀도함수를 갖는 확률변수 X의 확률분포였습니다. 지난 글에서 그린 그래프는 아래와 같았습니다. 오늘은 성질을 알아봅시다. 위 그래프에서 알 수 있는 정규분포의 확률밀도함수의 성질은 두가지 입니다. 1) x =m 에 대하여 대칭이다. 2) x축을 점근선으로 갖는다. 또 확률밀도함수이기 때문에 전체 넓이기 1이라는 성질도 같습니다. 3) 곡선과 x축 사이의 넓이가 1이다. 이번에는 표준편차인 σ 의 영향을 생각해봅시다. σ 가 커지면 꼭지점이 아래로 낮아집니다. 전체 넓이가 1로 유지되어야 하기 때문에 아래와 같이 펑퍼짐해집니다. 4) σ 가 커지면, 곡선의 높이는.. 2019. 10. 24.
[모듈식 확률과 통계] 3.통계 (18) 정규분포의 확률밀도함수 (그래프) [확률과통계]-[3.통계]-[①확률분포]-[(18) 정규분포의 확률밀도함수 (그래프)] 정규분포의 확률밀도함수 (그래프) 정규분포는 아래와 같은 확률밀도함수를 갖는 확률변수 X의 확률분포였습니다. 문자를 먼저 설명드리면, m은 평균이고 는 표준편차입니다. 이 함수의 성질을 살펴봅시다. 먼저 가장 간단한 형태에서 출발합시다. 정규분포는 아래 함수에서 출발하면 이해하기가 수월해집니다. 이 함수의 그래프의 개형만 생각해봅시다. x에 양수를 넣을 때와, 음수를 넣을 때 y값이 같으므로 y축 대칭인 함수입니다. x가 커지면 커질 수록, y값은 작아집니다. 지수가 음의 방향으로 커지기 때문입니다. 대충 그려보면 아래와 같은 모양이 될겁니다. 이 함수에 양수인 계수인 곱한 것입니다. 개형에는 변화가 없습니다. 이제 .. 2019. 10. 23.
[모듈식 확률과 통계] 3.통계 (17) 정규분포 (+유도과정 영상) [확률과통계]-[3.통계]-[①확률분포]-[(17) 정규분포] 정규분포 정규분포는 아래와 같은 확률밀도함수를 갖는 확률변수 X의 확률분포입니다. m은 확률변수 X의 평균이고, σ 는 표준편차입니다. 함수를 잘 뜯어보면 지수함수입니다. 밑이 e(자연상수)인 지수함수입니다. 갑자기 복잡한 모양의 함수가 왜 등장했나 궁금하실텐데요. 이 정규분포는 사회의 여러 현상들을 설명하는 함수입니다. 예를 들어 전국민 키를 조사해서 분포를 그려보면, 정규분포와 같은 모양으로 그려집니다. 키 뿐만 아니라 몸무게나 다른 여러 사회 현상 자료들로 그래프를 그려보면 정규분포와 같은 모양을 하는 경우가 많습니다. 어떤 현상을 수학적으로 표현할 수 있다는 것에는 굉장한 유익이 있습니다. 정규분포는 사회현상을 수학적으로 표현할 수 있.. 2019. 10. 22.
[모듈식 확률과 통계] 3.통계 (16) 확률밀도함수의 성질 [확률과통계]-[3.통계]-[①확률분포]-[(16) 확률밀도함수의 성질] 확률밀도함수의 성질 확률밀도함수는 연속확률변수의 확률분포를 나타내는 함수입니다. 연속확률변수는 어떤 구간의 모든 실수값을 갖는 확률변수입니다. 연속확률변수가 아래 구간의 모든 실수값을 갖는다고 하겠습니다. 이 연속확률변수의 확률밀도함수를 f(x)라고 놓는다면 아래의 세가지 성질이 성립합니다. 1) f(x) ≥ 0 확률밀도함수는 항상 양수값을 갖습니다. 2) 함수 f(x)와, 구간과, x축으로 둘러싸인 부분의 넓이는 1이다. 확률의 총합이 1이기 때문입니다. 3) P(a ≤ X ≤ b) 는 함수 f(x)와, x축과, 두 직선 x=a, x=b 로 둘러싸인 도형의 넓이와 같다. 확률변수 X가 어떤 구간사이의 값을 가질 확률은, 해당 구간.. 2019. 10. 18.
[모듈식 확률과 통계] 3.통계 (15) 확률밀도함수 [확률과통계]-[3.통계]-[①확률분포]-[(15) 확률밀도함수] 확률밀도함수 확률분포를 나타내는 함수를 확률분포함수라고 부릅니다. 확률변수의 종류에 따라 확률분포함수를 부르는 용어가 달라집니다. 이산확률변수의 확률분포함수를 '확률질량함수'라고 불렀었는데요. 연속확률변수의 확률분포함수를 '확률밀도함수'라고 부릅니다. - 이산확률변수 → 확률질량함수- 연속확률변수 → 확률밀도함수 확률질량함수는 함수값이 곧 확률인 함수였습니다. 예를들어 동전을 던지는 시행의 확률질량함수를 그려보면 아래와 같습니다. 확률밀도함수는 함수 값이 확률이 아니라, 어떤 구간의 넓이가 확률인 함수입니다. 예시를 통해 이해해봅시다. 시계가 하나 있고, 시침을 튕겨서 돌린다고 해봅시다. 이때 시침이 멈추는 위치의 각도를 12시를 기준으로.. 2019. 10. 17.
[모듈식 확률과 통계] 3.통계 (14) 연속확률변수 [확률과통계]-[3.통계]-[①확률분포]-[(14) 연속확률변수] 연속확률변수 확률변수는 두가지가 있습니다. - 이산확률변수- 연속확률변수 이산확률변수는 지난강의에서 배웠습니다. 오늘은 연속확률변수를 배워봅시다. 이산확률변수는 "셀 수 있는 변수"였습니다. 셀 수 있다는 말이 "개수가 유한하다"는 말이 아니라는 것을 이미 배웠습니다. 개수가 무한해도 이산확률변수가 될 수 있습니다. 확률변수가 모든 자연수집합이라면, 개수가 무한하지만 셀 수 있습니다. 셀 수 있다는 것은 전체가 몇개인지 말 할 수 있다는게 아니라, 1-2-3-4-5....이렇게 순서대로 카운트 할 수 있다는 것입니다. 그렇다면 연속확률변수는 무엇일까요? 먼저 떠오르는 말은 "셀 수 없는 변수"일 것입니다. 셀 수 없다는 말도 맞는데, 셀 .. 2019. 10. 16.
[모듈식 확률과 통계] 3.통계 (13) 큰 수의 법칙(대수의 법칙) [확률과통계]-[3.통계]-[①확률분포]-[(13) 큰 수의 법칙(대수의 법칙)] 큰 수의 법칙(대수의 법칙) 큰수의 법칙은 시행횟수를 무한히 늘려가면, 통계적확률이 수학적확률에 가까워져간다는 법칙입니다. 큰수의 법칙은 대수의 법칙이라고도 부르는데, '큰'이 한자어 '대'로 바뀐 것이므로 같은 말입니다. 큰수의 법칙의 증명은 고등학교 과정을 벗어나므로 '설명'만 하겠습니다. 큰수의 법칙은 아래와 같습니다. 위 식에 등장하는 문자들을 먼저 설명하겠습니다. n은 어떤 사건 A의 시행횟수이구요. X는 n회의 독립시행에서 사건 A가 발생한 횟수입니다. p는 사건 A가 발생할 수학적 확률입니다. 위 식에서 X/n 은 사건 A의 통계적확률입니다. p는 수학적확률입니다. h는 임의의 양수입니다. 예를 들어서 사건 A.. 2019. 10. 10.
[모듈식 확률과 통계] 3.통계 (12) 이항분포의 분산과 표준편차 [확률과통계]-[3.통계]-[①확률분포]-[(12) 이항분포의 분산과 표준편차] 이항분포의 분산과 표준편차 확률변수 X가 이항분포를 따른다고 해봅시다. 시행횟수는 n번이고, 사건 발생확률이 p라면 기호로는 아래와 같이 나타냅니다. X~B(n,p) 위와 같은 이항분포를 따르는 확률변수 X의 분산과 표준편차는 아래와 같습니다. 유도해봅시다. 아래와 같이 n개의 확률변수가 있다고 해봅시다. 확률변수 X의 분산은 아래와 같이 구합니다. 변량 뺴기 평균의 제곱의 평균입니다. 시그마 형태로 표현하면 아래와 같습니다. 또다른 방법으로는 아래와 같이 구할 수도 있습니다. 시그마 형태로 표현하면 아래와 같습니다. 기호로 표현하면 아래와 같습니다. 위 식에 이항분포의 확률변수와 확률을 대입하면 아래와 같습니다. 이항분포의.. 2019. 10. 9.
[모듈식 확률과 통계] 3.통계 (11) 이항분포의 평균 [확률과통계]-[3.통계]-[①확률분포]-[(11) 이항분포의 평균] 이항분포의 평균 확률변수 X가 이항분포를 따른다고 해봅시다. 시행횟수는 n번이고, 사건 발생확률이 p라면 기호로는 아래와 같이 나타냅니다. X~B(n,p) 위와 같은 이항분포를 따르는 확률변수 X의 평균은 np 가 됩니다. 유도해봅시다. 아래와 같이 n개의 확률변수가 있다고 해봅시다. 확률변수 X의 평균은 아래와 같이 구합니다. 시그마의 형태로 나타내면 아래와 같습니다. 위 식에 이항분포의 확률변수와 확률을 대입하면 아래와 같습니다. 이항분포의 확률변수는 0부터 n까지의 값을 갖습니다. 조합을 팩토리얼 형태로 나타냅시다. x가 0일때는 값이 0이므로 아래와 같이 시그마의 시작을 1으로 바꿀 수 있습니다. 아래와 같이 변형합시다. p와 .. 2019. 10. 8.
[모듈식 확률과 통계] 3.통계 (10) 이항분포 [확률과통계]-[3.통계]-[①확률분포]-[(10) 이항분포] 이항분포 시행을 1번 했을 때, 어떤 사건이 일어날 확률을 p라고 합시다. 이때 이 사건이 일어나지 않을 확률은 (1-p)입니다. 이러한 시행을 n번 했다고 해봅시다. 사건이 발생한 횟수를 X라고 놓는다면, 사건이 X번 발생할 확률은 P(X)라고 놓을 수 있습니다. 예를들어 P(3)은 n번 시행에서 사건이 3번 발생할 확률인 것입니다. P(0)부터 계산해봅시다. P(0)는 n번의 시행에서 사건이 0번 발생한 확률입니다. 따라서 확률은 아래와 같습니다. P(1)은 n번의 시행에서 사건이 1번 발생한 확률입니다. 1번이라는 사건은 첫번째 시행에서 발생할 수도 있고, 두번째 시행에서 발생할 수도 있고, ... , n번째 시행에서 발생할 수도 있습니.. 2019. 10. 7.
[모듈식 확률과 통계] 3.통계 (9) 이산확률변수 aX+b의 분산과 표준편차 [확률과통계]-[3.통계]-[①확률분포]-[(9) 이산확률변수 aX+b의 분산과 표준편차] 이산확률변수 aX+b의 분산과 표준편차 이산확률변수 X의 분산을 V(X)라고 했을 때, aX+b의 분산은 아래와 같습니다. (a와 b는 상수입니다.) 증명해봅시다. 이산확률변수 X와, 각 변수에 해당하는 확률값을 표로 나타내면 아래와 같습니다. 이산확률변수 X의 개수는 n개라고 가정하겠습니다. aX+b의 분산을 구하면 아래와 같습니다. (m을 X의 평균이라고 놓겠습니다.) 우변의 괄호 안을 계산하면 아래와 같습니다. 아래와 같이 변형할 수 있습니다. a제곱으로 묶어줍시다. 빨간 부분은 X의 분산입니다. 따라서 아래와 같이 쓸 수 있습니다. 표준편차는 분산에 루트를 씌운 것이므로 아래와 같습니다. 2019. 10. 6.
[모듈식 확률과 통계] 3.통계 (8) 이산확률변수 aX+b의 평균 [확률과통계]-[3.통계]-[①확률분포]-[(8) 이산확률변수 aX+b의 평균] 이산확률변수 aX+b의 평균 이산확률변수 X의 평균을 E(X)라고 했을 때, aX+b의 평균은 아래와 같습니다. (a와 b는 상수입니다.) 증명해봅시다. 이산확률변수 X와, 각 변수에 해당하는 확률값을 표로 나타내면 아래와 같습니다. 이산확률변수 X의 개수는 n개라고 가정하겠습니다. aX+b의 평균을 구하면 아래와 같습니다. 우변을 전개합시다. 아래와 같이 묶어줍시다. 빨간식은 평균이고 파란식은 1이므로 아래와 같이 변형됩니다. 2019. 9. 27.
[모듈식 확률과 통계] 3.통계 (7) 이산확률변수 X의 분산과 표준편차 [확률과통계]-[3.통계]-[①확률분포]-[(7) 이산확률변수 X의 분산과 표준편차] 이산확률변수 X의 분산과 표준편차 ▣ X의 분산 이산확률변수 X와, 각 변수에 해당하는 확률값을 표로 나타내면 아래와 같습니다. 이산확률변수 X의 개수는 n개라고 가정하겠습니다. X의 분산을 구해봅시다. 분산은 영어로 variance 이기 때문에, X의 분산은 첫글자를 따서 아래와 같이 나타냅니다. 분산은 편차의 제곱의 평균(기댓값)입니다. 따라서 아래와 같이 나타낼 수 있습니다. 지난시간에 배운 기댓값 계산법을 이용하면 아래와 같이 구합니다. 분산은 변량의 제곱의 평균에서 평균의 제곱을 빼는 방법으로도 구할 수 있습니다. 분산의 정의를 이용하여 유도해보겠습니다. 위 전개합시다. 같은 차수의 항끼리 모아줍시다. 빨간항은.. 2019. 9. 27.
[모듈식 확률과 통계] 3.통계 (6)이산확률변수의 기댓값(평균) + 직관적 이해 [확률과통계]-[3.통계]-[①확률분포]-[(6)이산확률변수의 기댓값(평균)] 이산확률변수의 기댓값(평균) + 직관적 이해 이산확률변수 X와, 각 변수에 해당하는 확률값을 표로 나타내면 아래와 같습니다. 이산확률변수 X의 개수는 n개라고 가정하겠습니다. X의 평균은 아래와 같이 구합니다. 평균은 기댓값이라고도 부르는데, 평균은 X를 확률변수로 갖는 사건이 발생했을 때 기대할 수 있는 값이기 때문입니다. 각 변수에 확률을 곱해서 더한 값이 기댓값이라는 것을 직관적으로 이해하기 위해 두가지 시도를 해봅시다. 1) 동전 예시 동전을 던져서 앞면이 나오면 1000원, 뒷면이 나오면 10원을 받기로 했습니다. 얼마를 기대할 수 있을까요? 앞면이 나올 확률이 50%니까 앞면에 500원, 뒷면이 나올 확률이 50%니.. 2019. 9. 25.
[모듈식 확률과 통계] 3.통계 (5)확률질량함수의 성질 [확률과통계]-[3.통계]-[①확률분포]-[(5)확률질량함수의 성질] 확률질량함수의 성질 이산확률변수 X의 분포를 나타내는 함수가 확률질량함수입니다. 기호로는 아래와 같이 나타냅니다. 확률질량함수에는 세가지 성질이 있습니다. 확률은 0이상 1이하의 값을 같습니다. 확률의 합은 1입니다. 확률변수의 범위를 지정하여 확률을 나타낼 수도 있습니다. 2019. 9. 22.
[모듈식 확률과 통계] 3.통계 (4)확률질량함수 [확률과통계]-[3.통계]-[①확률분포]-[(4)확률질량함수] 확률질량함수 확률분포를 나타내는 함수를 확률분포함수라고 부릅니다. 확률변수의 종류에 따라 확률분포함수를 부르는 용어가 달라집니다. 이산확률변수의 확률분포함수를 '확률질량함수'라고 부릅니다. 용어가 다른 이유는 함수가 갖는 값의 의미가 다르기 때문입니다. 확률질량함수에서 함수값은 '확률'입니다. 확률질량함수는 기호로 아래와 같이 나타냅니다. 확률질량함수에 '질량'이라는 용어가 붙어있는 이유는 확률밀도함수와 구별해주기 위함입니다. 이산확률변수의 확률분포와 연속확률변수의 확률분포를 구별할 때, '질량'과 '밀도'라는 개념이 효과적이기 때문에 통계와 무관하지만 사용하게된 용어입니다. 질량과 밀도라는 용어사용에 대해서는 확률밀도함수를 설명하는 글에서 .. 2019. 9. 22.
반응형