1. 연속확률분포
1-1. 연속확률분포(continuous probability distribution)의 개념
연속확률분포는 연속확률변수를 갖는 분포이므로 확률변수가 특정 구간에 속할 확률을 계산함. 특정한 값에 대한 확률은 항상 0이라고 설정. 가장 활용도가 높은 연속확률분포는 정규분포. 또한 가장 단순한 형태로 유도할 수 있는 연속확률분포로는 균등분포가 있음.
1-2. 대표적인 연속확률분포
1. 균등분포(uniform distribution)
모든 확률분포 중에서 가장 단순한 형태의 분포. 이산확률분포의 형태로도 정의할 수 있지만 많은 경우 연속확률분포로서의 균등분포를 다루게 됨. 균등분포(uniform distribution)는 이산이든 연속이든 상관없이 표본공간의 원소발생확률이 균등한 분포.
<연속균등분포의 확률 도출>
연속균등분포의 확률은 확률변수가 속하는 소구간의 길이와 전체 표본공간의 길이를 대비하여 구할 수 있음. 연속균등분포에서 누적확률은 주어진 변수와 하한값인 a와의 길이와 표본 공간의 길이를 대비하여 구할 수 있음.

2. 정규분포(normal distribution)
정규분포는 통계이론에서 가장 중요하며 현실적으로 가장 많이 적용되는 분포. 정규분포는 수많은 자연현상과 사회적 현상을 설명하는 데 적합하며 대부분의 통계분석기법들도 모집 단의 분포가 정규분포일 것을 가정하여 이루어짐.
(1) 정규분포의 주요 특성
- 종모양(bell-shaped) 곡선이며 곡선 아래 부분의 면적은 항상 1이다.
- 곡선의 모양은 평균 μ를 중심으로 좌우대칭이다.
- σ에 따라 곡선의 높이가 결정되며 σ이 작을수록 높이가 높아진다.
- 확률변수가 평균으로부터 특정 표준편차값 이내에 위치할 확률이 동일하다.
(2) 평균±k·표준편차 범위의 확률 계산
- 정규변수 X의 68%는 대략 μ ± σ범위 안에 분포한다.
- 정규변수 X의 95%는 대략 μ ± 2σ범위 안에 분포한다.
- 정규변수 X의 99%는 대략 μ ± 3σ범위 안에 분포한다.
3. 표준정규분포(standard normal distribution)
μ = 0이고 σ^2 = 1인 정규분포를 표준정규분포((standard normal distribution)이라 하며 모든 정규분포는 표준정규분포로 표준화(standardization)할 수 있다.
(1) 표준정규변수 Z의 도출

(2) 활용도가 높은 확률
표준정규분포는 활용도가 매우 높으므로 자주 사용하는 z값에 대해서는 기억을 해두는 것이 좋음. 정규분포에서와 마찬가지로 Z변수가 [평균 ± k·표준편차]의 범위 안에 분포할 확률은 항상 일정하며 평균이 0이고 표준편차가 1이므로 상수 k의 값은 곧 개별 z값으로 나타남. 정규변수 X가 [μ ± kσ] 내에 위치할 확률과 Z가 [ 0±kx1] 내에 위치할 확률은 동일.

<예제>
(주)승호의 사원들을 대상으로 TOEFL 성적을 조사한 결과 평균이 480이고 분산이 900 인 정규분포를 따른다고 한다. 임의로 선택된 한 직원의 성적이 500점과 520점 사이일 확률을 구하라.
<해설>

2. 표본분포의 정의
2-1. 표본분포(sampling distribution)의 개념
표본으로부터 도출되는 표본통계량은 표본을 어떻게 구성하는가에 따라 다양하게 나타날 수 있음. 따라서 표본통계량은 결과를 예측할 수 없으므로 확률변수가 되며 표본통계량의 확률 분포를 표본분포(sampling distribution)라고 정의. 표본평균의 분포, 표본비율의 분포, 표본분산의 분포 등이 대표적.
2-2. 표본분포(sampling distribution)의 체계
표본분포는 표본을 단순확률표본으로 추출했을 때에만 의미가 있음. 단순확률표본을 추출하면 표본의 구성요소 X1,X2,X3,...,Xn는 상호독립이며 모두 모집단의 확률분포와 동일 분포를 따르는 확률변수가 됨. 표본통계량은 표본의 특성을 나타내는 척도이며 표본의 구성 요소인 확률변수 X1, X2, X3, ..., Xn에 의해 정의된 함수. 표본분포는 동일한 모집단으로부터 추출할 수 있는 크기가 동일한 모든 표본으로부터 구한 표본통계량들의 분포.

3. 표본평균의 확률분포
3-1. 표본평균의 기댓값과 분산

3-2. 정규분포를 따르는 경우
1. 모집단의 분포가 정규분포이며 모분산( σ^2 )을 알 때
2. 모집단의 분포와 상관없이 표본의 크기가 30이상으로 클 때
→ 중심극한정리 : 모집단의 분포와 상관없이 표본의 크기가 30이상으로 크면 표본평균의 분포는 정규분포를 근사적으로 따른다.
3-3. t분포를 따르는 경우
1. t분포(t-distribution)의 개념
표본평균의 확률분포를 설명하는 t분포는 표준정규분포와 유사하게 평균이 0이며 좌우대칭인 분포이나 자유도에 따라 분포의 높이가 달라짐. 자유도(degree of freedom)란 자유롭게 값을 취할 수 있는 변수의 개수를 의미. 단일 모수에 대한 추정에서 자유도는 표본의 크기에서 1을 뺀 값이 됨. t분포는 표준정규분포에 비해 높이가 낮으므로 꼬리 부분이 두꺼워지며 자유도가 증가할수록 표준정규분포에 가까워짐.
2. 모집단의 분포가 정규분포이며 모분산을 모르고 평균이 작을 때
참고문헌 : Big Data 시대에 반드시 알아야 할 기초 통계지식/Ubion
'통계학 > 기초통계학' 카테고리의 다른 글
12차시 - 표본크기 결정 및 가설검정 기초 (0) | 2020.02.18 |
---|---|
11차시 - 표본비율 및 표본분산의 확률분포 (0) | 2020.02.17 |
9차시 - 확률변수의 특성 및 이산확률분포 (0) | 2020.02.14 |
8차시 - 확률변수의 다양한 특성 (0) | 2020.02.12 |
7차시 - 확률이론 (0) | 2020.02.10 |