@Prayer님 : 모분산을 추정할 때 n-1로 나누어야 하는 이유에 대한 답변입니다.

게시글 주소: https://image.orbi.kr/0001696165

왜 n으로 나누는 것이 타당하지 않은지를 살펴보자면….

모평균을 모르는 상태에서는 모평균을 표본평균으로 대체하여 사용해야 합니다. 그런데 이 과정에서 전체 분산의 일부가
표본평균에 흡수됩니다. 그래서 표본평균 자체를 모평균에 대한 추정값으로 사용하는 경우, 모분산을 추정할 때 그냥 n으로 나누게
되면 모분산보다 항상 작은 값이 추정되는 현상, 즉 편중(bias)이 발생하게 됩니다! 그 효과를 제거하기 위하여 n 대신 n-1
로 나누는 것입니다. 이를 베셀 보정(Bessel's correction)이라고 부릅니다.

실제로 유도해봅시다. 모분포 $http://latex.codecogs.com/gif.latex?X$ 의 모평균이 $http://latex.codecogs.com/gif.latex?\mathbb{E}(X)%20=%20m$ 이고 모분산이 $http://latex.codecogs.com/gif.latex?\mathbb{E}((X-m)^2)%20=%20\sigma^2$ 이라고 합시다.
(여기서, 기대값을 나타내는 기호인 E를 두 줄이 들어간 굵은 글씨로 표기하여 눈에 확 들어오도록 차별화(?)를 이루었습니다. 사실 국제적인 표기법이기도 하고요.)

그리고 이 모분포의 크기가 n인 표본을 생각하고, 그 표본평균 $http://latex.codecogs.com/gif.latex?\bar{X}$ 를 생각합시다. 그러면 $http://latex.codecogs.com/gif.latex?\bar{X}$ 의 평균은 $http://latex.codecogs.com/gif.latex?\mathbb{E}(\bar{X})%20=%20m$ 이고 분산은 $http://latex.codecogs.com/gif.latex?\mathbb{E}((\bar{X}%20-%20m)^2)%20=%20\frac{\sigma^2}{n}$ 입니다.

자, 그런데 잘 생각해봅시다. 모평균을 안다는 것은 이미 전체 집단에 대한 분포를 알고 있다는 것입니다. 그러나 우리가
현실에서 앙케이트 조사를 하거나 대선 후보에 대한 정보를 수집하는 등의 활동을 할 때에 모든 국민들을 상대로 결과를 얻어낼 수는
없습니다. (돈! 시간! 비협조! 주택총조사도 그래서 매년 못 하죠 -.-) 그러므로 우리는 항상 제한된 표본 내에서, 그 표본의 표본평균 자체를
모평균에 대한 추정값으로 삼고 계산을 진행할 수밖에 없습니다. 즉, n개의 샘플 $http://latex.codecogs.com/gif.latex?X_1,%20\cdots,%20X_n$ 에 대하여, 원래대로라면
우리는

$http://latex.codecogs.com/gif.latex?S^2%20=%20\frac{1}{n}%20\sum_{k=1}^{n}%20(X_k%20-%20\bar{X})^2$

의 값을 모분산에 대한 추정값으로 사용하려고 할 것입니다. 그렇다면 위 분포의 평균이 모분산과 일치할까요? 우선 계산의 편의를 위하여 다음 식을 먼저 보입시다.

$http://latex.codecogs.com/gif.latex?(1)%20\quad%20\mathbb{E}(X_k%20\bar{X})%20=%20m^2%20+%20\frac{\sigma^2}{n}$

증명은 다음과 같습니다.

$http://latex.codecogs.com/gif.latex?\begin{align*}%20\mathbb{E}(X_k%20\bar{X})%20&%20=%20\mathbb{E}%20\left(%20\frac{1}{n}%20\sum_{i=1}^{n}%20X_k%20X_i%20\right%20)%20\\%20&%20=%20\frac{1}{n}%20\sum_{i=1}^{n}%20\mathbb{E}%20(%20X_k%20X_i%20)%20\\%20&%20=%20\frac{1}{n}%20\left(%20\mathbb{E}(X_k^{2})%20+%20\sum_{i%20\neq%20k}^{n}%20\mathbb{E}%20(%20X_k%20X_i%20)%20\right)%20\\%20&%20=%20\frac{1}{n}%20\left(%20\mathbb{E}(X^2)%20+%20\sum_{i%20\neq%20k}^{n}%20\mathbb{E}%20(%20X_k)%20\mathbb{E}%20(%20X_i%20)%20\right)%20\\%20&%20=%20\frac{1}{n}%20\left(%20m^2%20+%20\sigma^2%20+%20(n-1)m^2%20\right)%20\\%20&%20=%20m^2%20+%20\frac{\sigma^2}{n}.%20\end{align*}$

단, 여기서 세번째 줄에서 네번째 줄로 넘어갈 때 i ≠ k 이면 두 분포가 독립임을 이용하여 기대값을 각각 취하였습니다. 그러면 식 (1)로부터

$http://latex.codecogs.com/gif.latex?\begin{align*}%20\mathbb{E}(S^2)%20&%20=%20\mathbb{E}%20\left(%20\frac{1}{n}%20\sum_{i=1}^{n}%20(X_i%20-%20\bar{X})^{2}%20\right%20)%20\\%20&%20=%20\frac{1}{n}%20\sum_{i=1}^{n}%20\mathbb{E}%20\left(%20(X_i%20-%20\bar{X})^{2}%20\right%20)%20\\%20&%20=%20\frac{1}{n}%20\sum_{i=1}^{n}%20\mathbb{E}%20\left(%20X_i^{2}%20-%202X_{i}\bar{X}%20+%20\bar{X}^{2}%20\right%20)%20\\%20&%20=%20\frac{1}{n}%20\sum_{i=1}^{n}%20\left(%20\mathbb{E}(X_i^{2})%20-%202\mathbb{E}(X_{i}\bar{X})%20+%20\mathbb{E}(\bar{X}^{2})%20\right%20)%20\\%20&%20=%20\frac{1}{n}%20\sum_{i=1}^{n}%20\left(%20(m^2%20+%20\sigma^2)%20-%202\left(%20m^2%20+%20\frac{\sigma^2}{n}%20\right%20)%20+%20\left(%20m^2%20+%20\frac{\sigma^2}{n}%20\right%20)%20\right%20)%20\\%20&%20=%20\frac{n-1}{n}%20\,%20\sigma^2%20\end{align*}$

입니다. 보시다시피 이 경우 모분산보다 항상 작게 추정됨을 알 수 있습니다. 또한 위의 식으로부터, 표본평균 자체의 분산이 이러한 현상의 직접적인 원인임을 알 수 있습니다. 따라서

$http://latex.codecogs.com/gif.latex?\tilde{S}^2%20=%20\frac{1}{n-1}%20\sum_{k=1}^{n}%20(X_k%20-%20\bar{X})^2%20=%20\frac{n}{n-1}%20S^2$

를 고려하여야 원하는대로 $http://latex.codecogs.com/gif.latex?\mathbb{E}(\tilde{S}^2)%20=%20\sigma^2$ 을 얻습니다.

팔로우 0

[ 수능한권 ] 6일 완성 전문항 풀컬러 손해설

[ 만점의 생각 완전판 ]　수능 국어 비문학 - 기초적인 독해방법부터 최고 난도 문제까지!

[ 수학의 단권화 ]　9종 교과서 수능 전 범위를 10일 만에?

0 XDK (+0)

유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.

sos440 [104180]

쪽지 보내기

최근 게시글 · 더보기
12/08/26 20:16 그냥 그저 그런 빈칸 채우기 문제...
12/08/26 18:45 쉬운 벡터문제 하나 투척합니다
12/07/16 16:53 쉬운 문제 하나 올려봅니다.
12/06/01 20:59 아래 고난이도 문제 풀이
12/03/20 09:26 이른 아침에 스리슬쩍 올려보는 간단한 적분 문제

알림
스크랩
신고

나카렌 · 278738 · 11/09/09 00:37 · MS 2018

대략적으로는 알고 있었는데, 이렇게 되는 것이로군요. 좋은 글 감사합니다!

좋아요 0 답글 달기 신고
수학적사고력 · 380092 · 11/09/30 18:44 · MS 2011

ㅇ ㅏ ㅇ ㅏ 굳입니다 ~

좋아요 0 답글 달기 신고