표준 오차 계산 예제

Last Updated on 2021-09-30 by BallPen

표준 오차 계산 방법을 예제로 알아보아요.

표준 오차 계산 방법에 대한 예제입니다.

문제

어떤 물체의 질량을 측정하기 위해 다음과 같이 총 10번의 측정이 이루어졌다고 가정하겠습니다. 질량은 SI 기본 물리량으로써 측정값의 단위는 kg을 사용합니다.

측정번호측정값(kg)측정번호측정값(kg)
\(x_1\)5.65\(x_6\)5.78
\(x_2\)5.72\(x_7\)5.43
\(x_3\)5.46\(x_8\)5.50
\(x_4\)5.52\(x_9\)5.83
\(x_5\)5.60\(x_{10}\)5.61

이때 신뢰수준은 95%를 적용합니다.

(a) 측정값의 표준 오차 SEM을 구하세요.

(b) 허용 오차를 이용하여 측정값을 표기하세요.

(a) 측정값의 표준 오차 계산

문제에서 주어진 데이터는 실험세트가 하나인 경우로 총 10개의 측정값으로 구성되어 있습니다.

표준 오차, SEM(Standard Error of Mean)이란 표본 평균에 대한 표준 편차로 정의됩니다. 표준 오차에 대한 식은 다음과 같습니다.

$$
\tag{1} SEM = {{\sigma}\over{\sqrt{n}}}
$$

(1)식에서 \(\sigma\)는 모집단의 표준편차이고, \(n\)은 측정횟수 입니다. 그러나 우리는 모집단의 표준편차를 모르기 때문에 측정을 통해 얻어진 표본의 표준편차 \(s\)를 모집단의 표준편차 \(\sigma\)로서 추정하게 됩니다.

따라서 (1)식은 다음과 같이 변경될 수 있습니다.

$$
\tag{2} SEM = {{s}\over{\sqrt{n}}}
$$

이제부터 (2)식의 표준 오차 SEM을 계산하겠습니다. 그러기 위해서는 표준 편차 \(s\)를 구해야 하는데, 이를 위해서는 측정값의 평균 \(\mu\)가 우선 필요합니다. 평균은 다음과 같습니다.

$$
\begin{align}
\tag{3}
\mu &= {{\Sigma{x}}\over{n}} = {{x_1 + x_2 + \ldots + x_9 + x_{10}}\over{n}}\\
&={{5.65+5.72+\ldots+5.83+5.61}\over{10}}\\
&=5.61~\mathrm{kg}
\end{align}
$$

위에서 구해진 평균값 \(\mu\)를 이용하여 표본의 표준 편차 \(s\)를 계산합니다.

$$
\begin{align}
\tag{4}
s &= \sqrt{{\Sigma(x-\mu)^2}\over{n-1}}\\
&= \sqrt{{(5.65-5.61)^2 + \ldots + (5.61-5.61)^2}\over{10-1}} \\
&= 0.136
\end{align}
$$

그러면 최종적으로 (2)식의 표준 오차 SEM은 다음과 같이 구해집니다.

$$
\begin{align}
\tag{5}
SEM &= {{s}\over{\sqrt{n}}}\\
&={{0.136}\over{\sqrt{10}}}\\
&=0.043
\end{align}
$$

(b) 허용 오차와 측정값 표기

측정값을 허용 오차(margin of error)를 활용해 표기하기 위해서는 ‘평균값\(\pm\)허용오차’의 형태로 표기하면 됩니다. 이를 신뢰구간(confidence interval)이라고 합니다. 이때 측정횟수가 10개뿐이므로 t값을 활용해 허용오차를 구하는 것이 좋습니다.

$$
\begin{align}
\tag{6}
평균값 \pm 허용오차 &= \mu \pm \Big( t_{{\alpha}\over{2}} \times {{s}\over{\sqrt{n}}} \Big) \\
&= \mu \pm ( t_{{\alpha}\over{2}} \times {SEM})
\end{align}
$$

이미 위에서 평균값 \(\mu\)와 SEM은 구해 놓았습니다. 그렇다면 \(t_{{\alpha}\over{2}}\)만 구하면 될 것 같아요.

아래의 표는 t-분포표입니다.

이 표는 세로축이 \(r\)로서 표기되어 있는데 이것을 자유도(Degree of freedom)라고 합니다. 일반적으로 측정에서의 자유도 \(r\)이란 측정횟수 \(n\)에서 1을 뺀 값을 말합니다.

즉 측정을 \(n\)=10회 했을 때 자유도 \(r\)은 다음과 같이 9입니다.

$$
r = n-1 = 10-1 = 9
$$

t-분포표에서 가로축이 \(\alpha\)로 표시되어 있습니다. 이것은 확률을 뜻합니다.

예를 들어 연구자들이 많이 선택하는 95% 신뢰수준의 경우 \(\alpha\)는 다음 식으로 계산됩니다.

$$
\begin{align}
(1-\alpha) \times 100 &= 95\% \\
1- \alpha &= {{95}\over{100}} \\
\alpha &= 1-{{95}\over{100}} \\
&=0.05
\end{align}
$$

이때 \(\alpha\)는 위에서 구한 값을 그대로 사용하지 않습니다. 그 이유는 t-분포의 양 끝단에서 \(\alpha\)값을 절반씩 나누어 갖기 때문입니다. 그래서 \({\alpha}\over{2}\)는 다음과 같습니다.

$$
{{\alpha}\over{2}} = {{0.05}\over{2}} = 0.025
$$

자 그러면 아래의 표를 이용해 \(t_{{\alpha}\over{2}}\)를 찾아 보겠습니다.

\(r\)=9이고, \({{\alpha}\over{2}}\)=0.025가 교차하는 숫자를 읽으면 됩니다. 무슨 값이 나오냐면 2.262가 나옵니다.

$$
t_{{\alpha}\over{2}} = 2.262
$$

표준 오차 계산 을 위한 t-분포표
표준 오차 계산을 위한 t-분포표
(출처 : By Jsmura – Own work, CC BY-SA 4.0)

결국 \(n\)=10, \(\mu\)=5.61, SEM=0.043의 신뢰 구간은 아래와 같습니다.

$$
\begin{align}
5.61 – (2.262 \times 0.043) \le &\mu \le 5.61 + (2.262 \times 0.043)\\
5.51 \le &\mu \le 5.71
\end{align}
$$

또는 (6)식과 같은 형태로 표기하면 아래와 같습니다.

$$
5.61 \pm (2.262 \times 0.043) = 5.61 \pm 0.097~ \mathrm{kg}
$$

이것을 말로 표현하면 “이 물체의 질량에 대한 참값은 5.51 kg보다는 크고 5.71 kg보다는 작은 구간내에 있을 확률이 95%이다”라는 것을 의미합니다.

흥미롭고 도움이 되는 글이었나요? 리뷰를 부탁드립니다.
[Total: 3 Average: 5]

Leave a Comment