95%信頼区間


 信頼区間(Confidence interval) 


全数調査ができない時は、標本調査で母集団の姿を推測することになる。
例えば【母平均の推定】標本調査で母集団の平均を推測することを「母平均の推定」という。

このとき、標本を使うので誤差が生じる。
誤差が存在するため、ある範囲の中に母平均があると推測する。
その範囲を信頼区間という。

信頼度95%のときの信頼区間:100回の標本調査のうち95回はこの範囲に母平均がある。

信頼度99%のときの信頼区間:100回の標本調査のうち99回はこの範囲に母平均がある。

信頼度99%の方が信頼区間が大きい。

 信頼度95%とは 


100回推定したら95回は「許容できる誤差の範囲」(許容誤差)の範囲内に収まる、という意味。
「許容できる誤差の範囲」5%(信頼度95%)で「統計学上、十分意味あり」と言われている。
信頼度は信頼係数ともいう。

よく使われる信頼度は、95%と99%である。

【推定】標本から母集団の平均や分散などの値を導く方法。

信頼度95%の信頼区間を求める

Excelの関数:CONFIDENCE(α, 標準偏差, 標本数)
(α:有意水準 (危険率))

使用例(標本から母集団の平均を推定する)
郊外に住む会社員 50 人を標本として、通勤時間を調査したところ、片道の 平均時間が 30 分で、母集団の標準偏差は 2.5 になりました。信頼度が 95%(α = 1-95% = 0.05) のとき、母集団の平均に対する信頼区間を求める には次の式を入力します。
  =CONFIDENCE(0.05,2.5,50)
計算結果は 0.692951 となり、95%の社員の通勤時間は 30 ± 0.692951 分 (つまり 29.3 〜 30.7 分) であるといえます。
出典:MIcrosoftサポートオンラインhttp://support.microsoft.com/kb/401625/ja

区間推定

母集団から標本を取り出して計算した平均は、標本の平均であって、 母平均と一致している保証はない。 そこで、母平均を、ある幅を持って推定することを「区間推定」という。

 有意水準(significance level) α 


「誤りの確率」(または危険率)と解釈するとわかりやすい。

α の値としては、0.05 (=5%) を用いるのが一般的である。
0.05水準で有意ならば * 、0.01水準で有意ならば ** と表示する。

有意水準=0.05 のとき、信頼度は 95%である。
母集団の 95%のデータがこの中にあると仮定される。
逆に、5%は外にある。

Copyright © 2009 Institute of Culture and Information Technology, Inc. All Rights Reserved.