1組、2組の数学の試験の点です。1列目が1組、2列目が2組です。
分散が等しいと言っていいかどうか、調べてみます。ネットを見ても記事によってあちこち違いがあったり、本も書き方が色々、Excelのデータ分析ツールの等分散の検定もパラメータの厳格な意味がぼくには今ひとつはっきりしません。そこで「こうすれば確かだろう」というのをまとめてみました。
Excelでは(不偏)分散は VAR() で求められます。単純にそれぞれの組の分散を調べると209.980952380952、154.892105263158で「分散は違う」ということになりそうです。でも、今回たまたまこういう結果になっただけなのかも知れません。つまり「本当は同じなんだけれど、何かの都合で今回は異なる分散の値が実現されただけ」なのかも知れないということです。そういう意味で、本当に分散が等しいのか、それとも異なるのか、判断する方法があるのです。F検定と言います。ここで手順をまとめておきます。
帰無仮説は「分散は等しい」です。このとき
k = FINV(有意水準/2, 分子の自由度, 分母の自由度 )として、
k≦(分散1)/(分散2)であれば仮説を棄却します。「すなわち分散は等しいとは言えない」となります。ただし、(分散1)>(分散2)とします。
FINV()はExcelの関数です。データ数がnのとき、自由度はn-1です。
これはつまり、分散の比がFINV()で計算できるある数値以上になると「分散は等しいとは言えない」ということです。先の例では、分散の比は
209.980952380952/154.892105263158=1.35565948970866
です。
FINV(0.025, 14, 19) = 2.64692794884402
なので、これと分散の比を比較すれば
(分散の比) ≦ FINV(0.025, 14, 19)
ですから、仮説は棄却されません。つまり「分散は等しくないとは言えない」です。現在あるデータでは仮説は棄却できないのです。仮説が棄却できないというのは「仮説を積極的に採用する」ということではないのでした。
2つの集団の平均点が等しいと言えるのかどうか、の検定の方法があります。しかしそれは分散が等しいか等しくないかで方法が変わるのです。前の記事では等分散を仮定しないで済む方法をまとめました。でもきっと等分散かどうかはっきりすればより精密な判断ができるのだと思います。
最初のデータで、分散は一応等しいと考えてよいことが分かりました。ここからExcelの平均値の検定「t検定:等分散を仮定した2標本による検定」メニューを使えます。これについてはまだ記事にしていません。この機会に一気にまとめておきたいです……。
教員はとにかく平均点、平均点、と話題にします。でも平均点が3点が違うとき実力は違うのか、5点ならどうなのか、10点ならどうなのか、という判断はしていないように思います。いいはずがありません。そこで今回、等分散の検定について書いたということです。