いぬおさんのおもしろ数学実験室

おいしい紅茶でも飲みながら数学、物理、工学、プログラミング、そして読書を楽しみましょう

2クラスで実施した試験の平均点に差があったら実力は違うと考えてよいのか?

 統計学、面白そうなのですが、なかなか勉強のための時間を取れません。しかし一応あちこち調べ、(理論的に納得したわけではないけれど手順については)納得して実用にできそうな部分を整理して載せておきます。

 教員にありがちなことです。例えば1組と2組の数学の試験の平均点がそれぞれ45点、50点でした。このとき普通は「2組の方が平均点が高かった、少し実力が上である」ということになりますよね。しかし実は「1組の方が高い平均点を取る実力があるが、今回はたまたま2組の平均点が高くなった」が真実なのかも知れません。どちらが正しいのでしょうか。

 「今回たまたま2組が上になったのか、それとも実際に実力があって上になったのか」判断するために検定します。1組、2組で同じ試験を仮想的に1000回も2000回も実施すると考えます。毎回平均点はいろいろ変わるでしょうが、1組の平均点、2組の平均点はそれぞれ正規分布するでしょう。今回の試験でたまたまそのうちのひとつが実現したのです。1組で仮想的に試験を1000回も実施した、その結果計算される1000個の平均点たちを集めた集合が母集団(母集団A)です。2組の方も同様(母集団B)。Aの平均とBの平均を比較したい(母平均を比較したい)のです。

 みなさんも実際にExcelで試してみてください。下のデータは単純にコピー&ペーストできます。実験なので、人数は40人よりずっと少なくしてあります。

1組は
53
62
57
53
53
34
70
63
49

で、平均54.9

2組は

58
40
26
50
48
50
55
45
43
48
52
40

で、平均46.3

だとしましょう。これはそれぞれ正規母集団A、Bから取り出した2個の標本です。2つの正規母集団の母平均が等しいかどうか調べたいときにはt検定を使えます。

Excelで、

データ → データ分析 → 「t検定 分散が等しくないと仮定した2標本による検定」(t検定のメニューには「分散が等しいと仮定」、「等しくないと仮定」の2通りがあります)

と進みます。「変数1の入力範囲」には1組の得点のセルの範囲を入れ、「変数2の入力範囲」には2組の得点の範囲を入れます。「二標本の平均値の差」には0を入れます(「平均値に差がない」を仮説(帰無仮説)にするので)。「α」には0.05(有意水準は通常5%)を入れます。OKをクリックすると結果が出るので、「P(T≦t)両側」の値と有意水準0.05を比較します。P(T≦t)両側<0.05 なら仮説「平均点に差がない」は棄却されます。実際に操作してみると  0.0564362808467413 ≧ 0.05 ですから、仮説は棄却できません。すなわち「平均に差がない」となります。なおこれは「このデータでは仮説の棄却はできない」ということであって、積極的に仮説を採用、ということではないのでした。一応注意しておきます。

 ご存じの方も多いと思いますが片側検定というのもあります。が、どうも両側、片側についてはどちらを使うか、結果をどう判断するかなど書籍によって説明がいろいろらしいです。ネットで「両側検定 片側検定」とかで検索してみましょう。自分自身、最初に書いたとおりで統計に関しては理論的な面で納得しているわけではなく、どうも両側検定を勧めている方が多そうなのでしばらくは両側検定でやってみます。

 なおAとBで、分散が等しいかどうかはまだ分かりません。参考文献によれば、等しいことが仮定できないときには「ウェルチの検定」というのを使うのだそうです。これはExcelでは「分散が等しくないと仮定」のケースらしく、すると分散が等しいかどうか不明ならこれを使えばよさそうです。……というわけで上では「分散が等しくない」としてExcelを使いました。事前に等分散であることを想定できないときはウェルチの検定を、と説明しているサイトもありました。また、分析ツールではF検定で等分散かどうか検定することもできます。これを先に実行して、その結果に応じて「等分散を仮定」、「分散が等しくないと仮定」に進むのがよいかも知れません。手間は増えますが。

 

 簡単に「2組の方が上」とか言ってしまったりするけれど、単純なことではないんですね。一応これでしばらく様子を見てみますが、まとめていて次々と疑問がわいてきています。お気づきの点がありましたら指摘していただければ助かります。

 

参考にしたサイト:コンピュータによるビジネス統計入門(阿部圭司氏)

参考文献:『統計処理リファレンス』(涌井良幸、涌井貞美2013技術評論社

どちらも分かりやすく、大変参考になりました。他にもたくさんのサイトを参考にしました。ありがとうございました!

 

追記:2020年7月25日(土) 数値や説明など、一部直しました。