いぬおさんのおもしろ数学実験室

おいしい紅茶でも飲みながら数学、物理、工学、プログラミング、そして読書を楽しみましょう

箱ひげ図について

 ふと気づいたら数学Ⅰに「箱ひげ図」というのが入っていました。新しい指導要領からみたいですね。こんなの、学生時代に勉強した記憶もありません。……と思って最近ネットで調べたら、箱ひげ図自体新しく、70年代に出てきたそうです。ウィキペディアでは品質管理で盛んに用いられている、とあります。

 箱ひげ図とは……データを5つの数で「要約」しよう、という考え方です。たくさんのデータがあり、「このデータの山はひと言で表現するとこんな感じ」とやるのです。中央値というのがありました。これはデータを小さいものから順に並べたときのちょうど真ん中のデータのことです。例えば7個のデータなら、大小順に並べて4番目です。偶数個、例えば6個なら真ん中はありませんから、3個目と4個目のデータの平均です。これが中央値。箱ひげ図は中央値を使って定義されています。データを大小順に並べ、中央値を求めます。小さいデータのグループと大きなデータのグループに分かれます。元のデータが偶数個ならちょうど半々に分かれます。奇数個なら、中央値の1個を除き、やはり2グループに分かれます。こうして2グループに分けたら、小さいデータのグループの中央値、大きいデータのグループの中央値を求めます。これで中央値が小さいものから3個、求まりました。

f:id:Inuosann:20210126193528p:plain

順に第一四分位数、第二四分位数、第三四分位数と呼びます。上の図のような記号(Q1、Q2、Q3)もよく使われます。読み方は「しぶんいすう」です。この四分位数と、最小値、最大値の5つの数でこのデータを説明しようというのです。例えば次のようになります。 

f:id:Inuosann:20210126195117p:plain

 教科書で初めて見て、「何、これ?」と思いました。いや、確かにこの5つの数で全体の分布がある程度分かります。四分位数は全体を大体4等分する点なのです(お分かりのように、データ数によっては正確に4等分にならないケースがあります)。……しかし、いくら「品質管理で使われます」って言ったって、今まで見たこともないものが教科書に入っていて、「なんだこりゃ」というのが率直な印象です。それほどのものなのか、ということです。実際、微積分などとは違って、多分教員の大多数は高校、大学で箱ひげ図について勉強してきていないはずなのです。

 どこかで誰かが「これを全国の高校生に勉強させるとよいのだ!!」とか言い出して、(その後、もちろん議論を経て)そういうことになってしまったんでしょう。あんまり興味がないのでアレですが、今度中学校に移るそうですね……。