四分位数
問題:
次の[ コ ],[ サ ]に当てはまるものを,下の(0)~(5)のうちから一つずつ選べ。ただし,解答の順序は問わない。
99個の観測値からなるデータがある。四分位数について述べた記述で,どのようなデータでも成り立つものは[ コ ]と[ サ ]である。
(0) 平均値は第1四分位数と第3四分位数の間にある。
(1) 四分位範囲は標準偏差より大きい。
(2) 中央値より小さい観測値の個数は49個である。
(3) 最大値に等しい観測値を1個削除しても第1四分位数は変わらない。
(4) 第1四分位数より小さい観測値と,第3四分位数より大きい観測値とをすべて削除すると,残りの観測値の個数は51個である。
(5) 第1四分位数より小さい観測値と,第3四分位数より大きい観測値とをすべて削除すると,残りの観測値からなるデータの範囲はもとのデータの四分位範囲に等しい。
解答:
(3)と(5)
教科書に書かれている方法で四分位数を求めると,どのようなデータでも成り立つものは (3),(5) である。
データを小さいほうから順に並べ替えたものを x1, x2, …, x99 とする。
第1四分位数は25番目のデータだから Q1 = x25,
中央値は50番目のデータだから Q2 = x50,
第3四分位数は75番目のデータだから Q3 = x75 になる。
Q1 = 10,Q2 = 20,Q3 = 30 とし, 平均値を大きくとるために,1番目から24番目を10,26番目から49番目を20,51番目から74番目を30,そして76番目から99番目を十分大きな値(70など)とする。 \begin{align} x_{1}=\dots =x_{24} &=Q_1=10\\ x_{26}=\dots =x_{49} &=Q_2=20\\ x_{51}=\dots =x_{74} &=Q_3=30\\ x_{76}=\dots =x_{99} &=70 \end{align} 平均値は約 32.1 だから,選択肢 (0) は成り立たない。
四分位範囲は標準偏差より大きいが成り立たないこと。
Q1 = 40,Q2 = 50,Q3 = 60 とし, 標準偏差を大きくとるために,26番目から49番目を40,51番目から74番目を60,そして1番目から24番目を十分小さな値(20など),76番目から99番目を十分大きな値(80など)とする。 \begin{align} x_{1}=\dots =x_{24} &=20\\ x_{26}=\dots =x_{49} &=Q_1=40\\ &\mathrel{\phantom{=}}Q_2=50\\ x_{51}=\dots =x_{74} &=Q_3=60\\ x_{76}=\dots =x_{99} &=80 \end{align} 標準偏差は約 22.1 になる。四分位範囲は 60−40=20 だから,選択肢 (1) は成り立たない。
中央値より小さい観測値の個数は49個であるが成り立たないこと。
49番目の値と50番目の値(中央値)が等しいとき,中央値より小さい観測値は49個より少なくなるから,選択肢 (2) は成り立たない。
最大値に等しい観測値を1個削除しても第1四分位数は変わらないが成り立つこと。
削除する前は99個の観測値があり,1番目から49番目の組の中央値が第1四分位数になる。 最大値に等しい観測値を1個削除すると98個残る。1番目から49番目の組の中央値が第1四分位数になるから,削除する前と同じである。 よって選択肢 (3) が成り立つ。
第1四分位数より小さい観測値と,第3四分位数より大きい観測値とをすべて削除すると,残りの観測値の個数は51個であるが成り立たないこと。
24番目の値と25番目の値(第1四分位数)が等しいとき,削除される観測値は24個より少なくなる。 同様に,75番目の値(第3四分位数)と76番目の値が等しいとき,削除される観測値は24個より少なくなる。 よって選択肢 (4) は成り立たない。
第1四分位数より小さい観測値と,第3四分位数より大きい観測値とをすべて削除すると,残りの観測値からなるデータの範囲はもとのデータの四分位範囲に等しいが成り立つこと。
第1四分位数は25番目の値である。それより小さい観測値をすべて削除すると,残りのデータの最小値は,もとのデータの第1四分位数に等しい。
同様に,第3四分位数は75番目の値である。それより大きい観測値をすべて削除すると,残りのデータの最大値は,もとのデータの第3四分位数に等しい。
よって選択肢 (5) が成り立つ。
第1四分位数から第3四分位数まで同じ値にすると,四分位範囲が0になる。
選択肢 (0),(1),(2),(4) は成り立たない。四分位数の定義を他のものに替えた場合も同じである。
選択肢 (3),(5) については,教科書に書かれている四分位数であれば成り立つが,その他の四分位数の場合は成り立つとは限らない。
教科書に書かれている方法で四分位数を求めると,観測値を削除する前も,削除した後も,25番目の値が第1四分位数になっている。分位点の位置が変化していない。
しかしそれは偶然である。データの大きさが変化すれば,分位点の位置も変化するのが普通である。
実際,EXCEL で定義されている四分位数の場合は,このような現象は起こらない。
選択肢 (3) は,四分位数の定義に深く依存している。
分位点の位置がなめらかに変化しないのは,このタイプの四分位数だけに見られる欠点のようなものである。
選択肢 (3) は,一部の四分位数に見られる特殊な現象についての設問なので,出題するべきではない。
教科書に書かれている方法で四分位数を求めると,第1四分位数が25番目の観測値に一致し,第3四分位数が75番目の観測値に一致している。
四分位数が1つの観測値に一致する場合は,選択肢 (5) が成り立ち,
反対に,四分位数が2つの観測値の中間の値になる場合は,選択肢 (5) は成り立たない。
たとえば,テューキーの方法で四分位数を求めると,選択肢 (5) は成り立たない。
選択肢 (5) も,四分位数の定義に依存するので,出題しないほうがよい。
選択肢 (0),(1),(2),(4) は四分位数の定義には依存しないが,どれも成り立たない。
選択肢 (3),(5) は成り立つことになっているが,四分位数の定義に依存するものばかりである。 テューキーの方法で四分位数を求めると,どの選択肢も成り立たず,解答不能になる。
四分位数の本来の目的は,データの分布を表示することだが,そのような選択肢は含まれていない。 四分位数の意義を理解せず,あら探しばかりしている。虚しい問題である。
なお,「四分位数」の学習内容は高等学校から中学校に移行し,大学入試には間もなく出題されなくなるとみられる。
2020.1.25 作成 / 2021.1.11 更新
検定済教科書 | 四分位数
Home › 検定済教科書