Home逆分布関数四分位数統計ソフトEXCELAppendix

1. 分位(順位)の求め方

1. 分位の求め方
2. 矩形近似
3. 台形近似
4. 分位数の求め方
5. ヒンジの求め方
6. 各ソフトウェアの既定値

分位数とは

p を 0 ≤ p ≤ 1 の範囲の実数とする。 昇順に並べられた標本に対して, 小さいほうからの順位が p の比率となる順位のことをp分位といい,rp または簡単に r で表す。 そしてその順位が r に一致するような標本値のことをp分位数といい,Qp または簡単に Q で表す。 p の値を百分率で表す場合は,p分位数のかわりに百分位数またはパーセンタイルということもある。

分位の求め方

p分位の計算方法として以下のものが知られている。 (3) はEXCEL等の方法,(2) は多くの統計ソフトで用いられる方法,(1) は重要であるがあまり用いられない。 \begin{align} & r=1/2+pN \tag{1}\\ & r=p(N+1) \tag{2}\\ & r=1+p(N-1) \tag{3}\\ & r=1/3+p(N+1/3) \\ & r=3/8+p(N+1/4) \end{align} この計算によって分位が r < 1 となってしまったときは r = 1 に,分位が r > N となってしまったときは r = N に修正しておく。

分位 r=1+p(N−1)

標本 {x} の大きさは N で,昇順に並べられているとする。 1 ≤ r ≤ N の範囲の順位 r に対して,比率 p を \[ p=\frac{r-1}{N-1} \] とおく。 これを変形すると (3) が得られる。 \[ r = 1+p(N-1) \] 比率 p = 0 に対応する順位は r = 1,比率 p = 1 に対応する順位は r = N となるから, p分位は 1 位と N 位の間を p:(1−p) の比に分ける順位とみなせる。 \[ r = (1-p) \times 1+p \times N \] このタイプの分位は EXCEL の PERCENTILE.INC 関数,統計ソフト R 等の既定値となっている。

分位 r=p(N+1)

1 ≤ r ≤ N の範囲の順位 r に対して,比率 p を \[ p=\frac{r}{N+1} \] とおく。 これを変形すると (2) が得られる。 \[ r = p(N+1) \] 比率 p = 0 に対応する順位は r = 0,比率 p = 1 に対応する順位は r = N+1 となるから, p分位は 0 位と N+1 位の間を p:(1−p) の比に分ける順位とみなせる。 \[ r = (1-p) \times 0+p \times (N+1) \] このタイプの分位は EXCEL の PERCENTILE.EXC 関数,SPSS 等の既定値となっている。

分位 r=0.5+pN

1 ≤ r ≤ N の範囲の順位 r に対して,比率 p を \[ p=\frac{2r-1}{2N} \] とおく。 これを変形すると (1) が得られる。 \[ r = \frac{1}{2}+pN \] 比率 p = 0 に対応する順位は r = 0.5,比率 p = 1 に対応する順位は r = N+0.5 となるから, p分位は 0.5 位と N+0.5 位の間を p:(1−p) の比に分ける順位とみなせる。 \[ r = (1-p) \times 0.5+p \times (N+0.5) \] このタイプの分位は GNU Octave 等の既定値となっている。

分位数の求め方

この後の2ページはとばして読んでも差し支えない。 この続きの分位数の求め方は 4 に書かれている。

次のページへ

1 2 3 4 5 6 Next

2. 矩形近似

1. 分位の求め方
2. 矩形近似
3. 台形近似
4. 分位数の求め方
5. ヒンジの求め方
6. 各ソフトウェアの既定値

実数を整数に丸める方法

切り捨て

分位から分位数を求める際に,整数でない数を整数に丸める必要がでてくるので,数値の丸め方をまとめておこう。 r を非負の実数とするとき,r 以下の整数のうちで最大のものを ⌊r⌋ と表す。 これは実数 r の小数部分を切り捨てたものである。\(\mathbb{Z}\) は整数全体の集合である。 \[ \lfloor r \rfloor=\max \{ n \in \mathbb{Z} \mid n \le r \} \] r の小数部分を {r} と表すと,それは r−⌊r⌋ に等しい。 実数 r は整数部分 ⌊r⌋ と 小数部分 {r} の和に分けることができる。 \[ r=\lfloor r \rfloor+\{ r \} \]

切り上げ

r を非負の実数とするとき,r 以上の整数のうちで最小のものを ⌈r⌉ と表す。 これは実数 r の小数部分が0でないときに小数部分を切り上げたものである。 \[ \lceil r \rceil=\min \{ n \in \mathbb{Z} \mid n \ge r \} \] 切り捨て ⌊r⌋ はつねに r 以下になり,切り上げ ⌈r⌉ はつねに r 以上になる。 \[ \lfloor r \rfloor \le r \le \lceil r \rceil \] また r 自身が整数の場合は,切り捨て ⌊r⌋ や切り上げ ⌈r⌉ は r に一致する。 \[ r \in \mathbb{Z} \implies \lfloor r \rfloor=r=\lceil r \rceil \]

四捨五入(算術丸め)

この後の 四捨五入・五捨五超入・銀行型丸め は実数 r に最も近い整数を求めるものである。 小数部分がちょうど 0.5 になる数のことを半整数という。 r を 四捨五入・五捨五超入・銀行型丸め で丸めると,r が半整数のときのみ結果が異なり,半整数でないときはどれを使っても結果は等しい。 四捨五入は半整数を切り上げる丸め方である。 四捨五入は \[ \lfloor r+0.5 \rfloor \] で求められる。

五捨五超入

五捨五超入は半整数を切り捨てる丸め方である。 五捨五超入は \[ \lceil r-0.5 \rceil \] で求められる。

五捨五入(偶捨奇入・銀行型丸め)

銀行型丸めは少し複雑で,半整数が切り上げになったり切り捨てになったりする。 銀行型丸めでは,半整数以外の数を四捨五入等と同様にして丸め,半整数は最も近い偶数に丸める。 r を銀行型丸めで丸めたものを ⌊r⌉ と表す。 \begin{array}{cccc} r & \lceil r-0.5 \rceil & \lfloor r \rceil & \lfloor r+0.5 \rfloor \\ 1.5 & 1 & 2 & 2 \\ 1.7 & 2 & 2 & 2 \\ 2.0 & 2 & 2 & 2 \\ 2.2 & 2 & 2 & 2 \\ 2.5 & 2 & 2 & 3 \\ 2.7 & 3 & 3 & 3 \\ 3.0 & 3 & 3 & 3 \\ 3.2 & 3 & 3 & 3 \\ 3.5 & 3 & 4 & 4 \end{array} 以下の大小関係がつねに成り立ち, \[ \lfloor r \rfloor \le \lceil r-0.5 \rceil \le \lfloor r \rceil \le \lfloor r+0.5 \rfloor \le \lceil r \rceil \] r 自身が整数の場合はすべて一致する。 \[ r \in \mathbb{Z} \implies \lfloor r \rfloor=\lceil r-0.5 \rceil=\lfloor r \rceil=\lfloor r+0.5 \rfloor=\lceil r \rceil=r \]

矩形近似

関数 y = f(x) は,x が自然数のときのみ値が分かっていて,次のようになっているとする。 a1,a2,a3 等はあらかじめ分かっている定数である。 \[ f(1)=a_1,\quad f(2)=a_2,\quad f(3)=a_3,\quad \cdots \] f(2.1) の値は分からないが,f(2.1) は f(2) にほぼ等しいだろうと考えて, \[ f(2.1) \fallingdotseq f(2)=a_2 \] と近似できる。 これを一般化しよう。 x が整数でないときは,x を x に最も近い整数に置き換えた値を使うようにする。 たとえば銀行型丸めで置き換えると, \[ f(x) \fallingdotseq f(\lfloor x \rceil)=a_{\lfloor x \rceil} \] とできる。 銀行型丸めでなく四捨五入でもよい。 \[ f(x) \fallingdotseq f(\lfloor x+0.5 \rfloor)=a_{\lfloor x+0.5 \rfloor} \] この手法を矩形近似という。

次のページへ

1 2 3 4 5 6 Next

3. 台形近似

1. 分位の求め方
2. 矩形近似
3. 台形近似
4. 分位数の求め方
5. ヒンジの求め方
6. 各ソフトウェアの既定値

台形近似

関数 y = f(x) は,x が自然数のときのみ値が分かっていて,次のようになっているとする。 a1,a2,a3 等はあらかじめ分かっている定数である。 \[ f(1)=a_1,\quad f(2)=a_2,\quad f(3)=a_3,\quad \cdots \] f(2.1) の値は分からないが,f(2.1) の値は f(2) と f(3) の中間の値で, そして f(3) よりも f(2) に近い値であると考えられる。 詳しくいうと \[ (2.1-2):(3-2.1)=0.1:0.9 \] が成り立つから, f(2.1) の値を f(2) と f(3) の間を 0.1:0.9 の比に分ける値として近似できる。 \[ f(2.1) \fallingdotseq 0.9 \, f(2)+0.1 \, f(3)=0.9 \, a_2+0.1 \, a_3 \] これを一般化しよう。 x が整数でないとき, \[ f(x) \fallingdotseq (\lceil x \rceil-x) \, a_{\lfloor x \rfloor}+(x-\lfloor x \rfloor) \, a_{\lceil x \rceil} \tag{1} \] とできる。 この手法を台形近似という。 線形補間あるいは按分比例配分とよばれることもある。

近似式の幾つかの表現

(1) 式は x が整数の場合にうまく機能しないから,整数の場合は近似値を ax とする。 \begin{align} x \not\in \mathbb{Z} &\implies f(x) \fallingdotseq (\lceil x \rceil-x) \, a_{\lfloor x \rfloor}+(x-\lfloor x \rfloor) \, a_{\lceil x \rceil} \\ x \in \mathbb{Z} &\implies f(x) \fallingdotseq a_x \tag{2} \end{align} ⌈x⌉ をやめて ⌊x⌋+1 に置き換えれば,x が整数の場合も機能するようになる。 \[ f(x) \fallingdotseq (\lfloor x \rfloor+1-x) \, a_{\lfloor x \rfloor}+(x-\lfloor x \rfloor) \, a_{\lfloor x \rfloor+1} \] 次の形で用いられることが多い。 \[ f(x) \fallingdotseq a_{\lfloor x \rfloor}+(x-\lfloor x \rfloor) (a_{\lfloor x \rfloor+1}-a_{\lfloor x \rfloor}) \tag{3} \] ⌊x⌋+1 を ⌈x⌉ に戻しても成立する。 \[ f(x) \fallingdotseq a_{\lfloor x \rfloor}+(x-\lfloor x \rfloor) (a_{\lceil x \rceil}-a_{\lfloor x \rfloor}) \tag{4} \]

次のページへ

1 2 3 4 5 6 Next

4. 分位数の求め方

1. 分位の求め方
2. 矩形近似
3. 台形近似
4. 分位数の求め方
5. ヒンジの求め方
6. 各ソフトウェアの既定値

分位数とは

p を 0 ≤ p ≤ 1 の範囲の実数とする。 昇順に並べられた標本に対して, 小さいほうからの順位が p の比率となる順位のことをp分位といい,rp または簡単に r で表す。 そしてその順位が r に一致するような標本値のことをp分位数といい,Qp または簡単に Q で表す。 分位 r がいつも整数になるとは限らないから,適当な方法で近似して分位数 Q を求めることになる。

分位の求め方

p分位の計算方法として以下のものが知られている。 (3) はEXCEL等の方法,(2) は多くの統計ソフトで用いられる方法,(1) は重要であるがあまり用いられない。 \begin{align} & r=1/2+pN \tag{1}\\ & r=p(N+1) \tag{2}\\ & r=1+p(N-1) \tag{3} \end{align}

分位数の求め方

いずれかの方法で求めたp分位を r とする。 r が整数になった場合は,r をそのまま使ってp分位数を求めればよい。 \[ Q=x_r \tag{4} \]

矩形近似による方法

r が整数にならなかった場合は,近似によってp分位数を求める。 近似の方法は大別して矩形近似台形近似がある。 矩形近似は,r を最も近い整数に置き換えることによってp分位数を求めるものである。 \begin{align} & Q=x_{\lceil r-0.5 \rceil} \tag{5}\\ & Q=x_{\lfloor r+0.5 \rfloor} \tag{6}\\ & Q=(x_{\lceil r-0.5 \rceil}+x_{\lfloor r+0.5 \rfloor})/2 \tag{7}\\ & Q=x_{\lfloor r \rceil} \tag{8} \end{align} (5) は五捨五超入によって,(6) は四捨五入によって,(7) はそれらの平均値によってp分位数を求めている。 (8) は銀行型丸めによってp分位数を求めている。 r が半整数のとき,(7) の方法とこの後の (9) の方法は同じ結果になる。 中央値を求めるときは (7) または (9) を用いるのが一般的である。

台形近似による方法

台形近似は,r を切り捨てた整数と r を切り上げた整数の間を比例配分することによってp分位数を求めるものである。 計算式はいくつかあるが,どれも同じ結果になるので次の形のものを使うことにする。 \[ Q=x_{\lfloor r \rfloor}+(r-\lfloor r \rfloor) (x_{\lceil r \rceil}-x_{\lfloor r \rfloor}) \tag{9} \] r が半整数のとき,(7) の方法と (9) の方法は同じ結果になる。 中央値を求めるときは (7) または (9) を用いるのが一般的である。

分位数の選択

大きさが N である標本 {x} の中位(中央値の分位)は r = (N+1)/2 と表せる。 標本 {x} の中央値は,N が奇数のとき \[ \mathit{Me}=x_r \] N が偶数のとき \[ \mathit{Me}=\frac{x_{r-0.5}+x_{r+0.5}}{2} \] とするのが普通である。 これに適合するようなp分位数は, 分位を (1) (2) (3) 等で,分位数を (7) (9) のどちらかで求めたものに限られる。 このページで示したものの中では (1)→(7),(2)→(7),(3)→(7),(1)→(9),(2)→(9),(3)→(9) が受け入れやすい定義といえる。 実際,(2)→(9),(3)→(9) の定義はよく用いられている。

次のページへ

1 2 3 4 5 6 Next

5. ヒンジの求め方

1. 分位の求め方
2. 矩形近似
3. 台形近似
4. 分位数の求め方
5. ヒンジの求め方
6. 各ソフトウェアの既定値

ヒンジとは

ヒンジとは四分位数と類似した量で, 標本全体を中央値を境界として二分し,分けた各々の組の中央値を求めたものである。 ヒンジが中央値の計算を繰り返したものであるのに対して, 分位数の仲間としての四分位数は一挙に四分割したものという違いがある。 ヒンジと四分位数は厳密には異なるが,ヒンジは四分位数とよばれることもある。 反対に,まれではあるが四分位数がヒンジとよばれることもある。

Tukey の方法(Inclusive hinge)

標本 {xi} は大きさが N で,昇順に並べられているとする。 \[ x_1 \le x_2 \le \dots \le x_N \] N が偶数のとき,N = 2m とおく。 標本 {xi} を半分に分け,小さいほうを下組,大きいほうを上組とする。 \begin{align} & \{x_1,\; x_2,\; \dots,\; x_m\}, && \{x_{m+1},\; x_{m+2},\; \dots,\; x_{2m}\} \end{align} N が奇数のとき,N = 2m−1 とおく。 標本 {xi} を半分に分け,小さいほうを下組,大きいほうを上組とする。 \begin{align} & \{x_1,\; x_2,\; \dots,\; x_m\}, && \{x_m,\; x_{m+1},\; \dots,\; x_{2m-1}\} \end{align} N が奇数のとき中央値 xm は下組と上組の両方に属している。 そして,下組の中央値を下側ヒンジ QL,上組の中央値を上側ヒンジ QU とする。 Tukey の方法でヒンジを求めることは, 次の式で分位 r を求めることと同等である。 Tukey の方法に相当する分位 r は, N が偶数のとき \[ r=1/2+pN \] N が奇数のとき \[ r=1+p(N-1) \] である。 ただし p の値は p = 1/4 または p = 1/2 または p = 3/4 とする。

Moore & McCabe の方法(Exclusive hinge)

この方法のヒンジは高等学校の四分位数と同じものである。 Moore & McCabe の方法(以下 M&M の方法)では中央値は下組にも上組にもどちらにも属さない。 標本 {xi} は大きさが N で,昇順に並べられているとする。 N が偶数のとき,N = 2m とおく。 標本 {xi} を半分に分け,小さいほうを下組,大きいほうを上組とする。 \begin{align} & \{x_1,\; x_2,\; \dots,\; x_m\}, && \{x_{m+1},\; x_{m+2},\; \dots,\; x_{2m}\} \end{align} N が奇数のとき,N = 2m−1 とおく。 標本 {xi} を半分に分け,小さいほうを下組,大きいほうを上組とする。 \begin{align} & \{x_1,\; x_2,\; \dots,\; x_{m-1}\}, && \{x_{m+1},\; x_{m+2},\; \dots,\; x_{2m-1}\} \end{align} N が奇数のとき中央値 xm は下組にも上組にもどちらにも属さない。 そして,下組の中央値を下側ヒンジ QL,上組の中央値を上側ヒンジ QU とする。 M&M の方法でヒンジを求めることは, 次の式で分位 r を求めることと同等である。 M&M の方法に相当する分位 r は, N が偶数のとき \[ r=1/2+pN \] N が奇数のとき \[ r=p(N+1) \] である。 ただし p の値は p = 1/4 または p = 1/2 または p = 3/4 とする。

外部リンク

次のページへ

1 2 3 4 5 6 Next

6. 各ソフトウェアの既定値

1. 分位の求め方
2. 矩形近似
3. 台形近似
4. 分位数の求め方
5. ヒンジの求め方
6. 各ソフトウェアの既定値

各ソフトウェアにおける分位数の既定値

R と Octave では9種,Maple では8種,SAS では5種の分位数が定義されている。 Mathematica では Quantile の既定値は R-1 だが,Quartiles は R-5 になっている。 各ソフトウェアで既定値の分位数を求めると,R-6 または R-7 となるものが多い。

Method分位 r分位数 Q既定値
R-1S-3\(1/2+pN\)\(x_{\lceil r-1/2 \rceil}\)Mathematica
R-2S-5\(1/2+pN\)\((x_{\lceil r-1/2 \rceil}+x_{\lfloor r+1/2 \rfloor})/2\)SAS
R-3S-2\(pN\)\(x_{\lfloor r \rceil}\)
M-1\(1/2+pN\)\(x_{\lfloor r+1/2 \rfloor}\)
M-2\(pN\)\(x_{\lfloor r+1/2 \rfloor}\)
R-4M-3S-1\(pN\)台形近似
R-5M-4\(1/2+pN\)台形近似GNU Octave
R-6M-5S-4\(p(N+1)\)台形近似Minitab, SPSS, JMP, MATLAB
R-7M-6\(1+p(N-1)\)台形近似S, R, Maxima, Excel
R-8M-7\(1/3+p(N+1/3)\)台形近似Maple
R-9M-8\(3/8+p(N+1/4)\)台形近似

分位数欄が 台形近似 となっているものは次の式による。線形補間とよばれることもある。 \[ Q=x_{\lfloor r \rfloor}+(r-\lfloor r \rfloor) (x_{\lceil r \rceil}-x_{\lfloor r \rfloor}) \]

整数でない分位 r に対して分位数 Q を求める際は近似が必要になる。 R-1,R-2,R-3,M-1,M-2 は矩形近似で,r に最も近い整数の順位によって近似を行う。 R-4,R-5,R-6,R-7,R-8,R-9 は台形近似で,r をはさむような隣接整数の順位によって近似を行う。

通常の中央値と一致するMethod

通常の中央値は,N が奇数のとき Q = xr,N が偶数のとき Q = (xr−0.5+xr+0.5)/2 で求められる。 上にあげたMethodのうち,1/2分位数が通常の中央値と一致するものは R-2,R-5,R-6,R-7,R-8,R-9 であり, 通常の中央値と一致しないものは R-1,R-3,M-1,M-2,R-4 である。 よって受け入れやすい Method は,矩形近似の R-2,台形近似の R-5,R-6,R-7,R-8,R-9 となる。

統計ソフトウェアにおけるヒンジ

一部のソフトウェアで五数要約を求めると,ヒンジになることがある。 その場合のヒンジはTukey のヒンジであり, 偶数標本では R-5 の分位数,奇数標本では R-7 の分位数に等しい。 一方で,高等学校で教えられている四分位数はM&M のヒンジであり, 偶数標本では R-5 の分位数,奇数標本では R-6 の分位数に等しい。 M&M のヒンジは,これらのソフトウェアで求めることはできない。

ヒンジ標本数分位 r分位数 Q
R-5 Tukey偶数\(1/2+pN\)\((x_{\lceil r-1/2 \rceil}+x_{\lfloor r+1/2 \rfloor})/2\) または台形近似
R-7 Tukey奇数\(1+p(N-1)\)\((x_{\lceil r-1/2 \rceil}+x_{\lfloor r+1/2 \rfloor})/2\) または台形近似
R-5 M&M偶数\(1/2+pN\)\((x_{\lceil r-1/2 \rceil}+x_{\lfloor r+1/2 \rfloor})/2\) または台形近似
R-6 M&M奇数\(p(N+1)\)\((x_{\lceil r-1/2 \rceil}+x_{\lfloor r+1/2 \rfloor})/2\) または台形近似

最後のページです

1 2 3 4 5 6

2012.12.12 作成 / 2015.12.28 更新

Home

Home › 分位点の求め方