記述統計度数分布尺度水準代表値散布度

1. 算術平均・幾何平均・調和平均

1. 算術平均・幾何平均・調和平均
2. ミッドレンジ
3. 刈り込み平均
4. 移動平均

算術平均

標本 x1,x2,⋯,xn に対して, これらの和を n で割った値のことを算術平均(Arithmetic mean)という。 単に平均といえば算術平均を指す。 算術平均を AM と表すと \[ \text{AM} = \frac{1}{n} \sum_{i=1}^n x_i = \frac{x_1+x_2+\dots+x_n}{n} \]

幾何平均

負でない標本 x1,x2,⋯,xn に対して, これらの積の n 乗根のことを幾何平均(Geometric mean)という。 幾何平均を GM と表すと \[ \text{GM} = \left( \prod_{i=1}^n x_i \right)^{\frac{1}{n}} = \sqrt[n]{x_1 \times x_2 \times \dots \times x_n} \]

調和平均

正の標本 x1,x2,⋯,xn に対して, これらの逆数の算術平均の逆数のことを調和平均(Harmonic mean)という。 調和平均を HM と表すと \[ \text{HM} = \left( \sum_{i=1}^n {x_i}^{-1} \right)^{-1} = \frac{n}{\frac{1}{x_1}+\frac{1}{x_2}+\dots+\frac{1}{x_n}} \]

各平均値の比較

3つの平均値は常に次の大小が保たれる。 \[ \text{AM} \ge \text{GM} \ge \text{HM} \] なお,統計で用いられる平均値はほぼ算術平均に限られる。

次のページへ

1 2 3 4 Next

2. ミッドレンジ

1. 算術平均・幾何平均・調和平均
2. ミッドレンジ
3. 刈り込み平均
4. 移動平均

ミッドレンジ

データの最大値と最小値の中点の値のことをミッドレンジ(Midrange)という。 \[ \text{Midrange} = \frac{\text{Min}+\text{Max}}{2} \] 順位を用いるという点で中央値に似たところもあるが,中央値とは性質が異なる。 データに外れ値がある場合,中央値は外れ値の影響を受けないが,ミッドレンジは外れ値の影響を強く受ける。 特別な理由がなけれが,ミッドレンジの利用は避けたほうがよい。

ミッドヒンジ

データの第1四分位数 Q1 と第3四分位数 Q3 の中点の値のことを ミッドヒンジ(Midhinge)という。 \[ \text{Midhinge} = \frac{Q_1+Q_3}{2} \] データに外れ値があっても,ミッドヒンジや中央値は外れ値の影響をほとんど受けない。 ミッドヒンジと中央値は似た値になることが多いが, 分布が歪んでいる場合は,ミッドヒンジと中央値は異なる。

3項平均

データの第1四分位数 Q1,中央値 Q2,第3四分位数 Q3 の次のような加重平均のことを, 3項平均(Tukey's trimean)という。 \[ \text{Trimean} = \frac{Q_1+2Q_2+Q_3}{4} \] 一般には中央値とミッドヒンジは異なるが,3項平均はこれらの中間の値になる。 \[ \text{Trimean} = \frac{1}{2} \left(Q_2+\frac{Q_1+Q_3}{2}\right) = \frac{\text{Median}+\text{Midhinge}}{2} \]

次のデータに対して,ミッドレンジ,ミッドヒンジ,3項平均を求める。

 4  6  6  6  6   6  7  7  7  7   7  8  9  9 10  10 11 12 13 18

大まかな分布は図のようになっている。

4 – 6☆☆☆☆☆☆
7 – 9☆☆☆☆☆☆☆☆
10 – 12☆☆☆☆
13 – 15
16 – 18

最小値,第1四分位数,中央値,第3四分位数,最大値は \[ \text{Min}=4,\qquad Q_1=6,\qquad Q_2=7,\qquad Q_3=10,\qquad \text{Max}=18 \] なので,中央値,3項平均,ミッドヒンジ,ミッドレンジは順に \[ Q_2=7,\qquad \text{Trimean}=7.5,\qquad \text{Midhinge}=8,\qquad \text{Midrange}=11 \] となる。

次のページへ

1 2 3 4 Next

3. 刈り込み平均

1. 算術平均・幾何平均・調和平均
2. ミッドレンジ
3. 刈り込み平均
4. 移動平均

刈り込み平均

大きさの順に並べたデータの両端から決められた割合を捨て,残った部分について求めた算術平均のことを刈り込み平均または調整平均(Truncated mean; Trimmed mean)という。 小さいほうから順に並べられた20個のデータ x1,x2,…,x20 に対して, 両端から5%ずつ切り捨てる場合を考える。 20個のうちの5%は1個だから,左端から x1 を,右端から x20 を捨てればよい。 5%調整平均は \[ \frac{x_2+x_3+\dots+x_{18}+x_{19}}{18} \] となる。

中央平均

両端から25%ずつを切り捨てて求めた算術平均のことを特に中央平均(Midmean; Interquartile mean)という。 中央平均は,第1四分位数 Q1 から第3四分位数 Q3 までの平均に等しく, よって25%調整平均に等しい。 小さいほうから順に並べられた20個のデータ x1,x2,…,x20 に対して, 中央平均を求めると \[ \text{IQM} = \frac{x_6+x_7+\dots+x_{14}+x_{15}}{10} \] となる。

次のページへ

1 2 3 4 Next

4. 移動平均

1. 算術平均・幾何平均・調和平均
2. ミッドレンジ
3. 刈り込み平均
4. 移動平均

単純移動平均

時系列データでは,季節変化など周期的な変動がみられることが多い。 移動平均を用いると,周期的な変動が相殺され長期的な変化が見えやすくなる。 n 期間の平均を最終期の値としたものを単純移動平均(SMA; Simple moving average)という。 第 k 期の n 項移動平均は次のように定義される。 \[ \text{SMA} = \frac{x_{k-n+1}+\dots+x_k}{n} \] たとえば第12期の3項移動平均は \[ \text{SMA} = \frac{x_{10}+x_{11}+x_{12}}{3} \] 第12期の12項移動平均は \[ \text{SMA} = \frac{x_{1}+\dots+x_{11}+x_{12}}{12} \] となる。

中心化移動平均(奇数項)

n 期間の平均を期間の中心の値としたものを中心化移動平均(CMA; Centered moving average)という。 n が奇数のとき n=2m+1 とすると,第 k 期の n 項移動平均は次のように定義される。 \[ \text{CMA} = \frac{x_{k-m}+\dots+x_k+\dots+x_{k+m}}{2m+1} \] たとえば第7期の3項移動平均は \[ \text{CMA} = \frac{x_6+x_7+x_8}{3} \] となる。

中心化移動平均(偶数項)

n が偶数のとき n=2m とする。 偶数項の場合は両端の期の重みを半分にした加重平均を用いて, 第 k 期の n 項移動平均は次のように定義される。 \[ \text{CMA} = \frac{0.5 x_{k-m}+x_{k-m+1}+\dots+x_k+\dots+x_{k+m-1}+0.5 x_{k+m}}{2m} \] たとえば第7期の12項移動平均は \begin{align} \text{CMA} &= \frac{0.5x_1+x_2+\dots+x_7+\dots+x_{12}+0.5 x_{13}}{12} \\ &= \frac{x_1+2 x_2+\dots+2 x_7+\dots+2 x_{12}+x_{13}}{24} \end{align} となる。

最後のページです

1 2 3 4 Home

2016.8.12 作成 / 2016.8.18 更新

Home › 代表値