四分位数
四分位数:
[1] データを値の大きさの順に並べ,中央値を求める。
[2] [1]の中央値を境界としてデータの個数を2等分し,値が中央値以下の下組と,値が中央値以上の上組に分ける。ただし,データの大きさが奇数のとき,[1]の中央値は,下組にも上組にも含めないものとする。
[3] 下組の中央値,上組の中央値を求める。
[1]で求めた中央値がQ2,[3]で求めた下組の中央値がQ1,上組の中央値がQ3である。第2四分位数Q2は,データの中央値に他ならない。
注意:
四分位数の定義はいくつかある。以下,本書では上の定義を用いる。
文部科学省検定済教科書 104 数研 数1 328 ISBN978-4-410-80203-4
[1]の中央値を境界としてデータの個数を2等分し,値が中央値以下の下組と,値が中央値以上の上組に分ける。ただし,データの大きさが奇数のとき,[1]の中央値は,下組にも上組にも含めないものとする。
データの中に中央値に等しい値が複数含まれる場合に,下組や上組の大きさが意図したものにならない。 上記センター試験の問題に正しく解答することができない。
変量
変量:
人の身長,体重や運動の記録などのように,ある特性を表す数量を 変量 という。 数学では,ある変量の測定値や観測値の集まりを データ という。
代表値:
データ全体の特徴を適当な1つの数値で表せると便利である。そのような値をデータの 代表値 という。 ここでは,データの代表値として,平均値,最頻値,中央値について調べよう。
大きさ:
データにおける測定値や観測値の個数を,そのデータの 大きさ という。
文部科学省検定済教科書 104 数研 数1 328 ISBN978-4-410-80203-4
整数の除法
整数の割り算:
整数aと正の整数bについて a=bq+r, 0≤r<b となる整数q,rは1通りに定まる。
文部科学省検定済教科書 104 数研 数A 328 ISBN978-4-410-80207-2
試行の独立
確率変数X,Y,Zが互いに独立であるとき E(XYZ)=E(X)E(Y)E(Z) V(X+Y+Z)=V(X)+V(Y)+V(Z)
分散は2次の積率なので,2項の V(X+Y)=V(X)+V(Y) や3項の V(X+Y+Z)=V(X)+V(Y)+V(Z) は,常に2次の E(XY)=E(X)E(Y) から導かれる。 項数(X+Y+Zの3項)と次数(XYZの3次)を関連付けてはいけない。
教科書の内容は以下のとおり。
試行の独立:
いくつかの試行において,どの試行の結果も他の試行の結果に影響を与えないとき,これらの試行は 独立 であるという。
独立な試行の確率:
2つの試行SとTが独立であるとき,Sで事象Aが起こり,かつTで事象Bが起こる確率pは,P(A)とP(B)の積に等しい。すなわち p=P(A)×P(B)
独立な3つの試行の確率:
独立な3つ以上の試行についても,上と同様なことが成り立つ。
反復試行:
同じ条件のもとでの試行の繰り返しを 反復試行 という。1つの試行を何回か繰り返すとき,これらの試行は独立である。
文部科学省検定済教科書 104 数研 数A 328 ISBN978-4-410-80207-2
乗法定理:
2つの事象A,Bがともに起こる確率P(A∩B)は P(A∩B)=P(A)PA(B)
3つの事象の乗法定理:
3つ以上の事象の場合についても,前ページで述べた乗法定理と同様なことが成り立つ。
文部科学省検定済教科書 104 数研 数A 328 ISBN978-4-410-80207-2
事象の独立
確率変数の独立:
2つの確率変数X,Yを考える。Xのとる値aとYのとる値bに対して, P(X=a,Y=b)=P(X=a)P(Y=b) が,a,bのとり方に関係なく常に成り立つとき,確率変数X,Yは互いに 独立 であるという。
試行の独立と確率変数の独立:
とくに,2つの試行SとTが独立のとき,Sの結果によって定まる確率変数XとTの結果によって定まる確率変数Yは独立である。
確率変数の積の期待値:
2つの確率変数X,Yが互いに独立であるとき E(XY)=E(X)E(Y)
確率変数の和の分散:
2つの確率変数X,Yが互いに独立であるとき V(X+Y)=V(X)+V(Y)
3つの確率変数の独立:
3つの確率変数X,Y,Zについて,Xのとる値a,Yのとる値b,Zのとる値cに対して, P(X=a,Y=b,Z=c)=P(X=a)P(Y=b)P(Z=c) が,a,b,cのとり方に関係なく常に成り立つとき,確率変数X,Y,Zは互いに 独立 であるという。
3つの確率変数の和の分散:
確率変数X,Y,Zが互いに独立であるとき E(XYZ)=E(X)E(Y)E(Z) V(X+Y+Z)=V(X)+V(Y)+V(Z)
文部科学省検定済教科書 104 数研 数B 326 ISBN978-4-410-80217-1
曖昧な箇所があり,
よって,これらの一方が成り立つとき,他方も成り立つ。このとき,事象AとBは互いに独立であるという。と書かれている。 しかし,
一方と
他方の指しているもの,
このときの指しているものが不明であるため,推測をもとに以下のように解釈しておく。
BはAに独立:
1つの試行における2つの事象A,Bについて PA(B)=P(B) が成り立つとき,事象Bは事象Aに 独立 であるという。 (一部編集済み)
互いに独立:
1つの試行における2つの事象A,Bについて PA(B)=P(B),PB(A)=P(A) がともに成り立つとき,事象AとBは互いに 独立 であるという。 (推測をもとに一部編集済み)
事象の独立:
2つの事象A,Bが互いに独立 ⇔ P(A∩B)=P(A)P(B)
文部科学省検定済教科書 104 数研 数B 326 ISBN978-4-410-80217-1
確率変数
試行の結果によってその値が定まり,各値に対応して確率が定まるような変数を確率変数という。
この定義は連続型確率変数の場合を含んでいる。各値に対応して確率が定まるような
の部分は,連続型確率変数の定義になじまない。
教科書の内容は以下のとおり。
確率変数:
試行の結果によってその値が定まり,各値に対応して確率が定まるような変数を 確率変数 という。
連続型確率変数:
連続した値をとる確率変数Xを 連続型確率変数 という。
文部科学省検定済教科書 104 数研 数B 326 ISBN978-4-410-80217-1
母集団分布
母集団:
調査の対象全体を 母集団 という。 母集団に属する個々の対象を 個体 といい, 個体の総数を 母集団の大きさ という。
標本:
調査のため母集団から抜き出された個体の集合を 標本 といい, 母集団から標本を抜き出すことを 抽出 という。 標本に属する個体の総数を 標本の大きさ という。
変量:
統計的な調査の対象には,身長,時間,不良品の個数などのように,特定の性質がある。これを特性といい,ある特性を表す数量を 変量 という。
母集団分布:
母集団から1個の個体を無作為に抽出して,変量xの値をXとするとき,Xは確率変数である。(中略) このXの確率分布を 母集団分布 という。 また,確率変数Xの期待値,標準偏差を,それぞれ 母平均,母標準偏差 といい,m,σで表す。
母集団分布と変量の分布:
この母平均m,母標準偏差σは,母集団における変量xの平均値,標準偏差に,それぞれ一致する。*
*変量xの平均値,標準偏差については,数学Ⅰの「データの分析」で学んだ。
標本平均:
母集団から大きさ\(n\)の無作為標本を抽出し,それらの変量xの値を\(X_1\),\(X_2\),…,\(X_n\)とするとき, \[ \bar{X}=\frac{X_1+X_2+\cdots +X_n}{n} \] を 標本平均 という。 \(n\)を固定すると,標本平均\(\bar{X}\)は1つの確率変数になる。
母比率と標本比率:
母集団の中である特性Aをもつものの割合を,その特性Aの 母比率 という。 また,抽出された標本の中で特性Aをもつものの割合を 標本比率 という。
文部科学省検定済教科書 104 数研 数B 326 ISBN978-4-410-80217-1
数研教科書の考える「データの構造」が複雑すぎる。そして「データの構造」を伝えきれていない。 母集団や標本は個体の集まりであり,個体は(1つの)特性をもち,特性は変量で表される。
教科書には書かれていないが,1つの個体は1つの特性をもつことが想定されているものとみられる。 「個体の値」,「特性の値」,「変量の値」にほとんど違いはなく,「変量」と「データ」にもほとんど違いはない。うまく使い分けるのは難しい。
母集団分布の定義において,変量x
の部分が理解を妨げている:
母集団から1個の個体を無作為に抽出して,変量xの値をXとするとき,Xは確率変数である。(中略) このXの確率分布を母集団分布という。
変量xの値をX
と定めると,変量xの値は x1,x2,…,xN のいずれか,確率変数Xの値も x1,x2,…,xN のいずれかになるから,変量xと確率変数Xの違いが分からなくなる。
標本平均の定義において,変量x
の部分に誤りがある:
母集団から大きさnの無作為標本を抽出し,それらの変量xの値を X1,X2,…,Xn とする
上のそれらの変量x
はn次元データでなければならない。
「母集団から大きさnの無作為標本を抽出し,それらの変量 xi1,xi2,…,xin の値をそれぞれ X1,X2,…,Xn とする」が正しい。
教科書の内容は以下のとおり。
大数の法則
導入は確率収束で表現される「大数の弱法則」,結論は概収束で表現される「大数の強法則」であり,導入と結論が異なる。
教科書の内容は以下のとおり。
導入:
標本の大きさ\(n\)を限りなく大きくしていくと,標本平均\(\bar{X}\)の分布を近似する正規分布の標準偏差\(\frac{\sigma}{\sqrt{n}}\)は,限りなく\(0\)に近づき,\(\bar{X}\)の分布は母平均\(m\)の近くに限りなく集中する。 すなわち,\(\bar{X}\)が\(m\)に近い値をとる確率が\(1\)に近づく。
結論:
母平均\(m\)の母集団から大きさ\(n\)の無作為標本を抽出するとき,\(n\)が大きくなるに従って,その標本平均\(\bar{X}\)はほとんど確実に母平均\(m\)に近づく。
文部科学省検定済教科書 104 数研 数B 326 ISBN978-4-410-80217-1
2020.1.25 作成 / 2021.1.6 更新
検定済教科書 | 四分位数 | 整数の除法 | 試行の独立 | 事象の独立 | 確率変数 | 母集団分布 | 大数の法則
Home › 検定済教科書 › 数研出版