統計2級に必要なレベルが分かるクイズ7つ
分散の性質
次の式のうち、分散の性質として、適切なものの組み合わせはどれか。
ただし、$X$, $Y$を互いに独立な確率変数とし、$C$, $k$を任意の定数とする。
1 | $ V(C) = C $ |
2 | $ V(C) = 0 $ |
3 | $ V(X+C) = V(X) $ |
4 | $ V(kX) = kV(X) $ |
5 | $ V(kX) = k^2V(X) $ |
6 | $ V(kX) = \frac{1}{k}V(X) $ |
7 | $ V(X+Y) = V(X)+V(Y) $ |
8 | $ V(X+Y) = V(X)V(Y) $ |
9 | $ V(X+Y) = \frac{V(X)}{V(Y)} $ |
(a)
2, 3, 4, 8が正しい
(b)
9のみ正しい
(c)
1, 3, 6, 9が正しい
(d)
2, 3, 5, 7が正しい
答えを表示する
確率変数の分散が持つ重要な性質としては、次の4つがあります。
【性質1】
$$ V(C) = 0 $$
【性質2】
$$ V(X+C) = V(X) $$
【性質3】
$$ V(kX) = k^2V(X) $$
【性質4】
$$ V(X+Y) = V(X)+V(Y) $$
ただし、性質4は確率変数$X$, $Y$は互いに独立である必要があります。
統計学を勉強する上で、これらは必須知識なので覚えておきましょう。
独立事象と排反事象
事象AとBが独立であるときと、事象AとBが排反であるときの$P(A \cap B)$の性質として、正しい組み合わせは次のうちどれか。
【事象AとBが独立であるとき】
ア | $$P(A \cap B) = P(A) + P(B)$$ |
イ | $$P(A \cap B) = P(A)P(B)$$ |
ウ | $$P(A \cap B) = \frac{P(A)}{P(B)}$$ |
【事象AとBが排反であるとき】
ア | $$P(A \cap B) = 0$$ |
イ | $$P(A \cap B) = P(A \cup B)$$ |
ウ | $$P(A \cap B) = P(A)+P(B)$$ |
(a)
独立: イ、 排反: ア
(b)
独立: ウ、 排反: どれでもない
(c)
独立: ア、 排反: ア
(d)
独立: ア、 排反: ウ
正規分布の標準化
互いに独立で、それぞれが$平均\mu$, $分散\sigma^2$の正規分布に従う確率変数$X_1, X_2, …, X_n$がある。このとき、標本平均$\bar{X} = \frac{1}{n}\sum_{i=1}^{n}X_i$を、標準正規分布$N(0, 1)$に従うにように正規化した確率変数$u$は、次のうちどれか。
(a)
$$u = \frac{(\bar{X}-2\mu)}{\sqrt\frac{\sigma^2}{n}}$$
(b)
$$u = \frac{(\bar{X}-\mu)}{\sqrt\frac{\sigma^2}{n}}$$
(c)
$$u = \frac{(\bar{X}-\mu)}{\frac{\sigma^2}{n}}$$
(d)
$$u = \frac{(\bar{X}-\mu)}{n\sigma}$$
答えを表示する
$\bar{X}$は$N(\mu, \frac{\sigma^2}{n})$に従うので、これを標準正規分布に従うように標準化すると、$u = \frac{(\bar{X}-\mu)}{\sqrt\frac{\sigma^2}{n}}$となります。
この説明からもわかるように、$u$の式を使って標本平均から母平均$\mu$の区間推定を行う際には、母分散$\sigma^2$をすでに知っている必要があります。(とはいっても、母平均$\mu$を知らないのに母平均$\sigma^2$だけは知っているというケースは、なかなかありません。)
ラスパイレス指数、パーシェ指数、フィッシャー指数
基準年と比較年における、みかんとりんごの購入価格と購入数量を次の表に示す。
基準年 | 比較年 | |||
購入価格 | 購入数量 | 購入価格 | 購入数量 | |
みかん | 127 | 10 | 98 | 11 |
りんご | 300 | 14 | 230 | 20 |
ここで、三つの指数 $X_1, X_2, X_3$を、次のように算出した。
指数$X_1$:
$$ \frac{98 \times 11 + 230 \times 20}{127 \times 11 + 300 \times 20} \times 100 = 76.76 $$
指数$X_2$:
$$ \frac{98 \times 10 + 230 \times 14}{127 \times 10 + 300 \times 14} \times 100 = 76.78 $$
指数$X_3$:
$$ \sqrt{X_1 \times X_2} = 76.77 $$
これらの式と、ラスパイレス指数、パーシェ指数、フィッシャー指数の組み合わせとして、正しいものはどれか。
回答 | 指数$X_1$ | 指数$X_2$ | 指数$X_3$ |
A | ラスパイレス指数 | フィッシャー指数 | パーシェ指数 |
B | ラスパイレス指数 | パーシェ指数 | フィッシャー指数 |
C | パーシェ指数 | ラスパイレス指数 | フィッシャー指数 |
D | フィッシャー指数 | ラスパイレス指数 | パーシェ指数 |
(a)
A
(b)
B
(c)
C
(d)
D
答えを表示する
指数$X_1$と指数$X_2$は、分母に基準年を、分子に比較年を使って計算していることから、まずはこれらがラスパイレス指数かパーシェ指数のいずれかであることがわかります。また指数$X_3$は、二つの指数の幾何平均をとっていることから、フィッシャー指数であることがわかります。
ラスパイレス指数では、基準年の購入数量を使って計算を行うことから、指数$X_2$であることがわかります。
パーシェ指数では、比較年の購入数量を使って計算を行うことから、指数$X_1$であることがわかります。
ローレンツ曲線とジニ係数
ローレンツ曲線を使って格差があるかどうかを分析することにした。格差が全くないといえるのは、ローレンツ曲線の形状とジニ係数の値がどのようになったときか。
ローレンツ曲線 | ジニ係数 | |
ア | 完全平等線に沿った直線になる | 0になる |
イ | 完全平等線に沿った直線になる | 1になる |
ウ | x軸またはy軸に沿った直線になる | 0になる |
エ | x軸またはy軸に沿った直線になる | 1になる |
(a)
ア
(b)
イ
(c)
ウ
(d)
エ
答えを表示する
正解は(a)です。格差が全くない場合には、ローレンツ曲線は完全平等線に沿った直線になります。また、ジニ係数はローレンツ曲線と完全平等線で囲まれた面積の2倍で求められるので、0になります。
決定係数の性質
あるデータに対して、回帰分析を行った結果、決定係数$R^2$は$0.9$であった。このことからわかることとして、次のうち正しいものはどれか。
ア | 決定係数$R^2$が$0.9$であることから、回帰式は実際のデータにはあまりあてはまっていない。 |
イ | 決定係数$R^2$が$0.9$であることから、回帰式は実際のデータによくあてはまっている。 |
ウ | 決定係数$R^2$が$0.9$であることから、回帰分析をするにあたって、データ数が不足していると言える。 |
エ | 決定係数$R^2$が$0.9$であることから、回帰分析をするにあたって、データ数は十分であると言える。 |
(a)
ア
(b)
イ
(c)
ウ
(d)
エ
答えを表示する
決定係数$R^2$は次の式で表される指標のことをいいます。
$$ R^2 = \frac{ \sum_{i=1}^{n}(\hat{y_i}-\bar{y})^2 }{ \sum_{i=1}^{n}(y_i-\bar{y})^2 } $$
これは、回帰変動(分子, 推定値$\hat{y_i}$とデータ全体の平均値$\bar{y}$の差)が、全変動(分母, 実データ$y_i$とデータ全体の平均値$\bar{y}$の差)に対してどれだけ大きいかを示しています。また、0から1までの値をとります。
これを言い換えると「説明変数が目的変数をどれくらい説明しているかを表している」ということになります。
したがって、決定係数$R^2$が$0.9$であった場合、決定係数としては高い値なので、「回帰式が実際のデータによく当てはまっている」という結論が得られます。
決定係数と自由度調整済み決定係数
重回帰分析の結果が実際のデータに対してどれだけよく当てはまっているかを確かめるために、決定係数$R^2$を求める。
目的変数$y$の総平方和(全変動の平方和)を$S_y$, 残差平方和(残差変動の平方和)を$S_e$とすると、決定係数は次のようになる。
$$ R^2 = 1 – \frac{S_e}{S_y} $$
さらに、自由度調整済み決定係数${R^*}^2$を求めることを考える。
データ数を$n$, 説明変数の個数を$k$とすると、自由度調整済み決定係数は次のようになる。
$$ {R^*}^2 = 1- \frac{ S_{e}/(ア) }{ S_{y}/(イ) } $$
ここで、(ア),(イ)にあてはまるものとして、正しい組み合わせは次のうちどれか。
(ア) | (イ) | |
A | $(n-k-1)$ | $(n-k-1)$ |
B | $(n-k-1)$ | $(n-1)$ |
C | $(n-1)$ | $(n-k-1)$ |
D | $(n-1)$ | $(n-1)$ |
(a)
A
(b)
B
(c)
C
(d)
D
答えを表示する
決定係数は、次のようにして求められます。
$$ R^2 = 1 – \frac{S_e}{S_y} $$
また、自由度調整済み決定係数は、次のようにして求められます。
$$ {R^*}^2 = 1- \frac{ \frac{S_e}{n-k-1} }{ \frac{S_y}{n-1} } $$
さらに統計の知識を深めたい方へ
実際にいくつかのクイズを解いてみて、いかがでしたでしょうか。
5つ以上解けた人はかなり統計の知識があると言って良いでしょう。もし解けなかった人は、学習や演習を通してさらに知識を深めていく余地があると言えます。
体系的に統計の知識を習得するには統計検定がオススメです。文系の方や全く数学を学んだ経験がない方は、3級や4級から進めるのが良いでしょう。理系の方や業務や仕事で統計を使ったことがある人は、ぜひ2級から学習するのを推奨します。
本サイトのサービス「スキルテスト」では、ビジネススキル・プログラミングなどをクイズを通して効果的に学習できるサービスを提供しています。統計に関するクイズも用意しているので、ぜひ使ってみてください。