問題

あるデータに対して、回帰分析を行った結果、決定係数$R^2$は$0.9$であった。このことからわかることとして、次のうち正しいものはどれか。

決定係数$R^2$が$0.9$であることから、回帰式は実際のデータにはあまりあてはまっていない。
決定係数$R^2$が$0.9$であることから、回帰式は実際のデータによくあてはまっている。
決定係数$R^2$が$0.9$であることから、回帰分析をするにあたって、データ数が不足していると言える。
決定係数$R^2$が$0.9$であることから、回帰分析をするにあたって、データ数は十分であると言える。

選択肢

(a)

(b)

(c)

(d)

  • a
  • b
  • c
  • d

決定係数の性質

答え

(b)

解説

決定係数$R^2$は次の式で表される指標のことをいいます。

$$ R^2 = \frac{ \sum_{i=1}^{n}(\hat{y_i}-\bar{y})^2 }{ \sum_{i=1}^{n}(y_i-\bar{y})^2 } $$

これは、回帰変動(分子, 推定値$\hat{y_i}$とデータ全体の平均値$\bar{y}$の差)が、全変動(分母, 実データ$y_i$とデータ全体の平均値$\bar{y}$の差)に対してどれだけ大きいかを示しています。また、0から1までの値をとります。

これを言い換えると「説明変数が目的変数をどれくらい説明しているかを表している」ということになります。

したがって、決定係数$R^2$が$0.9$であった場合、決定係数としては高い値なので、「回帰式が実際のデータによく当てはまっている」という結論が得られます。

テスト一覧

スキルテストが提供しているテストの一覧です。ぜひ学習や実力チェックに役立ててください。