FAQ データサイエンス研修(アドバンスト)

2.統計学の基礎/機械学習の基礎

回答

今回は動画内で説明している通り、noiz生成は用いずにuniformで取得しています。ご質問されているデータの生成範囲がわからないので、なんとも言えませんが、動画内ではnoizを使用しているパターンもいくつか紹介をしています。
その際に、乱数生成なのでseed値の有無や、内容によってデータの値は毎回変わりますのでその点ご留意ください。

回答

大変鋭い質問ですね。分析の各評価指標の見方は重要なポイントです。
今回の場合には、それぞれで観点が異なります。
まず、回帰係数の有意確率については「回帰係数が本当は0であった」という状況を表す確率です。
そのため、有意確率(誤り確率)が基準(0.05)よりも大きな場合には、本当は0であったという状況を想定することとし、その説明変数は予測に役立たないという判断となります。
一方で決定係数はその式自体の信頼性(予測値と実測値の関係)を見る指標なので、いくら回帰係数の有意確率が低かったとしても、そもそもが予測式としては役に立たないという判断になります。