FAQ データサイエンス研修(アドバンスト)
2.統計学の基礎/機械学習の基礎
回答
今回は動画内で説明している通り、noiz生成は用いずにuniformで取得しています。ご質問されているデータの生成範囲がわからないので、なんとも言えませんが、動画内ではnoizを使用しているパターンもいくつか紹介をしています。
その際に、乱数生成なのでseed値の有無や、内容によってデータの値は毎回変わりますのでその点ご留意ください。
回答
ご指摘の通りです。
引数は整数(Int)型の値を一つ指定した場合には、それがseedとして扱われるので、同様の意味になります。
回答
大変鋭い質問ですね。分析の各評価指標の見方は重要なポイントです。
今回の場合には、それぞれで観点が異なります。
まず、回帰係数の有意確率については「回帰係数が本当は0であった」という状況を表す確率です。
そのため、有意確率(誤り確率)が基準(0.05)よりも大きな場合には、本当は0であったという状況を想定することとし、その説明変数は予測に役立たないという判断となります。
一方で決定係数はその式自体の信頼性(予測値と実測値の関係)を見る指標なので、いくら回帰係数の有意確率が低かったとしても、そもそもが予測式としては役に立たないという判断になります。
回答
”回帰係数が有効か”という観点でいえば、有意確率が十分低いのであれば「有効」として考えます。
ここでいう有向は「0ではない」ということを意味します。
ただし、決定係数が低いのであれば、式全体としては予測はできていないというのが最終的な解釈です。