FAQ データサイエンス研修(アドバンスト)
5.統計学(多変量解析)
回答
これはフォントに関するエラーなので基本的に問題ありません。
おそらくjapanize_matplotlib()を使うと消えると思います。
回答
ご指摘の通りです。
共線性がない場合には、説明変数を加えて決定係数が下がることはありませんが、
加えた説明変数が有効でない場合(有意でないなど)には決定係数はほとんど変化しません。
モデルとしては出来るだけシンプルなほうがよいので、様々な変数の組み合わせを試すこととなります。
回答
こちらについては6日目の研修にてモデルデータを含めてお示し致します。
具体的にはVIFという、共線性の目安となる指標などがあるので、それらを用いて変数の選択を行います。
そのうえで、決定係数やAICといった評価指標でモデル選択を行うという流れになります。