原文


2.Rのパッケージと操作方法

回答

Rにてスクリプトを保存することはできるが、それは一連の命令文を保存することが可能なだけである。変換の登録機能などはないため、テキストファイルなどに使用する関数をまとめておくと良い。

 

1.Rとは

提出課題1

回答

メール添付のご提出で結構です。
提出は、 que@datascience.co.jp 宛にお願いいたします。

17.ダミー変数を用いた分析

15.標準偏回帰係数

14.重回帰分析

13.単回帰分析

12.回帰分析のしくみ

11.交絡要因と偏相関係数

回答

まず、偏相関係数の計算式ですが、次のとおりです。

交絡要因と変数 A の相関係数を a
交絡要因と変数 B の相関係数を b
変数 A と変数 B の相関係数を c

とした場合

偏相関係数 =  𝑐 − 𝑎 × 𝑏
      √1 − 𝑎2 × √1 − 𝑏2

となります。

動画の例の場合ですと、人口が交絡要因として、

人口と広告費の相関係数が r=0.895
人口と売上高の相関係数が r=0.951
広告費と売上高の相関係数が r=0.902

ですので、

偏相関係数 =  0.902 − 0.895 × 0.951
      √1 − 0.8952 × √1 − 0.9512  = 0.369

となります。

さて、この計算式を覚えるかどうかですか、実務としては覚える必要はないと思います。
多くの統計分析パッケージは偏相関係数が計算出来るようになっています。
R ですと、psychパッケージに「partial.r」という関数があります。
ただ残念ながら Excelには搭載されていませんので、ワークシートをご利用ください(スライド NO.78~79 参照)。
もし統計検定のような資格試験対策としての暗記であれば、難しいところです。
と言うのは、試験問題は毎年変わりますので、「絶対に覚えなくても良い」とは言い切れないからです。
ただ 2級の過去問を数年分見てみたのですが、偏相関係数と何か?を問う問題はあっても、
計算問題までは出題されていないようでした。

回答

計算式に誤りはありません。
(これに限らず、全ての計算式はSPSSやRなど別の統計パッケージで答えが合っているか確認しています)。
単純に端数の処理の問題です。
EXCELでは、「=」を使って相関係数を入力しています。
PPTでは、テンキーを使って小数点以下第3位まで入力しています。
そのために、端数がわずかに(±0.004)ズレています。

   統計学活用支援サイト