-
データ分析力養成講座
11.交絡要因と偏相関係数
回答
まず、偏相関係数の計算式ですが、次のとおりです。
交絡要因と変数 A の相関係数を a
交絡要因と変数 B の相関係数を b
変数 A と変数 B の相関係数を c
とした場合
偏相関係数 = 𝑐 − 𝑎 × 𝑏
√1 − 𝑎2 × √1 − 𝑏2
となります。
動画の例の場合ですと、人口が交絡要因として、
人口と広告費の相関係数が r=0.895
人口と売上高の相関係数が r=0.951
広告費と売上高の相関係数が r=0.902
ですので、
偏相関係数 = 0.902 − 0.895 × 0.951
√1 − 0.8952 × √1 − 0.9512 = 0.369
となります。
さて、この計算式を覚えるかどうかですか、実務としては覚える必要はないと思います。
多くの統計分析パッケージは偏相関係数が計算出来るようになっています。
R ですと、psychパッケージに「partial.r」という関数があります。
ただ残念ながら Excelには搭載されていませんので、ワークシートをご利用ください(スライド NO.78~79 参照)。
もし統計検定のような資格試験対策としての暗記であれば、難しいところです。
と言うのは、試験問題は毎年変わりますので、「絶対に覚えなくても良い」とは言い切れないからです。
ただ 2級の過去問を数年分見てみたのですが、偏相関係数と何か?を問う問題はあっても、
計算問題までは出題されていないようでした。
回答
計算式に誤りはありません。
(これに限らず、全ての計算式はSPSSやRなど別の統計パッケージで答えが合っているか確認しています)。
単純に端数の処理の問題です。
EXCELでは、「=」を使って相関係数を入力しています。
PPTでは、テンキーを使って小数点以下第3位まで入力しています。
そのために、端数がわずかに(±0.004)ズレています。