FAQ 事例から学ぶビジネスパーソン向け統計データ利活用セミナー
【回答】
相関係数はプラスとマイナスがありますので、二乗する必要があります。
また、直観的な理解になりますが、散布図から説明力という情報を得るには、相関係数そのままの数値より、二乗した数値の方が感覚的に合致します。
【回答】
そのとおりです。人口の影響を除いた場合における相関係数です。
【回答】
2つのグラフの横軸の目盛は同じであり、全体の分布がほとんど同じように見えます。
従って、相関があるのでは?という仮説が立てられます。
【回答】
P値(有意確率)は、データが多い場合、算出するとすべて小さな値(例:0.00‥1)となってしまいますので算出する意味が無くなってしまいます。
【回答】
一般的には平均値がよく用いられますが、外れ値のある場合は中央値の方が代表値として優れています。
データの分布を把握して使い分けてください。
【回答】
箱ひげ図で外れ値とする基準も一つの判断方法です。
おっしゃってくださっている箱ひげ図は「その数値」における外れ値の判断方法です。
関東を外れ値と捉える方法は、単純に散布図から、少し外れている数値に見えるという判断や、
例えばほかの地方と比較して関東だけ人口が多いから外れ値とするとか、多面的に考えたうえで、関東が外れているという判断も可能です。
【回答】
国がどう想定しているかは、e-statは数値データだけになっている状態ですが、jstat-mapでは単純に地図で見える化できるのが違います。
それはつまり、自身の営業所なり支店なりがある市町村内だけでなく、周辺の市町村、自動車での30分圏内におけるデータを見える化することによって、特定の地図上の地点の周辺のデータが見える化されることが、使い方だと思います。
特定の地点の想定がない場合は(特定の支店の住所がない)、e-statで広くデータを分析できるようにしていると考えることが可能です。
【回答】
表示できます。参考URLを入れておきますので参考にしてください。
https://jstatmap.e-stat.go.jp/manual/gis_manual.pdf
https://www.stat.go.jp/info/guide/public/kouhou/img/pdf_10/10.pdf
【回答】
データそのものは、estatを使っているので、出典は例えば
https://www.e-stat.go.jp/help/surveyitems/search-3-5
にある通りでよくて、それを図示したということでjstatmapを書くと良いと思います。
以下例です。
「出典:「政府統計の総合窓口(e-Stat)」、調査項目を調べる-国勢調査(総務省)「住居の種類」を地図で見る統計(jSTAT MAP)にて図示した」という書き方でよろしいかと思います。
本セミナーに関するお問い合わせ
- MAIL:info@datascience.co.jp
- TEL:03-3265-3908
- ※受付時間/10:00~17:00(土日祝日を除く)