実践統計学
~統計学の本質的理解と実践的活用方法〜
本セミナーの概要
・近年、統計学は改革が行われており、20世紀初めに登場した推測統計学は変わりつつあります。
本セミナーでは、最新の統計学の考え方と、用いるべき統計手法について学び、統計学の本質の理解と共に、実践的な統計学の活用能力の習得を目指します。
・統計学の初心者から研究者、及び解析(分析)業務担当者までの方を対象に、できる限り数式を用いずに、事例を多く用い解説致します。
・統計学の範囲は非常に広範であり、様々な分野で活用されていますが、統計ソフトウェア(EXCEL、R、SPSS、SAS等)を用いた分析結果について、ある程度解釈できても、統計学の本質を踏まえてきちんと理解されている方は意外に多いとは言えないのではないでしょうか。
・統計学の実践的な活用において、最初に考慮すべきポイントは、データの吟味(外れ値の有無、データの偏り等)、及びサンプルサイズ(データ量)です。それぞれのデータに合わせた正しい解析(分析)方法について学びます。
・統計学の本質(構造)の理解なくして、様々な統計的手法を学んでも実践的な理解は困難です。
・事例演習は、EXCEL2016 を用い、受講者各自1台ずつPCによる演習を行います。
・セミナーにて使用したデータ(事例、関数、分析結果等)はお持ち帰りになれます。
(PCはご用意致しますが、持ち込みも可能です。)
*より本格的な実践力を高めるために「実践統計手法」を併せて受講されることをお勧め致します。
#本セミナーは、従来開講していました「ビジネスに役立つ統計学(基礎編)」をより多くの方に、統計学の本質を学んで頂くことを目的として改編致しました。
受講目標
最新統計学の本質の理解、及び統計学の実践的な活用能力の習得
受講対象
・統計学初心者の方
・統計学の本質的な構造、知識、解析(分析)手法について実践的に学びたい方
・教育、研究等において統計学を活用される方
・マーケティング(企画、宣伝、予測、調査等)、データ管理業務(営業、経理、人事等)における統計学の活用方法について習得したい方
(特に数学の知識は必要ありません。)
学習内容(キーワード・内容)
1.データの特徴について把握する。
箱ひげ図、ヒストグラム、分散、標準偏差、変動係数、Z値、偏差値、正規分布
データの特徴(偏り、外れ値の有無)の把握方法、バラツキの重要性と判断への活用方法、Z値と正規分布の関係等について学びます。
1)グラフの活用方法
・箱ひげ図を用いて外れ値の有無についてチェックする。
・ヒストグラムでデータ全体の偏りを把握する。
2)平均、バラツキについて(基本統計量)
・バラツキ(分散、標準偏差)の計算方法
・データの正しい評価は、平均とバラツキを用いたZ値(偏差値)で行う。
・正規分布は、統計学において最も重要な分布である。
2.平均値の差の違いについて検討する。
t分布、2標本t検定(対応の有無)、P値(有意確率)、区間推定、効果量、検出力(検定力)
データの形式、サンプルサイズ(データ量)に合わせた検定方法及び分析結果の解釈方法について学習します。
1)平均値の差の検討(t検定)
・t分布と正規分布の違い
・サンプルサイズが小さい場合は、t分布を利用する。
・違いの大きさをP値、区間推定で判断する。
・効果量は、違いの大きさではなく、効果(ズレ)の大きさである。
・サンプルサイズの異なる分析結果の比較には、P値ではなく効果量を用いる。
・サンプルサイズが小さい場合は、検出力に注意する。
・検出力の小さい分析の結果は信頼度が低い。
・ビッグデータにおいては、P値はまったく参考にならない。
2)対応のある場合
・対応の有無は、分析者が判断する。
・対応データは、差に着目した分析である。
・対応の有無を間違えると正しい分析結果は得られない。
3.集計データの検討(カイ二乗検定)
適合度検定、分割表の検定、比率の差の検定、期待値、実現値(実測値) 、効果量(ファイ係数)
クロス集計データ(分割表)、2つの比率データの差に対する検定方法及び分析結果の解釈方法について学習します。
1)適合度検定
・集計データにおいて、期待値を求め、実現値との食い違いについて検討する。
・食い違いの大きさを算出し、P値を求める。
2)分割表の検定
・分割表における期待値の算出方法
・期待値と実現値の食い違いの大きさを求め検定する。
・比率の差の比較は分割表により検討する。
・P値はサンプルサイズの影響を大きく受ける。
・サンプルの異なる分析結果の比較には、効果量(ファイ係数)を用いる。
4.2群の関係について把握する。(相関分析)
散布図、相関関係、積率相関係数、交絡要因
2つの量の関係について、関係をグラフで把握する方法、及び数値で把握する方法について学びます。
1)散布図の活用方法
・散布図の正しい書き方と散布図の種類
2)積率相関係数
・係数のしくみ
・積率相関係数の解釈の方法
・外れ値は、積率相関係数の値に大きな影響を与える。
・積率相関係数は、効果量である。
・無相関の検定(P値)はあまり利用されていない。
5.2群以上の因果関係について検討する。(回帰分析)
回帰分析(従属変数、説明変数、偏回帰係数、t検定、決定係数)、ダミー回帰
注目する量(売上高等)と、それに影響を与えると思われる量的データ、及び質的データとの関連を明らかにする方法について学習します。
1)回帰モデル
・回帰モデルのしくみ
2)モデルのチェック方法
・決定係数は説明力を表し、自由度調整済み決定係数(EXCEL : 補正R2)を参考にする。
・t検定は、偏回帰係数が0より大きかどうかの検定である。
・ビッグデータにおいては、t検定は利用されていない。
・説明変数間の積率相関係数が高いと、回帰モデルの解釈は困難である。
3)ダミー回帰
・説明変数が質的データ(男女…等)の場合はダミー変数を使用する。
・カテゴリーデータにおけるダミー変数の作成法
・外れ値のデータは、ダミー変数で区別し回帰分析を行う。
(セミナーの内容は、一部変更される場合があります)
・セミナー終了後、希望される方には業務への活用方法等についてご相談に応じます。