Reスキル講座認定給付金 助成金対象 全100時間

統計学による
データ分析力養成講座

データ解析に必要な統計学を体系的・実践的に習得

このような課題はありませんか

統計学を体系的に学んだ経験がない

?

統計解析を自己流で行っており不安がある

生成AIを解析に活用したい

解析手法のしくみと適用制約について理解したい

新たな解析手法を習得したい

A B ?

どの検定手法を使うべきか判断に迷う

本講座は、これらの課題を解決するための講座です。

講座概要

なぜ統計学が必要なのか

データ解析において最も重要な要素の一つが「客観性」であり、その根幹を支えるのが「データ」です。しかし、データは収集しただけでは十分ではなく、最適な統計手法を用いて解析し、正しく解釈することが不可欠です。

統計解析には多様な手法が存在し、「どの手法を選択するべきか」「解析結果をどのように解釈するべきか」といった判断には体系的な知識が必要となります。

本講座で得られるもの

・統計学の基礎から多変量解析(統計用語の理解、各手法のしくみ、解釈方法・使い方)
・統計解析手法の体系的理解、データによる制約条件、目的に合わせた手法の選択方法
・生成AIを最大限に活用した解析方法(コード生成、エラーチェック等)
・様々な分野(メディカル、製造、マーケティング等)における実践的解析手法

受講対象

  • 統計学を体系的に実践的に理解したい方
  • 業務に統計学を使用する方・活用したい方
  • 各企業・研究所等のデータ解析担当者
  • 食品関連企業の分析担当者・研究者
  • 研究所の分析担当者
  • 生成AIを統計解析に活用したい方

高度な数学の知識は必要ありません。

本講座の特長

Feature 01

実務データを用いた
課題解決プレゼンテーション(約30時間)

受講者ご自身の業務・研究における課題を取り上げ、プレゼンテーションを実施します。メンター・各専門分野の講師がマンツーマンで個別対応し、業務・研究において統計解析を実際に活用できる実践力を獲得します。

  • 課題設定とデータの選択・前処理
  • 解析手法の選択と結果の解釈
  • 発表資料の作成・プレゼンテーション実施

実施の流れ

  • 課題設定
  • データ選択・前処理
  • 解析手法の選択
  • 解析結果の解釈
  • 資料作成・発表

Feature 02

修了まで
講師が個別にサポート

本講座は給付金・助成金対象のため、修了についてご不安な方も安心してご受講いただけます。意欲を持って取り組んでいただければ、修了に問題はありません。

サポート内容

  • 受講中のリアルタイムチャット
  • 受講後のメール対応
  • 課題の添削
  • ZOOM面談による個別支援

Feature 03

約100時間の
体系的カリキュラム

演習を重視した本格的なカリキュラムです。講義・演習から実際の課題解決プレゼンテーションまで、段階的に実践力を高めます。

*標準学習時間です(個人差があります)

学習時間の内訳

講義・演習・課題作成70h
プレゼン30h
  • 講義・演習・課題作成:70時間
  • 課題解決プレゼン:30時間

カリキュラム

EXCELとRを使用した、全100時間の体系的カリキュラム

EXCELによる統計学の基礎1

6時間

1. EXCELの基本的な操作

  • 操作の基礎(行・列の選択方法、並べ替え、セルの移動、絶対参照等分析)
  • 分析に必要なEXCEL関数(算術平均、分散、標準偏差、中央値、最頻値、四分位数、相関係数等)
  • データのカウントとクロス集計(条件指定カウント、並び替え、フィルタ、ピボットテーブル)
  • データの可視化(箱ひげ図、ヒストグラム、散布図、層別散布図、棒グラフ、積み上げ棒グラフ、円グラフ、対数折れ線グラフ、レーダーチャート、バブルチャート、バイオリンプロット、グラフの調整方法、タイトルの編集、軸・要素の書式設定)

2. データの特徴について把握する

  • グラフの活用方法(箱ひげ図による外れ値のチェック、ヒストグラムによる分布の把握)
  • 平均、バラツキについて<基本統計量>(平均⦅算術平均、幾何平均⦆、分散、標準偏差、Z値、偏差値、正規分布の理解と活用方法)

EXCELによる統計学の基礎2

6時間

3. 平均値の差について検討する

  • 平均値の差の検討<t検定>(t分布と正規分布の違い、有意確率ではなく効果量を用いる場合)
  • 対応のある場合

4. 二群の関係について把握する(相関分析)

  • 散布図の活用方法(散布図の書き方、データ属性による散布図の解釈方法)
  • 積率相関係数、順位相関係数(相関係数のしくみと解釈法、外れ値との相関係数の関係)
  • 偏相関係数<交絡要因>(交絡要因がある場合の相関係数と解釈の方法について)

5. 二群以上の因果関係について検討する(回帰分析)

  • 回帰モデルのしくみ<従属変数、説明変数、決定係数>(標準化回帰分析、ダミー回帰分析)

Rによる実践演習1

6時間

1. Rの基礎

  • R、Rstudioのインストール、Rstudioの使い方
  • パッケージの基礎とインストール、使い方(データの「型」と「変数」、プログラミング関数の基礎、Rデータの取り込み)
  • データフレームの扱い(行の抜き出し、条件指定値の抜出し、行・列の削除、因子設定)

2. 統計学基礎

  • データの種類、代表値、散布度(分散、標準偏差)、四分位と箱ひげ図
  • 不偏統計量
  • カテゴリカルデータの要約(クロス集計とtable関数)
  • 複数の統計量の同時算出(apply関数・tapply関数)
  • 積率相関、順位相関、偏相関

3. データの可視化

  • ヒストグラム、棒グラフ、+エラーバー、円グラフ、箱ひげ図、折れ線グラフ
  • 散布図(層別、3次元)、複数グラフの同時プロット、ヒートマップ

Rによる実践演習2

6時間

4. 統計的推定

  • 母集団と標本(標本調査と標本抽出方法、区間推定、母平均推定)

5. 統計的検定の基礎

  • 検定の考え方(検定の誤り⦅第1種の誤り、第2種の誤り⦆、有意確率⦅p値⦆の性質、効果量、検定力、サンプルサイズ、データの対応)

6. 正規性の検定

  • 正規性とは、正規性の検定の種類、仮説の設定
  • QQプロット、コルモゴロフスミノフ検定、シャピロウィルク検定、球面性の検定

7. 等分散性の検定

  • 等分散性とは
  • F検定、バートレット検定、ルビーン検定

8. パラメトリック検定

  • 1標本t検定
  • 2標本t検定(対応なし・対応あり)

9. 分散分析

  • 分散分析の基礎、要因計画とデータの準備
  • 1要因の分散分析(対応なし・対応あり)

Rによる実践演習3

6時間

10. ノンパラメトリック検定

  • カイ二乗検定、フィッシャーの正確確率検定
  • ウィルコクソンの順位和検定、符号順位和検定
  • クラスカルウォリス検定、フリードマン検定

11. 線形回帰分析

  • 単回帰分析、重回帰分析、標準化回帰分析
  • 残差と残差分析、多重共線性
  • モデルの評価(赤池情報量基準:AIC)
  • 質的変数を用いた回帰

12. ロジスティック回帰

  • ロジスティック回帰の考え方
  • ロジスティック回帰分析(回帰係数、オッズ比、予測値)

13. ポアソン回帰

  • ポアソン回帰の考え方、線形回帰分析との比較

実践力の養成1

6時間

1. パス図

2. 主成分分析

3. 因子分析

  • 因子分析(最尤法、因子負荷量、因子スコア)
  • 因子の回転(バリマックス、プロマックス)

4. 階層クラスター分析

  • 階層クラスター分析(様々な距離、デンドログラム)

5. 共分散構造分析

  • 共分散構造分析とは、モデルの考え方
  • 分散・共分散・相関、パス解析と係数
  • 適合度指標(CFI、TLI、RMSEA、SRMR、情報量基準:AIC・BIC)

  • 逐次モデル (Recursive Model)
  • 非逐次モデル (non-Recursive Model)
  • MIMICモデル、PLSモデル
  • 2次因子分析

実践力の養成2

6時間

1. 二元配置分散分析

2. 多重比較、ノンパラ多重比較

  • Tukey法、Bonferoni法、Holm法、Dunnett法、ウイルコクソン法

3. 繰り返しデータの群間比較

  • 介入前後・多時点データ構造
  • ANCOVA、MMRM、クロスオーバーデザイン

4. ノンパラの群間比較

  • Brunner–Munzel、Kruskal–Wallis / Friedman、Steel–Dwass

5. 非正規分布への対処

  • 天井・床効果、ロバスト推定、トービットモデル

実践力の養成3

6時間

1. いろいろな検定

  • 尤度比検定、カッパ係数の検定、並び替え検定

2. データ変換

  • 対数変換、Box-Cox変換

3. 生存曲線

  • 生存曲線のしくみ
  • カプランマイヤー曲線(データの要約、中央生存率(MST)、年次生存率)
  • ログランク検定による生存曲線の群間比較、論文での書き方
  • 一般化ウィルコクソン検定とログランク検定の違い
  • 生存曲線における治療効果推定のためのコックス比例ハザードモデル
  • ハザード比とオッズ比の違い
  • 比例ハザード性とは
  • ハザード関数と生存確率の関係
  • コックス比例ハザードモデルから、リスクの解釈、論文の書き方

4. 傾向スコア分析

  • 交絡因子への対応方法(共変量・モデル・RCT)
  • RCTが困難な希少疾患患者への傾向スコア分析
  • 傾向スコアの推定方法(ロジスティック回帰分析・近年使用された機械学習の紹介)
  • 傾向スコア推定に使用する因子の効果的な選択方法、傾向スコアの妥当性確認方法
  • 傾向スコア算出後の解析手順(マッチング・層別・多変量・逆確率重みづけ(IPWE))
  • マッチングなど、それぞれの調整方法による利点と欠点
  • マッチングにおける、最近傍法と最適マッチング
  • 層別解析における重みづけの種類(ATE・ATT・MMWS)
  • 逆確率重みづけとは
  • 極端な重みの回避方法(重みの打ち切り・安定化重み(stabilized weights))

5. メタアナリシス

  • メタアナリシスの目的、固定効果モデル vs 変量効果モデル
  • 異質性(I²)、感度分析

ベイズアプローチ

6時間

1. ベイズの定理と確率

  • 条件付き確率
  • 事前分布、尤度、事後分布、周辺尤度

2. ベイズ推論とMCMC法

  • 正規回帰の事後分布、メトロポリス法、Gibbs sampling、トレースプロット

3. ベイジアンt検定

  • 頻度主義t検定との比較、ベイズファクター、効果量の事後分布、事前分布依存性、サンプルサイズとの関係

4. ベイズ線形回帰

  • 回帰係数の事後分布、正則化との関係(Ridgeとの類似)、モデル比較(LOO、WAIC、ベイズファクター)

5. 階層モデル

  • 小標本問題、部分プーリング、ランダム効果との比較

生成AIによる実践演習

4時間

1. AI連携開発環境の構築、生成AIの連携・使用方法

  • 生成AIによる統計解析コーディング

2. 生成AIによる可視化コード生成

  • 生成AIが得意とするインタラクティブなグラフ作成や複雑な図解の自動化

3. デバッグと試行錯誤のプロセス

  • 失敗例をもとにエラーをAIと対話しながら修正していく実践的プロセス

4. 生成AIによる回帰分析

  • 教師あり学習のデータ解析を実行する演習

5. 機械学習ケーススタディ

6. 生成AIによる総合演習

  • 習得した各解析手法について生成AIを用いた演習を実施

総合演習

2時間
  • 習得した各分析方法を組み合わせた分析
  • よくある分析の失敗事例と解決方法
  • 論文での掲載方法

課題作成時間

10時間
  • 各科目学習後の課題作成

修了認定:課題解決プレゼンテーション

30時間
  • 課題設定、データ前処理、分析手法選択、分析結果の解釈、レポート、プレゼン発表

*課題作成時間・課題解決プレゼンテーションの学習時間は個人差があります。

講義・演習・課題作成 70時間
プレゼン 30時間
合計 100時間

使用するRパッケージ

講座で使用する主要なRパッケージ一覧

基本統計・データ処理

解析手法 パッケージ名
基本統計量、主成分分析、因子分析psych
基本統計量e1071
データ処理・可視化tidyverse
Excelファイルの取り込みopenxlsx
Excel読み込みreadxl

可視化

解析手法 パッケージ名
作図ggplot2
複数のグラフの同時プロットGGally
グラフの分割プロットgridExtra
ヒートマップgplots
相関行列(ヒートマップ)corrplot
共分散構造分析パス図semPlot
生存曲線描画survminer

検定・相関

解析手法 パッケージ名
偏相関ppcor
効果量effectsize
ルビーン検定lawstat
検定力pwr
ノンパラメトリック検定、厳密検定exactRankTests
ノンパラメトリック検定(置換検定)coin
カイ二乗検定(効果量)vcd
カッパ係数irr
ノンパラメトリック統計NSM3
Brunner–Munzel検定brunnermunzel

回帰・モデリング

解析手法 パッケージ名
多重共線性とVIF値、VIF、回帰診断、ANOVAcar
標準化回帰係数(β)算出QuantPsyc
共分散構造分析lavaan
LMMnlme
AIC、ベイズシミュレーションMASS
TobitモデルcensReg
ロバスト統計WRS2
ロバスト標準誤差(分散共分散行列)sandwich
回帰モデル検定lmtest

分散分析・多重比較

解析手法 パッケージ名
多重比較(Dunnett法)multcomp
ANOVA(混合効果モデル)afex
多重比較emmeans

生存時間解析

解析手法 パッケージ名
生存時間分析survival

傾向スコア・メタアナリシス

解析手法 パッケージ名
傾向スコアマッチングMatchIt
傾向スコア(IPTW)WeightIt
傾向スコアのバランス確認cobalt
メタアナリシスmetafor

ベイズ統計

解析手法 パッケージ名
MCMC、ベイズ線形回帰rstanarm
ベイズGLMbrms
事後分布、ベイズt検定の効果量、信用区間・ROPEbayestestR
ベイズt検定BayesFactor

講師紹介

須藤 竜之介

統計学、EXCEL

若田講師

若田忠之

統計学、R

請園 正敏

統計学

伊藤講師

伊藤 嘉朗

統計学、実践力の養成

*その他、統計学を専門とするプロが担当致します。

講座概要・受講料

講座名 統計学によるデータ分析力養成講座
受講時間 全100時間(講義・演習60時間+課題作成10時間+課題解決プレゼンテーション30時間)
対象者 各企業・研究所等のデータ解析担当者
受講形式 ハイブリッド講座(オンデマンド+個別対面)
給付金・助成金 Reスキル講座認定(教育訓練給付金・人材開発支援助成金 対象)
受講料 550,000円(税込み)

受講者の声

「統計解析への理解が深まり、研究に活用できました。自己流だった解析手法を体系的に学び直すことができ、論文執筆においても正しい統計処理に自信を持てるようになりました。個別プレゼンテーション指導が特に有益でした。」

製薬企業 分析担当者

「どの検定手法を選べばよいか、ずっと迷っていました。本講座では手法の選択基準を体系的に学べたため、データに応じた適切な解析ができるようになりました。生成AIを活用した解析の効率化も、業務に取り入れています。」

食品メーカー 品質管理担当者

「多変量解析は難しいと敬遠していましたが、演習を通じて実践的に習得できました。自分の研究データを使った課題解決プレゼンテーションは特に印象に残っており、受講後すぐに業務で活用できるレベルに到達できたと感じています。」

研究機関 研究員

「仕事と並行しながら無理なくオンデマンドにて受講できました。わからない点はリアルタイムチャットで対応いただけ、ZOOM面談もありましたので挫折せず修了できました。給付金を利用できたことも、受講のきっかけになりました。」

製造業 商品開発担当

よくある質問

統計学の知識が全くない文系初心者ですが受講できますか?
受講いただけます。本講座は基礎から体系的に学ぶカリキュラムで、個別サポートも充実しています。高度な数学知識も必要ありません。
修了できるか不安です。
初心者にも受講可能、個別サポートも充実しています。少しでも不安でしたら、無料相談にて具体的にご相談ください。
どのくらいの期間で修了できますか?
標準学習時間は100時間です。週7~8時間程度の学習で約4ヶ月が目安ですが、個人差があります。
仕事をしながら受講できますか?
ハイブリッド講座のため、ご自身のペースで受講いただけます。受講中はリアルタイムチャット、受講後はメール・ZOOM面談等で個別にサポートします。

まずは無料相談から

講座内容・給付金・受講方法など、お気軽にご相談ください。