原文


MEDICAL

メディカルデータサイエンティスト
養成講座

医療データ解析に必須のデータサイエンスを 実践的・効率的に取得

医療データ解析に必須のデータサイエンスを実践的・効率的に取得

医療データ解析に必須のデータサイエンスを
実践的・効率的に習得

本講座はメディカル分野におけるデータサイエンティスト養成講座です。
メディカル分野において用いられる解析手法のしくみ・活用方法の理解と共に、
メディカル分野の特性に合わせたデータを用いた具体的演習により、
実践的解析力、問題解決力の習得を目指します。

統計検定2級取得無料サポート

統計検定2級取得
無料サポート

検定2級対応講座無料受講可能

検定2級対応講座
無料受講可能

料金・研修時間・修了認定要件

 
料金40万円(税込)
受講方法

1)対面受講(研修室) 2)オンラインLive受講

  • *講義は同時収録されますので、アーカイブによる復習は、受講終了後1年間、何回でも可能です。
研修時間42時間(3ヶ月)
修了認定要件

下記3 要件を満たした場合、修了認定証を交付

  • ・全科目受講(各科目90%以上出席)
  • ・総合テスト70 点以上
  • ・課題解決プレゼンテーションに合格

<不合格の場合>

  • 1.受講不足の場合は、アーカイブ受講をして頂きます。
  • 2.総合テスト不合格の場合は、再受講をお勧めし、再試験を受けて頂きます。
  • 3.課題解決プレゼンテーションに不合格の場合は、課題レポートを提出して頂きます。
  • 4.総合的に審査し、合格と認められた場合は、修了認定証を交付します。
 

講義スケジュール

 

年3回(2月・6月・10月)開講されます。

講義スケジュール
 

講座説明

(再生時間:9分03秒)

講師メッセージ

(再生時間:4分08秒)

事例演習(例)

降圧剤服用前後の最高血圧の違いについて比較する。睡眠薬の服用前後による効果の違いについて比較する。
薬の使用法の説明前後による薬の使用頻度の違いについて比較する。新薬投与群と既存薬投与群の効果の違いについて比較する。
薬の有効成分含有量による効果の違いを比較する。20代、30代、50代による病院への満足度の違いについて比較する。
外れ値を含む治療方法の効果、刺激応答性の違いについて比較する。高齢者における運動の介入の有無と認知機能への影響を調べる。
分布が歪んでいる中性脂肪値を対数変換して条件間比較する。外れ値を含み、分布が歪んでいるγ-GTP値を対数変換して比較する。
バラツキが大きい新薬投与群と既存薬投与群を比較する。治療方法と有効の有無、喫煙と不整脈の有無の違いを検討する。
不整脈診断後、過去の喫煙の有無が影響しているか検討する。外れ値を含む、薬剤投与と有効の有無の違いについて検討する。
喫煙習慣が及ぼす歯周ポケットのサイズへの影響を検討する。倫理審査書類におけるサンプルサイズ設計の算出を行う。
中性脂肪とGOT数値、年齢の関係について検討する。外れ値を含む、中性脂肪とGOT数値の関係について検討する。
GOT数値とBMIから検査数値を予測し検査数値に影響を及ぼすか検討する。薬の投与量による抗体の増加量を予測、性差による増加量への影響を調べる。
感染者数に曜日と温度が与える影響を調べる。病院への満足度に、看護と医師の対応、どちらが重要か調べる。
因果関係についてニューラルネットワークを構築する。生存データから決定木により生存に最も関係した要因を調べる。
生存データからカーネルSVMにより生存について最も関係した要因を調べる。検査数値より疾患の有無についてロジスティック回帰分析により予測する。
疾患の有無ついてロジスティック回帰分析により予測する。喫煙とがんの発生の有無についてロジスティック回帰分析を行う。
結節性甲状腺種の良性か悪性かを予測できるか、超音波検査の各項目結果を用いてロジスティック回帰分析を行う。新治療法と既存治療法による生存についてカプランマイヤー生存曲線を作成する。
胃がん患者に対するS-1薬剤投与による生存についてカプランマイヤー生存曲線を作成する。新治療法と既存治療法による生存についてログランク検定と一般化Wilcoxon検定にて比較する。
新治療法と既存治療法による生存についてCox回帰分析にて治療効果を検討する。喫煙による生存について、カプランマイヤー生存曲線、性差をログランク検定にて比較、Cox回帰分析にて喫煙期間や年齢による生存リスクを調べる。
希少疾患患者への治療効果の有無について、傾向スコア分析にて背景因子を整える。手術介入が及ぶす死亡リスクを検討するため、傾向スコア分析にて年齢と性差の背景因子を整える。

カリキュラム

科目内容
医療データのための実践統計学

1. データの視覚化(箱ひげ図、ヒストグラム、散布図)

2. 基本統計(平均、分散、標準偏差、Z値、中央値、中央絶対偏差)

3. 分布(正規分布、t分布)

4. 母集団と標本(検定のしくみ、2種類の過誤)

5. t検定(有意確率、区間推定、効果量、検出力)

6. カイ2乗検定(カイ2乗分布、効果量)

7. 相関分析(散布図、積率相関係数、交絡要因と偏相関係数)

8. 重回帰分析(標準化偏回帰係数、決定係数、交互作用のある場合)

医療データ解析の実践

1. Rとは(R、Rstudioのインストール)

2. Rの基本的な使用方法(Rstudio の使用方法、ライブラリー、データの読込み方法)

3. 基本統計量、グラフ(平均、分散、標準偏差、Z値(偏差値))

4. グラフと外れ値(箱ひげ図、ヒストグラム、散布図、外れ値の検出方法)

5. t検定(有意確率、区間推定、効果量、検定力、対応の有無)

6. 2種類の過誤とサンプルサイズ(効果量・検定力・有意水準によるサンプルサイズの設定方法)

7. ノンパラメトリック検定(ウイルコクソン順位和検定、符号付順位和検定)

8. 分散分析(F値、多重比較(テューキー、ボンフェローニ)、対応の有無)

9. 重回帰分析(ダミー回帰)

10.ロジスティック回帰分析(予測値、オッズ比)

11.主成分分析(主成分負荷量、主成分スコア)

ビッグデータ解析

1. Pythonの基礎

  • Python の導入、Jupyter Notebook の使い方、
    各種ライブラリの紹介:Matplotlib/Pandas/Numpy/scikit-learn

2.データ加工の基本

  • データベースの基礎、複数データの結合、ダミー変数化、カテゴリー値化

3.教師あり学習:数値予測

  • 重回帰分析、ニューラルネットワーク、データの標準化
  • オーバーフィッティング(過学習)と多重共線性、モデルの評価(決定係数)

4.教師あり学習:クラス分類

  • ロジスティック回帰、決定木、ランダムフォレスト (アンサンブル学習)
  • サポートベクターマシン、モデルの評価(Accurary, Precision, Recall, F値)

5.教師なし学習:クラスタリング

  • 非階層的クラスタリング(k-means 法)、階層的クラスタリング
  • モデルの評価(Elbow 法、シルエット係数)

6.教師なし学習:アソシエーション分析

  • Aprioriによるアソシエーション分析、モデルの評価 (支持度、確信度、リフト値)

7.自然言語処理とテキストマイニング

  • 形態素解析、頻出語分析とジップの法則、単語のベクトル化
実践力の養成

Ⅰ 統計的推定と検定

  • サンプルサイズの違いによる検定の有効性と結果の解釈
  • 効果量、サンプルサイズ、検定力の関係
  • 倫理審査書類におけるサンプルサイズ設計時の算出方法
  • 介入研究でのクロスオーバーと前後比較試験の違い
  • ランダム化比較試験(RCT)の有用性
  • 中性脂肪値にて分布の偏りが発生した際の対数変換を利用した検定
  • n数が少ない2群間比較におけるバラつきが大きいときの対処法
  • フィッシャーの直接確率法とオッズ比、カイ2 乗検定との違い
  • コホート研究とケースコントロール研究による解釈の違い

Ⅱ ロジスティック回帰分析

  • 交互作用のある場合、複数のダミー変数を用いた分析
  • 推定したパラメータからオッズ比の推定
  • 超音波検査の各項目から腫瘍が悪性か予測
  • 腫瘍の予測から主要な検査項目を推定
  • ROC曲線によるロジスティック回帰モデルの評価
  • ROC曲線使用時の論文の方法での書き方
  • ROCとは:信号検出理論
  • ROCを用いた、検査での陽性と陰性、カットオフ値の算出
  • 陽性と陰性、感度と特異度とは
  •  10.感度と特異度から陽性的中率の算出
     11.有病率と陽性的中率の関係
     12.ROC曲線からAUCの算出
     13.論文の結果でのAUCの書き方(ロジスティック回帰モデルの評価の度合いの目安)

Ⅲ 生存曲線

  • 生存曲線のしくみ
  • カプランマイヤー曲線(データの要約、中央生存率(MST)、年次生存率)
  • カプランマイヤー曲線におけるヒゲから研究精度を判断
  • ヒゲの代表値:リスク集合
  • ログランク検定による生存曲線の群間比較
  • ログランク検定の論文での書き方
  • 一般化ウィルコクソン検定とログランク検定の違い
  • 生存曲線における治療効果推定のためのコックス比例ハザードモデル
  • ハザード比とオッズ比の違い
  •  10.比例ハザード性とは
     11.ハザード関数と生存確率の関係
     12.コックス比例ハザードモデルから、リスクの解釈
     13.コックス比例ハザードモデルからのハザード比の論文での書き方

Ⅳ 傾向スコア分析

  • 交絡因子への対応方法(共変量・モデル・RCT)
  • 傾向スコア分析とは
  • RCTが困難な希少疾患患者への傾向スコア分析
  • 傾向スコアの推定方法(ロジスティック回帰分析・近年使用された機械学習の紹介)
  • 傾向スコア推定に使用する因子の効果的な選択方法
  • 傾向スコアの妥当性確認方法
  • 傾向スコア算出後の解析手順(マッチング・層別・多変量・逆確率重みづけ(IPWE))
  • マッチングなど、それぞれの調整方法による利点と欠点
  • マッチングにおける、最近傍法と最適マッチング
  •  10.層別解析における、重みづけの種類(ATE・ATT・MMWS)
     11.逆確率重みづけとは
     12.逆確率重みづけ時における極端な重みを回避する方法(重みの打ち切り・安定化重み(stabilized weights))
     13.傾向スコアの欠点
修了認定

総合テスト・課題解決プレゼンテーション