原文


メディカルデータサイエンティスト養成講座
 

医療現場に必須のデータサイエンスを実践的・効率的に習得


本講座はメディカル分野におけるデータサイエンティスト養成講座です。
メディカル分野において用いられる解析手法のしくみ・活用方法の理解と共に、メディカル分野の特性に合わせたデータを用いた具体的演習により、実践的解析力、問題解決力の習得を目指します。
修了認定者には、統計検定2級取得を無料サポートします。検定2級対応講座を無料にて受講可能です。
料金 40万円(税込)
研修時間 42時間(3 ヶ月)
修了認定要件 下記3 要件を満たした場合、修了認定証を交付
・全科目受講(各科目90%以上出席)
・総合テスト70 点以上
・課題解決プレゼンテーションに合格
 

<不合格の場合>
1.受講不足の場合は、アーカイブ受講をして頂きます。
2.総合テスト不合格の場合は、再受講をお勧めし、再試験を受けて頂きます。
3.課題解決プレゼンテーションに不合格の場合は、課題レポートを提出して頂きます。
4.総合的に審査し、合格と認められた場合は、修了認定証を交付します。


演習事例

  • 降圧剤服用前後の最高血圧の違いについて比較する。
  • 新薬投与群と既存薬投与群の効果の違いについて検討する。
  • 新薬の投与前後の効果について比較する。
  • 薬効について患者アンケートから年代別に比較する。
  • 中性脂肪とGOT数値、年齢の関係について検討する。
  • 治療方法と有効の有無の違いについて検討する。
  • 患者情報から入院日数を予測する。
  • 地域特性に基づき感染者数を予測する。
  • 検査測定値から糖尿病の進行度を予測する。
  • 健康状態や、年齢等から病気の罹患の予測を行う。
  • 2種類の検査数値と疾患の有無の関係について検討する。
  • 検査結果に基づき患者をタイプ別にグルーピングする。
  • バイタル値に基づき健康状態を分類する。
  • 合併症の発症パターンについて分析する。
  • 電子カルテのテキストデータから病名を予測する。
  • 医療論文からトピックに関する特徴的なキーワードを抽出する。
  • ダイエットと取得カロリーに対する認識調査結果を分析する。
  • 血液検査の結果から肝疾患を予測する。
  • 基礎疾患の有無や血液検査の結果から慢性腎臓病を予測する。
  • 心疾患患者の臨床データから生命予後を予測する。
  • オープンデータを用いてCOVID-19の症状をテキスト分析する。
  • 医薬品副作用の公開データを用いて、有害事象の発生パターンを分析する。
  • レセプト公開データを用いて、エリア別の医薬品使用傾向を分析する。
  • 錠剤の製造データから薬効に影響を与えうる品質要因を分析する。
  • 医療事故に関する公開事例集を用いて、テキストマイニングにより
       頻発するインシデントやその要因を探索する。

カリキュラム

科目 内容
1 医療データ解析のための実践統計学 1. データの視覚化(箱ひげ図、ヒストグラム、散布図)
2. 基本統計(平均、分散、標準偏差、Z値、中央値、中央絶対偏差)
3. 分布(正規分布、t分布)
4. 母集団と標本(検定のしくみ、2種類の過誤)
5. t検定(有意確率、区間推定、効果量、検出力)
6. カイ2乗検定(カイ2乗分布、効果量)
7. 相関分析(散布図、積率相関係数、交絡要因と偏相関係数)
8. 重回帰分析(標準化偏回帰係数、決定係数、交互作用のある場合)
2 Rによるデータ解析 1. Rとは(R、Rstudioのインストール)
2. Rの基本的な使用方法(Rstudio の使用方法、ライブラリー、データの読込み方法)
3. 基本統計量、グラフ(平均、分散、標準偏差、Z値(偏差値))
4. グラフと外れ値(箱ひげ図、ヒストグラム、散布図、外れ値の検出方法)
5. t検定(有意確率、区間推定、効果量、検定力、対応の有無)
6. 2種類の過誤とサンプルサイズ(効果量・検定力・有意水準によるサンプルサイズの設定方法)
7. ノンパラメトリック検定(ウイルコクソン順位和検定、符号付順位和検定)
8. 分散分析(F値、多重比較(テューキー、ボンフェローニ)、対応の有無)
9. 重回帰分析(ダミー回帰)
10.ロジスティック回帰分析(予測値、オッズ比)
3 Pythonによるビッグデータ解析 1. Pythonの基礎
 ・Python の導入、Jupyter Notebook の使い方、
  各種ライブラリの紹介:Matplotlib/Pandas/Numpy/scikit-learn
2.データ加工の基本
 ・データベースの基礎、複数データの結合、ダミー変数化、カテゴリー値化
3.教師あり学習:数値予測
 ・重回帰分析、ニューラルネットワーク、データの標準化
 ・オーバーフィッティング(過学習)と多重共線性、モデルの評価(決定係数)
4.教師あり学習:クラス分類
 ・ロジスティック回帰、決定木、ランダムフォレスト (アンサンブル学習)
 ・サポートベクターマシン、モデルの評価(Accurary, Precision, Recall, F値)
5.教師なし学習:クラスタリング
 ・非階層的クラスタリング(k-means 法)、階層的クラスタリング
 ・モデルの評価(Elbow 法、シルエット係数)
6.教師なし学習:アソシエーション分析
 ・Aprioriによるアソシエーション分析、モデルの評価 (支持度、確信度、リフト値)
7.自然言語処理とテキストマイニング
 ・形態素解析、頻出語分析とジップの法則、単語のベクトル化
4 実践力の養成 1. 統計的推定と検定
 ・サンプルサイズの違いによる検定の有効性と結果の解釈
 ・効果量、サンプルサイズ、検定力の関係とサンプルサイズの設定方法
 ・フィッシャーの直接確率法とオッズ比、カイ2 乗検定との違い
 ・リスク比とオッズ比の違い
 ・コホート研究とケースコントロール研究による解釈の違い
2. 相関関係
 ・積率相関係数、順位相関係数のしくみと活用方法
 ・交絡要因による疑似相関、偏相関の求め方と活用法
3. 重回帰分析
 ・交互作用のある場合、複数のダミー変数を用いた分析
4. ロジスティック回帰分析
 ・ROC 曲線のしくみと活用方法
5. 生存曲線
 ・カプランマイヤー曲線
 ・コックス比例ハザードモデルのしくみ
6. 傾向スコア分析
 ・逆確率による重みづけ
 ・傾向スコア・マッチング
5 修了認定 総合テスト・課題解決プレゼンテーション
Copyright © データサイエンス研究所 All Rights Reserved.
S