マニュファクチュアリングデータサイエンス実践力養成講座|カリキュラム
科目 | 内容 |
---|---|
実践統計学 |
1. データの視覚化(箱ひげ図、ヒストグラム、散布図)
2. 基本統計(平均、分散、標準偏差、Z値、中央値、中央絶対偏差) 3. 分布(正規分布、t分布) 4. 母集団と標本(検定のしくみ、2種類の過誤) 5. t検定(有意確率、区間推定、効果量、検出力) 6. カイ2乗検定(カイ2乗分布、効果量) 7. 相関分析(散布図、積率相関係数、交絡要因と偏相関係数) 8. 重回帰分析(標準化偏回帰係数、決定係数、交互作用のある場合) |
製造分野における データ分析の実践 |
1. Rとは(R、Rstudioのインストール)
2. Rの基本的な使用方法(Rstudio の使用方法、ライブラリー、データの読込み方法) 3. 基本統計量、グラフ(平均、分散、標準偏差、Z値(偏差値)) 4. グラフと外れ値(箱ひげ図、ヒストグラム、散布図、外れ値の検出方法) 5. t検定(有意確率、区間推定、効果量、検定力、対応の有無) 6. 2種類の過誤とサンプルサイズ(効果量・検定力・有意水準によるサンプルサイズの設定方法) 7. ノンパラメトリック検定(ウイルコクソン順位和検定、符号付順位和検定) 8. 分散分析(F値、多重比較(テューキー、ボンフェローニ)、対応の有無) 9. 重回帰分析(ダミー回帰) 10.ロジスティック回帰分析(予測値、オッズ比) 11.主成分分析(主成分負荷量、主成分スコア) |
ビッグデータ解析 |
1. Pythonの基礎
・Python の導入、Jupyter Notebook の使い方、 各種ライブラリの紹介:Matplotlib/Pandas/Numpy/scikit-learn 2.データ加工の基本 ・データベースの基礎、複数データの結合、ダミー変数化、カテゴリー値化 3.教師あり学習:数値予測 ・重回帰分析、ニューラルネットワーク、データの標準化 ・オーバーフィッティング(過学習)と多重共線性、モデルの評価(決定係数) 4.教師あり学習:クラス分類 ・ロジスティック回帰、決定木、ランダムフォレスト (アンサンブル学習) ・サポートベクターマシン、モデルの評価(Accurary, Precision, Recall, F値) 5.教師なし学習:クラスタリング ・非階層的クラスタリング(k-means 法)、階層的クラスタリング ・モデルの評価(Elbow 法、シルエット係数) 6.教師なし学習:アソシエーション分析 ・Aprioriによるアソシエーション分析、モデルの評価 (支持度、確信度、リフト値) 7.自然言語処理とテキストマイニング ・形態素解析、頻出語分析とジップの法則、単語のベクトル化 |
実践力の養成 |
1. 統計的検定
・1標本t検定、区間推定 ・2標本t検定、対応の有無による解釈の違い ・効果量、検出力、標本の大きさの設計 ・カイ二乗検定、効果量 2. データの可視化 ・箱ひげ図、ヒストグラム、折れ線グラフ ・散布図、層別散布図、パレート図 3. 重回帰分析 ・マルチコのある場合、交互作用のある場合 4. ダミー変数による重回帰分析 5. シェハート管理図 ・エックバー、R、s、X管理図 ・np、p、c、u管理図 ・異常判定のルール 6. 工程能力指数(Cp、Cpk) 7. 製造業におけるデータマイニング ・製造業におけるデータの種類と活用例 ・製造業におけるデータ分析の適用範囲 ・組み立て製造とプロセス製造の違い ・製造業におけるビッグデータ分析事例 8. 教師あり学習による数値予測 ・重回帰分析による欠陥発生数の予測と欠陥増加要因の絞り込み ・VIF統計量による多重共線性対策 9. 教師あり学習による不要要因の分析 ・ロジスティック回帰分析 ・決定木による不良要因の分析 ・不均衡データへの対応 ・アンサンブル学習による精度向上 10. 教師なし学習による不良モードの分類 ・クラスタリングによる分類 ・クラスタリング×決定木による不良モード間比較 ・様々なクラスタリングアルゴリズムとその活用方法 ・階層的クラスタリング、DBSCAN、混合ガウスモデル 11. 教師なし学習による不良モードの分類 ・Onehotベクトルへの変換 ・アソシエーション分析による不良種別の頻出パターン抽出 12. モデルチューニングの考え方 ・サンプル分割による過学習対策 ・クロスバリデーションによる過学習対策 ・ハイパーパラメータサーチ 13. 時系列センサーデータの分析デモ ・時系列データ分析のアプローチ ・時系列データにおける特徴量抽出の考え方 ・特徴量抽出に基づく不良検知 14. 画像データの分析デモ ・画像分析の基礎知識 ・簡単な画像分類モデルの構築 15. テキスト分析による不具合レポート分析 ・形態素解析による単語分割 ・頻出単語の集計頻度集計 ・ワードクラウドによる特徴語の可視化 ・利用可能なテキストデータソース |
修了認定 |
課題解決プレゼンテーション |