原文


マニュファクチュアリングデータサイエンス実践力養成講座|カリキュラム


科目 内容
製造業のための実践統計学

1. データの視覚化(箱ひげ図、ヒストグラム、散布図)

2. 基本統計(平均、分散、標準偏差、Z値、中央値、中央絶対偏差)

3. 分布(正規分布、t分布)

4. 母集団と標本(検定のしくみ、2種類の過誤)

5. t検定(有意確率、区間推定、効果量、検出力)

6. カイ2乗検定(カイ2乗分布、効果量)

7. 相関分析(散布図、積率相関係数、交絡要因と偏相関係数)

8. 重回帰分析(標準化偏回帰係数、決定係数、交互作用のある場合)

製造分野における
データ分析の実践

1. Rとは(R、Rstudioのインストール)

2. Rの基本的な使用方法(Rstudio の使用方法、ライブラリー、データの読込み方法)

3. 基本統計量、グラフ(平均、分散、標準偏差、Z値(偏差値))

4. グラフと外れ値(箱ひげ図、ヒストグラム、散布図、外れ値の検出方法)

5. t検定(有意確率、区間推定、効果量、検定力、対応の有無)

6. 2種類の過誤とサンプルサイズ(効果量・検定力・有意水準によるサンプルサイズの設定方法)

7. ノンパラメトリック検定(ウイルコクソン順位和検定、符号付順位和検定)

8. 分散分析(F値、多重比較(テューキー、ボンフェローニ)、対応の有無)

9. 重回帰分析(ダミー回帰)

10.ロジスティック回帰分析(予測値、オッズ比)

11.主成分分析(主成分負荷量、主成分スコア)

ビッグデータ解析

1. Pythonの基礎

  • Python の導入、Jupyter Notebook の使い方、
    各種ライブラリの紹介:Matplotlib/Pandas/Numpy/scikit-learn

2.データ加工の基本

  • データベースの基礎、複数データの結合、ダミー変数化、カテゴリー値化

3.教師あり学習:数値予測

  • 重回帰分析、ニューラルネットワーク、データの標準化
  • オーバーフィッティング(過学習)と多重共線性、モデルの評価(決定係数)

4.教師あり学習:クラス分類

  • ロジスティック回帰、決定木、ランダムフォレスト (アンサンブル学習)
  • サポートベクターマシン、モデルの評価(Accurary, Precision, Recall, F値)

5.教師なし学習:クラスタリング

  • 非階層的クラスタリング(k-means 法)、階層的クラスタリング
  • モデルの評価(Elbow 法、シルエット係数)

6.教師なし学習:アソシエーション分析

  • Aprioriによるアソシエーション分析、モデルの評価 (支持度、確信度、リフト値)

7.自然言語処理とテキストマイニング

  • 形態素解析、頻出語分析とジップの法則、単語のベクトル化
実践力の養成

1. 製造業におけるデータマイニングと進め方

2. データマイニングで用いる統計学(製造現場における統計学:工程能力指数と公差)

3. 分析課題の理解・分析目的の設定(「品質不良」の捉え方(良品/不良品 など))

4. データの理解・可視化・観察

  • 製造工程の理解とデータの確認
  • グラフによる不良状況の可視化と偏在の確認

5. データの準備・加工

  • 変数の加工(不良率)
  • データ結合(製造データと品質データ)

6. 分析モデルの構築とモデル評価

7. 教師あり:不良要因の分析

  • ロジスティック回帰によるニクラス分類
  • 決定木におけるクラス分類
  • モデルの評価指標(Precision、Recall)
  • 不均衡データのバランシング、重み調整
  • アンサンブル学習による精度向上

8. 教師なし:不良モードの分類

  • K-means法アルゴリズム、Elbow法
  • クラスタリングによる不良モードの分類
  • クラスタリング x 決定木による不良モード間の差異分析
  • 精度向上に向けたモデルチューニング

9. 時系列センサーデータの分析

  • 分析に適したデータ形式と分析単位
  • 時系列データにおける特徴量抽出の考え方
  • 特徴量抽出に基づく異常検知

10. 画像データ分析の基本

  • 画像分析の基礎知識
  • ディープラーニングによる画像分析
  • 画像から不良品を判別する機械学習モデル

11. テキスト分析による不具合レポート分析

  • 自然言語処理(NLP)
  • 形態素解析による単語分割
  • 頻出単語の集計頻度集計
  • ワードクラウドによる特徴語の可視化
  • 利用可能なテキストデータソースの取得方法

12. 画像解析
  1)画像解析とデータサイエンスの基礎
   ・画像解析の概念とその応用
   ・デジタル画像の基本的な性質と構造
   ・Pythonの基本的な画像操作ライブラリ(PIL, OpenCVなど)の紹介
  2)Pythonを使った基本的な画像処理
   ・画像の読み込み、表示、保存
   ・画像の色空間、リサイズ、クロップなどの操作
   ・画像のフィルタリングとエッジ検出
  3)特徴抽出と画像分類
   ・特徴抽出の基本(SIFT, SURFなど)
   ・テクスチャ、色、形状に基づく特徴
   ・特徴を基にした画像分類(SVM、ランダムフォレストなど)
  4)深層学習と画像解析
   ・ニューラルネットワークと深層学習の紹介
   ・畳み込みニューラルネットワーク(CNN)とその仕組み
   ・TensorFlowやPyTorchを使用したCNNの実装

13. 音声解析
  1)音声解析とデータサイエンスの基礎
   ・音声解析の概念とその応用
   ・デジタル音声の基本的な性質と構造
   ・Pythonの基本的な音声操作ライブラリ(librosa、scipy、pydubなど)の紹介
  2)Pythonを使った基本的な音声処理
   ・音声の読み込み、再生、保存
   ・音声の波形分析、スペクトログラム分析
   ・音声の特徴抽出(音高、タイミング、メル周波数ケプストラル係数(MFCC)など)
  3)音声分類と音声情報処理
   ・音声を用いた感情分析
   ・音声認識とその基礎(音素、単語、フレーズの識別)
   ・Pythonによる音声認識ライブラリ(Google Speech Recognitionなど)の紹介と使用方法
  4)深層学習と音声解析
   ・リカレントニューラルネットワーク(RNN)とその音声解析への適用
   ・音声合成(Text-to-Speech)と音声認識(Speech-to-Text)の最新技術
   ・TensorFlowやPyTorchを使用したRNNの実装

修了認定

課題解決プレゼンテーション