原文


MANUFACTURING

マニュファクチュアリング
データサイエンティスト養成講座

製造業に必須のデータサイエンスを 実践的・効率的に取得

製造業に必須のデータサイエンスを実践的・効率的に取得

製造業に必須のデータサイエンスを
実践的・効率的に習得

本講座はマニュファクチュアリング分野におけるデータサイエンティスト養成講座です。
マニュファクチュアリング分野において用いられる解析手法のしくみ・ 活用方法の理解と共に、
マニュファクチュアリング分野の特性に合わせたデータを用いた具体的演習により、
実践的解析力、問題解決力の習得を目指します。

統計検定2級取得無料サポート

統計検定2級取得
無料サポート

検定2級対応講座無料受講可能

検定2級対応講座
無料受講可能

料金・研修時間・修了認定要件

 
料金40万円(税込)
受講方法

1)対面受講(研修室) 2)オンラインLive受講

  • *講義は同時収録されますので、アーカイブによる復習は、受講終了後1年間、何回でも可能です。
研修時間42時間(3ヶ月)
修了認定要件

下記3 要件を満たした場合、修了認定証を交付

  • ・全科目受講(各科目90%以上出席)
  • ・総合テスト70 点以上
  • ・課題解決プレゼンテーションに合格

<不合格の場合>

  • 1.受講不足の場合は、アーカイブ受講をして頂きます。
  • 2.総合テスト不合格の場合は、再受講をお勧めし、再試験を受けて頂きます。
  • 3.課題解決プレゼンテーションに不合格の場合は、課題レポートを提出して頂きます。
  • 4.総合的に審査し、合格と認められた場合は、修了認定証を交付します。
 
 

講義スケジュール

 

年3回(2月・6月・10月)開講されます。

講義スケジュール

講座説明

(再生時間:9分03秒)

講師メッセージ

(再生時間:2分43秒)

事例演習(例)

過去10年間の年度別製品生産量平均を幾何平均によって求める。技術研修前後の成績についてZ値(偏差値)により比較する。
新型機械の製造部品の重さが製品仕様書の表示どおりか調べる。機械の製造する部品の長さが一定値かどうかサンプルから調べる。
二種類の機械の加工精度の違いの有無について調べる。同材料を加工したときの二種類の機械の性能差について調べる。
工程に対する改善案の実施前後による適合度合について検討する。温度と生産量の関係についてグラフ及び数値で確認する。
接着強度と不純物含有量の関係について回帰分析を行う。接着強度と2種類の材料について回帰分析を行い、材料間の影響力を比較する。
不良品数と稼働時間の関係について分析する。不良種別発生件数データからトレンドの有無を調査する。
集積回路の不適合データにおけるパレート図、工程管理図等から不良傾向の確認を行う。品質を目的変数としランダムフォレストによる不良要因分析モデルを構築する。
電子部品の寸法、品質データから不良に影響を与える因子について考察する。製造・品質データにおいてロジスティック回帰、決定着による分析モデルを構築する。
分析モデルをチューニングしRecallの改善を試みる。部品の寸法、重量データの特徴をK-meansによりグルーピングする。
クラスタ番号を目的変数とし決定木分析からクラスタ間の違いについて考察する。印刷機テストデータについて散布図行列・相関行列により観察する。
設備センサーデータから予知保全モデルを構築する。鋳造部品画像データから不良品を予測する機械学習モデルを構築する。
自動車リコール情報のテキストマイニングから車名別の傾向を比較する。寸法などの結果系データから不良モードを分類する。
製造条件に基づく精密部品の不良発生件数を予測する。原材料・製造工程データから品質管理指標を予測、及び影響因子を探索する。
多クラス分類による全故障モードの判別と、2クラス分類による特定故障を検出する。不良率の算出、良品/不良品のダミー変数化、不良種別の2クラス化を行う。
クラスタリングによる不良モードの分類、決定木による不良モード別の影響因子を分析する。不良率を閾値設定によりカテゴリー値化し、2クラス分類として影響因子を探索する。
アンダーサンプリングにより少数の不良品データと多数の良品データのサンプル数を揃えて分析する。

カリキュラム

科目内容
製造業のための実践統計学

1. データの視覚化(箱ひげ図、ヒストグラム、散布図)

2. 基本統計(平均、分散、標準偏差、Z値、中央値、中央絶対偏差)

3. 分布(正規分布、t分布)

4. 母集団と標本(検定のしくみ、2種類の過誤)

5. t検定(有意確率、区間推定、効果量、検出力)

6. カイ2乗検定(カイ2乗分布、効果量)

7. 相関分析(散布図、積率相関係数、交絡要因と偏相関係数)

8. 重回帰分析(標準化偏回帰係数、決定係数、交互作用のある場合)

製造分野における
データ分析の実践

1. Rとは(R、Rstudioのインストール)

2. Rの基本的な使用方法(Rstudio の使用方法、ライブラリー、データの読込み方法)

3. 基本統計量、グラフ(平均、分散、標準偏差、Z値(偏差値))

4. グラフと外れ値(箱ひげ図、ヒストグラム、散布図、外れ値の検出方法)

5. t検定(有意確率、区間推定、効果量、検定力、対応の有無)

6. 2種類の過誤とサンプルサイズ(効果量・検定力・有意水準によるサンプルサイズの設定方法)

7. ノンパラメトリック検定(ウイルコクソン順位和検定、符号付順位和検定)

8. 分散分析(F値、多重比較(テューキー、ボンフェローニ)、対応の有無)

9. 重回帰分析(ダミー回帰)

10.ロジスティック回帰分析(予測値、オッズ比)

11.主成分分析(主成分負荷量、主成分スコア)

ビッグデータ解析

1. Pythonの基礎

  • Python の導入、Jupyter Notebook の使い方、
    各種ライブラリの紹介:Matplotlib/Pandas/Numpy/scikit-learn

2.データ加工の基本

  • データベースの基礎、複数データの結合、ダミー変数化、カテゴリー値化

3.教師あり学習:数値予測

  • 重回帰分析、ニューラルネットワーク、データの標準化
  • オーバーフィッティング(過学習)と多重共線性、モデルの評価(決定係数)

4.教師あり学習:クラス分類

  • ロジスティック回帰、決定木、ランダムフォレスト (アンサンブル学習)
  • サポートベクターマシン、モデルの評価(Accurary, Precision, Recall, F値)

5.教師なし学習:クラスタリング

  • 非階層的クラスタリング(k-means 法)、階層的クラスタリング
  • モデルの評価(Elbow 法、シルエット係数)

6.教師なし学習:アソシエーション分析

  • Aprioriによるアソシエーション分析、モデルの評価 (支持度、確信度、リフト値)

7.自然言語処理とテキストマイニング

  • 形態素解析、頻出語分析とジップの法則、単語のベクトル化
実践力の養成

1. 製造業におけるデータマイニングと進め方

2. データマイニングで用いる統計学(製造現場における統計学:工程能力指数と公差)

3. 分析課題の理解・分析目的の設定(「品質不良」の捉え方(良品/不良品 など))

4. データの理解・可視化・観察

  • 製造工程の理解とデータの確認
  • グラフによる不良状況の可視化と偏在の確認

5. データの準備・加工

  • 変数の加工(不良率)
  • データ結合(製造データと品質データ)

6. 分析モデルの構築とモデル評価

7. 教師あり:不良要因の分析

  • ロジスティック回帰によるニクラス分類
  • 決定木におけるクラス分類
  • モデルの評価指標(Precision、Recall)
  • 不均衡データのバランシング、重み調整
  • アンサンブル学習による精度向上

8. 教師なし:不良モードの分類

  • K-means法アルゴリズム、Elbow法
  • クラスタリングによる不良モードの分類
  • クラスタリング x 決定木による不良モード間の差異分析
  • 精度向上に向けたモデルチューニング

9. 時系列センサーデータの分析

  • 分析に適したデータ形式と分析単位
  • 時系列データにおける特徴量抽出の考え方
  • 特徴量抽出に基づく異常検知

10. 画像データ分析の基本

  • 画像分析の基礎知識
  • ディープラーニングによる画像分析
  • 画像から不良品を判別する機械学習モデル

11. テキスト分析による不具合レポート分析

  • 自然言語処理(NLP)
  • 形態素解析による単語分割
  • 頻出単語の集計頻度集計
  • ワードクラウドによる特徴語の可視化
  • 利用可能なテキストデータソースの取得方法
修了認定

総合テスト・課題解決プレゼンテーション