マーケティング・データサイエンティスト育成講座|カリキュラム
科目 | 内容 |
---|---|
実践統計学 |
1.データの視覚化(箱ひげ図、ヒストグラム、散布図) 2.基本統計(平均、分散、標準偏差、Z値、中央値、中央絶対偏差) 3.分布(正規分布、t分布) 4.母集団と標本(検定のしくみ、2種類の過誤) 5.t検定(有意確率、区間推定、効果量、検出力) 6.カイ2乗検定(カイ2乗分布、効果量) 7.相関分析(散布図、積率相関係数、交絡要因と偏相関係数) 8.重回帰分析(標準化偏回帰係数、決定係数、交互作用のある場合) |
AI手法 |
1.Pythonの基礎 ・Python の導入、Jupyter Notebook の使い方、 各種ライブラリの紹介:Matplotlib/Pandas/Numpy/scikit-learn2.データ加工の基本 ・データベースの基礎、複数データの結合、ダミー変数化、カテゴリー値化3.教師あり学習:数値予測 ・重回帰分析、ニューラルネットワーク、データの標準化・オーバーフィッティング(過学習)と多重共線性、モデルの評価(決定係数) 4.教師あり学習:クラス分類 ・ロジスティック回帰、決定木、ランダムフォレスト (アンサンブル学習)・サポートベクターマシン、モデルの評価(Accurary, Precision, Recall, F値) 5.教師なし学習:クラスタリング ・非階層的クラスタリング(k-means 法)、階層的クラスタリング・モデルの評価(Elbow 法、シルエット係数) 6.教師なし学習:アソシエーション分析 ・Aprioriによるアソシエーション分析、モデルの評価 (支持度、確信度、リフト値)7.自然言語処理とテキストマイニング ・形態素解析、頻出語分析とジップの法則、単語のベクトル化 |
実践力の養成 |
1.デジタルマーケティングとは ・デジタル時代の購買行動・データドリブンとオムニチャネル 2.顧客分類と成約要因の分析 ・ロジスティック回帰、決定木による成約要因の分析・不均衡データへの対応 ・クラスタリングによる顧客分類 ・クラスタリング x 決定木によるグループ間の差異分析 3.売上と広告効果の分析 ・時系列データの可視化・マーケティングミックスモデリング ・説明変数の追加、加工によるモデルチューニング ・残存効果と非線形性の考慮考慮したマーケティングミックスモデリング ・過学習への対応 ・ニューラルネットワークによる精度向上 4.アソシエーション分析による併売分析 ・One Hotベクトルへのデータ加工・アソシエーション分析の評価指標 ・アソシエーション分析による併売ルール抽出 5.レコメンデーションモデルの構築 ・ユーザーベース協調フィルタリングによるレコメンデーション6.ECサイトレビュー分析 ・形態素解析による単語分割・頻出単語の集計頻度集計 ・ワードクラウドによる特徴語の可視化 ・利用可能なテキストデータソース 7.オープンデータ 1)オープンデータの例・e-Stat(政府統計の総合窓口) ・統計センター教育用標準データセット ・全国の人流オープンデータ ・各省庁のHPデータ、Kaggle Datasets 2)テーブルデータの分析 ・データの整形 ・欠損値とデータ型の確認 ・分布の確認 ・地図上の可視化 ・相関、回帰モデル 3)人流データの分析 ・人流データとは ・データ構造の理解 ・データの結合 ・コロナ禍の影響の分析 4)機械学習の流れ データの読み込み~ 探索的データ分析~データの前処理~学習 モデルの評価~精度の改善~モデルの完成 ・心臓発作のリスク予測 ・銀行口座の解約予測 5)スパムSMSの分類 ・データの理解 ・EDA ・分類モデルの構築 ・tf-idf 8.効果検証 1)効果検証の概要2)A/Bテストによる効果検証 ・施策と効果、バイアス ・A/Bテストのデザイン(A/Aテスト、層化テスト、クラスター化テスト) ・実務における課題 ・共変量 3)DID(差分の差法) ・基本的な発想 ・期間データにおける分析 ・パラレルトレンド過程と検証 4)RDD(回帰不連続デザイン) ・RDDの概要 ・SharpRDD(rdrobust) ・McCraryの検定 ・Fuzzy RDD ・bunching 9.アンケート調査法 ・調査の分類、バイアス、質問項目の作成法・回答形式(単一回答、複数回答、自由記述)、 尺度化の方法(順位尺度、段階尺度、SD法、VAS法等) ・調査結果の集計方法 (箱ひげ図、ヒストグラムによる外れ値の検討、散布図による把握) ・平均値の違いについての検討 (t検定、対応の有無、有意確率、効果量、検定力) ・クロス集計表による検討(カイ2 乗検定、有意確率、効果量) ・2群以上の因果関係の検討(相関分析、重回帰分析、交絡要因、ダミー変数) ・サンプルサイズの設定方法(効果量、検定力、有意水準の設定 10.販売予測・需要予測 ・対数グラフによる観察法(差と比率の違い、グラフから予測する方法)・指数平滑法 ・時系列分析析(移動平均法、季節指数、TCSI 分離法による予測) ・回帰モデルによる予測(トレンド、季節指数を用いた予測、ダミー変数を用いた予測 11.意思決定法 ・統計的意思決定法・階層化意思決定法(AHP) |
修了認定 |
課題解決プレゼンテーション
|