ビジネスデータサイエンス実践力養成講座|カリキュラム
| 科目 | 内容 |
|---|---|
| 実践統計学 |
1.データの視覚化(箱ひげ図、ヒストグラム、散布図) 2.基本統計(平均、分散、標準偏差、Z値、中央値) 3.分布(正規分布、t分布) 4.母集団と標本(検定のしくみ、2種類の過誤) 5.t検定(有意確率、区間推定、効果量、検出力) 6.カイ2乗検定(カイ2乗分布、効果量) 7.相関分析(散布図、積率相関係数、交絡要因と偏相関係数) 8.重回帰分析(標準化偏回帰係数、自由度調整済み決定係数、t検定、交互作用のある場合、ダミー変数) |
| ビジネスにおける データ分析の実践 |
1.Rとは(R、Rstudioのインストール) 2.Rの基本的な使用方法(Rstudio の使用方法、ライブラリー、データの読込み方法) 3.基本統計量、グラフ(平均、分散、標準偏差、Z値(偏差値)) 4.グラフと外れ値(箱ひげ図、ヒストグラム、散布図、外れ値の検出方法) 5.t検定(有意確率、区間推定、効果量、検定力、対応の有無) 6.2種類の過誤とサンプルサイズ(効果量・検定力・有意水準によるサンプルサイズの設定方法) 7.ノンパラメトリック検定(ウイルコクソン順位和検定、符号付順位和検定) 8.重回帰分析(ダミー回帰) 9.ロジスティック回帰分析(予測値、オッズ比) 10.主成分分析(主成分負荷量、寄与率、主成分スコア) 11.生成AIによるRコード生成 |
| ビッグデータ解析 |
1.Pythonの基礎 ・Python の導入、Jupyter Notebook の使い方、 各種ライブラリの紹介:Matplotlib/Pandas/Numpy/scikit-learn2.データ加工の基本 ・データベースの基礎、複数データの結合、ダミー変数化、カテゴリー値化3.教師あり学習:数値予測 ・重回帰分析、ニューラルネットワーク、データの標準化・オーバーフィッティング(過学習)と多重共線性、モデルの評価(決定係数) 4.教師あり学習:クラス分類 ・ロジスティック回帰、決定木、ランダムフォレスト (アンサンブル学習)・サポートベクターマシン、モデルの評価(Accurary, Precision, Recall, F値) 5.教師なし学習:クラスタリング ・非階層的クラスタリング(k-means 法)、階層的クラスタリング・モデルの評価(Elbow 法、シルエット係数) 6.教師なし学習:アソシエーション分析 ・Aprioriによるアソシエーション分析、モデルの評価 (支持度、確信度、リフト値)7.自然言語処理とテキストマイニング ・形態素解析、頻出語分析とジップの法則、単語のベクトル化 |
| 生成AIの活用 |
1.生成AI基礎 ・生成AIの概要と仕組み、主要な生成AIの特徴・プロンプトの基本ルールといくつかの方式、プロンプトの重要性の理解 ・業務への活用(文書作成・ようやく・検索等) ・リスク管理と倫理(ハルシネーションへの対処法・情報漏洩対策・著作権・利用マナー) 2.生成AIを用いたデータ分析 ・データベースの基礎、複数データの結合、ダミー変数化、カテゴリー値化・生成AIによる統計解析コーディング ・生成AIによる可視化コード生成 ・デバッグと試行錯誤のプロセス ・生成AIによる回帰分析(pythonコードを生成、実行) ・機械学習ケーススタディ(教師あり学習のデータ解析演習) ・総合演習(オープンデータに対する前処理と分析の実践演習) |
| 実践力の養成 |
1.デジタルマーケティングとは ・デジタル時代の購買行動、データドリブンとオムニチャネル2.顧客分類と成約要因の分析 ・ロジスティック回帰、決定木による成約要因の分析・不均衡データへの対応 ・クラスタリングによる顧客分類、クラスタリング x 決定木によるグループ間の差異分析 3.売上と広告効果の分析 ・時系列データの可視化・マーケティングミックスモデリング、説明変数の追加、加工によるモデルチューニング ・残存効果と非線形性の考慮考慮したマーケティングミックスモデリング ・過学習への対応、ニューラルネットワークによる精度向上 4.アソシエーション分析による併売分析 ・One Hotベクトルへのデータ加工・アソシエーション分析の評価指標、併売ルール抽出 5.レコメンデーションモデルの構築 ・ユーザーベース協調フィルタリングによるレコメンデーション6.ECサイトレビュー分析 ・形態素解析による単語分割、頻出単語の集計頻度集計・ワードクラウドによる特徴語の可視化、利用可能なテキストデータソース 7.テーブルデータの分析 ・データの整形、欠損値とデータ型の確認・分布の確認、地図上の可視化 ・相関係数、重回帰モデル 8.人流データの分析 ・人流データとは、データ構造の理解、データの結合、コロナ禍の影響の分析・Pythonを使った基本的な音声処理 9.機械学習の流れ ・心臓発作のリスク予測、銀行口座の解約予測10.スパムSMSの分類 ・データの理解、EDA、スパムSMS分類モデルの構築、tf-idf11.画像処理 ・YOLO、物体検出、セグメンテーション・画像分類、姿勢推定 12.アンケート調査法 ・調査の分類、バイアス、質問項目の作成法・回答形式(単一回答、複数回答、自由記述)、 尺度化の方法(順位尺度、段階尺度、SD法、VAS法等) ・調査結果の集計方法 (箱ひげ図、ヒストグラムによる外れ値の検討、散布図による把握) ・平均値の違いについての検討 (t検定、対応の有無、有意確率、効果量、検定力) ・クロス集計表による検討(カイ2 乗検定、有意確率、効果量) ・2群以上の因果関係の検討(相関分析、重回帰分析、交絡要因、ダミー変数) ・サンプルサイズの設定方法(効果量、検定力、有意水準の設定 13.販売予測・需要予測 ・対数グラフによる観察法(差と比率の違い、グラフから予測する方法)・指数平滑法 ・時系列分析(移動平均法、季節指数、TCSI 分離法による予測) ・回帰モデルによる予測(トレンド、季節指数を用いた予測、ダミー変数を用いた予測 14.意思決定法 ・統計的意思決定法、階層化意思決定法(AHP) |
| 修了認定 |
課題解決プレゼンテーション ・課題の設定、データ前処理、分析手法の選択、分析結果の解釈、レポートの作成、プレゼン発表 |
