ビジネスパーソン向けデータサイエンティスト育成講座

カリキュラム

 ・初心者の方向けに基礎から解説します。
 ・実践的な事例を用いた数多くの演習により実務に役立つ実践力の習得を目的としています。
 *学習時間は目安です。(個人差があります)  

科目 内容 学習時間
実践統計学

EXCELを用いた事例演習により統計学のしくみを理解します。

  • データの特徴の把握(外れ値、分布の把握)
     箱ひげ図、ヒストグラム
  • データ群の特徴の把握方法
     いろいろな平均、バラツキ(分散、標準偏差)、データの評価方法(偏差値、Z値)、正規分布
  • データ群の平均値の差の検討方法
     t検定(対応の有無)、P値(有意確率)、効果量
  • クロス集計データの検討方法
     適合度検定(比率の差の検定)、効果量
  • 相関分析
     散布図、積率相関係数、疑似相関(交絡要因)
  • 回帰分析
     回帰分析のしくみ、回帰モデルの評価方法、多重共線性がある場合、カテゴリがある場合
27
Rによる統計学演習

統計分析ツールRを用いて実践的分析力を習得します。

  • RとRstudioの基本操作
     関数、変数の基礎、データ形式とデータフレーム
  • データ群の特性把握
     可視化、代表値、分散、標準偏差、標準化(Z値)
  • 統計的検定
     t検定(対応の有無)、検定のしくみ(2種類の過誤)、効果量、検定力、適正なサンプルサイズ
  • ノンパラメトリック検定
     ウイルコクソン検定(対応の有無)
  • 相関分析
     積率相関係数、順位相関係数、偏相関係数
  • 回帰分析
     回帰モデルの解釈、標準化回帰分析、交互作用のある場合
  • ロジスティック回帰分析
     モデルのしくみと解釈方法、予測値の算出とオッズ比
  • 主成分分析
     説明変数の次元圧縮
  • クラスター分析
     階層クラスター分析、非階層クラスター分析
  • データの可視化
     エラーバーの追加、層別散布図、ヒートマップ
PythonによるAI手法

Pythonによる各AI手法のしくみの理解、実務への応用・実践力を習得します。

  • AIの基礎
     知識機械学習とは
     機械学習・ディープラーニングの違い、機械学習の手法
     Googlecoraboratory、Jupyterlabの使い方
  • Pythonの基礎
     算術演算、比較演算、論理演算、Print関数、コメントアウト、空白
     変数、データの型
     if、for、while、関数、組み込み関数
     クラス、継承、モジュール・パッケージ・ライブラリー、import
  • Pythonの応用
     numpyとは、ndarray、基本的な演算、インデックス・スライス、2次元配列
     pandasとは、ファイル読込み、DataFrameの操作、抽出と代入、欠損値
     matplotlibとは、グラフ表示、詳細設定、seaborn、相関係数とヒートマップ
  • 教師あり学習
     単回帰帰分析、重回帰分析、回帰モデルの解釈
     ロジスティック回帰、ラッソ回帰・リッジ回帰
     K近傍法、サポートベクターマシン、決定木
     ランダムフォレスト、勾配ブースティング決定木
  • 教師なし学習
     教師なし学習とは
     クラスタリング、次元削減、アソシエイション分析
  • モデルの検証とチューニング
     評価指標、モデルの評価方法、エンコーディング
     アンサンブル、ハイパーパラメータチューニング
  • SQL
     データベースとSQL、SELECT、CRUD
     テーブル操作、JOIN
  • 画像処理
     画像データ、画像処理、深層学習モデルの概要
     画像分類、物体検出
  • 自然言語処理
     自然言語処理とは
     形態素解析、Bag-of-Words、コサイン類似度
     tf-idf、Word2Vec、BERT
  • Webスクレイピング・WebAPI
     WebスクレイピングとWebAPIとは
     HTML、Beautiful Soup、CSS、TwitterAPI
  • Webアプリ作成
     Streamlitとは、Streamlitの機能、デプロイ
  • 音声処理
     音声処理とは
     波形データの可視化、スペクトログラム
     音声認識、テキスト音声合成
  • 異常検知
     異常検知とは
     ホテリングのT2法、K近傍法
     one-class SVM、オートエンコーダー
43
実践演習

オープンデータ等を用いた具体的なケースに対する事例演習を行い、実務課題を解決するための実践的な分析能力を習得します。

  • オープンデータ
     e-Stat、統計教育用標準データセット、全国の人流オープンデータ
     国立情報学研究所データセット、各省庁HPデータ、Kaggle Datasets
  • テーブルデータの分析
     データの整形、欠損値とデータ型の確認
     分布の確認、地図上の可視化
     相関係数、重回帰モデル
  • 人流データの分析
     人流データとは
     データ構造の理解、データの結合
     コロナ禍の影響の分析
  • 機械学習の流れ
     心臓発作のリスク予測
    銀行口座の解約予測
  • スパムSMSの分類
     データの理解、EDA、分類モデルの構築、tf-idf
  • 画像処理
     YOLO、物体検出、セグメンテーション、画像分類、姿勢推定
12
生成AIの基礎

生成AIの基礎について習得します。

  • 生成AIの概要と仕組み
     生成AIの定義、大規模言語モデル(LLM)の仕組み・動作原理と特徴、従来のAIとの違い
  • 主要な生成AIの特徴
     生成AIによる統計解析コードの生成
  • 生成AIへの的確な指示
     期待する回答を得るための指示出し(プロンプト)の基本ルールといくつかの方式、プロンプトの重要性の理解
  • 日常業務・生活での活用
     文書作成・要約・翻訳・検索・アイデア出しなどの具体的な活用シーン、具体例
  • リスク管理と倫理
     ビジネスで安全に生成AIを運用するための必須知識(ハルシネーションへの対処法・情報漏洩対策・著作権・利用マナー)
12
生成AIを用いた分析

生成AIを活用した分析方法について習得します。

  • AI連携開発環境の構築
     生成AIの連携・使用方法
  • 生成AIによる統計解析コーディング
     生成AIによる統計解析コードの生成
  • 生成AIによる可視化コード生成
     生成AIが得意とするインタラクティブなグラフ作成や複雑な図解の自動化
  • デバッグと試行錯誤のプロセス
     失敗例をもとにエラーをAIと対話しながら修正していく実践的プロセス
  • 生成AIによる回帰分析
     実際の状況を想定したケーススタディ。生成AIを用いて、教師あり学習のデータ解析を実行する演習
  • 機械学習ケーススタディ
     実際の状況を想定したケーススタディ。生成AIを用いて、教師あり学習のデータ解析を実行する演習
  • 総合演習
     オープンデータに対する前処理と分析の実践演習
課題解決プレゼンテーション

課題の設定に対する適切な分析手法の選定、的確な解釈等、実務への実践能力を習得します。

  • 受講者各自に解決すべき課題の設定
  • 分析方法の立案、 分析の実施、分析結果の解釈
  • レポートの作成、プレゼンテーションの実施
30
124