データ分析力養成講座|カリキュラム

 ・初心者の方向けに基礎から解説します。
 ・具体的な事例、数多くの演習により実務に役立つ実践力の養成を目的としています。
 *学習時間は目安です。 

科目 内容 学習時間
実践統計学

EXCELを用いた事例演習により統計学のしくみを理解します。

  • データの特徴の把握(外れ値、分布の把握)
     箱ひげ図、ヒストグラム
  • データ群の特徴の把握方法
     いろいろな平均、バラツキ(分散、標準偏差)、データの評価方法(偏差値、Z値)、正規分布
  • データ群の平均値の差の検討方法
     t検定(対応の有無)、P値(有意確率)、効果量
  • クロス集計データの検討方法
     適合度検定(比率の差の検定)、効果量
  • 相関分析
     散布図、積率相関係数、疑似相関(交絡要因)
  • 回帰分析
     回帰分析のしくみ、回帰モデルの評価方法、多重共線性がある場合、カテゴリがある場合
6
Rによるデータ分析

統計分析ツールRを用いて実践的分析力を習得します。

  • RとRstudioの基本操作
     関数、変数の基礎、データ形式とデータフレーム
  • データ群の特性把握
     可視化、代表値、分散、標準偏差、標準化(Z値)
  • 統計的検定
     t検定(対応の有無)、検定のしくみ(2種類の過誤)、効果量、検定力、適正なサンプルサイズ
  • ノンパラメトリック検定
     ウイルコクソン検定(対応の有無)
  • 相関分析
     積率相関係数、順位相関係数、偏相関係数
  • 回帰分析
     回帰モデルの解釈、標準化回帰分析、交互作用のある場合
  • ロジスティック回帰分析
     モデルのしくみと解釈方法、予測値の算出とオッズ比
  • 主成分分析
     説明変数の次元圧縮
  • クラスター分析
     階層クラスター分析、非階層クラスター分析
  • データの可視化
     エラーバーの追加、層別散布図、ヒートマップ
12
PythonによるAI講座

Pythonによる各AI手法のしくみの理解、実務への応用・実践力を習得します。

  • AIの基礎
     知識機械学習とは
     機械学習・ディープラーニングの違い、機械学習の手法
     Googlecoraboratory、Jupyterlabの使い方
  • Pythonの基礎
     算術演算、比較演算、論理演算、Print関数、コメントアウト、空白
     変数、データの型
     if、for、while、関数、組み込み関数
     クラス、継承、モジュール・パッケージ・ライブラリー、import
  • Pythonの応用
     numpyとは、ndarray、基本的な演算、インデックス・スライス、2次元配列
     pandasとは、ファイル読込み、DataFrameの操作、抽出と代入、欠損値
     matplotlibとは、グラフ表示、詳細設定、seaborn、相関係数とヒートマップ
  • 教師あり学習
     単回帰帰分析、重回帰分析、回帰モデルの解釈
     ロジスティック回帰、ラッソ回帰・リッジ回帰
     K近傍法、サポートベクターマシン、決定木
     ランダムフォレスト、勾配ブースティング決定木
  • 教師なし学習
     教師なし学習とは
     クラスタリング、次元削減、アソシエイション分析
  • モデルの検証とチューニング
     評価指標、モデルの評価方法、エンコーディング
     アンサンブル、ハイパーパラメータチューニング
  • SQL
     データベースとSQL、SELECT、CRUD
     テーブル操作、JOIN
  • 画像処理
     画像データ、画像処理、深層学習モデルの概要
     画像分類、物体検出
  • 自然言語処理
     自然言語処理とは
     形態素解析、Bag-of-Words、コサイン類似度
     tf-idf、Word2Vec、BERT
  • Webスクレイピング・WebAPI
     WebスクレイピングとWebAPIとは
     HTML、Beautiful Soup、CSS、TwitterAPI
  • Webアプリ作成
     Streamlitとは、Streamlitの機能、デプロイ
  • 音声処理
     音声処理とは
     波形データの可視化、スペクトログラム
     音声認識、テキスト音声合成
  • 異常検知
     異常検知とは
     ホテリングのT2法、K近傍法
     one-class SVM、オートエンコーダー
42
実践演習

オープンデータ等を用いた具体的なケースに対する事例演習を行い、実務課題を解決するための実践的な分析能力を習得します。

  • オープンデータとは
     政府統計(国勢調査、物価指数、貿易統計・・)、企業・経済(東証、日銀、経産省、Jetro・・)
     地理情報(地理院地図、都道府県別GIS、基盤地図情報、気象庁・・)
     医療(厚労省、eStat医療、医療機関情報・・)、環境(環境省、気象庁・・)
     交通(国交省、eStat交通・・)、スマートシティ(横浜、神戸、なごや、大阪・・)、その他
  • オープンデータの加工
     欠損値の抽出、インデックス表示
     欠損値の補完(平均値、中央値、最頻値)補完後の分布の比較
     K近傍法を用いた補完と可視化、Cabin列欠損値ランダム補完
     Unknown補完、ランダムフォレストによる補完
  • 政府統計のデータ活用
     全国人口推計データのダウンロード、各種グラフ表示
  • 自治体ポータルサイトのデータ活用
     バス停の表示、店舗ファイルのリスト、地図表示
  • ネットニュースのヘッドラインを抽出
     Beautiful Soupによる解析、タグを探して抽出
  • ネットからの画像収集
     Beautiful Soup、icrawlerを使用して犬の画像を集める
  • Web APIによるデータ処理
     OpenWeatherMapのデータ活用、ニューヨークの天気情報法の収集、
     日本標準時に変換した天気表示、郵便番号検索API、
     気象庁APIによるヘッドラインの取得、気象庁アメダスデータ、二酸化炭素データ
     世界の年平均気温OpenBD、HeartRails Express
     コンビニスィーツマップの作成、Geolonia 住所データ
     日本地図、厚生労働省COVID-19
  • 医療画像データオープンデータ処理
     Beautiful DICOM画像の読込みと表示、画像データのフィルタリング、エッジ検出
     日本放射線学会MiniJSRT_databaseを利用する
     マトリックスサイズを変換、水平方向・垂直方法の断面分布を作成、描画画像のリサイズ
  • 異常値検知
     ニューヨーク市のタクシー乗車データ、心臓病データ、 エネルギー効率データ、
     赤ワインと白ワインの品質データ、ボストン住宅価格、株式価格
12
課題解決プレゼンテーション

課題の設定に対する適切な分析手法の選定、的確な解釈等、実務への実践能力を習得します。

  • 受講者各自に解決すべき課題の設定
  • 分析方法の立案、 分析の実施、分析結果の解釈
  • レポートの作成、プレゼンテーションの実施
(42)
(112)

*個人差がありますが、課題解決プレゼンテーションの作成に別途約30時間程必要です。

標準学習進度表(50ステップ)