実践統計学 |
EXCELを用いた事例演習により統計学のしくみを理解します。
- データの特徴の把握(外れ値、分布の把握)
箱ひげ図、ヒストグラム
- データ群の特徴の把握方法
いろいろな平均、バラツキ(分散、標準偏差)、データの評価方法(偏差値、Z値)、正規分布
- データ群の平均値の差の検討方法
t検定(対応の有無)、P値(有意確率)、効果量
- クロス集計データの検討方法
適合度検定(比率の差の検定)、効果量
- 相関分析
散布図、積率相関係数、疑似相関(交絡要因)
- 回帰分析
回帰分析のしくみ、回帰モデルの評価方法、多重共線性がある場合、カテゴリがある場合
|
6 |
Rによるデータ分析 |
統計分析ツールRを用いて実践的分析力を習得します。
- RとRstudioの基本操作
関数、変数の基礎、データ形式とデータフレーム
- データ群の特性把握
可視化、代表値、分散、標準偏差、標準化(Z値)
- 統計的検定
t検定(対応の有無)、検定のしくみ(2種類の過誤)、効果量、検定力、適正なサンプルサイズ
- ノンパラメトリック検定
ウイルコクソン検定(対応の有無)
- 相関分析
積率相関係数、順位相関係数、偏相関係数
- 回帰分析
回帰モデルの解釈、標準化回帰分析、交互作用のある場合
- ロジスティック回帰分析
モデルのしくみと解釈方法、予測値の算出とオッズ比
- 主成分分析
説明変数の次元圧縮
- クラスター分析
階層クラスター分析、非階層クラスター分析
- データの可視化
エラーバーの追加、層別散布図、ヒートマップ
|
12 |
PythonによるAI講座 |
Pythonによる各AI手法のしくみの理解、実務への応用・実践力を習得します。
- AIの基礎
知識機械学習とは
機械学習・ディープラーニングの違い、機械学習の手法
Googlecoraboratory、Jupyterlabの使い方
- Pythonの基礎
算術演算、比較演算、論理演算、Print関数、コメントアウト、空白
変数、データの型
if、for、while、関数、組み込み関数
クラス、継承、モジュール・パッケージ・ライブラリー、import
- Pythonの応用
numpyとは、ndarray、基本的な演算、インデックス・スライス、2次元配列
pandasとは、ファイル読込み、DataFrameの操作、抽出と代入、欠損値
matplotlibとは、グラフ表示、詳細設定、seaborn、相関係数とヒートマップ
- 教師あり学習
単回帰帰分析、重回帰分析、回帰モデルの解釈
ロジスティック回帰、ラッソ回帰・リッジ回帰
K近傍法、サポートベクターマシン、決定木
ランダムフォレスト、勾配ブースティング決定木
- 教師なし学習
教師なし学習とは
クラスタリング、次元削減、アソシエイション分析
- モデルの検証とチューニング
評価指標、モデルの評価方法、エンコーディング
アンサンブル、ハイパーパラメータチューニング
- SQL
データベースとSQL、SELECT、CRUD
テーブル操作、JOIN
- 画像処理
画像データ、画像処理、深層学習モデルの概要
画像分類、物体検出
- 自然言語処理
自然言語処理とは
形態素解析、Bag-of-Words、コサイン類似度
tf-idf、Word2Vec、BERT
- Webスクレイピング・WebAPI
WebスクレイピングとWebAPIとは
HTML、Beautiful Soup、CSS、TwitterAPI
- Webアプリ作成
Streamlitとは、Streamlitの機能、デプロイ
- 音声処理
音声処理とは
波形データの可視化、スペクトログラム
音声認識、テキスト音声合成
- 異常検知
異常検知とは
ホテリングのT2法、K近傍法
one-class SVM、オートエンコーダー
|
42 |
実践演習 |
オープンデータ等を用いた具体的なケースに対する事例演習を行い、実務課題を解決するための実践的な分析能力を習得します。
- オープンデータとは
政府統計(国勢調査、物価指数、貿易統計・・)、企業・経済(東証、日銀、経産省、Jetro・・)
地理情報(地理院地図、都道府県別GIS、基盤地図情報、気象庁・・)
医療(厚労省、eStat医療、医療機関情報・・)、環境(環境省、気象庁・・)
交通(国交省、eStat交通・・)、スマートシティ(横浜、神戸、なごや、大阪・・)、その他
- オープンデータの加工
欠損値の抽出、インデックス表示
欠損値の補完(平均値、中央値、最頻値)補完後の分布の比較
K近傍法を用いた補完と可視化、Cabin列欠損値ランダム補完
Unknown補完、ランダムフォレストによる補完
- 政府統計のデータ活用
全国人口推計データのダウンロード、各種グラフ表示
- 自治体ポータルサイトのデータ活用
バス停の表示、店舗ファイルのリスト、地図表示
- ネットニュースのヘッドラインを抽出
Beautiful Soupによる解析、タグを探して抽出
- ネットからの画像収集
Beautiful Soup、icrawlerを使用して犬の画像を集める
- Web APIによるデータ処理
OpenWeatherMapのデータ活用、ニューヨークの天気情報法の収集、
日本標準時に変換した天気表示、郵便番号検索API、
気象庁APIによるヘッドラインの取得、気象庁アメダスデータ、二酸化炭素データ
世界の年平均気温OpenBD、HeartRails Express
コンビニスィーツマップの作成、Geolonia 住所データ
日本地図、厚生労働省COVID-19
- 医療画像データオープンデータ処理
Beautiful DICOM画像の読込みと表示、画像データのフィルタリング、エッジ検出
日本放射線学会MiniJSRT_databaseを利用する
マトリックスサイズを変換、水平方向・垂直方法の断面分布を作成、描画画像のリサイズ
- 異常値検知
ニューヨーク市のタクシー乗車データ、心臓病データ、
エネルギー効率データ、 赤ワインと白ワインの品質データ、ボストン住宅価格、株式価格
|
12 |
課題解決プレゼンテーション |
課題の設定に対する適切な分析手法の選定、的確な解釈等、実務への実践能力を習得します。
- 受講者各自に解決すべき課題の設定
- 分析方法の立案、 分析の実施、分析結果の解釈
- レポートの作成、プレゼンテーションの実施
|
(42) |
|
計 |
(112) |