原文


10.散布図と積率相関係数

7.統計的検定とは

6.標準正規分布

4.分散と標準偏差

3.いろいろな平均

2.ヒストグラム

回答

四分位範囲を計算するとき、「排他的な中央値」(Exclusive median)は中央値を除いて計算し、「包括的な中央値」(Inclusive median)は中央値を含めて計算します。
Excel でよくあることですが、日本語の翻訳がわかりにくいかもしれません。
四分位範囲の計算に、前者は「中央値を除く」、後者は「中央値を含む」ということです。
中央値の値が変わるわけではありません。
関数を利用して四分位範囲を計算する場合、次のものを使います。

・中央値を含まない…QUARTILE.EXC(配列,戻り値)
・中央値を含む…… QUARTILE.INC(配列,戻り値)
(戻り値:1-第 1 四分位数、2-第 2 四分位数、3-第 3 四分位数)

さてこの使い分けですが、データの数が少ないとき、外れ値に影響してきます。
Excel の箱ひげ図は自動的に外れ値を検出してくれますが、
データの数が少ないとき、「包括的な中央値」の方が箱とひげの長さが短く、外れ値が検出されやすくなります。
しかし、データの数が多ければ、「包括的な中央値」と「排他的な中央値」の結果はほとんど変わりません。

1.箱ひげ図

回答

各講座ごとにダウンロードが可能です。
「01実践統計学」ですと、「0.概要」の右側にある
「関連ファイルダウンロード」のオレンジ色の部分から
ダウンロードいただけます。
 https://learn.datascience.co.jp/contents/1650

   統計学活用支援サイト