-
データ分析力養成講座
4.アソシエーション分析
回答
te.columns_は、商品名がlistになったものです。
print(the.columns_)を実行すると、下のように出力されます。
te.columns_が何を意味しているか知りたい場合は、それを出力すると良いでしょう。
teに対して「.columns_」でアクセスすると商品名のlistを取得できるのは、
TransactionEncoderの仕様でして、これはそういうものだと理解するしかないです。
ただ、これは頻繁に使うものではないので覚える必要はありません。
回答
metricで指定した指標がmin_threshold以上であるような商品の組み合わせが出力されるという認識が正しいです。
つまり、min_thresholdで設定できるのは、metricで指定した指標の最小値です。
また、metricsを指定しなくてよいのは、それがオプション引数だからです。
関数の引数には「必ず指定する必要がある引数」と「指定しなくても良い引数」の2種類があり、
後者をオプション引数といいます。
関数を実行する際は、そのオプション引数を指定しなくても良く、その場合はデフォルト値が採用されます。
オプション引数には予めデフォルト値が定められおり、それを確認する方法をご紹介します。
実はPythonでは、関数などにカーソルを当ててしばらく待つと、下の画像のように、
その仕様や説明などが表示されます。
ここでは、「association_rules」にカーソルを当てることで、その関数の仕様や説明を表示させています。
そして、そこには「metric=‘confidence’, min_threshold=0.8」と書かれています。
これは「〇〇=△△」の形で書かれているため、デフォルト値が設定されていることがわかります。
〇〇がオプション引数で、△△がそのデフォルト値を表しています。
したがって、metricsやmin_thresholdは必ずしも設定する必要はなく、
それぞれ’confidence’と0.8というデフォルト値が設定されていることがわかります。
そのため、metricsを指定しなくても関数は実行できるわけです。
講座でmetricsを指定するように説明したのは、metricsを切り替えることで、
基準となる指標を変更できることをお伝えしたかったからです。