FAQ

実践力の養成3

回答

 

おっしゃる通り、分散分析は次の前提を置いています:
①独立性:観測値は独立している。
②正規性:各群の母集団分布は正規分布に従う。
③等分散性(homoscedasticity):群ごとの分散は等しい。
このうち③等分散性は、F検定の正当性に直結します。そのため、必要かどうかと問われると検討した方が良いとは思います。

 

等分散性の確認方法は箱ひげ図や残差プロットで群ごとの散らばり具合を見るというのがありますが、統計的検定では以下の方法があります。
①Bartlett検定(正規性に敏感)
②Levene検定(頑健、よく使う)
③Brown–Forsythe検定(中央値を基準、さらに頑健)

回答

 

その後の多重比較にて、Welchのt検定にて実施するというのが多くみられます。またはノンパラメトリック分析に切り替えることや、線形モデルにすること、あまり見ませんがWelch の ANOVA(R:oneway.test(y ~ group, data = df, var.equal = FALSE))というのもあります。

回答

 

おっしゃる通りで、メインは要因の検討です。その検討のため、水準を設け、そのときに被験者に実際にデータを取っている、という流れになります。その際、被験者間の差が、その要因検討に直結しているはずなので、興味の対象の有無という表現でいえば、被験者間の差は興味対象だとは思います。単純にマクロな視点で話すのが要因であり、ミクロとしては被験者になっていると思います。

回答

 

pairwise.t.test(x, g, p.adjust.method = “holm”, pool.sd = FALSE)によってウェルチになります。

回答

 

η2乗は論文においてよく使われる効果量となります。効果量fは検出力または必要サンプルサイズを算出するときに使用する効果量となります。

回答

 

Bonferroniは5回検定するとき、各検定の有意水準を0.05/5 = 0.01として、非常に 保守的(真の効果を見落としやすい)補正です。一方、Holmでは、p値を小さい順に並べて、順番にBonferroniを適用する「段階的補正」です。使い分けとしては、Bonferroniは非常に厳格に誤検出を抑えたいとき、例:臨床試験での一次評価など。Holmは、できるだけ検出力を落としたくないときに使用となります。


有意水準0.05とは「1回の検定で誤って有意と言う確率が5%」という意味です。でも、複数回検定をすると誤判定が積み重なります。例えば20回検定すると、0回連続で誤判定しない確率 = 0.95の20乗→約0.36となり、少なくとも1回は誤判定する確率 = 1 – 0.36 = 64%となります。

回答

 

分野によって異なります。生命科学・ゲノム解析・バイオインフォマティクスではよくBH法が見られます。一方、臨床研究・医学ではあまりみられません。

回答

 

こちらはk=4ですね。誤っており失礼いたしました。

回答

 

n数が異なっている状態であったため、平均すると約5になっているため、5としてたかと思います。

回答

 

おっしゃる通りです。n数が群ごとに異なっていましたが、分散分析を実施している研究計画ということは、大きくnが群ごとに異なる可能性はほぼありません。そのため1~2名程度違うくらいであれば、平均化したnをこの場合では使用します。

回答

 

Error(支店)では、支店をブロック因子(ランダム効果のような扱い)として誤差に切り出す指定となります。この場合、支店間の違いは「誤差」として処理されます。出力では「支店」という誤差成分と「残差」の2つに分かれることが多いです。解析のイメージは「各支店ごとの差は気にせず、そのばらつきは誤差としてまとめる」です。


Error(支店/広告手段)は、まず「/」は「階層(nested)」を意味します。こちらでは、「広告手段」は各支店内で繰り返し試されている(反復測定)」ことを表現します。そのため、誤差は以下に分解されます:①支店間の誤差、②同じ支店の中で広告手段を変えたときの誤差(支店×広告手段)。解析のイメージは「支店を被験者、広告手段をその被験者内要因として比較する(=反復測定ANOVA)」。


そのためError(支店)では広告手段の効果は「支店全体をまとめて」比較し、Error(支店/広告手段)では、広告手段の効果は「支店ごとに比較してから統合」する形になります。

回答

 

aov_ezの中身を確認しましたところError(支店/広告手段)が選択されていました。

回答

 

η2乗は全体のばらつきに対して、その効果がどのくらい説明しているかを示します。

まず対応のある分散分析(反復測定)では、被験者ごとに複数条件を測るため、被験者間の個人差が大きな成分として計算に入ってきます。

そして偏η2乗は、分母から「被験者間の差」など、関心のない変動要素を取り除き、その効果に対応する誤差だけを使います。

そのため、反復測定では「人によって元々違う」分散が大きく入ってしまうので、η2乗を使うとその影響で効果量が過小評価されますが、要因+その誤差だけに注目できる偏η2乗であれば、妥当な評価となります。

回答

 

こちらはどちらかというと、分野によって固定していると仮定できるものが異なるという部分です。被験者ごとランダムに異なるだろう、という予測は医学系ではよくなされますが、工学では同じ製造ロットは独立に存在する物体ですが、ランダムに異なることは想定しません。

では、実験動物ではどうしましょう?このように考えると大変なことになるので、ある程度分野ごと、お作法として決めてしまっているところがあるように思います。

回答

 

あのくらいのn数で、あのデータであればまず変わりませんが、場合によりけりです。講義でも行っていたように、説明変数に入れるだけ、Errorに入れるだけ、Errorに割り算でいれる、と3パターンとも同じ結果だったと思います。ただし、基本的にはお示しした、割り算で入れるものが最も良いと思います。

回答

 

2要因分散分析を実施しているということは、研究計画段階で、分散分析を実施することを明記しているはずですので、除外してやり直すということは分散分析を実施するならば、通常あり得ません。やり直さずに主効果を見るのが普通かと。

回答

 

ややこしすぎるというよりは、分散分析を実施している段階で、研究計画で倫理に通っているはずなので、複数回取得しているのは、その取得方法はばらつきがあって、それを平均化するために複数回取得を実施としていると思います。

回答

 

おっしゃる通りとは思います。しかし、最初の研究計画でどうしているかによりけりになると思われます。

回答

 

なるほど、季節を「ノイズ要因」と割り切って取得していたということであれば、おっしゃる通り「lmer(data ~ med + (1|ID) + (1|sea), df)のようにする方法」は適切です。

ただ、これについてはランダム効果として扱うのが良いのか、固定効果因子として取り扱うのが良いのか、で分かれると思いました。興味なしのノイズならば、(1|sea)のランダム効果でありです。季節は固定水準であり、繰り返し再現されるということであれば、+seaとして入れることになりそうです。

回答

 

こちらはよく分かっておりませんで、同じ位置づけというのは、前後比較とそれとは別に季節比較をするということでしょうか。
最終的に投薬前後を比較しているのですよね?それは全体(季節をつぶして)として投薬前後と比較しているか、季節ごとに投薬前後を比較しているしかないと思いましたが、それは目的によると思います。
自由度大きい方になるものを選択ということですね、質問の意図はわかりました。ただやはり前提が違う気がします。すなわち、100シーズン追いかけるという研究計画を立ち上げているはずで、その場合それだけの長期間追いかけるということは時系列解析をするのでしょうね。その上で、シーズンごとに平均をとって前後比較という確かめなども行いそうです。
そもそもなぜこのデータを取得するのか、計画があると思われます。メインの結果はその目的に沿った分析を実施し、その上でほかにも分析したらこういう結果がみられた、と行うはずで、そのほかに行う分析というのも、当初取る目的に沿う形になると思われます。
スキルとしてはおっしゃる通り自由度が大きい方を選ぶということになると思いますが、それは上述の目的に沿うもの、または関連するものを実施すると思われます。

回答

 

確認します。なぜならば、交互作用があり主効果もある場合、交互作用はあるが主効果はない場合、というシーンが起こりうるため、必ず主効果も確認し、それに沿う考察を行います。

回答

 

以下で回答されていますが、Steel法があります。

回答

 

質問「分散分析では群間の等分散性を仮定すると思いますが、それが妥当であるかを検討する必要はありますか?」、および、質問「上記に関連して、等分散性が仮定できない場合、どのような方法をとることができますか?」に対象法などあります。


結果については、どのような影響というと、その結果が信じられない状態になると思われます。

回答

 

aov_ez(Rパッケージ afex)の出力に出てくる「モークリーの球面性の検定(Mauchly’s test of sphericity)」やその後の補正(Greenhouse–Geisser, Huynh–Feldtなど)は、分散分析(ANOVA)の理論的前提条件に関わる話です。ただし、行動科学、動物実験や細胞培養実験などの多くの研究では「そこまで気にしなくてよい」と言われることが多い理由があります。順を追って説明します。

 

気にしても仕方がないと言われる理由

  • 球面性は非常に厳しい仮定:実際のデータでは球面性がほぼ破れる
  • 球面性(sphericity)は「各水準間の分散の差が等しい」という強い条件です。
  • 実際のデータではほとんど成立しません。特に時間経過を追うような繰り返し測定データでは必ずと言っていいほど破れます。
  • たとえば動物実験や細胞培養実験などで「同じ個体を複数回測定」するような繰り返し測定デザインでは、時間経過や条件によってデータが自動的に相関するため、球面性(各差の分散が等しい)という仮定はほぼ成立しません。
  • したがって、モークリー検定で有意になるのは“普通のこと”です。それ自体を問題視する必要はあまりありません。
  • また、被験者内要因が3水準以下の場合は、球面性の問題はほとんど影響しません。
  •  

補正をすれば十分に対応可能

  • 球面性が破れても、Greenhouse–GeisserやHuynh–Feldt補正をかけることで型Ⅰ誤差を適切に抑えられます。
  • したがって、「破れていたら補正を使えばよい」という対応で済みます。

 

モークリーの球面性の検定とは

  • 球面性(sphericity)とは、繰り返し測定(被験者内要因)ANOVAにおいて、「条件間の差の分散がすべて等しい」という前提条件です。
  • モークリーの検定は、この仮定が成り立っているかをチェックします。
  • 帰無仮説 H₀:球面性が成り立つ

対立仮説 H₁:球面性が破れている

  • p値が小さい(例:p < .05)場合、「球面性が破れている」と判断します。

 

線形混合モデル(混合効果モデル)(LMM)など、より柔軟な手法が主流

  • 現代の分析では、lmer() やglm()などの混合効果モデルを使えば球面性の仮定自体が不要です。むしろ、データ構造を正確にモデリングできる分、理論的に優れています。
  • 「aov_ezで球面性を気にするより、モデルを適切に立てる方が重要」という立場が一般的です。
  • 生物学でも、特に行動実験・神経科学・発達研究・生理学などでは、被験体(動物・細胞・個体差)をランダム効果として扱う線形混合モデル(lmer など)が標準化しつつあります。

 

ただし注意すべき場合

古典的なANOVAを使う必要がある(例:査読者の要請)
⇒モークリー検定を報告し、GG/HF補正後の結果を併記するとよいです。

学会・雑誌が「統計手法に保守的」な傾向
⇒球面性検定の報告を形式的に入れる(p値がどうであれ解釈は補正後でOK)。