DS検定

実験計画法におけるFisherの3原則(DS検定に頻出!)

今回はDS検定に出題されやすいテーマである「実験計画法」を取り上げます。
実験計画法の考え方である「Fisherの3原則」については、さらに掘り下げて解説します。

実験計画法とは

調査、実験、研究では、適切な実験計画を立てることが不可欠です。実験計画を立てずに思いつきに身を任せて実験を行うと、時間や予算が無駄になり有意義な結果を期待できません。

よい実験計画を立てる指針となるのが実験計画法」です。効率的な実験を設計し、実験を実施した結果であるデータを正しい手法で解析・解釈することを目的とする統計学の手法です。

実験計画法は、Fisherの3原則(読み方:フィッシャーの三原則)を指針とします。1935年に、統計学者のフィッシャーによって、「The Design of Experiments」(まさに「実験計画法」という意味)という書籍の中で提唱されました。

Fisherの3つの原則は次の3つの要素から成り立ちます。
• 反復(repetition, replication)
• 無作為化(randomization)
• 局所管理(local control)

これらは次の2種の誤差を減らすことを目指しています。ここで示す「誤差」とは、実験で測定した値と真の値との間にある差を指しています。

  • 偶然誤差:
    • たまたま生じる差であり、測定者がコントロールできない。
    • 測定ごとにランダムにばらつく。
    • 例として、測定の読み取り誤差やランダムノイズが挙げられる。
  •  系統誤差
    • 処理や条件の違いや不適切さによる、系統的に一定の傾向や方向性がある差。
    • 測定の繰り返しに対して一定。
    • 例として、測定機の固有の特性、測定者のくせ、気温など周囲環境の変動などが挙げられる。

Fisherの三原則の全てを満たす実験計画法を乱塊法と呼びます。

ここから、Fisherの3原則のそれぞれについて詳しく理解していきましょう。

反復(repetition, replication)

反復とは、実験において複数の測定を比較する際に、それぞれの測定に対して同じ条件で2回以上繰り返して行うことです。

なぜ繰り返すかというと、1回だけでは測定値に違いが見えたとしても、それが実験目的上で意味のある違いなのかを判断できません。系統誤差または偶然誤差による見かけ上の違い、あるいは実験者の人為ミスによる違いである可能性があります。1回だけではこれらの可能性を棄却できません。

実験を反復することによって、偶然誤差の大きさそのものを評価できます。

ちなみに、実験の都合上データを1回以上取ることが不可能な場合は、仕方がないことですが反復はできません。

無作為化(randomization)

比較したい条件(実験を行う順序、時間、場所など)を無作為に(ランダムに)割り振って実験を繰り返すことです。

実験の順序、時間、場所などが測定結果に影響を与え、「一定の傾向がある誤差」、つまり系統誤差を引き起こす可能性があります。

ここで、無作為化とは、目的とする要因以外に結果に影響を与える要因(実験を行う順序、時間、場所など)を、無作為に(ランダムに)割り振って実験を繰り返すことです。副次的な要因による影響からくるバイアスを極力減らす効果があります。

実際、「無作為化」を行うことによって、系統誤差を偶然誤差に変換することになります。言い換えると、系統誤差を偶然誤差に吸収させています。

 

局所管理(local control)

先述の通り、実験を行う条件(順序、時間、場所など)が測定結果に影響を与え、系統誤差を引き起こす可能性があります。その際に、あえて実験を行う条件を同じにした「セット」で実施するやり方があります。このセットを実験計画法で「ブロック」と呼びます。

局所管理とは、系統誤差を生じる可能性のある要因によってブロックに区切り、各ブロック内で比較したい条件をすべて含ませる手法です。

実験全体を複数のブロックに分割することで、「無作為化」以上に、系統誤差を減らす効果が期待できます。

具体例を挙げると、ある薬の効果が食前と食後で効果が異なることが疑われているとすると、局所管理では「食前」「食後」というブロックに分けて、薬の摂取の有無を割り当てて効果を測定します。

 

さて、みなさん実験計画法について理解していただけましたでしょうか?しっかりとマスターして、いよいよ来たるDS検定にも備えましょう!

yan
データ分析官・データサイエンス講座の講師