DS検定

仮説検定における第一種の過誤と第二種の過誤、どちらの方が深刻?

仮説検定における誤判断

仮説検定(hypothesis testing)とは、標本を使って母集団に関する「統計的な判断」をする推計統計学の手法の1つです。事前に母集団に対して仮説を立てて、検定を実行することでその仮説が正しいのか否かを統計学的に検証します。

ここでいう「仮説」とは、母集団の特性に関する予測をすることであり、「検定」とは、標本データに対して計算や統計処理を行い、その結果に基づき、一定の確率で結果の有意性を判断することです。

仮説検定では、一般的に、目の前の課題に対して以下2種類の仮説を決めます。

  • 帰無仮説H0主張を否定する仮説、無に帰する仮説  
  • 対立仮説H1主張したい仮説

ところで、上で「一定の確率」という表現を使いました。これは裏を返していうと、仮説検定は確率的な判断であるため、判断の誤りを起こす可能性もあるということです。

この誤りは次のような2種類に分けることができます。

第一種の過誤

  • 帰無仮説が正しいにもかかわらず、それを棄却してしまう誤り
  • 別の言い方:
    • 本当は差がないのに、差があると間違えてしまうこと
    • 間違えて対立仮説を採択する

第二種の過誤

  • 本当は帰無仮説が棄却されるべきにもかかわらず、それを棄却しなかった誤り
  • 別の言い方:
    • 本当は差があるのに、差がないと間違えてしまうこと
    • 間違って帰無仮説を採択する

 

第一種・第二種の過誤を起こす可能性

第一種の過誤をしてしまう可能性は、有意水準αと同じです。そのため、第一種の過誤は有意水準と同じ記号αで表すことが多いです。第一種の過誤の方がコントロールしやすいのです。

例えば、有意水準αが5%と設定している場合、2つの集団で差がなくても、5%の確率で差があると誤判断するという意味です。

第二種の過誤は慣習的に記号のβで表され、帰無仮説の分布と対立仮説の分布の被り具合(2つの分布が以下に似ているか似ていないか)によって変わってきます。帰無仮説の分布と対立仮説の分布の間の差が大きいとβは小さくなりますし、分布同士が近いとβは大きくなります。

帰無仮説の分布と対立仮説の分布が近いということは、有意水準αが小さいことでもあるので、αが小さくするとβが大きくなり、βを小さくするとαが大きくなります。

これは何を言っているかというと、第一種の過誤と第二種の過誤、両方の確率を同時に減らすことは出来ない、つまり両者はトレードオフの関係にあることです。

このトレードオフ関係におけるバランスを図ることは、仮説検定を難しくしています。

第一種の過誤と第二種の過誤、どちらを優先すべき?

トレードオフの関係にある以上、第一種の過誤と第二種の過誤のどちらを優先的に減らそうとすべきでしょうか?

わかりやすくするために、以下のようなケースを考えましょう

「新しく開発された栄養補助食品は血圧を下げる効果があるかどうか」

この場合、帰無仮説は以下を主張します。

「この栄養補助食品に効果はない。血圧は変わらないはず」

第一種の過誤では、帰無仮説が正しいにもかかわらず、それを棄却してしまう誤りなので、以下となります。

「有意な効果はないのに、血圧を下げる効果があると判断してしまう」

上記の誤判断が有意水準と同じ確率(例えば5%)だけおきます。

これに対して、第二種の過誤は、以下となります。

「血圧を下げる効果があるのに、効果がないと判断してしまう」

たった一例ではあるが、この場合は、どちらが深刻かと言えば、第一種の過誤です。第一種を優先した場合、高血圧症の患者が効果が本当はない薬を信じて飲み続けて、病状が改善されないどころか時間と共に悪化してしまう可能性があるからです。大勢の人間に対して、被害を与える可能性があるため、ここでは、第一種の過誤を深刻に考えるべきです。

第二種の過誤の方が大事な場合がある!

そもそも仮説検定とは、「稀な現象」を認めるか認めないかを厳しく判断するための統計操作です。上記の例の「新商品の栄養補助食品が素晴らしい効果を発揮できる」ことはまさにその「稀な現象」です。

ただし、そうではないケースもあります。

今度は下の例を考えましょう。

「新開発された薬には毒性があるかどうか」

この場合、帰無仮説は以下を主張します。

「この薬に毒はない。」

第一種の過誤では、以下を判断してしまいます。

「毒はないのに、毒があると判断してしまう」

これに対して、第二種の過誤は、以下となります。

「毒があるのに、毒がないと判断してしまう」

このような危ない判断が検証のために取得したサンプル数が足りなかったなどの実験の不手だけで起きてしまうのは、怖いですね。このケースでは、明らかに第二種の過誤の方が深刻です。

確かに第一種の過誤は、薬を開発した側にとって大きな迷惑ではあるが、これからも毒がないと頑張って証明していけば良いのです。第二種の過誤は場合によって危険人命に関わる問題になってしまいます!

 

執筆担当者:ヤン ジャクリン(分析官・講師)

本記事に問い合わせたい場合は yan.jackie@gri.jp までご連絡をください。

 

 

yan
データ分析官・データサイエンス講座の講師