仮説検定における第一種の過誤と第二種の過誤、どちらの方が深刻？

仮説検定における誤判断
第一種・第二種の過誤を起こす可能性
第一種の過誤と第二種の過誤、どちらを優先すべき？
第二種の過誤の方が大事な場合がある！

仮説検定における誤判断

仮説検定（hypothesis testing）とは、標本を使って母集団に関する「統計的な判断」をする推計統計学の手法の１つです。事前に母集団に対して仮説を立てて、検定を実行することでその仮説が正しいのか否かを統計学的に検証します。

ここでいう「仮説」とは、母集団の特性に関する予測をすることであり、「検定」とは、標本データに対して計算や統計処理を行い、その結果に基づき、一定の確率で結果の有意性を判断することです。

仮説検定では、一般的に、目の前の課題に対して以下２種類の仮説を決めます。

帰無仮説H₀：主張を否定する仮説、無に帰する仮説　　
対立仮説H₁：主張したい仮説

ところで、上で「一定の確率」という表現を使いました。これは裏を返していうと、仮説検定は確率的な判断であるため、判断の誤りを起こす可能性もあるということです。

この誤りは次のような２種類に分けることができます。

■第一種の過誤

帰無仮説が正しいにもかかわらず、それを棄却してしまう誤り
別の言い方：
- 本当は差がないのに、差があると間違えてしまうこと
- 間違えて対立仮説を採択する

■第二種の過誤

本当は帰無仮説が棄却されるべきにもかかわらず、それを棄却しなかった誤り
別の言い方：
- 本当は差があるのに、差がないと間違えてしまうこと
- 間違って帰無仮説を採択する

第一種・第二種の過誤を起こす可能性

第一種の過誤をしてしまう可能性は、有意水準αと同じです。そのため、第一種の過誤は有意水準と同じ記号αで表すことが多いです。第一種の過誤の方がコントロールしやすいのです。

例えば、有意水準αが5%と設定している場合、２つの集団で差がなくても、5%の確率で差があると誤判断するという意味です。

第二種の過誤は慣習的に記号のβで表され、帰無仮説の分布と対立仮説の分布の被り具合（２つの分布が以下に似ているか似ていないか）によって変わってきます。帰無仮説の分布と対立仮説の分布の間の差が大きいとβは小さくなりますし、分布同士が近いとβは大きくなります。

帰無仮説の分布と対立仮説の分布が近いということは、有意水準αが小さいことでもあるので、αが小さくするとβが大きくなり、βを小さくするとαが大きくなります。

これは何を言っているかというと、第一種の過誤と第二種の過誤、両方の確率を同時に減らすことは出来ない、つまり両者はトレードオフの関係にあることです。

このトレードオフ関係におけるバランスを図ることは、仮説検定を難しくしています。

第一種の過誤と第二種の過誤、どちらを優先すべき？

トレードオフの関係にある以上、第一種の過誤と第二種の過誤のどちらを優先的に減らそうとすべきでしょうか？

わかりやすくするために、以下のようなケースを考えましょう

「新しく開発された栄養補助食品は血圧を下げる効果があるかどうか」

この場合、帰無仮説は以下を主張します。

「この栄養補助食品に効果はない。血圧は変わらないはず」

第一種の過誤では、帰無仮説が正しいにもかかわらず、それを棄却してしまう誤りなので、以下となります。

「有意な効果はないのに、血圧を下げる効果があると判断してしまう」

上記の誤判断が有意水準と同じ確率（例えば5%）だけおきます。

これに対して、第二種の過誤は、以下となります。

「血圧を下げる効果があるのに、効果がないと判断してしまう」

たった一例ではあるが、この場合は、どちらが深刻かと言えば、第一種の過誤です。第一種を優先した場合、高血圧症の患者が効果が本当はない薬を信じて飲み続けて、病状が改善されないどころか時間と共に悪化してしまう可能性があるからです。大勢の人間に対して、被害を与える可能性があるため、ここでは、第一種の過誤を深刻に考えるべきです。

第二種の過誤の方が大事な場合がある！

そもそも仮説検定とは、「稀な現象」を認めるか認めないかを厳しく判断するための統計操作です。上記の例の「新商品の栄養補助食品が素晴らしい効果を発揮できる」ことはまさにその「稀な現象」です。

ただし、そうではないケースもあります。

今度は下の例を考えましょう。

「新開発された薬には毒性があるかどうか」

この場合、帰無仮説は以下を主張します。

「この薬に毒はない。」

第一種の過誤では、以下を判断してしまいます。

「毒はないのに、毒があると判断してしまう」

これに対して、第二種の過誤は、以下となります。

「毒があるのに、毒がないと判断してしまう」

このような危ない判断が検証のために取得したサンプル数が足りなかったなどの実験の不手だけで起きてしまうのは、怖いですね。このケースでは、明らかに第二種の過誤の方が深刻です。

確かに第一種の過誤は、薬を開発した側にとって大きな迷惑ではあるが、これからも毒がないと頑張って証明していけば良いのです。第二種の過誤は場合によって危険人命に関わる問題になってしまいます！

執筆担当者：ヤン　ジャクリン（分析官・講師）

本記事に問い合わせたい場合は　yan.jackie@gri.jp までご連絡をください。

データ分析・AIの専門家集団 GRI

[データ分析・AIの専門家集団「GRI」と一緒に仕事をしませんか？お問い合わせお待ちしております]

仮説検定における第一種の過誤と第二種の過誤、どちらの方が深刻？

仮説検定における誤判断

第一種・第二種の過誤を起こす可能性

第一種の過誤と第二種の過誤、どちらを優先すべき？

第二種の過誤の方が大事な場合がある！

【テスト入力パターン集】Webフォームの単体テストでチェックすべき18のポイント

重回帰分析の結果を統計学的に解釈：Excelの分析ツール使用（前編）

GoogleColab 上でファイルを操作するコツ（Part2）

【正規表現】 N文字目からN文字、N文字続いた後の末尾N文字 etc.

「そうだ、数理最適化、やろう。」ってなった時にめっちゃ参考になったリンク集＆参考書

仮説検定における誤判断

第一種・第二種の過誤を起こす可能性

第一種の過誤と第二種の過誤、どちらを優先すべき？

第二種の過誤の方が大事な場合がある！

「ライゾマティクス」とデータ可視化

今注目のGPTモデル・学習と予測の仕組み大解説

定期的にBigQueryにテーブルが作成されているかどうかをSlackに通知する

最近G検定によく出る画像変換手法CycleGANを明解

【最新海外AI技術の解説】説明可能AI#1・特徴量の相関関係を考慮できるモデル非依存型解釈手法

標本誤差〜標準誤差〜標準偏差、正しく解釈できているか？

仕事で信頼を得るために必要なこと3選

（2023年3月時点）ChatGPTの数学力の限界を試す 〜 記号のパターンを学習？〜

【テスト入力パターン集】Webフォームの単体テストでチェックすべき18のポイント

重回帰分析の結果を統計学的に解釈：Excelの分析ツール使用（前編）

GoogleColab 上でファイルを操作するコツ（Part2）

【正規表現】 N文字目からN文字、N文字続いた後の末尾N文字 etc.

「そうだ、数理最適化、やろう。」ってなった時にめっちゃ参考になったリンク集＆参考書

（2023年3月時点）ChatGPTの数学力の限界を試す　〜記号のパターンを学習？〜