DATA-SCIENCE
現在の機械学習分野を概観するための基礎知識 ~一般的な分析業務の手順とその留意点~ (4)
それでは、学習モデルの性能評価に良く用いられるROC曲線に関して説明していきます。ROC曲線では、各々のデータの陽性確率の閾値を変化させたときの「の割合」と「
の割合」をプロットしていきます。例えば、以下のような表を考えます。
陽性確率 | 0.1 | 0.3 | 0.6 | 0.8 | 0.9 |
正解ラベル | ![]() |
![]() |
![]() |
![]() |
![]() |
陽性確率の閾値を0.3として、それ以下を陰性()のグループ、それより大きいグループを陽性(
)と考えたとします。
を青、
を赤で表を塗りつぶしてみると、以下の表のようになります。
陽性確率 | 0.1 | 0.3 | 0.6 | 0.8 | 0.9 |
正解ラベル | ![]() |
![]() |
![]() |
![]() |
![]() |
この時のの割合を考えます。3つの
のうち2つが
に入るため、
の割合は0.67となります。一方で
の割合は、2つの
のうち1つが
に入るので、
の割合は0.5となります。以上から、閾値が0.3の時の座標 (
) はそれぞれ (0.50, 0.67) と計算できたので、この点をプロットします。陽性確率の閾値を0.0から1.0まで変化させ、全てのパターンに対してプロットすることでROC曲線が得られます。今回の表を用いると、下のようなグラフになります。

ROC曲線はその性質上、曲線が左上の点 (


この記事をシェアする