データサイエンス

時系列に使える検定手法

かばん検定

参考:ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル_時系列分析 変量時系列モデルとその性質_長倉 大輔http://user.keio.ac.jp/~nagakura/zemi/ts1_slide_2015.pdf

かばん検定とはm 次までの自己相関がすべて 0 かどうかを判断する手法です。
代表的なかばん検定統計量には、 Ljung – Box 統計量があります。
Ljung – Box 統計量の問題点のひとつとして、 m の選択が難しい事にあります。
m が小さすぎると、高次の相関を見逃す可能性があり、m が大きすぎると、検出力が低下する可能性があります。
そのため、実際には、複数の m に対して検定統計量を計算して総合的に判断するのが一般的です。

ADF検定

参考:医療職からデータサイエンティストへ_じっくり学ぶ時系列解析~見せかけにだまされない編~
https://www.medi-08-data-06.work/entry/non_stationary_process

ADF検定は時系列標本が単位根を持つかどうかを判断する手法です。
ADF検定は、AR過程の次数が1の場合を検定するためのDF検定を次数が1以上にも対応できるように拡張したものです。
DF検定では、対立仮説では以下の3つからもっともらしそうなものを選びます。
(1)過程の期待値が0で、トレンドがない
(2)過程の期待値が0ではなく(定数項をもち)、トレンドがない
(3)過程の期待値が0ではなく(定数項をもち)、トレンドがある
上から下に行くほど前提が緩くなり、誤って棄却してしまうことが少なくなりますが、その分定常過程であっても棄却されない可能性が高くなります。
一番緩い仮定を持つ3番目を対立仮説とするのが一般的です。
その他に有名な単位根検定の手法としては、KPSS検定やPP検定などがあります。

ジャックベラ検定

ジャックベラ検定は標本が正規分布に従うかどうかを判断する手法です。
検定統計量は、歪度と尖度から求められます。
データの正規性の検定にはほかに、コルモゴロフ・スミルノフ検定やシャピロ・ウィルク検定などがあります。

Y.Y
アナリティクス&デベロップメント所属。画像や時系列など。