AI

異常検知手法紹介(Part1)

ここでは異常検知の手法として、深層学習による再構築手法を紹介します。
一般的に異常検知では、異常データのサンプルを収集することが困難であるという問題が挙げられます。
しかしながら、これらの手法では正常データのみから訓練を行うことができるため、そのようなケースでも識別を行うことができます。

今回は、AutoEncoder (AE) をベースにした手法とGenerative Adversarial Networks (GAN)をベースにした手法について紹介していきます。

AutoEncoder

AEは入力されたデータから特徴量を抽出するエンコーダとその特徴量からデータを復元するデコーダから構成されています。
エンコーダにより次元が圧縮されながらもデコーダによって入力データと同じものが出力されるように訓練が行われます。

異常検知で利用する場合には、まず正常データのみから訓練を行います。これにより正常データを復元可能なAEが得られます。
次に、テストデータを訓練したAEに入力します。
テストデータが正常である場合には、そのまま正常データが復元されますが、
テストデータが異常である場合には、異常の特徴を上手く復元することができません。
そのため、入力データと出力データを比較し、誤差が大きい場合には異常データであると識別することができます。

GAN

GANは生成ネットワークと識別ネットワークから構成されており、
生成ネットワークは訓練データの生成を、識別ネットワークはデータが本物であるか生成ネットワークによって生成されたものであるかの識別を行います。
相互に作用させながら訓練を繰り返すことで、生成ネットワークは本物に近いデータを生成できるようになります。

異常検知で利用する場合には、AEと同様に正常データからGANを訓練させます。
このとき、生成ネットワークは正常データを生成することはできますが、
異常データの潜在空間から正常データを生成することはできません。
そのため、入力データと生成ネットワークから生成されたデータを比較することで、識別が可能になります。

 

Y.Y
アナリティクス&デベロップメント所属。画像や時系列など。