以前は以下の記事で、GLUEという、言語理解タスクの性能を評価するベンチマークについて紹介しました。

GLUE:AIによる自然言語理解の性能を評価この記事では、英語圏における自然言語処理の標準ベンチマークであるGLUEについて解説します。
※本記事のトピックはG検定やDS検定...
自然言語処理によって解決できるタスクは様々あります。今回の記事では、GLUEに含まれていないものを含めて、重要な言語理解タスクの例を挙げていきます。
■GLUE以外の代表的な言語理解タスク
これらを行うAIシステムの多くは、初期的に基本的な学習だけ行えば、日々データを蓄積させながら学習するように設定できるため、継続的に分析の精度を向上させることができます。
固有表現抽出(NER; Named Entity Recognition)
- ある文章から、人名前や組織名などの固有表現を機械的に抽出する。
- 用途例:プライバシー保護のために、データから人の名前を抽出してその情報を削除する処理など
文章の要約
- 用途例:記事の内容からタイトルを自動的に生成など
- 文章の要約は、抽出型要約と抽象型要約の2タイプに分かれる。
- 抽出型要約とは、文章中から重要な部分を抽出することで要約文とする。
- 具体的には、文書の各部分に対して「重要」または「重要でない」という2クラスの分類問題を解き、重要なものだけを並べて要約文を生成する。
- メリットとしては、生成された要約文が文章としては破綻する可能性が比較的低いこと。
- デメリットとしては、抽出されなかった部分に実は重要な情報が潜んでいることもあるので、見落としの可能性があること、そして文章に多少は継ぎ接ぎ感が残ること。
- ニュース記事や論文などの文章は「重要な部分が大体この辺にある」(例:最後のsummary)のパターンがあるため、文章要約モデルがその位置に過学習してしまうと「位置バイアス」という系統誤差が起きやすい。つまりほぼ位置だけで判断するモデルが出来てしまう。
- 抽象型要約は、文章の全体の意味を捉えて尤もらしい要約文を生成する。
- Encoder-Decoder(エンコーダ・デコーダ)モデルなどのニューラルネットワークをベースとする言語モデルを使用するエンコーダでは入力文を意味を表す数値ベクトルに変換(エンコード)し、デコーダではそのベクトルをもとに要約文を生成(デコード)する。
- メリットとしては、入力文にはない語句も学習データに含ませれば、要約文に反映させることができること。
- デメリットとして、不要な情報を多く生成してしまうこと、同じような内容を繰り返し生成してしまうことが起こり得ること。
文章分類
- 一言でいうと、文章の内容を認識・分類し、検索可能な状態にするタスク
- 文書分類には複数のアプローチが考えられる。例えば…
- トピックの分類:ニュース記事をジャンル(スポーツ、政治、エンタメ)に分類
- 属性を推定:SNS投稿からユーザーの属性(年齢、性別、嗜好)を推定
- 評判推定:商品やサービスなどのレビュー文書からポジティブなのかネガティブなのかを判定
- フィルタリング処理:スパムメールかどうか、優先度が高いかどうかを判定
- 機械学習の視点から2クラス分類(スパムメール判定など)または多クラス分類(感情分析など)に分けられる。
- 基本的に分類クラス数が少ない方が精度が高くなり、必要とする学習データが少なくて済むので、ラベル数を少なくしたデータセットを作るのが望ましい。
- 文中の単語には、そのカテゴリを示す特徴単語が含まれる。コンピューターで解析する場合、形態素解析で文章をその単位の最小の構成要素の単語に分解した後に、得られた単語の分布から、確率統計アルゴリズムやディープラーニング技術を用いて、定量的に文章の特徴を抽出する方法がとられる。
- 単純な例を挙げると、ニュース記事がスポーツ、政治、科学、エンタメの中のどのカテゴリに分類されるかを判断する際に、スポーツの文書には、他カテゴリと比べると、「オリンピック」、「ホームラン」、「選手」などの用語が相対的に数多く含まれる。収集した全体の文書と各カテゴリに出てくる統計的な分布の差から特徴的な単語にスコアをつけて分類する手法がとられる。
感情分析・感情認識
- 人間が入力した文章(テキスト)に含まれている単語や表現を、自然言語処理のAIが分析することで入力者の感情(怒り、悲しみ、喜びなど)を判定する。
- 用途例:SNSやレビューの感情分析 ➡︎ マーケティング施策に役に立つ。
質問応答
- ユーザーの質問に対して適切な答えを返すシステム
- ディープラーニングを用いた質問応答システムは、質問文と答えのペアを学習させており、Transformerなどの最新の言語処理技術によって、多岐にわたる質問に答えることができ、精度が大きく向上した。
- 用途例:コールセンター、ヘルプデスク、サポートセンターなど
機械翻訳
- 初代の機械翻訳は、両言語に関するマニュアルと照合して訳文を出力するルールベースシステム。1990年代に統計モデルを通じて訳文を出す統計的機械翻訳が主流となり、Google翻訳にも2006からの10年間採用されていた。
- その後、2016年にGoogleがニューラル機械翻訳であるGNMT(Google Neural Machine Translation)を発表した。近年の機械翻訳システムの殆どが、ニューラル機械翻訳の手法を使ったもの。
- エンコーダ・デコーダモデルが一般的で、エンコーダが翻訳前の文章を読み込み、隠れ層で特徴表現に変換してデコーダに渡し、デコーダを通じて訳文を出します。
もちろん、上記は(GLUEタスク以外の)言語理解タスクの全てではありませんが、皆さんが日常的に使う機会が多いのであろう代表例として挙げました。
もっと仕組みを詳細に知りたい方はぜひ調査をし勉強してみてください。
執筆担当:ヤン ジャクリン (分析官・講師)