AI

今、自然言語処理が熱い理由

2021年DXに関するニュースや広告は至る所で目にします。ここでは、DXの中でも特に、自然言語処理の注目が高い理由について考察します。

現在、自然言語処理の分野として最も広く展開されているのは、チャットボットです。このチャットボットは、あらかじめ用意された選択肢や解答を選んでユーザに提示するものであり、人と自在に会話できるものではありません。近年では、自然言語処理と音声認識を組み合わせたAIスピーカーに着目が集まっていますが、ごく一部のタスクのみに対応されているといった状況です。

自然言語処理が熱い理由〜その1

理由その1として挙げられるのは、テキストデータが年々増加しているためです。IDC Japanの予測では、2025年におけるデータ量は163兆ギガバイトとなると予想されています。また、近年では社内におけるコミュニケーションツールとしてSlackやChatworkの導入が増えることで紙媒体の書類が電子化されることでデータの増加が考えられます。またペーパーロジックの調査では、東京の企業の36%が2020年度予算でペーパーレスシステムを導入することを決定し、書類のPDF化率も極めて高くなっているため、テキストデータの活用が今後さらに進むことが予想できるためです。

自然言語処理が熱い理由〜その2

理由その2として、言語処理モデルの汎用化にあります。現在、有力なモデルとしてはGoogleのBRTEモデルや、OpenAIのGTP-2などが公開されています。さらに、今年はGTP-3が公開され、このモデルは約45TBという莫大なテキストデータを学習させたモデルになります。現在GTP-3のモデルサイズはかなり大きいですが、このモデルの軽量化が進むことで、文章自動生成に関するタスクに利用される可能性は大きくなると予想できます。

自然言語処理が熱い理由〜その3

現在、汎用言語モデルは英語圏での開発が中心となっていますが、今後は日本企業の参入も予想されるためです。2020年LINEが日本語特化した大規模モデルの開発を発表したことにより、日本語の自然言語処理における精度水準が大幅に向上する可能性があるためです。

最後に

自然言語処理はこれからの時代特に熱い分野になりそうです。データサイエンス系の会社として、この時代の波に乗り遅れないよう最新の動向・技術のチェックは勿論、知識レベルの底上げに私も力を注ぎたいと思います。

T.A
新卒1年目で働いてます。 まだわからないことも沢山ありますが頑張りたいと思います。