雑談

経済学のマッチング理論と強化学習が繋がった話

前回のブログでG検定に合格体験記を書きました。今回はG検定を勉強する上で知った、私が大学在学時に学んでいたマッチング理論と強化学習が非常に近いものなことを知りました。

強化学習

強化学習はある環境におけるエージェント(プレイヤー)の行動を最適化し、環境から得られる報酬を最大化することを目的としています。例えばロボットの歩行訓練では、歩行距離を報酬として上手く歩けた時の速度や歩幅を学習して歩行距離を最大化していきます。

マッチング理論

皆さんが想像するマッチングアプリの裏側で使用されているアルゴリズムです。ユーザーの異性に対する選好をもとにユーザー全員がより良い相手とマッチングし、アプリ内のユーザー全員の報酬(より好みの異性とマッチすること)を最大化することを目的としています。私は大学のゼミでは保育園と児童のマッチングを最適化し待機児童を減らす研究をしていました。

分かったこと・感想

どちらも環境にユーザーが存在し、ユーザーの報酬を最大化するためにユーザーの行動を最適化するという点で共通しています。実際使用されている強化学習のシステムにも経済学の理論が盛り込まれています。経済学は日本では文系に分類されますが、海外では理系に分類されることも多いです。自分の学んでいたことが、AIの分野に深く関わっていたことを知り、意外でしたが非常に興味深いと思いました。経済学や経営学には他にもAIに組み込まれるような分野があると思います。私もこれを機に色々調べてみたいと思いました。

O.J
Tableau を用いたダッシュボードの作成を主に業務で行っています。