データサイエンス

分析会社GRIが開発したAI予測ツール「ForecastFlow」は何がいいのか

3秒で知りたい方へ、結論はこちら

社会人をやっていると1度や2度はあると思うんです。エレベーターで乗り合わせた部長に急に、「ForecastFlow」とは何であって、何かいいのか秒で言ってくれと問い詰められることが。しかも部長は短気。そんなこと無いかもしれないけど、答えはこちらで

『我々分析会社のGRIが作っていて、GRIが導入支援まで請け負える、機械学習のツール』

です。

3分くらいは読んでもいい方へ、開発ストーリーなども

この『機械学習のツール』が何なのかをもう少し詳しく言うと、「ForecastFlow」は我々GRIが開発した機械学習モデルの自動構築システム(AutoMLと呼ばれる)です。

AutoMLとは何かというと、

Webアプリケーション(SaaS)的なインターフェースで、データアップロードしたらパッと結果が出てくる感じでやりましょうとなっているやつです。「ForecastFlow」はAIはAIでも画像認識とかではなく、システムからSQLで抜き出してくるデータ(構造化データ)を使う系統であります。

f:id:gri-blog:20201029234424p:plain

イメージはこんな感じで、この予測に使う列でID以外の列を特徴量といいます。最初に、[優良顧客判定]の列も含むデータを入れれば、学習する(モデル化する)ので、その後は[優良顧客判定]の列がないデータに対して[優良顧客判定]を付与して返してくれるという具合です。

よくある使用例としては以下などが挙げられます。

  • 解約(または継続や成約)する可能性が高い人を判定して、効率的に施策や営業を行いたい
  • 優良顧客としての特徴の重要な順を整理し、KPIを洗い直したりデータ活用の可能性を社内に広めたい
  • 退職者予測をしたい

いままでExcelで行っていたスコアリングを試しにやらせてみるとかも良いと思います。なぜ上記のことを予測しなければいけないか。当たり前かもしれませんが、それは経営が限られた人や金といったリソースの配分であるとすれば、リソースを必要なところに必要な分だけ配分すればよくするために予測が使えるからです。現代は、全方位的に人や金をばらまいていく時代ではなさそうという世の中の情勢です。

その上で、我々が開発しているAutoMLの「ForecastFlow」のどこがいいのかというと、大きく2つです。

1つ目が、まず『我々分析会社が作っていて』の部分です。この開発周りの特徴としては、

  • 過去様々なモデルを一通り試した上で、最も精度が良かったツリー系モデルをベースに開発
  • 高度なテクニックが必要とされるハイパーパラメータチューニングなどを自動化
  • 実際の分析プロジェクトで使いながら、要望が多かった機能は追加で実装

などです。開発しているのでツール化されてしまっていて中身はブラックボックスということはなく、中でどんな処理をしているかを熟知しているので、我々は出てきた結果を内部モデルや処理からも理解することが出来る環境にあります。また例えば、一般的には似たような特徴量を何個も入れてしまうと、予測の精度が落ちていきがちですが、よくあるランダムフォレストなんかほど落ちない仕組みになっているので、クライアントのビジネスの局面によっては多少精度が落ちても特徴量全部載せで行きましょう、という判断も中身を知っているからこそ出来たりします。日々の分析プロジェクトでも使っているので、一般的な特徴量の作り方のパターンを熟知していて、ある程度機械的に量産し、あとは時間をかけて各々のビジネスのシチュエーションを踏まえたきめ細かい特徴量を考えていくということをよくやったりしています。また特徴量に関しては、一般的には使われる方法ではあるが、本ツールではあまり意味がないというものもあります。例えば、ある数値の特徴量は人によりすごく開きがあったので、LOGをとってみたのですが、これはあまり意味がないことがわかりました。どんな業種のどんなデータのときにどんな特徴量が効きそうかの勘所や、特徴量側よりもデータセットを(行方向に関して)小分けにしたほうが良さそうとか勘所もあったりします。また、実際にお客様に報告したときに、何に驚きどんなとき響かなかったのかが知っているので、その経験を踏まえさらなる追加開発をしています。例えば、MAツールとの連携ができるためのAPI機能などはその一つの例となります。これらが、開発をしているがゆえの強みではないかと思います。

カッコよく言うと、クライマーであったパタゴニアの創設者イヴォン・シュイナードが、ピトンを作っていたのと同じ理由で、我々もこのツールを作っております。

2つ目が、我々は分析会社なので『我々が導入支援まで請け負える』の部分になります。
もちろん特徴量づくりや、どうAutoMLと元データや出力先のMAツールと連携するかのようなノウハウは多数あります。またもっと広い意味で「ForecastFlow」を使ったプロジェクトの特徴としては、「ForecastFlow」を使うことにより、よりクリエイティブなことにプロジェクトの時間をさけるということが最大のメリットになります。案件ごとにAIやハイパーパラメータチューニングにおける車輪の再開発をせずに済むため、その分出できた結果をどう解釈しそれをどう施策に活かすか、または、分析やAIによってこんな可能性もある、ということを社内にどう広めて行けばいいかということを考えるために十分時間が使えるということです。これはイコール、開発ストーリーになります。過去のプロジェクトで様々なモデルを比較したり、ハイパーパラメータの探索をしたり大変だった。これをパッケージ化することにより、今後のプロジェクトは施策の検討や付随するデータ人材の育成のための取り組みなど、もっとビジネスの本質の部分に注力してほしいとの想いから生まれています。ちなみに、分析会社を並行して複数使っているクライアント様はしばしばいらっしゃいます。それが普通かもしれません。あるとき、我々が精度で負けていたが、その後の継続契約は弊社のみ頂いたということがありました。他にも近い話が何度かあり、その決めてはおそらくこの前後のビジネスに対する理解度なのだと思っております。

無免許だけどランボルギーニどうぞってよりも、教習所の合宿と共にフィットからという感じでしょうか。

これは個人的な意見ですが、今後もいろいろなこと(ビジネス上のpain)が簡単にできるようになるツールは出続けるであろう中、人間が必ずやらなければならないことは、①その結果の解釈と、②その結果を踏まえていままでの行動を変えること、以外は無いかもなぁと思っています。AutoMLに限らず、特にアフターコロナは人間がやらなければいけないことに注力していきたいものです。

では逆に、この2つ目の特徴だけを持った、分析やマーケの会社はどうか。この場合、ツールに関しては中立な立場であるというのはメリットだと思います。ただAutoML各社の様々なツールやそのツールの中のどのモデルを使うかということを片っ端から調べたりすることに時間をかけるよりは、クライアントのサービス分析官自ら使い倒してみて特徴量をひねり出したり、速やかに2周目のPDCAに突入していく方がお互いハッピーな気がします。なので、最初からGoogleのAutoML Tablesでお願いします、という依頼の仕方ならばそれは良いと思います。

30分くらいは時間がある人へ、ブランディングの切り口で

どんな人向けかについて

例えば、デジタル〜〜という部署が新設され、そこに配属になった。データは溜まっていると聞いているが、さて何から始めたら良いか。結果の出やすいテーマから取り組んで社内に成功事例を積み上げつつ、徐々に息をするようにデータを扱うようなデータリテラシーの高い人を増やしていかないと、勘と経験だけでは立ち行かなくなるに違いない。まずは、どんな計画(最初のテーマとツール選定)で社内の承認を得ようか。。と考えている方でしょうか。これはイメージです。もちろん、その限りではありません。

逆に、ある程度自分で開発していくよって人は、自分でOpen Sourceかそれに近いツールから試していくのがいいと思います。その方が楽しいでしょう。

UIや料金の観点

比較的他のツールよりも機械学習や統計の知識が無い方でも使いやすい設計になっており、あとは従量課金でお手軽に使い始められるという特徴があります。少し前までは、AutoMLといえばDataRobotという感じでただ料金もお高く、我々はその対極のサービスという位置づけでしたが、最近は、本当にたくさんのツールがあります。ですので、色々試した上で環境に合うものを使えばいいと思います。GoogleのAutoML Tablesなんかは、既にBigQueryデータを溜め込んでいる場合に、Data Prepなんかと組み合わせて使うにはかなりおすすめなのではないかと思います。

最後になぜこの記事か

世の中的には、あらゆるところでDXとかAIとかって言われておりまして、なんだかそのワードだけ聞くと胡散臭いなと。もちろん素晴らしいAIもたくさんあって、我々も多くのAI案件に真面目に携わっております。で、公式HPの「ForecastFlow」紹介ページをみると、なんだか小難しくて分かりづらい。で、要は何なのか頭に入ってこないなぁ、と。「データに基づく施策立案をサポートする機械学習基盤ForecastFlowのご紹介」というタイトルは、なんとなくAutoMLの一般的な良さであり、逆に一番最後におまけのようにさらっとかいてある「予測モデル構築サポート」の内容は、結構我々の強みなのになぁと思った次第です。

また、ForecastFlowサービスサイトのコピーは、「予測で世界は変えられる」でした。いいのだけれども、もう少し予測は予測でも銀座のママの予測との違いが見え隠れしてると良いなぁと感じた次第です。いち社員の感想ですので。。

というわけで、日々分析をしている私の目線で、「ForecastFlow」が何なのかを書いてみたという次第です。
なぜ紹介ページが分かりづらいのかは、一般的なAIやAutoMLの良いところ(グレーの丸)と、「ForecastFlow」が他と違っていて良いところ(黄色の丸)をごちゃまぜにして書いているからだと思っております。

f:id:gri-blog:20201029234523p:plain

黄色の丸は、最初の部長への回答です。「分析会社が作っていて、分析会社が導入支援までやってくれるAutoML」市場があるとすればNo.1かなと思っております(存じ上げてなかったらすみません)。これらを踏まえ、これをコピーにすると例えば下記のような感じでしょうか。これはもうブランディングの話です。ちなみに最初からブランディング目線で「ForecastFlow」のことを書こうと思って書いておりました。

データサイエンティスト集団による、ビジネス変革者のためのスカウター ※A案

  • 誰が開発しているか
  • ビジネス変革者は、エンジニアのためのツールよりではないというニュアンス
  • 全社の売上予測ではなくIDごと一人ひとり予測するというイメージ

日本で唯一の、分析集団によるAI予測ツール ※B案

  • 他にも同様のツールがある場合は、「御成門で」にしますか
  • 誰が開発しているかは、こちらの方が地に足がついている感じ?
  • 機械学習という言葉も使わず、なるべく平易な言葉で表現
ブランディングについて

「ForecastFlow」に限らずどんなビジネスにおいても、ブランドのIdentityやMissionを整理しておく必要はあると思っており、これは前出の何をやるかの方が重要、に繋がります。私はどんなプロジェクトでもクライアント企業様のブランドとは何かについてある程度自分なりのポジションを取った上で分析業務をしています。この辺を無視したままとにかくデータで反応率を上げたいといようなことを続けていった場合、短期的には反応率は上がるとは思います。以下の図はIdentityやMissionを図解した素晴らしい図だと思います。

f:id:gri-blog:20201029234741j:plain:w400

「THE VISION あの企業が世界で成長を遂げる理由」江上 隆夫 (著)より

「くまもん」をデザインしたことでも有名なクリエイティブディレクターの水野学さんの著書によれば、ブランディングとは、『見え方のコントロールである』とあります。その通りだと思います。他と違っていて良いところという観点で、そのサービスや企業が持っている現在の資産を元に見え方をコントロールしていくということだと理解しています。中川政七商店の中川さんの「小さな会社の生きる道」中川淳 (著)によれば、ブランディングとは、『伝えるべきことを整理して、正しく伝えること』です。伝えるべきことは整理して3つくらいに絞り、響く順に伝えるべきと書いてあります。そして、響く順というのは、開発者や生産者が伝えたい順番とは異なるともあります。耳が痛いです。

私は「ForecastFlow」の場合、その資産が多くの導入支援プロジェクトのノウハウが溜まっていることで、伝えるべきことは、我々が自ら開発していることだと考えたのです。

Weaknessについて

ついでに欠点についても触れておきます。UIがやや気が利いていなかったりとかでしょうか。最近はかなり改善されてきてはいます。あとは、メインの機能以外の料金に関するUXやマニュアルの整備などで、豊富な資金力で開発しているサービスに劣る事柄はあるかもしれません。ちなみに、社内的な雰囲気としては、大きい会社によるAutoML展開の動きは気にはしているが、予測精度や処理速度の面ではそんなに驚異を感じていないという感じでしょうか。

最後まで読んで頂いてありがとうございます。関連記事のリンクを貼っておきますね、あ、頭に入ってこないかもしれませんが 笑。30分はかからなかったけど更に詳しく知りたいという方は、ぜひ弊社取締役のYoutubeを見ていただければと思います。

公式Webサイト

ForecastFlowサービスサイト
http://forecastflow.jp/manual/のページの一番下にForecastFlow資料2020年10月版 ダウンロードのボタンがあります。このスライドにも詳細な情報があります。

過去の記事
AutoML(自動機械学習)サービスの比較 / ForecastFlowとPredictionOne

データサイエンスすいすい会「自動機械学習での特徴量の作り方」

youtu.be