NEWS

データサイエンスすいすい会【アーカイブ 第1回~31回】

 

データサイエンスに関する雑談を通して、すいすいデータサイエンスを理解できるような知見を貯めていく『オンライン雑談会』

GRIの分析官リーダ他が参加してテーマについてお話します
参加無料、お気軽にご参加ください

 

スケジュール

隔週水曜日 18:30~19:30

 

ナビゲーター

古幡征史
所属: 株式会社GRI 取締役
Ph.D in Computer Science
経歴: GRIにて50以上のAI, BI, 分析基盤構築プロジェクトをリード
KPMGコンサルティング、University of Southern California、ドワンゴを経て、2016年9月より現職

 

参加方法

以下のURLからzoomでの参加が可能です
https://zoom.us/j/96152836275
参加無料
時間になりましたらご自由にご参加ください

 

機械学習活用やデータサイエンスに関する
情報共有コミュニティ

自由にご参加いただけるSlackを用意しています
実践的に機械学習を活用するための議論やノウハウの共有を目的としています
すいすい会の内容についても活発に議論できればと思います
Slackはこちら

 

過去のすいすい会

▼第31回「【データ活用の実務担当者向け】クロス集計から自動機械学習へ〜ノーコードAI時代のインサイト発掘〜」

弊社開発の自動機械学習ツールForecastFlowのデモを通じて使い方や結果の解釈方法などについてご紹介しました。

資料はこちら↓
データサイエンスすいすい会第31回「【データ活用の実務担当者向け】クロス集計から自動機械学習へ〜ノーコードAI時代のインサイト発掘〜」

 

▼第30回「AIカメラでセミナー来場者の行動を捉えTableauで可視化分析」

Vieureka社のエッジAIカメラを用いて、人流解析を行いコンテンツの人気状況を自動解析し、解析結果をTableauで可視化する例をご紹介しました。

資料はこちら↓
データサイエンスすいすい会第30回「AIカメラでセミナー来場者の行動を捉えTableauで可視化分析」

 

▼第29回「IoTセンサーデータのお手軽な予兆分析(時系列データの自動機械学習と自動特徴量作成)」

自動機械学習を用た、センサーデータを利用するイベント予測の初手についてお話しました。また、センサーデータのような時系列の波形データに対する自動特徴量生成ライブラリtsfreshを用いた一連の手順についてご紹介しました。

資料はこちら↓

「本日のトピックのポイント」
株式会社GRI 古幡征史
発表スライドはこちら

「自動機械学習ツール ForecastFlow を活用した時系列データによる予測モデル構築方法のご紹介」
株式会社GRI 安井優平
発表スライドはこちら

「予兆を捉える機械学習のポイント」
株式会社GRI 大友祐一
発表スライドはこちら


 

▼第28回特別編「【登壇企業】株式会社アミューズ◆エンタメ業界での先進DX事例紹介」

エンタメ業界のリーディング企業である”アミューズ社”にご登壇いただき、DXの推進事例をご共有いただきました。また、アミューズ社のDX推進で採用された「BIツールの”Tableau社”」と「データクラウドの”Snowflake社”」より、DXを成功させるポイントをお話しいただきました。最後に、DX推進プロジェクトを多く手がける”GRI社”より、エンタメ業界の特色を反映したDX戦略の提案背景をお届けしました。
当日の様子はこちらからご覧ください

 

▼第27回「DXを高速推進するためのクラウド・データ統合ツールMatillionの紹介」

Matillionを使うと高速にDXを推進できる理由、Matillionの機能の具体例、そしてMatillionと自動機械学習の連携させる応用例の三部作をお話ししました。

資料はこちら↓
データサイエンスすいすい会第27回「DXを高速推進するためのクラウド・データ統合ツールMatillionの紹介」

 

▼第26回「ロケーションテックと自動機械学習の実践例」

大規模になりがちなGPSデータを自動機械学習で活用する方法とエリアマーケティングでの可視化分析の方向性についてをご共有しました。

資料はこちら↓
データサイエンスすいすい会第26回「ロケーションテックと自動機械学習の実践例」

 

▼第25回「SaaSビジネスのグロースに重要な再入会を機械学習で」

休眠掘り起こしの機械学習プロセスを表現したチュートリアルの使い方をご紹介しました。

資料はこちら↓
データサイエンスすいすい会第25回「SaaSビジネスのグロースに重要な再入会を機械学習で」

 

▼第24回「これからの自動機械学習のあるべき姿」

「自動機械学習ツールは、どうあるべきか?」という命題に対して、データサイエンスを専業とするGRI社からの視点でお話しました。

資料はこちら↓
データサイエンスすいすい会第24回「これからの自動機械学習のあるべき姿:ForecastFlowのバージョンアップ」

 

▼第23回「機械学習によるECサイトでの購入予測」

「自動機械学習を利用すると、手軽にサイト改善案に繋がるインサイトを導けるか」というチャレンジを、ご紹介しました。

資料はこちら↓
発表スライド

 

▼第22回「データ分析基盤どうあるべき?~データエンジニアリングの民主化の方向性~」

最近のデータ分析基盤の典型例を紹介し、どのようなことに配慮すれば、分析官にとって使いやすいデータ分析基盤を用意できるか、ご紹介しました。

資料はこちら↓
データサイエンスすいすい会第22回「データ分析基盤どうあるべき?~データエンジニアリングの民主化の方向性~」

 

▼第21回「CRM領域でのAI活用例」

CRM領域でどのようにAIを活用すると、効率的に顧客満足に繋がる施策立案と実施を行えるかについて解説しました。

発表1 「予測スコアによる効率的な顧客満足向上施策の自動出し分け」
株式会社GRI 寺内晴輝
発表スライドはこちら

発表2 「休眠顧客の掘り起こしの流れ(AIとBIの効果的な使い方)」
株式会社GRI 古幡征史
発表スライドはこちら

 

▼第20回「自動機械学習ツールForecastFlowのアルゴリズム解説 ~勾配ブースティングを中心に~」

自動機械学習ツールForecastFlowに搭載されている勾配ブースティングについて解説しました。

発表1 「直感的にわかる勾配ブースティング入門」
株式会社GRI 奥本翔
発表スライドはこちら

発表2 「勾配ブースティングでも変わらない決定木のお気持ち」
株式会社GRI 岡部泰三
発表スライドはこちら

発表3 「ForecastFlow のリリース情報」
株式会社GRI 古幡征史
発表スライドはこちら

 

▼第19回「はじめての効果検証」

難易度の高い効果検証に入門するための内容を3人のスピーカーにお話をいただきました。

発表1 「はじめてのA/Bテスト」
株式会社 truestar 田中麻衣子様
発表スライドはこちら

発表2 「実務でベイジアンA/Bやってみてわかった2つのメリット」
株式会社GRI 望月優志
発表スライドはこちら

発表3 「ノンプログラミングで効果検証しよう」
株式会社GRI 古幡征史
発表スライドはこちら

 

▼第18回「可視化分析(Tableau)を向上させるための私の情報源」

Tableauに代表される可視化分析は、「誰でもできるが誰でもできない」ことが知られています。謎めいていますが、Tableauはプログラミングなしでドラッグ&ドロップでダッシュボードを作成できるので簡単なのですが、人を動かすダッシュボードやデータから自然とインサイトが得られるようなダッシュボードを作るのは難易度が上がります。

可視化分析を向上させるには、いくつかのステップがあり、そのステップごとに参考にすべき書籍、ウェブ記事、動画などをご紹介します。

発表1「Tableau 初心者のススメ - 挫折しないためのヒント」
Slalom(スラローム株式会社) コンサルタント 岩橋智宏様
発表スライドはこちら

発表2「データ可視化の勘どころを掴んで磨くためのコンテンツ紹介」
Yoshitaka Arakawa様
発表スライドはこちら

発表3「可視化分析(Tableau)を向上させるための私の情報源」
株式会社GRI古幡征史
発表スライドはこちら

資料はこちら↓
可視化関連の参考文献集

 

▼第17回「AIを活用した2020年代の新しいアイデアの着想法(Post-Deconstructionism)」

現代のAI技術と脱構築主義の考え方を組み合わせた、これまでとは少し違った切り口から考察しました

資料はこちら↓
データサイエンスすいすい会第17回「AIを活用した2020年代の新しいアイデアの着想法」

 

▼第16回「はじめての自動機械学習(ForecastFlow)」

資料はこちら↓
データサイエンスすいすい会第16回「はじめての自動機械学習」

 

▼第15回「自動機械学習Google AutoML TablesとForecastFlowの比較」

自動機械学習ツールの選定基準について2つの自動機械学習を用いて比較しました

資料はこちら↓
データサイエンスすいすい会第15回「自動機械学習Google AutoML TablesとForecastFlowの比較」

 

▼第14回「【電通様ご登壇】オンオフ統合マーケティングにおけるForecastFlowの活用について」

テレビCMやデジタル広告のサイト来訪への広告効果の表現方法を自動機械学習基ForecastFlowを通して紹介しました。
第14回に関してはYoutubeでのアーカイブや資料のご共有はございません。

 

▼第13回「自動機械学習での特徴量エンジニアリングのテクニカル解説」

自動機械学習の予測結果を理解しやすくするためには、入力データの準備の工夫が必要です。
多くの予測問題に共通する、時刻データの扱い、欠損値の扱い、カテゴリデータの扱いについて、共有しました。

資料はこちら↓
データサイエンスすいすい会第13回「自動機械学習での特徴量エンジニアリングのテクニカル解説」

 

▼第12回「ECの売上データに対して自動機械学習を用いた顧客行動予測」

EC(e-コマース)の売上データは、一般的な小売り店の売上データと比較して顧客情報データが充実しており、機械学習の予測モデルで扱いやすいテーマになります。近頃の社会情勢を反映し、EC市場の伸びは大きいですが、自社ECの成長を維持するためには、リピート注文をいかに獲得するかが鍵になります。
今回のすいすい会は、ECの成長の鍵を2つの視点で紹介します

  • EC分野での自動機械学習を利用する典型的な分析テーマ例の整理
  • あるイギリスのECの売上データを用いたForecastFlow(自動機械学習)のデモの共有
    • 売上データを用いた予測モデル構築から得られる施策提言の例を共有します
    • 自動機械学習とTableauの使いどころの違いを、予測モデル構築時の可視化分析(Tableau)やデータ前処理(Tableau Prep)の業務を通して説明します
    • 大学生が60時間かけると、”初見のデータに対してここまで実現できる”ということが実感できる内容になっております

資料はこちら↓
データサイエンスすいすい会「ECの売上データに対して自動機械学習を用いた顧客行動予測」

 

▼第11回「大規模データ分析基盤と自動機械学習(BigQuery + Matillion + ForecastFlow)」

大規模データ分析基盤と自動機械学習連携の手順を紹介しました。

資料はこちら↓
データサイエンスすいすい会第11回「大規模データ分析基盤と自動機械学習」

 

▼第10回「はじめての自動機械学習(ForecastFlow)」

今回のすいすい会では、ForecastFlowを使ってはじめての自動機械学習に関してご説明いたします。「予測ができれば世界が変わる」というキャッチコピーの元、ForecastFlowでは誰でも機械学習(人工知能の一種)の最新技術を利用することができます。事業インパクトを出すためのForecastFlowの活用事例、及び機能紹介をいたします。

資料はこちら↓
はじめての自動機械学習

 

▼第9回「自動機械学習での予測モデル分割による詳細分析」

予測モデルの自動分割による詳細分析がテーマです。機械学習での予測結果は、入力データセットの母集団に依存します。例えば、全顧客データで予測モデルを一つ構築する場合、全顧客に対して同じ条件で予測することになります。しかしながら、いくつかのセグメントで顧客行動が明らかに異なることが現場で分かっている場合、先ほどの予測モデルに違和感を感じることもあり得ます。

このような状況への対応方法として自動機械学習基盤のForecastFlowではユニークな便利機能(予測モデルを自動分割して訓練する機能)があります。1つのデータセットから特定のカテゴリ特徴量を指定して訓練を実施すると、自動的に予測モデルが分割された上で訓練が行われます。この機能を用いて、以下の2つの事例紹介を行います。

  • 米国電話会社でのサブスクリプションビジネスでの顧客行動の違いを浮かび上がらせる手順(反応していたのは価格だけでなく、オプション利用のロイヤルカスタマー化が判明)
  • ADK様の大規模アンケート調査の生活者総合調査を用いた性年代ごとの旅行をするユーザの特徴を理解

資料はこちら↓
【イントロダクション】自動機械学習でのモデル分割20210113

 

▼第8回 「データ活用を推進するマネージャが知っておくべき自然な摂理」

データ活用の推進とリモートワークにより、各マネージャは静かな大変動に直面しています。データを活用する上で自然な摂理がいくつか存在しており、それらをベースにマネージャとしてデータを効率的に使うための環境整備のヒントを提供します。

資料はこちら↓
【イントロダクション】データ利活用マネージャが知っておくべきポイント

 

▼第7回「時系列のセンサーデータを扱ったPredictive Modelでの予測について」

ビジネスシーンで扱うデータの多くは時系列データであり、予測に関して、数多くのモデルが存在します。NASAの研究の一つである飛行機のタービンエンジン機器のセンサーデータを用いて、故障予測を中心にお話しました。

資料はこちら↓
【イントロダクション】時系列の予期的モデル20201125

 

▼第6回「予測スコアを用いた効果的な施策実施」

自動機械学習ForecastFlowを使うと、顧客一人一人のレベルで予測スコアを自動で算出できるようになります。これからの出来事が予測できるので、効率的に施策を実施することができます。その実行手順や考え方を説明します。

– 推論(予測スコアの算出)の考え方
– 予測スコアの施策選定への活かし方
– 予測スコアの算出から可視化までの自動化のやり方(Tableau PrepのTabpy連携)
– ELTツールMatillionを利用したBigQueryとForecastFlowの自動連携のやり方
– ForecastFlowの機能追加の紹介(Sensitivity Analysis (Partial Dependence Plot) の探索機能追加)

資料はこちら↓
【イントロダクション】予測スコア20201111

動画内で紹介しているForecastFlowとTableau Prepの連携については、 こちらの記事もご参照ください

 

▼第5回「ForecastFlowで自動機械学習をやってみよう」

自動機械学習の仕事の進め方をForecastFlowのデモ(分類問題と回帰問題)を通して紹介しました。このデモは幕張で開催された「AI・業務自動化 展」より生放送でお送りしました。

 

▼第4回「自動機械学習での特徴量の作り方」

自動機械学習の工程の中で最も時間を要するのが予測ターゲットを説明する特徴量データの準備になります。特徴量の考え方、アンチパターン、モダンなアルゴリズムで不要な特徴量処理をお話しました。また、Tableauなどの可視化ツールで事前に分析しておくべきことと自動機械学習での特徴量エンジニアリングの使いどころをお伝えしました。

– 特徴量エンジニアリングの基本形
– 特徴量のアンチパターン
– ForecastFlowで不要な特徴量エンジニアリングのリスト
– Tableauと自動機械学習での特徴量エンジニアリングの切り分け
– 特徴量エンジニアリングのおすすめツール

資料はこちら↓
【イントロダクション】特徴量エンジニアリング

 

▼第3回「機械学習の初心者卒業: 分類問題の精度評価手法と不均衡データの実践的な取り扱い」

実社会では不均衡データを扱うのが普通ですが、教科書ではあまり触れられていないため、今回は不均衡データの実践的な取り扱い方をお話します。その際、Google ColaboratoryやTableau Prepでの実装例をご紹介します。また、不均衡データの取り扱いを理解する前提知識として正解率のパラドクスや精度評価方法を述べます。

資料はこちら↓
【イントロダクション】初心者突破①:精度評価と不均衡データの扱い

 

▼第2回「アンケートと機械学習で効率的な顧客理解の実践方法の共有」

アンケート回収数が少なくアンケート結果が眠っている企業も多いのではないでしょうか?
今回の「すいすい会」では、アンケートと機械学習の組み合わせの事例を紹介しました

QA追加回答
当日いただいたご質問への回答内容を追加いたします
Q. アンケートの内容そのものの妥当性はどのように検証するのでしょうか?
A. コンバージョンが、すぐに決まる商材であれば、コンバージョンを教師にして、設問を含めた特徴量で機械学習。設問が重要特徴量に入ってくれば、良い設問だったと言える

資料はこちら↓
【イントロダクション】アンケートと機械学習で効率的な顧客理解の実践方法の共有20200916

 

▼第1回「ビジネスでAIを上手く活用するための問題設定法の共有」

AIを実践的に活用する際、どのような問題を設定すべきか?
AIで解くべき問題が分かると、実践的なデータ利活用ができます
第1回では、サブスクリプション・ビジネス(解約防止、Life-Time Valueの予測)における問題設定の秘訣を話しました

資料はこちら↓
【イントロダクション】ビジネスでAIを上手く活用するための問題設定法の共有20200902

 

 

この記事をシェアする

PREV

NEXT