定期的にBigQueryにテーブルが作成されているかどうかをSlackに通知する

以下のようなデータの流れで、表題の通りのことを行っていきます。
1. BigQueryのクエリをスケジュールし、定期的にクエリを投げる。
2. 1の操作が完了後、Pub/Subのトピックにパブリッシュする。
3. Pub/Subのトピックをトリガーとして、Cloud Functionsを起動し、Slackへの通知を行う。

それぞれについてもう少し詳しく見ていきます。

Pub/Subトピック

まず、Pub/Subトピックを作成します。「トピック」→「トピックを作成」を選択し、スキーマやサブスクリプション等は入力せずにIDだけ入力すれば、新たなトピックが作成されます。

クエリのスケジュール

INFORMATION_SCHEMA.TABLESを利用することで条件に合うテーブル情報を拾ってくることができます。「スケジュール」→「スケジュールされたクエリを新規作成」を選び、実行する時間帯、出力テーブルの格納先、さらには先ほど作成したPub/Subトピックを入力すれば、完了です。

Slackへの通知

今回はpythonとIncoming Webhookを利用して、Slackへの通知を行います。まずは、Incoming Webhookの設定ページを開き、投稿するチャンネルを選び、「Incoming Webhook インテグレーションの追加」をクリックします。その後、Webhook URLが表示されるので、それをコピーします。最後に以下のような処理を実行するとSlackに通知を送ることができます。

pip install slackweb

import slackweb

slack = slackweb.Slack(url="コピーしたWebhook URL")
slack.notify(text="通知内容")

Cloud Functions

作成したトピックを開き、「CLOUD FUNCTIONをトリガー」を選択します。
ランタイムにPythonを選択し、以下のように、クエリから作成されたテーブルに対し、get_table関数を使用します。

client = bigquery.Client(project="project_id")
table_id = "dataset_id.table_id"
table = client.get_table(table_id)

table.num_rowsで行数を調べて、上述のSlackへの通知文を挿入すれば、テーブルの有無を調べてSlackに通知することができます。

データ分析・AIの専門家集団 GRI

[データ分析・AIの専門家集団「GRI」と一緒に仕事をしませんか？お問い合わせお待ちしております]

定期的にBigQueryにテーブルが作成されているかどうかをSlackに通知する

Pub/Subトピック

クエリのスケジュール

Slackへの通知

Cloud Functions

【テスト入力パターン集】Webフォームの単体テストでチェックすべき18のポイント

重回帰分析の結果を統計学的に解釈：Excelの分析ツール使用（前編）

GoogleColab 上でファイルを操作するコツ（Part2）

【正規表現】 N文字目からN文字、N文字続いた後の末尾N文字 etc.

「そうだ、数理最適化、やろう。」ってなった時にめっちゃ参考になったリンク集＆参考書

Pub/Subトピック

クエリのスケジュール

Slackへの通知

Cloud Functions

【CSS】tableを角丸にできない原因と解決策

【連載】記述的多変量解析 - 対応分析（コレスポンデンス・アナリシス）

AWS Glue Crawlerの増分クロールでハマった落とし穴と対策

PredictivePowerScoreによる特徴選択

使えるダッシュボードを作るために何が必要か

Isolation Forest と異常検知（ネットアクセスログを用いて）

Pythonで画像のテンプレートマッチングしてみる

続・AIは人類を超える絵画を描けるか

【テスト入力パターン集】Webフォームの単体テストでチェックすべき18のポイント

重回帰分析の結果を統計学的に解釈：Excelの分析ツール使用（前編）

GoogleColab 上でファイルを操作するコツ（Part2）

【正規表現】 N文字目からN文字、N文字続いた後の末尾N文字 etc.

「そうだ、数理最適化、やろう。」ってなった時にめっちゃ参考になったリンク集＆参考書