Tips

【BigQuery初心者の日記 DAY3】クラスタ化テーブル①ークラスタ化テーブルの作成ー

クラスタ化テーブル

クラスタ化テーブルでは、指定した1つ以上の列の値に基づいてデータが並び替えられます。クラスタリングとパーティショニングを併用すると、パーティション分割された後に各パーティションの中で、指定した列でクラスタ化されるようです。

指定した列に基づいてデータが並び替えられるため、WHERE句でこの列を使ってフィルタをかけた際に、不要なデータのスキャンをスキップすることができます。パーティション分割テーブルでは、WHERE句のフィルタに該当するパーティションのみをスキャンするため、さらにクエリ課金額の削減やパフォーマンスの向上が可能ですね。

クラスタ化テーブルの作成

テーブル作成時に特定の列をクラスタ化列として指定します。WHERE句等でよく使われる列を指定すると良いです。指定した列順で並び替えられるため、複数の列でクラスタ化する場合は、指定する順序を考慮する必要があります。

↓パーティション分割テーブルをクラスタ化

Order_Dateでパーティション分割され、さらに各パーティションの中でCustomer_Nameに基づいて並び替えられます。↓イメージ

クラスタ化テーブル②ークエリ課金額を削減するー に続く。。

【BigQuery初心者の日記 DAY4】クラスタ化テーブル②ークエリ課金額を節約するー検証してみる クラスタ化テーブルの作成 パーティションも設定してます。 クラスタ化列を使用してフィルタをかけてみる ...
Y.K
アナリティクス&デベロップメント所属。雪国出身。