GIS

【LLoco】オープンデータをLLocoと結合して可視化する〜郵便番号結合編〜

弊社のプロダクトであるLLocoは、郵便番号粒度でのポリゴンデータ、およびそれに付随する様々な統計データを提供し、地図上での可視化を可能としています。

LLocoに標準搭載されている統計データ以外でも、郵便番号、住所コード、あるいは地名が含まれているデータがあれば、その情報を可視化することが可能です。

今回は郵便番号を持ったデータの結合を、オープンデータである「法人番号データ」を例にして行い、東京都の法人数を郵便番号粒度で見ていきます。

この記事でやること

  • 郵便番号の情報を使ってLLocoと法人番号データの結合を行い、郵便番号粒度での法人数の可視化を行います。

法人番号データ

法人番号データは国税庁の 法人番号公表サイト から取得できるオープンデータです。日本にある法人ごとのデータが存在し、その項目に郵便番号も存在するため、LLocoと結びつけることができます。

中身を軽く整形して必要なカラムだけ取り出すと下記のような形になります(法人番号データと言いながら、今回は法人番号自体には興味はないので削除してあります……)

一番左のインデックス列を見るとわかるように、ここには延べ1,216,472もの法人にまつわるデータが存在します。ただしこれには「番号の新規登録」「番号の削除」「番号の訂正」のいずれも含まれているため、今回は歴代の「新規登録」に該当するもののみを抽出し、約800万件となりました(現在存在しない法人も含まれてます)。

法人種別とは、法人のおおまかな分類で下記のようなものがあるようです。今回は法人種別ごとで分類することで、種別毎の傾向を見ていきたいと思います。

LLocoと法人番号データの郵便番号での結合

LLocoのポリゴンと法人番号データを郵便番号で結合するには、LLocoの「郵便番号界ポリゴン」データと「郵便番号マスタ」データを使用します。

「郵便番号界ポリゴン」は各ポリゴンに対応する郵便番号情報のテーブルとなっていますが、ここにある郵便番号は全ての郵便番号を網羅していないため、その情報が含まれている「郵便番号マスタ」と紐づける必要があります。

関係性を図にすると下記の通りになります。これにより法人番号データに存在する全ての郵便番号とLLocoのポリゴンを紐づけることが可能となります。

法人番号とポリゴンの紐付け結果

法人番号とポリゴンの紐付け結果をTableauで可視化してみます。今回はLLocoの粒度での法人種別ごとの法人数を可視化しました。

「法人種別301: 株式会社」の東京都心での法人数は下記の通りです。法人番号登録されている法人の9割以上はこちらに該当し、銀座、西新宿、南青山のあたりに集中して存在することがわかります。

「法人種別101: 国の機関」は特徴的な結果となっています。絶対数は株式会社に比べてかなり少ないですが、霞ヶ関、永田町とごく一部の地域に集中して存在していることがわかります。実際のイメージとも合致していますね。

まとめ

ここで紹介した結果はほんの一部ですが、LLocoと法人番号データを郵便番号で結合させることで、郵便番号ポリゴン粒度での法人の可視化ができました。

今回はオープンに取得可能な郵便番号データということで法人番号データを用いましたが、各社の持っている顧客データなどから郵便番号を結びつけることでも同様の可視化は可能です。

LLocoのご利用について興味のある方はぜひ弊社までご連絡いただければと思います。

kai
アナリティクス&デベロップメント所属。 平日に大きなデータを扱い、週末は大きな楽器を扱う