【Python】shapefileのポリゴンのレンダリングを高速にしたい

はじめに
軽量化手法
実験

はじめに

国勢調査のシェープファイルは全都道府県合わせると数GBととても容量の大きいファイルとなってしまいます。

これにより、表示の際に時間がかかってしまったり、表示できなかったりします（実際、データポータルは頂点数100万までしか表示できない仕様でした）。

そこでシェープファイルを軽量化し、レンダリングを高速にする手法について紹介します。

軽量化手法

geopandas

頂点の始点と終点を結び、ほかの座標から許容距離外のものを除外する手法です。

位置は保持され、頂点の数が減ります。

topojson

トポロジーの概念を用いて頂点の数を減らす手法です。

具体的には各ポリゴン間の共有されている座標を認識し、接続関係を考慮しながら除外します。

実験

各手法で神奈川県の郵便番号界ポリゴンを軽量化したものは以下の通りとなりました。

パラメータ（許容距離）	geopandas	topojson
元データ
0.001
0.01
0.1

それぞれ簡略化はできていますが、geopandasを用いた場合、独立して簡略化され、topojsonの場合、元の位置からずれるポリゴンもできています。

topojsonでパラメータ0.01の場合、全都道府県でおよそ1~6%程度の頂点数まで削減することができ、レンダリングも高速になります。

ちなみに

神奈川県では比較的ポリゴンも大きいですが、北海道札幌市や京都府など、粒度がとても細かい地域の場合、大きな差が生じています。

また、それぞれ相互に変換が可能なので比較的使いやすい印象です。

geopandas

topojson

データ分析・AIの専門家集団 GRI

[データ分析・AIの専門家集団「GRI」と一緒に仕事をしませんか？お問い合わせお待ちしております]

【Python】shapefileのポリゴンのレンダリングを高速にしたい

はじめに

軽量化手法

geopandas

topojson

実験

ちなみに

【テスト入力パターン集】Webフォームの単体テストでチェックすべき18のポイント

重回帰分析の結果を統計学的に解釈：Excelの分析ツール使用（前編）

GoogleColab 上でファイルを操作するコツ（Part2）

【正規表現】 N文字目からN文字、N文字続いた後の末尾N文字 etc.

「そうだ、数理最適化、やろう。」ってなった時にめっちゃ参考になったリンク集＆参考書

はじめに

軽量化手法

geopandas

topojson

実験

ちなみに

住居費から見る地域差を考える

『データサイエンスもくもく会』・第１回目の課題を解説

LLoco（エルロコ） —— 地理空間データ共有プラットフォーム

【ForecastFlow×LLoco】機械学習を使って会社近くのお得物件をSUUMOから探し出せ 〜（２）前処理・可視化編〜

ディープラーニングの挙動を解析的に眺めてみた

データサイエンティストが知るべきビジネス用語#1：ビジネスモデルとプレイヤー

最速でマネージャーになるために僕が心がけたこと

【Tableau】要注意！ IFとIIFの挙動の違い

【テスト入力パターン集】Webフォームの単体テストでチェックすべき18のポイント

重回帰分析の結果を統計学的に解釈：Excelの分析ツール使用（前編）

GoogleColab 上でファイルを操作するコツ（Part2）

【正規表現】 N文字目からN文字、N文字続いた後の末尾N文字 etc.

「そうだ、数理最適化、やろう。」ってなった時にめっちゃ参考になったリンク集＆参考書

【ForecastFlow×LLoco】機械学習を使って会社近くのお得物件をSUUMOから探し出せ　〜（２）前処理・可視化編〜

【Tableau】要注意！　IFとIIFの挙動の違い