最近、とあるクライアント案件で家計調査のデータを利用する機会があったのですが、サイト構成がイケてな若干複雑であるため家計調査の全体像を理解するのに少し時間がかかってしまいました。本記事では家計調査の全体像を理解するためのポイントについて簡易的にまとめています。
家計調査とは?
家計調査は総務省が実施している国内の家計に関する調査です。一定の統計上の抽出方法に基づき選定された全国約9千世帯を対象として、家計の収入・支出、貯蓄・負債などを調査しています。二人以上の世帯の結果は毎月、単身世帯及び総世帯の家計収支に関する結果と二人以上の世帯の貯蓄・負債に関する結果は四半期ごととに公表されています。
家計調査のデータを探す前に見ておくべきページ
家計調査のデータを探す前に上記ページを一読しておくことをお勧めします。世帯種別や各種分類の定義がわかりやすくまとまっています。イマイチ意味が分からない用語がある場合はこちらのページも参考になるかと思います。
データの蓄積量
2023年6月5日現在、データベースは112件、ファイル(主にExcel)は23,344件となっています。各種データベース/ファイルはこちらのページからアクセスが可能となっています。
データのダウンロード方法
ファイルの場合、web画面上から主にExcelファイルのダウンロードが可能となっています。また、データベースの場合ですと、Excelファイルの他にcsvやAPIを用いたダウンロードが可能です。
データベースとファイルの関係性
いくつかのデータベースとファイルを眺めている限りでは、おそらく「データベースにある情報をもとに各種ファイルが作られいる」と考えています。
※明記しているページが見当たらなかったため、あくまで私個人の推測になります。
多くのExcelファイルはいわゆる神エクセル(印刷結果優先で、データの扱いやすさは犠牲にする)となっているため、データ分析に用いる際はデータベースから取得する方が良いかもしれません。
データベースからデータをダウンロードする際の注意点
例えば二人以上世帯の品目分類別の支出金額・購入数量のデータを取得する場合、下記ページからダウンロードすることになりますが、集計世帯数や世帯数分布(抽出率調整)等の補足情報が入っているのは金額の方のみのようです。(数量の方にも入っててほしいなぁと思いつつ……)
金額:https://www.e-stat.go.jp/dbview?sid=0003348239
数量:https://www.e-stat.go.jp/dbview?sid=0003348235