データサイエンス

お金を「平均」で語るんじゃあないッ! 〜平均年収1,200万円の町〜

どうも、タイトルからお察し(?)の通り最近ジョジョにハマっている岡部です。アマプラでストーンオーシャン見れるようになったのでつい見れるとこまで一気見しました。

さて本記事では「データサイエンティストが一般ピープルにもっとちゃんと知ってほしい概念第一位」である「平均」についての話題です。

市区町村別の「平均年収」ランキング

さて、突然ですがこちらの表をご覧ください。

総務省「市町村税課税状況等の調」(https://www.soumu.go.jp/main_sosiki/jichi_zeisei/czaisei/czaisei_seido/czei_shiryo_ichiran.html)よりデータ取得。2018年度から2022年度の5年分のデータをプロット。市区町村(元データ「団体名」)ごとに「課税対象所得」*1,000/「所得割の納税義務者数」で「平均年収」を定義し計算。「表側」の「市町村民税」と「道府県民税」の平均を計算。「総計」列は5年間の平均を計算。「総計」列で降順にソート。単位は(万)円

総務省が公開しているデータから集計した市区町村ごとの平均年収(※)ランキングトップ20の表です。

(※)正確には所得なので場合によっては全然別のものを表すんですが、それなりに近しいものを見ていることと、「平均年収」という言葉が世の中にあまりにも普及していて伝わりやすいことなどを勘案して、この記事では「平均年収」でいかせてください。
データソース
総務省「市町村税課税状況等の調」よりデータ取得。
より具体的には、年度ごとのページ(例.令和4年度)に飛んだときの「市区町村別内訳」内の「第11表 課税標準額段階別令和4年度分所得割額等に関する調(合計) (所得割納税義務者数・課税対象所得・課税標準額・所得割額)」から取得。

トップ5には港区、千代田区、渋谷区、中央区、芦屋市と名だなる面子が並んでおり、さもありなんって感じです。

データ元の集計単位である行政区分は恣意性があることには注意が必要で、東京特別区はそれぞれ集計されてるんですが、政令指定都市は一つの市として集計されてます。なので横浜市(43位)や大阪市(177位)や名古屋市(48位)など、区のレベルで見ていけば上位に食い込みそうなエリアがまとめられていることにはご留意ください。

トップ20を少し詳しく見てみると、東京23区や関西の雄である芦屋市、由緒正しい住宅街の鎌倉市や葉山町、別荘地の代表格軽井沢町、夢の国浦安市などの名前に混じって、人によってはあまり聞き馴染みがない市区町村がランクインしてることに気づくのではないでしょうか?(猿払村、忍野村、安平町)

少し脇道に逸れますが、それぞれの特徴を調べてみましょう。

  • 8位 北海道猿払村 618.2万円(5年間平均、以下同様)
    • ホタテの漁獲地として有名で、それが大きく所得を引き上げているようです。相席食堂で長州力さんが飛んだ場所。
  • 13位 山梨県忍野村 508.5万円
    • 世界的に有名な企業であるFUNUCがあってそこの従業員の方が住んでるからでしょう。(実は個人的にFUNUC様とは少しご縁があって、大学時代はこの忍野村にたびたび訪れていました。)
  • 16位 北海道安平町 480.4万円
    • ここだけよくわからず、調べてみてもよくわかりませんでした。(わかる人教えてください。。。)自然が豊かで交通の便もよく、子育てや移住にも力を入れているようなので、それで人を惹きつけているのかもしれません。

なるほど、それなりの理由があるからこそこうやって数字に表れているようです。

平均年収1,200万円の町

このように年によらず常に上位に食い込んでくる市区町村であれば、地域全体として所得が高いちゃんとした理由があります。

しかし、これを単年の平均所得ランキングで見てみるとまた違った景色が見えてきます。
例えば、先ほどの表は5年間の平均年収で並び替えていたんですが、これを2022年度の平均年収で並び替えてみてみましょう。(レイアウト若干変わってすみません。プロットしやすさでLookerStudioからTableauに切り替えました。)

データソースは先ほどの表と同様。ただし2022年の平均年収で降順に並び替え。

 

なんと千代田区と渋谷区を押し除けて2位に山口県の周防大島町が上がってくるのです。しかもその平均年収はなんと1,177万円!!(およそ1,200万円でタイトル回収)。

ただ、表を見てもわかるように、2021年までは平均年収250万円くらいの町だったようです。それがなぜいきなり平均年収がこんなにも上がったのか?

どうやら「複数の高額納税者が転入し」たことが原因のようで、ニュースでも取り上げられています。

つくづくお金を平均で語ることの危険性を教えてくれるいい例でしょう。

 

なぜお金を平均で語ってはいけないのか?

代表値に関してはこちらのブログで非常にわかりやすく解説してくれているので、そもそも平均値とか中央値とか怪しいかも、、、って方はこちらを読んでみて欲しいのですが、要は「平均値という指標は異常値や分布の裾野に引っ張られてしまうから」です。

代表値の話こんにちは。新米分析官のA.K.です! 今回は統計学の基本である代表値についての話をしようと思います。簡単だからこそ理解しているつもりに...

「平均」といえばテストの嫌な思い出が蘇ってきます。
平均点と比べて一喜一憂したりのあれです。
ただ、テストの場合は0-100点までと値の範囲が決まっていたので、例えば55万点の人とか入ってきません。なので、平均値はわりかし「みんな取ってる平均的な値」とそこまでズレがなかったりします。

一方でお金の話になると値に上限がないので、みんな300万くらいもらってる中で1億もらう人とかいるわけです。先ほど紹介したブログでも

例えば、年収がそれぞれ100万円、200万円、200万円、300万円の4人がいた場合、4人の平均年収は200万円です。そこへ、年収1億円の人がやってきたとしたら、5人の平均年収は2700万円になります。4人だった時は庶民的な集団だったにもかかわらず、5人になった途端にセレブな集団に早変わりしてしまいます。

などの例が紹介されています。

ちなみに、この例を読んだときに、「またまた〜、そんな極端な例出して、確かに原理的には平均が危険なのは分かるよ?でも現実問題そんな極端な例なんかないでしょ〜」と思った方もいるんじゃないでしょうか?(僕はこういう捻くれた考え方をよくします)

が、この周防大島の例を見れば分かるように現実問題あるのです。お金を平均で判断するとなぜ危険なのか、単なる例ではなく実感を伴う実例として感じていただけたのではないのでしょうか。

でも平均で判断すると何をどう見誤るんでしょう?
「代表値なだけだから、別にそれで判断間違うとかなさそうな気もするけど、、、」とお考えの方、尤もです。
少し考えてみましょう。もう一度先ほどのブログに戻るとこんな例を紹介してくれてます。

例えば、給料UPを目指して平均年収が1000万円の職業に転職しても使用しているデータが右に裾を引いている分布だった場合、実際に自分がもらえる年収は最頻値の300万円前後だった……みたいなことが起きてしまいます。

なるほど、これは見誤りそう、、、

今回の例でいくと「平均年収1,200万円の町か、、、よし移住しよう」となる人はなかなかいないと思いますが、「平均年収1,200万円の会社か、、、よし転職しよう」となる人はたくさんいるのではないかと思います。

そのケースだと例えば

  • 年功序列で給料が上がる会社でかつ50代の社員が多いだけで、若手の給料は300万だった
  • 出来高分が非常に大きく一部の成績上位陣の給料が平均を爆上げしてるだけで、多くの社員の給料は300万だった

などの場合はよくあるんじゃないでしょうか。(特に前者は日本企業だと多いと思うので、少なくとも企業の平均年齢を合わせて確認した方がいいでしょう。ちなみに年齢は範囲がほぼ程度決まってるので年収みたいに平均があんまバグらないです。)

結論「平均、鵜呑み、ダメ絶対」

 

Taizo Okabe
脳筋系データサイエンティスト。筋肉は裏切らない。筋肉。