データサイエンス

データがあるのに、活用しない人々へ – 最高の統計が教えてくれる『発展途上国とは何か?』

 

世界保健の専門家である統計学者ハンス・ロスリングが、世界の格差やその変化に関する我々の誤った認識を、データを可視化する事で解いてくれます。そして、国連を始めとする機関が既にあるデータを活用できていない現状を指摘し、その改善を訴えています。(※この講演は2006年に行われたものです。)

『あなたは世界をどう見ていますか?』

10年ほど前、私はスウェーデンの学生に世界の発展について教える仕事に就きました。私がアフリカの機関と一緒に、20年ほどアフリカの飢餓の研究をしていたので世界のことを少しは知っていると期待したのでしょう。医科大であるカロリンスカ研究所で「世界保健」という学部の授業を持つことになりました。しかしやる段になって不安になりました。スウェーデンでも最も成績優秀な学生たちが相手です。私が教える事なんかみんな知っているのではないかと思いました。そこで最初に小テストをやることにしました。その時の質問は、私に多くのことを教えてくれました。“この5組のそれぞれについて 乳幼児死亡率が高い方を選べ。”

1

各組は、一方が他方よりも2倍以上乳幼児死亡率が高くなるように選んであります。差異がデータの誤差よりずっと大きくなるようにしたのです。別に皆さんをテストはしません。答えはトルコ、ポーランド、ロシア、パキスタン、南アフリカです。これがスウェーデンの学生の成績です。信頼区間はごく狭く、私にはありがたい結果でした。5点満点で平均1.8です。これなら世界保健の教授の居場所があります。私の授業も安泰です。

(会場笑)

しかしその結果について、本当に理解したのは夜遅くその答案をまとめている時でした。スウェーデンの学生の世界の知識は、統計的有意に、チンパンジーより低いということです。

(会場笑)

チンパンジーはバナナを2本もやれば、スリランカかトルコか、半分の場合は正しい方を選ぶでしょう。

スウェーデンの学生はもっと下です。問題は無知ではなく、先入観です。

私はカロリンスカ研究所の教授にも非倫理的な調査を行いました。

(会場笑)

ノーベル医学賞を授与する人たちが、チンパンジー並みだったのです。

(会場笑)

コミュニケーションの必要性を実感しました。世界各国の子供の健康水準については、よく整ったデータがあるからです。

2

それで、ご覧のようなソフトを作りました。丸はそれぞれ国を表しています。これは中国で、これはインドです。円の大きさは人口を表し、横軸は出生率です。学生たちが世界をどう捉えているのか、彼らに聞いてみました。“世界を実際どう思っているの?” 彼らの知識は「タンタンの冒険旅行」から来ているのが分かりました。

(会場笑)

学生たちはいまだ世界を「我々」と「彼ら」に分け、我々「西欧世界」、彼ら「第三世界」と考えています。私は聞きました。 “その「西欧世界」というのは何?”“長生きで小家族なのがそうです、短命で大家族なのが第三世界です”

3

出生率と平均寿命の変化が教えてくれること

これをご覧ください。横軸は出生率、女性1人当たりの子どもの数です。1人、2人、3人、4人から8人まで 1962年以降の各国の家族の大きさについては、とても良いデータがあります。誤差はわずかです。縦軸は出生時平均余命です。30歳くらいから上は70歳くらいまであります。1962年には実際こういう国のグループがありました。工業国は小家族で長寿です。そしてこっちは発展途上国。大家族で比較的短命でした。そして1962年以降何が起きたのか?変化を見てみましょう。学生たちは正しく、今も2種類の国があるのでしょうか?それとも発展途上国が小家族になってこの辺にいるのか?あるいは長寿になって、この上にいるのか?

4

見てみましょう。データには利用可能な 国連の 統計を使っています。では見てみましょう。これは中国。より健康な社会へと改善していきます。緑のラテンアメリカ諸国が小家族に向かっています。黄色いのはアラブ諸国です。寿命が延びています。緑色のアフリカはこの場に留まったままです。インドに、インドネシア。とても速く動いています。

(会場笑)

80年代に入ります。バングラデシュはずっとアフリカ諸国と一緒でしたが、ここで奇跡が起きます。イマームが家族計画を推進し、左上に上がっていきます。90年代にひどいHIVの流行があり、アフリカ諸国の平均余命が下がります。残りの国はみな左上へと進んでいきます。長寿で小家族、私たちの世界は全く違ったものになったのです。

(会場拍手)

5

米国とベトナムとを比較してみましょう。1964年、米国は小家族で長寿。一方ベトナムは大家族で短命です。その後こうなります。戦争中のデータを見ると、戦争による多くの死者にも関わらず、平均余命が伸びています。戦争が終わる頃にベトナムで家族計画が始まり、小家族に向かいます。米国は長寿で小さな家族を保っています。ベトナムは80年代に計画経済を捨てて市場経済になり、社会水準の向上が加速します。そして今日、2003年のベトナムの平均余命と家族の大きさは、ベトナム戦争末1974年の米国と同じ水準になりました。データを見なければ、我々はアジアの著しい変化を過小評価することになります。アジアでは経済の変化の前に社会の変化が現れています。

6

所得格差の真実

別な見方をしてみましょう。世界の所得の分布です。これは世界の人々の所得の分配を示しています。世帯1日当たり1ドル、10ドル、100ドルです。もはや豊かな国と貧しい国の間にギャップはありません。神話です。小さな谷がありますが、ずっと途切れなく分布しています。所得がどういう配分になっているか見てみましょう。これが世界の年間所得の100%です。最も豊かな20%が74%を手にしています。そして最も貧しい20%が2%を手にしています。これを見ると、発展途上国という概念は非常に疑わしいことが分かります。援助について考えるとき、私たちはここの人たちが、ここの人たちを助けていると思っています。しかし真ん中の最も人口の多い部分が今や24%の所得を得ているのです。

7

この人たちは誰なのでしょう?それぞれの国はどこにあたるのでしょう?まずアフリカです。これがアフリカ。世界の人口の10%で 大部分が貧困です。これはOECD諸国。豊かな国々、国連のカントリークラブです。この部分で、アフリカとOECDの間に結構重なりがあります。これは南アメリカ。最貧から最富裕まで全部そろっています。さらに重ねて、東欧、東アジア、南アジア。時間を1970年までを戻します。谷が深くなっています。極貧生活をしている人はアジアに多くいました。世界の問題はアジアの貧困だったのです。時間を進めていくと人口が増加していき、アジアでは何億という人々が貧困から抜け出し、別なところで貧困が進みます。これが現在のパターンです。世界銀行による最良の予測ではこの後こうなります。世界は分断されておらず、ほとんどの人が真ん中にいます。

8 9

これはもちろん対数目盛です。私たちの経済の概念では、成長をパーセントで計ります。発展の割合として見るのです。横軸を世帯収入から1人当たりのGDPに変えましょう。それぞれのデータを地域のGDPに変えます。円の大きさは人口です。OECDがここで、サハラ以南のアフリカがここです。アラブ諸国をアフリカやアジアと分けて別にしましょう。横軸を引き伸ばし、次元をもう1つ追加します。子供の生存率です。横軸がお金で、縦軸が子どもの生き残る可能性です。ある国々では99.7%の子どもが5歳以上まで生きられます。一方70%の国々もあります。ここにギャップがあるように見えます。OECD、南アメリカ、東欧、東アジア アラブ諸国、南アジア、サハラ以南のアフリカ。子どもの生存率とお金の間には強い相関があります。

10

サハラ以南のアフリカをバラしてみましょう。縦軸が保健の水準で、上に行くほど良いということです。サハラ以南アフリカを国に分けました。それぞれの円の大きさは国の人口を表しています。シエラレオネがここ、モーリシャスがあそこにあります。モーリシャスは貿易障壁を最初に解除した国で、砂糖や繊維製品を欧米と対等な条件で売ることができます。

アフリカの国の間にも大きな差があるのです。ガーナは真ん中あたり。シエラネオネは人道的支援を受けています。ウガンダは開発支援を受けています。この辺は投資できます。ここでは休暇を過ごせます。アフリカには大きな幅があるのに、私たちは一緒くたにしています。南アジアを分割してみましょう。真ん中の大きな円がインドです。アフガニスタンとスリランカでは、大変大きな違いがあります。アラブ諸国を分割してみましょう。どうなるでしょう?気候、文化、宗教が同じでも 大きな違いがあります。隣国同士でもイエメンは内戦、アラブ首長国連邦では外国人労働者の子どもも含め、お金が平等にうまく使われています。私たちが信じているのとは異なっています。データはみんなが思うより有効なのです。不確実な部分があるにしても、はっきりした差が見られます。このカンボジアとシンガポールの差は、データの問題をはるかに超えています。東欧は長い間ソビエト経済下にありましたが、離脱して10年、大きく変わっています。南米も今や健康な国はキューバだけではありません。チリは数年のうちに子供の死亡率の低さでキューバを抜きそうです。こちらは高所得なOECD諸国です。

これが世界全体のパターンです。だいたいこんな感じになっています。1960年の世界を見てみましょう。動き始めます。これは毛沢東です。中国に健康をもたらしました。彼の死後、鄧小平が出てきて、中国にお金をもたらし、中国を本流に引き戻しました。このようにそれぞれの国が違った方向に動いています。ですから、世界の典型的なパターンを示す。国の例を挙げるというのは難しいのです。また1960年に戻しましょう。ここにある韓国と、こちらにあるブラジルを比較してみましょう。比較のためウガンダも入れましょう。ここにあります。時間を進めます。韓国がいかに速く進歩しているか分かるでしょう。それに比べるとブラジルはずっとゆっくりです。

11

また最初に戻って、航跡表示をオンにしてもう一度実行すると、発展の速度が大きく異なるのが分かります。そして経済と保健はだいたいのところ同じ割合で変化しています。しかし経済より保健が先に来る場合に、動きがずっと速いのが分かります。それが良くわかるようにアラブ首長国連邦を加えてみましょう。資源の豊かな国です。石油でお金はできましたが、健康をスーパーマーケットで買うことはできません。健康に投資し、子どもたちを学校で教えなければなりません。医療スタッフを育て、国民を教育しなければなりません。首長ザーイドはこれをかなりうまくやりました。石油価格の下落にも関わらず、この国をここまで引き上げたのです。だから世界の主流の状況としては、各国は昔に比べてお金をうまく使うようになっています。これは各国をその平均で見た場合です。

17

でも平均データを使うのは危険があります。国の中にも大きな差があるからです。これを見ると、現在のウガンダは1960年に韓国がいた場所にいます。ウガンダを分けると、国内に大きな差があります。ウガンダで最も富裕な20%がここ。最も貧しい層はここです。 南アフリカを分けるとこんな感じです。最近ひどい飢饉のあったニジェールを見てみましょう。ニジェールの最貧の20%はここで、南アフリカの最も豊かな20%はここです。それなのに私たちはアフリカに対する解決策はどうあるべきかと議論しています。アフリカには世界の全てがあります。HIV対策について、こっちの20%と一緒の議論を、こっちの20%にはできないのです。世界の改善はそれぞれのコンテキストに合わせる必要があり、大きな地域でくくるのは不適切です。細かくやらなきゃいけません。このツールを使わせると 学生がとてもワクワクするのに気づきました。

既にデータがあるのに、活用できていない!

政策立案者や企業もまた 世界の変化を知りたがっています ではなぜそれが実現しないのでしょう?なぜ既に持っているデータを使おうとしないのか?国連も、国の統計機関も、大学も、その他の非政府組織も、データを持っているというのに。それはデータが隠されているからです。一般の人々が使えるインターネットがあるというのに、データは有効に使われていません。

私たちが見てきた世界の変化を示す情報に、公的にアクセスできるものはありません。ある種のウェブページはあります。データベースから養分を取っているわけですが、高い値段を付け、変なパスワードをかけ、退屈な統計データを表示するだけです。

(会場笑と拍手)

これではうまくいきません。

12

何が必要なのか?データベースはあります。新しいデータベースが必要なわけではありません。素晴らしいデザインツールもあり、どんどん増えています。ですから私たちはデータをデザインに結び付ける非営利のベンチャーを始めました。Gapminderです。ロンドン地下鉄の“MIND THE GAP” (隙間にご注意ください)から名前を取りました。私たちはデータをつなげられるソフトを作り始めました。そんなに難しくはありません。数人年です。それでデータを引き出し、アニメーションできるようになりました。いくつか国連機関のデータも解放しました。

いくつかの国はデータを世界に公開することに同意しています。しかし本当に必要なのは検索機能です。データを検索可能な形にして公開し、自由に検索できるようにしなければなりません。そのために世界を回って、どんな言葉を耳にするでしょう? 私は統計機関の人類学に詳しくなりました。みんな同じことを言います。“不可能です、うちの情報は特殊ですから”“よそのデータのように検索可能にするのは無理です”“学生や世界の起業家にデータを無料で提供はできません”。しかし私はそうしたいのです。公的資金によるデータがここにあり、それがネット上で花開くのを見たいのです。肝心なのはデータを検索可能にし、様々なデザインツールを使い、絵として見られるようにすることです。良い報せがあります。国連統計局の新局長は不可能だとは言いません。彼はただ“我々には無理です”と言うだけです。

(会場笑)

なかなか頭の良い人ですよね?

(会場笑)

今後数年で、データの方面で多くのことが起こるでしょう。所得分布をまったく違った方法で見られるようになるでしょう。紫は1970年の中国の所得分布で、水色は1970年の米国の所得分布です。ほとんど重なりはありません。その後どうなったでしょう?こうなります。中国は成長し、平等ではなくなっていきます。そしてこのような位置に、米国のすぐ背後に迫っています。なんだかお化けのようですね。結構怖い感じです。このような情報を持つのは大変重要だと思います。本当に見る必要があります。

(会場笑)

13 14

インターネットが経済力に与える影響

最後に、1000人当たりのインターネットユーザ数をご覧いただきましょう。このソフトを使うと、世界の国々の500種のデータに容易にアクセスできます。画面の切り替えに若干時間がかかりますが、縦軸と横軸に好きなデータを選択できます。必要なのはデータベースを無料化し、検索可能にすることで、そうすればクリックするだけでグラフに変えて、即座に理解できるようになります。統計学者はこういうのを気に入りません。現実を表していないと言います。統計的、分析的手法を使うべきだと言います。しかし、これで仮説生成ができるのです。

16

インターネットが現れ、インターネットにアクセスするユーザ数が増えていきます。横軸は1人当たりのGDPです。新しく登場した技術ですが、それが驚くほど国の経済力に対応しています。だからこそ100ドルPCが重要なのです。ここには良い傾向が見えます。世界がフラットになっているかのようです。これらの国々は経済以上に上昇しており、今後どうなるか興味深いところです。みんながすべての公的データを使えるようになることを願っています。

(拍手)

15