オープンデータを利用した細かいメッシュの人口推計法として、国勢調査の250mメッシュ人口を電子地図等から得られる住宅の図上面積等を用いて、より細かいメッシュに按分するという方法がある。しかし、この方法では中高層の住宅が多い地域で推計誤差が大きく、都市部での25mメッシュといった高い水平解像度の人口推計には適さない。そこで、2020年に整備が始まった3D都市モデル等のオープンデータを活用して、住宅の延床面積等を用いた25mメッシュ人口の推計を行った。建物の階数データを併用すれば階数別のおおまかな人口も推計できる。このような推計は、オープンデータから得られる高空間解像度の簡易人口データとして、高度なマネジメントが求められる人口減少時代の都市経営に役立つ可能性がある。
1.結果の概要
具体的な推計方法や妥当性の検証など技術的な内容は後述することとし、背景から結果までを総括する。
国勢調査による人口データには、市町村の町丁・字等単位で集計された小地域データと緯度・経度方向で区画されたメッシュデータの2種類がある。オープンデータ1として入手可能なメッシュデータで最も細かいものは250mメッシュである(メッシュは緯度・経度単位で分割されるため、実際には1辺が約250m)。
それに対して、近年整備が進んでいる洪水ハザードマップの氾濫・浸水計算では25mメッシュが使われることが多く2、浸水想定区域内の人口推計などの場面ではメッシュサイズの違いが問題となる。このため、国勢調査をもとにした100mメッシュ等の推計人口や、スマホ等のGPS位置情報を活用した高解像度人口データなど、250mメッシュより細かい人口推計データが事業者等から有償で提供されている。
また、電子地図等で住宅の形状や面積をGIS(Geographic Information System)ソフトで計測するなどして、250mメッシュの人口を更に細かいメッシュに按分する簡易推計法も提案されている3。この方法では、既知メッシュ内の人口の按分に、建物の図上面積や建築面積(図表1)等を用いるため、中高層住宅が多い地域では推計誤差が大きく、都市部での25mメッシュなど高解像度の人口推計には適していない。そのような推計には、個々の建物の用途や床面積の合計(図表1の延床面積)に関するデータが必要になる。
そこで、2020年度に開始された3D都市モデルの整備・オープンデータ化プロジェクトPLATEAU4で提供されている建物データを活用して、同じくオープンデータである250mメッシュ国勢調査人口データから25mメッシュ人口を推計する方法を検討した。なお、本稿では、既知のメッシュ人口を細かいメッシュに按分する際に建物の建築面積(または図上面積)等を用いる従来の方法を「建築面積法」と呼称し、建物の延床面積等を用いる今回の方法を「延床面積法」と呼称する。
図表2の左図に検討対象地域の建物の状況を示す。これは、ある中核市の3D都市データを用いて建物を用途別に色分けしたものである。この範囲は中心市街地から郊外に移行する地域にあたり、人口のコントラストが大きく、中高層の建物は多くが共同住宅である。右図は今回の延床面積法による推計結果であり、25mメッシュで推計した人口を住宅の2階以下と3階以上の階数区分別に表現している。このように、延床面積法では3D都市モデルの高さや階数データとの組み合わせにより、住宅の高さや階数別のおおまかな人口も推計できる。洪水による資産被害額の算定では、建物の2階以下を算定対象とする資産額補正5があり(3階以上は算定対象から除外)、右図はそのような資産被害の算定区分と紐づいた大まかな人口を表している。
次項に詳述するとおり、延床面積法は従来の建築面積法と比べて妥当性が高く、オープンデータから得られる高解像度の簡易人口データとして、地域の様々な分析に利用できる可能性がある6。現在のところ、延床面積法の利用に必要なデータが公開されている都市は限定的だが、令和5年4月に国土交通省の審議会がとりまとめた今後の都市政策の方向性では、都市に関わるデータの取得、デジタル技術の活用の重要性が指摘されており7、今後の建物関連情報の充実と更なるオープンデータ化が期待される。
近年は、個人情報保護の面で地域のきめ細かな情報の収集・把握が難しいケースも多い。災害や気候変動リスクへのレジリエンス向上など、高度なマネジメントが求められる人口減少時代の都市経営にとって、このようなオープンデータを有効活用した、きめ細かな人口推計が役立つ可能性がある。
2.推計方法と妥当性の検証
(1)推計方法
延床面積法は、既存メッシュ内の人口を個々の住宅の延床面積データを使って細かいメッシュに按分するという方法であり、推計のためには個々の建物の位置、形状といった基礎的な情報以外に、建物の用途と延床面積という2つのデータが必要になる8。PLATEAUでは2023年4月時点で約130都市の3D都市モデルが公開されており、このうち上記の2つのデータが公開されているのは45都市となっている9。
中核市の場合、3D都市モデルの建物データは数万~数十万レコード × 数十カラムという非常に大きなデータ量になるため、ある程度の記載漏れや誤りが含まれる可能性もある。このため、今回の推計では個々の建物の用途と延床面積だけでなく、建物の高さ、地上階数、建築面積という5種類のデータが揃っている都市のデータを用い、延床面積の記載漏れや明らかな誤りを補完・修正した上で検証を行った(詳細には触れないが、“建物の高さ”、“地上階数”、“延床面積 / 建築面積”との関係、更には建築面積とGISソフトで計測した図上面積との関係を地域ごとに分析して外れ値を検出し、補完・修正等を行った)。
延床面積法ではメッシュごとの推計人口を次式により求めることができる。
各細分メッシュの推計人口 = 元メッシュの人口(国勢調査人口等)× 細分メッシュの人口按分率P
P = 細分メッシュ内の住宅の補正後総延床面積S1 ÷ 元メッシュ内の住宅の補正後総延床面積S2
S1 = Σ (共同住宅以外の住宅の延床面積 × 当該住宅を細分メッシュで分割した後のGIS測定面積 ÷ 当該住宅のGIS測定面積)
+ R × Σ(共同住宅の建物の延床面積 × 当該共同住宅を細分メッシュで分割した後のGIS測定面積 ÷ 当該共同住宅のGIS測定面積)
S2 = Σ (共同住宅以外の住宅の延床面積 × 当該住宅を元メッシュで分割した後のGIS測定面積 ÷ 当該住宅のGIS測定面積)
+ R × Σ(共同住宅の建物の延床面積 × 当該共同住宅を元メッシュで分割した後のGIS測定面積 ÷ 当該共同住宅のGIS測定面積)
R補正係数 = 共同住宅以外の住宅の一人当たり平均床面積 ÷ 共同住宅の一人当たり平均床面積
※上記のΣ ( ) は個々の住宅の計算結果をメッシュ内のすべての住宅について合計することを意味する。
※上記のRは、居住者一人当たりの床面積が共同住宅とそれ以外の一戸建て等の住宅で異なる場合に、その違いを補正するための係数である。住宅ごとの値ではなく地域全体の平均値を用いた。住宅の一人当たり平均床面積は総務省住宅・土地統計調査の市町村再集計版データから算出できる。
(2)妥当性の検証
推計方法の妥当性を検証するため、図表2に示した南北約1850m、東西約2270mの範囲について、延床面積法と建築面積法による推計結果の比較を行う。
この範囲は、GISの標準地域メッシュの3次メッシュ(1kmメッシュと呼ばれる)で4区画分、4次メッシュ(500mメッシュ)で16区画、5次メッシュ(250mメッシュ)では64区画分となる。この場合、500m、250mのいずれのメッシュサイズについても国勢調査による人口がオープンデータで得られる。このため、500mメッシュ国勢調査人口から、建築面積法と延床面積法でそれぞれ250mメッシュ人口を推計し、それらの結果を250mメッシュ国勢調査人口と比較することで、推計方法の妥当性を比較検証できる。
推計結果を図表3に示す。図には、元データである500mメッシュ国勢調査人口(図の①)、建築面積法による250mメッシュ推計人口(②)、延床面積法による250mメッシュ推計人口(③)のほか、結果の対比のために250mメッシュ国勢調査人口(④)を示した。各メッシュの赤の濃淡は人口の大小を表している。人口の色分け区分の一致度をみると、建築面積法(②)に比べて延床面積法(③)の方が国勢調査人口(④)との一致度が高いことがわかるものの、2つの方法による結果に決定的な違いはないようにみえる。
そこで、推計結果と250mメッシュ国勢調査人口について更に詳しい検証を行う。
図表4の左グラフの赤いラインは傾きが1の直線である(推計人口が国勢調査人口に一致していれば、64メッシュ分のプロットが赤いライン上に並ぶことになる)。グラフをみると、建築面積法では回帰直線の傾きが1から外れているが、延床面積法では回帰直線の傾きが1に近く、決定係数(R2)も1に近い。このことは、延床面積法の方が推計値と国勢調査人口との適合度が高いことを意味している。参考まで、各推計値と国勢調査人口との差を推計誤差とみなして回帰モデルの評価指標であるMAEとRMSE10を求めると、RMSEについて違いが大きく、延床面積法の方が外れ値による影響が小さい推計になっていると考えられる。
図表4の右グラフは、左グラフの縦軸(推計人口)を推計誤差(国勢調査人口と推計値の差)に置き換えたものである。これをみると、建築面積法では人口密度が高いメッシュで誤差が拡大する傾向があるのに対して、延床面積法ではそのような傾向はなく、人口密度が大きい地域でも適用できる可能性が相対的に高い。
以上から、延床面積法は建築面積法に比べて推計方法としての妥当性が高いことがわかる。
(3)妥当性の違いを生む要因
図表5に、250mメッシュ内の国勢調査人口と総建築面積との関係(左グラフ)、同じく総延床面積との関係(右グラフ)を示す。この図からわかるとおり、メッシュ内の人口との相関は、総建築面積よりも総延床面積の方が明らかに強く、このことが延床面積法の妥当性が相対的に高いことの要因となっている。
3.延床面積法による高解像度メッシュ人口の推計
(1)25mメッシュ人口の推計
延床面積法による25mメッシュ人口の推計結果を図表6に示す。この図には、250mメッシュ国勢人口からの推計結果(図表2の右図はこの結果を階数区分別に立体表示したもの)、500mメッシュ国勢人口からの推計結果、推計結果の拡大図を順に示した。図中の赤色の濃淡は各区画内の推計人口を表している。図の範囲には25mメッシュが6,400区画含まれており、拡大図をみると、右側の25mメッシュ推計人口では赤色の濃淡と住宅の位置や粗密がよく整合していることがわかる。高解像度メッシュでは、人口が密集している場所とそうでない場所のコントラストが強く、元の国勢調査メッシュ人口とはかなり違った印象をもたらす。
なお、図からは元データの違いによる推計結果への影響は読み取れないため、その点は次項にて考察する。
(2)推計結果に関する考察
25mメッシュの場合、250mメッシュにおける国勢調査人口のような比較可能な調査データがないため、推計誤差という形で結果を検証することができない。このため、(1)の推計結果に関して2点考察する。
1点目は、推計に用いる人口データの元メッシュサイズと推計メッシュサイズとの面積比(ここでは「メッシュ分割比」という)が推計結果に与える影響である。図表7に、異なるメッシュ分割比で得られた2つの推計人口をプロットした。2つの推計結果には相関が認められるが、図中の赤枠内をみると、原点を通る傾き1の直線から大きく外れる点(2つの推計結果が大きく食い違うメッシュ)が多数ある。延床面積法が元データのメッシュ人口を各メッシュ内に按分する方法であることを踏まえると、図の赤枠内は、500mメッシュからの推計に、非常に大きな推計誤差が含まれる場合があることを示している。以上から、25mメッシュ人口の推計では、元データとして250mメッシュ人口を用いることが望ましい。
2点目は、高解像度の人口推計における推計方法の違いによる影響である。図表8に、メッシュ内の総建築面積と総延床面積の関係を示す。左が250mメッシュ64区画分、右が25mメッシュ6,400区画分についての結果である。この図から、25mメッシュでの総建築面積と総延床面積の相関は、250mメッシュに比べて大幅に弱いことがわかる。2(3)のとおり、メッシュ内の人口との相関は総延床面積よりも総建築面積の方が弱く、2(2)のとおり、推計誤差は延床面積法よりも建築面積法の方が大きい。このため、推計メッシュサイズが小さくなると、メッシュ内人口と総建築面積との相関が大幅に弱まり、建築面積法による推計誤差が大幅に拡大することになる。よって、25mメッシュといった高解像度メッシュの人口推計では延床面積法を用いることが望ましい。
4.おわりに
本稿では、オープンデータを活用した延床面積法による高解像度メッシュ人口の簡易推計法の概要を報告した。今回の延床面積法の一部は、すでに10km2以上の広範囲の高解像度人口推計に適用しており11、細かいメッシュの洪水ハザードデータに人口データを重ねて詳細な分析を行う場面等で有用性を確認している。
都市関連データのオープンデータ化の進捗に伴い、今回の簡易推計法の適用可能地域も拡大が見込まれる。気候変動リスクへの対応やまちづくりに関する検討・分析など、中長期的な都市経営に関わる様々な場面で、このような簡易人口推計が役立つことを期待したい。