・ディープラーニングを用いた新しいモデルは、低解像度の衛星画像を用いて、非正規市街地を自動的に検出し、地図化することができる。
・費用対効果の高い方法で、非正規市街地の領域を分類することができる。
世界の都市人口の約4分の1は、非正規市街地で暮らしています。非正規市街地とは、都市のインフラや基本的なサービスから切り離された地域です【法律上建物の建設が許されない土地】。これらの地域の住宅のほとんどは建築規制を遵守しておらず、環境的にも地理的にも危険な地域に位置しています。
このような地域を地図化することで、NGOが困っている人たちにより良いサービスを提供することができます。そうすれば、現地の人々は大きな進化を遂げ、より良い生活の質を得ることができるようになるでしょう。しかし、このような地域の地図化は困難な作業であり、多くの献身的な人材と資金が必要とされます。
このような課題に対処するため、国際的な研究者チームは、無料で入手できる衛星画像や航空画像を用いて、非正規市街地を自動的に検出し、地図化できるディープラーニングベースのシステムを構築しました。このシステムは、衛星画像(未加工のユーザーフォーム)を入力とし、学習された分類器を提供し、非正規市街地を強調表示するバイナリマップを生成します。
費用対効果の高い、機械学習ベースのアプローチ
研究チームは、非正規市街地を特定し、地図化するための2つの機械学習ベースの手法を開発し、広範囲において検証しました。一方の方法は費用対効果が高く、他方は費用対効果が低いものの、文脈情報を処理するのに不可欠なものです。これらの方法を組み合わせることで、非正規市街地の領域がどのようなものかを分類することができます。
一つ目の方法は、計算効率の良い正準相関フォレスト(分類と回帰のための決定木アンサンブル法)を用いて、低解像度の衛星画像から非正規市街地のスペクトル信号を学習します。
二つ目の方法は、非常に高解像度の衛星画像を用いて畳み込みニューラルネットワークを使用し、より細かな特徴を抽出するものです。研究チームは、提案した手法を一般化することで、局所地域だけでなく世界規模で非正規市街地を特定できることを実証しています。
畳み込みニューラルネットワークは、低解像度、高解像度、超高解像度の衛星画像で、それぞれ16GBのメモリを搭載したNVIDIA Tesla V100 GPUを8台使用して学習されています。超高解像度を実現するには少々コストがかかるため、研究チームは低解像度の衛星画像を使用した費用対効果の高いアプローチを考え出しました。
ナイロビ、キベラの正規市街地と非正規市街地
出典:研究チーム
研究チームは、低解像度と超高解像度の衛星画像に対応した2つの非正規市街地ベンチマークと、それに付随する地上検証データ【遠隔測定した地上の対象物について、現地調査から得た真実のデータ】を発表しました。また、すべてのソースコードとモデルをGitHub【Gitの仕組みを利用して、世界中の人々が自分の作品(プログラムコードやデザインデータなど)を保存、公開できるようにしたWebサービスの名称】で提供しています。
世界中の非正規市街地には違いがあり、地盤内の不確実性もあるため、このシステムは転移学習やメタ学習技術のテストに非常に有用であると考えられます。研究チームは、ベイズ手法【ある仮定のもとで限られたデータから発生元の母集団を特定する手法】を応用して、確率的なモデルによって不確実性を特徴付けることを計画しています。
さらに、非正規市街地の1キロ四方のエリアには、129,000人以上の人々が住んでいると考えられます。つまり、1ピクセルが13人を表すことになります。このような計算は、政府やNGOが、どれだけの援助が必要なのか、どれだけのインフラが必要なのかを理解するのにとても役立つと思われます。
研究チームは現在、ユニセフと協力して、非正規市街地の地上検証データと注釈を追加で収集しています。