透明になるブラック ボックス: UCLA が地滑りを予測する解釈可能なニューラル ネットワーク SNN を開発

内容の概要: 地滑りの予測は、多くの空間的および時間的変数が関係するため、伝統的に困難でした。ディープ ニューラル ネットワーク (DNN) は予測精度を向上させることができますが、本質的に解釈可能ではありません。この論文では、UCLA の研究者が SNN を紹介します。SNN は、完全な解釈可能性、高精度、高い一般化能力、低いモデルの複雑さという特徴を備えており、地滑りの危険性の予測能力をさらに向上させます。
キーワード: 地滑り SNN DNN

この記事は、HyperAI スーパー ニューラル WeChat パブリック プラットフォームで初めて公開されました~

地滑りの発生は、地形、斜面、土壌、岩石などの材料特性、気候、降雨量、水文などの環境条件など、さまざまな要因の影響を受けます。したがって、予測は常に困難でした。通常、地質学者は物理モデルと統計モデルを使用して、地滑りが発生するリスクを推定します。これらのモデルはかなり正確な予測を提供できますが、物理モデルのトレーニングには多くの時間とリソースが必要であり、大規模なアプリケーションには適していません。

近年、研究者は地滑りを予測するために機械学習モデル、特にディープ ニューラル ネットワーク (DNN) をトレーニングしています。DNNは高精度な予測モデルとして、画像認識、音声認識、自然言語処理、計算生物学、金融ビッグデータなど多くの分野で顕著な効果を発揮しますが、入力層と出力層の外側に複数の隠れた構造を持っています。 、信頼できる解釈が欠けているため、このブラックボックスの問題は研究者を困惑させてきました。

最近、カリフォルニア大学ロサンゼルス校 (UCLA) の研究者らは、スーパーポーザブル ニューラル ネットワーク (SNN) を開発しました。DNN とは異なり、SNN はさまざまなデータ入力の結果を分離し、自然災害に影響を与える要因をより適切に分析できます。SNN モデルは物理モデルや統計モデルよりも優れており、最先端の DNN と同様のパフォーマンスを実現します。現在、研究成果は「解釈可能なニューラルネットワークによる地すべり感受性モデリング」と題して、Communications Earth & Environmental誌に掲載されている。

 図1:研究成果は『Communications Earth & Environmental』に掲載されました

論文全文を読む:

https://www.nature.com/articles/s43247-023-00806-5#Sec4

ヒマラヤ最東端の地滑りデータの選定

研究者らはデータを分析し、2004年から2016年の地滑りによる犠牲者がアジアに集中していることを発見した。ヒマラヤ山脈の最東端の地域では、急斜面の地滑り、極端な降水、洪水などが非常に起こりやすくなっています。 研究者らは、手動による地滑り領域の描写と半自動検出アルゴリズムを組み合わせて、ヒマラヤ最東端の地滑り目録(地滑り事象の記録またはデータセット)を作成しました。900 ~ 1.96 × 106 m2 の範囲の 4.19 × 109 m2 の調査エリア全体で、合計 2,289 個の地滑りがマッピングされました。

図 2: ヒマラヤ最東端の調査地域

色は標高を表し、黄色のボックスは NS (ディバング)、北西-南東 (範囲前線)、および EW (ロヒット) 方向の調査エリアを示します。

差し込み図はヒマラヤ東部を示し、黒いボックスは調査地域を示し、濃い灰色の線は国境 (右上) を示します。

上の図に示すように、研究者らは、SNN モデルのパフォーマンスとアプリケーションをテストするために、ヒマラヤ最東端の異なる環境条件を持つ 3 つの地域 (ディバン、ロヒット、および射程前線) を選択しました。以下、ディバン、ロヒット、レンジフロントエリアをそれぞれNS、EW、NW-SEと呼びます。

データセットアドレス:

https://doi.org/10.25346/S6/D5QPUA

モデル開発: SNN をトレーニングする 6 つのステップ

この研究では、精度を確保しながら DNN の解釈可能性の欠如を回避するために、研究者らはモデル抽出 (モデル抽出) と特徴ベースの手法を組み合わせて、完全に解釈可能な追加的 ANN 最適化フレームワークを生成しました。加算的 ANN は、一般化加算的モデル (GAM) の一種です。モデル抽出方法は、教師モデルを模倣するように解釈可能な学生モデルをトレーニングすることを目的としています。特徴ベースの手法は、各入力特徴の影響を分析して定量化することを目的としています。

研究者らは、この付加的な ANN アーキテクチャをスーパーポーザブル ニューラル ネットワーク (SNN) 最適化と呼んでいます。異なるレイヤー間の接続を通じてフィーチャ間の相互依存性を確立する DNN とは異なり、SNN は元の入力フィーチャの積関数を通じてフィーチャ間の相互依存性を確立します。この 2 つの比較を次の図に示します

図 3: 従来の DNN と SNN

x1、x2、...、xn は n 個の元の特徴のセットを表し、χ1、χ2、...、χM は M 個の結合された特徴のセットを表し、Y と St はそれぞれ DNN と SNN の感受率の結果を指します。

図 3 に示すように、従来の DNN では、ネットワーク内の接続を通じて特徴が表現および学習されます。この依存関係は、非常に複雑で分離が困難なネットワーク構造にしっかりと埋め込まれています。しかし、SNN では、研究者は、各ニューロンが 1 つの入力のみに接続された状態で、出力に寄与する特徴を事前に見つけて明示的にフィードします。

SNN トレーニングのフローチャートは次のとおりです。

 図 4: SNN のトレーニングのフローチャート

この図は、研究者が特徴選択モデルと多段階トレーニングという 2 つの主要なアプローチを採用したことを示しています。特徴選択モデルは、後続の分析とモデリングに最も関連する特徴を選択するために使用されます。マルチステージ トレーニングとは、トレーニング プロセスが複数のステージに分割されていることを意味し、各ステージにはモデルのパフォーマンスを段階的に最適化するための特定の目標とトレーニング戦略があります。

トレーニング プロセスは次の手順に要約できます。

  1. 多変量多項式展開:複合特徴を生成します。
  2. トーナメント ランキング:モデルに最も関連する特徴を見つけるための自動特徴選択方法。
  3. マルチステージ トレーニング (MST):高性能の教師ネットワークを生成するための 2 次深層学習手法。
  4. 部分的知識の蒸留:最終出力に対する各機能の寄与を分離するために使用されます。
  5. 並列知識抽出:標準的な知識抽出手法を各機能に対応するネットワークに個別に適用します。
  6. ネットワークの重ね合わせ:各特徴に対応する単層ネットワークを 1 つの SNN に結合します。

実験結果

SNNの最高正解率は99%を超える

モデルのトレーニングで使用される複合特徴の最高レベルに従って、研究者らは SNN を 3 つの異なるレベルのモデル、つまりレベル 1、レベル 2、およびレベル 3 に分割しました。実験によると、レベル 3 SNN の精度は SOTA 教師 DNN の 99% 以上に達し、レベル 2 SNN の精度は 98% 以上です。2 つの精度の差が小さいことを考慮して、研究者らは、レベル 2 SNN の解釈可能性が分析には十分であると仮説を立てています。

次に研究者らは、レベル 1 およびレベル 2 の SNN を、すべて同じ領域に適用された SOTA DNN 教師モデル (MST、2 次最適化に基づく DNN)、および従来の手法 (LogR および LR) と比較しました。同じデータを使用し結果を下の図に示します。

図5:各モデルの性能比較

MST:  SOTA DNN 教師モデル

LogR: ロジスティック回帰 (従来のアプローチ)

LR: 尤度比(従来法)

示されているように、SNN のパフォーマンスは MST モデルと同等であり、一般的に使用されている従来のモデルよりも優れています。3 つの調査領域の平均に基づいて計算された、レベル 1 およびレベル 2 SNN の AUROC は、それぞれ 0.856 および 0.890 です。レベル 2 SNN の AUROC は、LogR (AUROC = 0.848) および LR (AUROC = 0.823) より約 8% 高くなります。

AUROC (受信機動作特性下の領域): 分類モデルを評価するためのパフォーマンス メトリック。AUROC が 1 に近づくほど、モデルのパフォーマンスが向上します。

SNN は完全に解釈可能です

SNN は、線形回帰に匹敵するレベルの解釈可能性を備えた、完全に解釈可能なモデルです。

研究者らは調査地域を地滑り(ld)地域と非地滑り(nld)地域に分けた。SNN は、地滑りの感受性に対する個々の特性の正確な寄与を提供し、地滑りの感受性に対する各特性の影響を定量化することを可能にします。ld 地域と nld 地域の個々の特性の違いを計算することにより、地滑りの主な制御要因とその相対的な寄与を決定できます。

下図に示すように、MAP*Slope(年間平均降水量と傾きの積)、NEE*Slope(異常降雨回数と傾きの積)、Asp*Relief(傾きの積)方向とローカル方向)は、3 つの領域すべてに大きな影響を与えます。

図 6: 地滑り感受性に対するさまざまな特性の影響

(a、d): NS 調査エリア、(b、e): 北西-南東調査エリア、(c、f): EW 調査エリア。

(a ~ c​​) の棒グラフは、地滑り (ld) 地域と非地滑り地域 (nld) の地物の差の大きさを降順に示し、(d ~ f) の円グラフは、地滑り (ld) に対する地物による影響を示します。 )および非地滑り(nld)地域の平均影響。

平均年間降水量 (MAP)、極端な降雨イベントの数 (NEE)、アスペクト (Asp)、標高 (Elev)、平均曲率 (CurvM)、水路までの距離 (DistC)、全断層 (DistF)、および主な正面反転インパルスと破砕帯 (DistMFT)、および局所空気供給 (リリーフ)。

アスタリスク * は、2 つの特徴の代数乗算を示します。

SNN の独自の機能により、研究者は主要な制御特徴の空間分布とその局所的な影響を分離できます。

 図 7: 各特徴の空間分布

ac: 主要な特徴の空間分布。

df: 感受性に対する気候と傾斜の影響。

(a、d): NS 調査エリア、(b、e): 北西-南東調査エリア、(c、f): EW 調査エリア。

気候の影響が大きい場所は青で色付けされ、傾斜の影響が大きい場所は赤で色付けされます。

平均年間降水量 (MAP)、極端な降雨イベントの数 (NEE)、アスペクト (Asp)、標高 (Elev)、平均曲率 (CurvM)、局地的な風供給 (Relief)。

アスタリスク * は、2 つの特徴の代数乗算を示します。

上記の df に示されているように、 NS、NW-SE、および EW 地域のサイトの約 74%、54%、および 54% は、気候特性 (極端な降雨イベントの数、平均年間降水量、降水量など) の影響を受けます。傾きよりも影響が大きいこと(図では赤色の領域よりも青色の領域が大きい)は、ヒマラヤ最東端の地すべりを制御する上で気候特性が重要であることを示しています。ヒマラヤ山脈に沿って東に向かって降水量が徐々に増加するため、ヒマラヤ山脈東部では垂直気候が大きく変化します。この気候勾配は、ヒマラヤ山脈東部の地滑りの起こりやすさに影響を与える可能性があります。

SNN コードの GitHub アドレス:

https://GitHub.com/geosnn/geosnn.git

SNN が地滑り予測の難問を突破

研究著者のLouis Bouchard氏とSeulgi Moon氏はどちらもUCLAの准教授、Khalid Youssef氏はUCLAの博士研究員、Kevin Shao氏はUCLAの地球・惑星・宇宙科学の博士号取得候補者である。

 写真8: 左から右へ、ルイ・ブシャール、スルギ・ムーン、ハリド・ユセフ、ケビン・シャオ

Kevin Shao 氏は、  「ディープ ニューラル ネットワーク (DNN) は地滑りの正確な発生確率を提供できますが、どの特定の変数が地滑りを引き起こすのか、またその理由を判断することは不可能です。」と述べ、共同筆頭著者の Khalid Youssef 氏は「問題は次のとおりです。」と指摘しまし。  DNN レイヤーの個々のネットワークは学習プロセス中に常に相互に影響し合っているため、その結果を明確に分析することは不可能です。この研究では、さまざまなデータ入力の結果を明確に分離できるようになり、識別にさらに役立つことが期待されています。自然災害に影響を与える最も重要な要因。」

「死因を特定するために解剖を行うのと同様に、地滑りの正確な引き金を特定するには、常に現場での測定と土壌、水文、降雨量や強さなどの気候条件に関する履歴記録が必要ですが、これらの情報は、次のような遠隔地では入手が困難です。しかし、SNN は重要な変数を特定し、地滑りの感受性への寄与を定量化することができます」と Seulgi Moon 教授は述べました。Louis Bouchard 氏は、  「トレーニングに強力なコンピューター サーバーを必要とする DNN とは異なり、SNN は Apple Watch 上で実行できるほど小さいです。」と述べています。

研究者らは、カリフォルニアなど、世界の他の地滑りが発生しやすい地域にも研究を拡大する予定だ。頻繁に山火事や地震が発生し、地滑りの危険が高まっているカリフォルニアでは、SNN は複数の信号を組み合わせて他の多くの地表の危険を予測する早期警報システムの開発に役立つ可能性があります。

参考記事:

[1] https://phys.org/news/2023-06-geologists-artificial-intelligence-landslides.html

[2] https://newsroom.ucla.edu/releases/artificial-intelligence-can-predict-landslides

[3] https://www.bccn3.com/news/ucla-geologists-develop-ai-model-to-predict-landslides

[4] https://static-content.springer.com/esm/art%3A10.1038%2Fs43247-023-00806-5/MediaObjects/43247_2023_806_MOESM1_ESM.pdf

この記事は、HyperAI スーパー ニューラル WeChat パブリック プラットフォームで初めて公開されました~

おすすめ

転載: blog.csdn.net/HyperAI/article/details/132067881