パラメトリック・ノンパラメトリック手法と機械学習手法を使用してインドの降雨量の変化を分析すると、我が国にどのような警告をもたらすことができるでしょうか?

気候予測 | 並列コンピューティング クラスター

気候シミュレーション | 高性能数値計算

気象ビッグデータプラットフォーム | 気象高機能メータークラスター

気候予測、気候シミュレーション、スマート天気、並列コンピューティング クラスター、気象ビッグ データ プラットフォーム、高性能数値コンピューティング、および気象高性能コンピューティング クラスターの発展により、人類は人工知能ビッグデータの新時代を迎えました。気候変動への対処において基礎科学技術の支援的な役割を効果的に果たすために、気候システム変化の新たな事実と新たな傾向を科学的に理解し、気候変動とグリーン・低炭素開発への取り組みにおける国家および地域のサービスニーズに応える。この論文では、パラメトリック ノンパラメトリックおよび機械学習手法を使用してインドの降雨量の変化を分析し、私の国にもたらされた啓蒙について説明します。

インドの降雨量研究について

降雨の空間的および時間的分布と降雨パターンの変化を調査することは、水資源の管理と計画、持続可能な農業開発、その他の部門にとっての基本的な要件です。この研究は、34気象区分の全体データや変化点などを用いて、年間降水量の変動や傾向を調査するものです。調査によると、年間降水量の変動はインド西部の各地域で最も大きく、降水量の変動が最も小さいのはインド東部と北部であることが判明した。

1960 年以降、ほとんどの気象小地域で複数年の長期平均降水量からの降水量の偏差は -500 mm を超えましたが、いくつかのサブ地域の降雨量はプラスに偏差しました。したがって、詳細な分析から、ほぼすべての部門が 1970 年以降、マイナスの傾向と大きな変動を示していることがわかります。したがって、全国の過去のデータに関するこの詳細な情報は、計画を立てるのに非常に役立ちます。この研究では、人工ニューラル ネットワークなどの高度な AI モデルを使用して、すべての気象区分の降雨量を予測しました。降水量予測の結果は、2030 年までに降雨量の 15% が降るということを示唆しており、環境と生物界の両方にとって憂慮すべきシナリオを示しています。

インド経済は農業と工業に完全に依存しています。したがって、水資源はインドの経済発展にとって不可欠な部分です。地球規模の気候変動によって降雨パターンが乱れているため、先進国では降雨パターンの変化を定量化し、それに応じて管理計画を策定する研究が行われています。この研究は、年雨量と季節雨量の全体的な変化点の降水量の変化傾向、変化点からの降雨量の変化率、年の見かけの偏差と将来の降雨量など、さまざまな側面に関する情報を提供します。 、この研究はインドの降雨量の変化の原因を分析します。技術的には、この研究では、高精度の結果が得られたとして世界中の科学者から賞賛されているいくつかの洗練された技術が使用されました。

この研究における設計手法:

マン・ケンダル法

マン・ケンダル法は、マン・ケンダル検定とも呼ばれ、気候の診断と予測のためのノンパラメトリックな方法です。マン・ケンダル検定法は、一連の気候に急激な変化があるかどうか、また、ある場合にはその急激な変化の時期を判断するために使用できます。マン・ケンドール テストは、気候変動の影響下での降水量と干ばつの頻度の傾向を検出するためにもよく使用されます。

上海の年平均気温のマン・ケンダル統計曲線

2. 確率論的手法と決定論的手法

人工ニューラル ネットワーク (一般的な AI モデル) を使用して、34 の気象区分の降雨量を予測します。ANN は、非線形ブラック ボックス AI モデルです (並列分散情報処理システムのように機能し、脳の生物学的構造を反映し、入力と出力の間の関連付けを確立するために情報を処理する単純なニューロンとリンクで構成されます)。脳の機能と同様に、ANN モデルはフィードフォワード多層パーセプトロン アルゴリズムを使用して機能します。構造は入力層、1つ以上の隠れ層、出力層の3層で構成されます。隠れ層のニューロンの数は試行錯誤により決定しました。ANN 学習は、生物学的ニューラル ネットワークの構造と機能、つまりニューロンのコアに存在するシナプス リンクへの厳密な調整に基づいています。

ANN人工ニューラルネットワーク

3. Sen+MK トレンド分析

Sen の傾き推定は傾向値の計算に使用され、MK ノンパラメトリック検定と組み合わせてよく使用されます。つまり、まず Sen トレンド値を計算し、次に MK 法を使用してトレンドの重要性を判断します。

4. ArcGIS クリギング

この方法は、自己相関 (つまり、測定点間の統計的関係) を含む統計モデルに基づいています。したがって、統計的手法には、予測曲面を作成する機能があるだけでなく、予測の確実性または精度の何らかの尺度も提供されます。

クリギングでは、サンプル ポイント間の距離または方向が、表面の変動を説明するために使用できる空間相関を反映していると仮定します。クリギング ツールは、指定された数のポイント、または指定された半径内のすべてのポイントに数学関数を当てはめて、各位置の出力値を決定します。クリギングは複数段階のプロセスであり、データの探索的な統計分析、バリオグラム モデリング、分散曲面の調査を含む曲面の作成が含まれます。この方法は土壌科学や地質学で一般的に使用されます。

私の国の現在の気候状況

地球温暖化などの問題が顕在化する中、我が国の気候の現状を大気圏、水圏、雪氷圏、生物圏の側面から紹介します。

1. 雰囲気

1. 平均年間降水量は増加傾向を示しており、降水量の変化には地域差が顕著である。1961 年から 2021 年まで、平均年間降水量は増加傾向を示し、10 年あたり平均 5.5 ミリメートル増加しました。2012 年以降、年間降水量は高い状態が続いています。2021年の平均降水量は平年より6.7%多く、このうち中国北部の平均降水量は1961年以来最も多く、華南の平均降水量は過去10年間で最も少ない。

2. 高温や大雨などの異常気象や気象現象が増加し、激化しています。1961 年から 2021 年にかけて、極端な大雨が増加傾向にありましたが、1990 年代後半以降、極端な高温現象が大幅に増加し、上陸台風の平均強度変動が増加しました。2021年の平均暖かい日の数は1961年以来最多となり、雲南省の元江(44.1℃)や四川省の撫順(41.5℃)など62の観測所で日最高気温が歴史的な極値を突破した。1961年から2021年にかけて、北部地域の平均粉塵日数は減少傾向を示し、近年で最低値に達し、わずかに回復しました。

1901 年から 2021 年までの中国の年間平均表面温度の異常 (1981 年から 2010 年の平均との比較)

2. 水圏

1. 沿岸の海面変化は一般に変動する上昇傾向を示します。1980 年から 2021 年までの沿岸の海面上昇率は年間 3.4 mm であり、同期間の世界平均よりも高かった。2021年の沿岸海面は1993~2011年の平均より84ミリ高くなり、1980年以来最高となる。

2. 地表水資源の量は年ごとに大きく異なり、青海湖の水位は過去 20 年間上昇し続けています。2021年、地表水資源量は平年値よりわずかに増加し、遼河、海河、黄河、淮河流域は大幅に増加し、海河流域の地表水資源量は1961年以来最大となる。 ; 珠江と南西江は通常の値より低くなります。1961年から2004年まで、青海湖の水位は顕著な低下傾向を示し、2005年以来、青海湖の水位は17年連続で上昇し、2021年の青海湖の水位は3196.51メートルに達し、過去最高を超えた。 1960年代初頭の水位。

1980 年から 2021 年までの中国沿岸海面の異常値 (1993 年から 2011 年の平均値との比較)

3. 雪氷圏

1. 青海チベット高速道路沿いの永久凍土は劣化傾向を示している。1981 年から 2021 年にかけて、青海チベット高速道路沿いの永久凍土地域の活性層の厚さは顕著な増加傾向を示し、10 年あたり平均 19.6 cm 増加しました。2004 年から 2021 年にかけて、地下の温度は上昇しました。活性層(永久凍土の上限)は顕著な増加傾向を示しました。2021年には、青海チベット高速道路沿いの永久凍土地域の活性層の平均厚さは250cmとなり、これは観測記録以来最高値となる。

2. 北極の海氷の面積は大幅な減少を示しています。1979 年から 2021 年まで、北極の海氷の面積は一貫した減少傾向を示し、3 月と 9 月の北極の海氷の面積はそれぞれ 10 年あたり平均 2.6% と 12.7% 減少しました。1979 年から 2021 年まで、南極の海氷の面積は顕著な直線的な変化傾向を示さなかった; 1979 年から 2015 年まで、南極の海氷の面積は変動し、増加したが、2016 年以降、海氷の面積は全体的に比較的小さかった。


青海チベット高速道路沿いの永久凍土地域における活性層の厚さと活性層底部の温度変化

4. 生物圏

1970 年代以降、中国沿岸部のマングローブ林の面積は、一般的に最初は減少し、その後増加する傾向を示しています。2020年には、中国のマングローブの総面積は基本的に1980年の水準に回復するとみられている。

1. 全体的な植生面積は着実に増加し、緑化傾向を示しています。2000 年から 2021 年にかけて、中国の年平均正規化差異植生指数 (NDVI) は大幅な上昇傾向を示しました。2021年の中国の平均NDVIは、2001年から2020年の平均と比べて7.9%増加し、2016年から2020年の平均と比べて2.5%増加し、2000年以来最高値となる。

2000 年から 2021 年までの中国の衛星リモートセンシング (EOS/MODIS) による正規化された植生指数の年間平均値

2.中国各地の代表的な植物の春の季節は進歩傾向を示し、秋の季節は年ごとに大きく変動した。1963年から2021年まで、北京駅のモクレン、瀋陽駅のクロバッタ、合肥駅のシダレヤナギ、桂林駅の甘草、西安駅のカエデの葉の展開開始は3.5日、1.5日早く、 10年ごとにそれぞれ2.5日、3.0日、2.8日。

1963年から2021年までの中国各地の代表的な植物の葉展開の初期および初期段階の変化

Blue Ocean Brain 気象データ ソリューション

ある県は、私の国で台風、大雨、干ばつ、寒波、強風、ひょう、凍害、竜巻などの災害により最も深刻な被害を受けた地域の一つです。比較的頻繁に発生する気象災害の場合、経済社会発展に貢献する地方気象局の役割がますます重要になっており、気象観測、データ共有、精度の高い予報のレベルを向上させることが重要になっています。ブルーオーシャンブレインとの協業により、気象業務における独自のITインフラの制約を取り除き、柔軟な統一アーキテクチャを導入し、高度な気象観測・予報・サービスビジネスを実現しました。

1. お客様のニーズ

天気予報シミュレーションは、大量の計算量、集中的な通信、高い I/O 要件、標準化されたモデルの体系的な統合などの特性により、高性能コンピューティング システムの計算性能に対する非常に高い要求が求められます。 :

1. 計算量が多い

天気予報自体は時間に敏感であり、手動介入なしで一定時間に自動的に操作する必要があります。通常、毎日 2 ~ 4 つの固定時間帯で実行され、各時間帯は 2 時間以内に実行されます。したがって、並列計算には優れた計算性能を備えた高性能計算機システムを使用する必要があります。

2. 集中的なコミュニケーション

並列計算を使用しているため、各 CPU 間の通信量が非常に多くなります。これは主に、WRF のさまざまなコンピューティング ドメイン間の通信と、さまざまなデータ部門間の通信に反映されます。したがって、高性能コンピューティングシステムには、高性能なコンピューティングだけでなく、高性能な通信ネットワークも必要となる。

3. 高い I/O 要件

多数のユーザーと多数の小さなファイルの読み取りと書き込みが関係するため、ウェザー モードにはシステム全体の IOPS パフォーマンスに対する高い要件があり、ストレージ システムの安定性と可用性は、システム全体の動作にとって非常に重要です。ビジネス システムには障害の自己修復機能が必要であり、ストレージ システムには障害の自己修復機能が必要です。また、気象データの定期的なアクセス特性を考慮すると、ポリシーベースの階層化ストレージ機能をサポートする必要がある。

4.モードシステム統合

ソフトウェアの処理フローの観点からは、一般的に前処理、メインモード、後処理に分けられます。前処理からメインモデル、そして後処理に至るモデルシステム全体において、システムには高い堅牢性が求められるため、優れたモデルソフトウェアアプリケーションの専門家によるサポートとハードウェアレベルのシステム技術サポートも、モデルシステムを有効に活用するための鍵となります。予測モデル。

2、解決策

従来の気象観測データ、気象衛星データ、レーダーデータ、Blue Ocean Brainが受信した数値予報製品などのマルチソースデータを利用し、定量的反転、機械学習、クラウドコンピューティング、クラウドストレージ、ビッグデータ分析、高速サイクルに基づいて同化、仮想現実などの最先端技術を活用し、多様な高性能コンピューティング能力、正確な短期予測、ワンストップのマルチソースデータ融合、多様な気象サービスの利点を備えた気象ビッグデータプラットフォームを開発しました。気象業界全体の情報システムのトップレベル設計、ソフトウェア開発・アプリケーション、データ共有サービスなどを提供するほか、道路、航空、物流、農業などの業界を対象とした正確な天気予報支援サービスも提供します。

お客様のニーズに業界の特性を合わせて応えるため、計算ノード、ネットワーク、ストレージ、消費電力、拡張性、放熱性などの側面から総合的なソリューションをご提案します。

1. 計算ノード

高性能インテル Core シリーズ プロセッサーが使用され、コンピューティング ノードには 2 ソケットの組み合わせソリューションが採用されています。4 ウェイ コンピューティング ノードは、その卓越したコンピューティング能力とメモリ容量を利用して、中小規模のモデルの処理と分析を 1 台のマシンで完了し、データの前処理、計算、分析の時間を短縮し、コンピューティング効率を向上させることができます。

2. 高速ネットワーク

高性能の専用高速 IB ネットワークを使用して、コンピューティング ノード、管理ノード、ログイン ノードをフルライン速度で相互接続し、クラスター通信ネットワークの高性能を確保します。また、NASストレージは10Gbを介して高速ネットワークに接続されており、クラスタ並列ファイルシステムと連携して全ノードのデータ共有を実現します。

3. ストレージシステム

これまでのストレージ ハードウェア ソリューション、システム アプリケーションに必要なストレージ デバイスの特性、およびハイ パフォーマンス コンピューティングの分野における Blue Ocean Brain の長年の実装経験を組み合わせることで、現在の使用および将来の拡張ニーズに完全に対応できます。ユーザー。

4. 低消費電力

このソリューションは、全体的なコンピューティング効率を重視するだけでなく、単位体積あたりのコンピューティング能力と単位エネルギー消費によって提供できるコンピューティング能力も重視します。

5. スケーラブル

コンピューティング システムにはラックマウント サーバーが採用されており、ノード内のスケーラビリティを確保するだけでなく、クラスタ全体の水平スケーラビリティも確保できます。一般に、これは将来のクラスターに対するユーザーの拡張要件を満たします。

6. 液体冷却

Blue Ocean Brain 水冷サーバー HD210 H シリーズは、従来の空冷放熱モードを打破し、空冷と水冷の混合放熱モードを採用し、サーバーの主な熱源である CPU を液体で冷却します。 -冷却されたコールドプレート、残りの熱源は空冷によって冷却されます。このハイブリッド冷却方式により、サーバーの放熱効率が大幅に向上すると同時に、主な熱源であるCPUの放熱による消費電力が削減され、サーバーの信頼性が向上します。テスト後、インフラストラクチャ ソリューションをサポートする液冷サーバーを使用するデータ センターの年間平均 PUE 値は 1.2 未満に低減できます。

3. ユーザーのメリット

1. より良い事業継続性を実現するためのリソースの再統合

主要なアプリケーションのパフォーマンス、安定性、容量は、アプリケーションをパーティション化してドメイン固有に展開することで大幅に向上するため、ビジネスの継続性がより確実になります。

2. 気象情報配信サービスの効率化

クライアントがより効率的でタイムリーな気象情報配信サービスを確立し、異常気象が州の社会経済構造に及ぼす影響を軽減できるよう支援します。

3. データのセキュリティが向上し、人的労力が削減されます

統合されたアーキテクチャにより、災害復旧計画が強化され、管理の複雑さとコストが軽減され、気象サービスチームはより戦略的な任務に集中できるようになります。

4. 運用の俊敏性を向上させ、リソース要求に迅速に対応します

大量のレーダー データを効率的に管理および保存するための、安定した安全な新しいストレージ。統合されたインフラストラクチャは運用の機敏性の最適化に役立ち、局が開発チームのリソース要求に迅速に対応できるようになります。

おすすめ

転載: blog.csdn.net/LANHYGPU/article/details/127549124