AI が深刻な「鉱業」産業に参入し、カーネギー科学研究所は相関分析によって新しい鉱床を見つける別の方法を発見しました...

超神経質で

内容の概要:鉱物は技術社会に不可欠な原材料を提供し、多くの地質学的事象や古代環境の唯一の証拠でもあります。鉱物資源を発見し、その起源と分布の基本を理解することは、何世紀にもわたって地質学の主要な関心事でした。最近、米国科学アカデミー紀要のサブジャーナルである PNAS Nexus は、機械学習モデルを使用して鉱物相関分析を通じて新しい鉱床の住所と鉱物の種類を予測する研究結果を発表しました。

キーワード:機械学習協会 分析 鉱物探査

著者 | 小さくて遅い

編集者 | 三陽

鉱物は数十億年前に出現し、生物の進化に重要な役割を果たしてきました。現在、地質業界には多くの探査技術が存在しますが、鉱物資源の隠蔽性や不確実性により、鉱物探査プロセスは非常に曲がりくねったものであると同時に、高いリスク、長い投資サイクル、低い探査成功率など、さまざまな課題に直面しています。

過去の研究で科学者らは、地球上の5,000以上の鉱物がランダムに分布しているわけではなく、多くは寄生して存在していることを発見した。いわゆる共生関係は、特定の物理的および化学的法則の下で形成される鉱物の組み合わせであり、例えば、鉱物の形成は母岩の化学組成および環境条件と密接に関係しています。

最近、ワシントンのカーネギー科学研究所のモリソン・ショーナ M 氏は、アリゾナ大学のプラブ・アニルー氏らとともに、機械学習を使用して鉱物の組み合わせの法則を発見し、鉱物の位置を予測しました。今回の研究成果は、「鉱物会合分析による新鉱物出現と惑星類似環境の予測」というタイトルで雑誌「PNAS Nexus」に掲載された。

daf7cee9d3f507c9fcca9ebcec71c14f.png

研究成果は「PNAS Nexus 」に掲載されました

用紙のアドレス:

https://academic.oup.com/pnasnexus/article/2/5/pgad110/7163824?login=true

 実験概要

研究者らは、鉱物進化データベースのデータを使用し、相関ルールに基づいて鉱物の位置を予測する機械学習モデルを開発し、火星シミュレーション環境としてよく知られるテコパ盆地でそのモデルをテストしました。実験結果は、機械学習が鉱物の位置、種類、量を効果的に予測できることを示しています。

関連分析は、データセット内の関連ルールとパターンを発見するための機械学習方法ですデータ内の項目セット間の相関関係を分析することで、異なる項目セット間の相関関係と依存関係が明らかになります。

著者らは、適切なデータがあれば、鉱物集合体分析により、新しい鉱床の位置やそこに含まれる鉱物の種類に加えて、特定の場所の鉱物の量を予測できると示唆しています。そして、このモデルは地球だけでなく、あらゆる岩石惑星体にも当てはまります。

 データセット 

この研究のデータセットには、810,907 の鉱物起源の組み合わせを含む大規模鉱物進化データベース (Mineral Evolution Database) 内の 5,478 個の鉱物、295,583 個の鉱物出現および 5,472 個の鉱物出現の年齢情報 (関連年齢) が含まれています。データ規模が大きいため、研究者はデータをさまざまなサブセットに分割し、そのうちの 3 つを選択しました。

*地理的サブセット:研究者らは、鉱物の多様性が高く、地理的範囲が広く、十分に文書化されており、広範囲にわたる地質環境がある米国を選択しました。このサブセットには、2,622 の鉱物種、93,419 件の出現、および 8,139,004 の関連ルールが含まれています。

*地球化学サブセット:研究者らは、U を基本元素とする 1 つ以上の鉱物種を分析することにより、ウラン含有鉱物相を調べるためにウラン鉱床を選択しました。このサブセットには、5,439 個の鉱物、11,729 個の出現、および 60,589,982 個の関連ルールが含まれています。

時間サブセット:研究者らは、始生代 (> 2.5 Ga)、原生代 (2.5 - 0.54 Ga)、および新生代 (< 0.54 Ga) の 3 つの時間スライスを選択しました。

 モデル開発 

上記のデータセットに基づいて、研究者はモデルの開発と効果の検証を開始しました。全体のプロセスは 3 つのステップに分かれています。

1. 鉱物関連ルールの作成

研究者らは、関連分析で一般的に使用されるアプリオリ アルゴリズムを使用しました。このアルゴリズムは、ボトムアップ アプローチを使用して、頻繁に共起する項目セット (鉱物集合体など) をテストおよび比較することによって相関ルールを生成します。これは、鉱物関連分析で使用できます。

2. 鉱物関連ルールの可能性尺度

研究者らは、要件を満たす相関ルールを除外するために尤度指数を設定しました。可能性指数とは、ミネラル間の関係を数値化して評価するための指標のことで、一般的な可能性指数には、Support、Confidence、Lift などがあります。

サポートとは、すべてのサンプルに同時に含まれる 2 つ以上のミネラルの割合を指します。サポートの度合いが高いほど、これらのミネラル間の関係は強くなります。

495255dda5563414cfee0bcb9d4b7e93.png

図2:サポートの計算式

信頼度は、1 つのミネラルが存在するときに、他のミネラルも存在する確率を指します。高い信頼度は、2 つのミネラル間の強い関連性を示します。

60cfecf4cc7b1fc1636ca0fecf8eb65a.png

図 3: 信頼度の計算式

リフトは、2 つの鉱物が一緒に発生する確率と、それらが独立して発生する確率の比です。リフトが 1 より大きい場合は 2 つのミネラル間の正の関連性を示し、1 未満の場合は負の関連性を示し、1 に等しい場合は 2 つのミネラル間に関連性がないことを示します。

03c007df9a116dd76871d31b8af96368.png

図 4: 揚力の計算式

3. ミネラル関連ルールによるミネラルの予測

この研究では、研究者は既存の鉱物データをマイニングして分析し、3 つのデータ サブセット (地理、地球化学、時間) のそれぞれに対する相関ルールを生成しました。予測したい場所の鉱物の産状を相関ルールと比較して分析し、任意の場所の鉱物の種類、鉱物の組み合わせ、鉱石形成環境を予測することができます。

 実験結果

実験は米国カリフォルニア州のテコパ盆地で行われた。この盆地には火山灰とトラバーチンの堆積物が含まれており、近くには玄武岩質の溶岩流があり、火星の環境を模擬できるからだ。研究者らは、以下の表に示すように、その場所に出現する鉱物の種類を予測しました。

75ec2c009fca4bdae7c7c81c33d5e738.png

表 1: テコパ盆地で発生すると予測される鉱物種

この表は、予測が行われる相関ルールに関連する信頼性とリフトのメトリクスを示しています。

研究者らはまた、ウラン鉱床や他のいくつかの重要な鉱物が発生する可能性が高い場所を予測し、その予測を地図上にマークしました。ウラン鉱床の位置を予測した結果を下図に示します。その中で、2020年10月から現在までにいくつかの予測が確認されており、鉱物相関分析の予測能力を裏付けています。

9141fdf7e861d981015e510f256ab7a4.png

図 5: 予測されるウラン鉱床の地理的地図

他のいくつかの重要な鉱物の予測位置を下の図に示します。

8278d5b481a58adf50f3dffe8be909f2.png

図 6: 予測されている他のいくつかの主要な鉱物の地理的位置図

2021 年 10 月現在、確認済みの場所には Mindat のロゴが付いています。Mindat は、鉱物がどこかで見つかると、それが公開される世界的な鉱物データベースの Web サイトです。

さらに、地球の歴史における鉱物の外観の変化をさらに理解するために、研究者らは、始生代(>2.5 Ga)、原生代(2.5-0.54 Ga)、新生代(<0.54 Ga)を含む選択された期間における鉱物の相関則も研究しました。3 つの期間におけるミネラルの組み合わせの改善を以下の図に示します。

4b0fcce3c89909be94357fc1e805048f.png

図 7: 始生代 (a)、原生代 (b)、新生代 (c) の鉱物群における鉱物群のアップグレード度

昇格度は鉱物群間の相関の強さを表しており、始生代、原生代、新生代では鉱物群の分布に明らかな違いがあることがわかります。この規則は、環境や気候などのさまざまな要因が鉱物集合体に及ぼす影響をさらに調査するための将来の研究で使用できます

上記に基づいて、鉱物関連分析を適用して、新しい鉱物の種類とターゲットの鉱物の場所を予測できます。

 アソシエーション分析: 情報マイニングの分野で最も活発な手法の 1 つ

関連マイニングとも呼ばれる関連分析は、1993 年に初めて提案された、データ情報マイニングの分野で最も活発な研究手法の 1 つです。この論文の著者らは、「考察」セクションで、関連分析の適用は鉱物集合体に限定されるべきではなく、共生化石、微生物、分子、地質環境などの他の属性の分析にもさらに適用できることを提案しています。この方法は拡張性と移植性があり、多くの分野に適用でき、重要な役割を果たすことができるからです。

この論文で議論した鉱物探査における関連分析の応用に加えて、人間、動物、植物の遺伝学の研究におけるその進歩も注目に値します。現在、この分野の研究者は、関連性分析に基づいた一連の新しい方法とソフトウェアを提案しています。例えば、以前に公開されていた PLINK ソフトウェアは、データ管理、集団構造の評価、複雑な形質と症例対照データの関連分析に使用でき、遺伝子型と表現型のビッグデータも処理できます; 浙江大学の Zhu Jun 教授の研究室が開発した QTXNetwork は、大規模な複雑形質オミクスデータを処理できる GPU コンピューティングに基づく関連分析ソフトウェア パッケージです。

データ量が継続的に増加し、コンピューター科学技術と統計アルゴリズムが継続的に更新されることにより、さまざまな分野での関連分析の応用がさらに発展し、新しい効率的で高速で大規模にラベル付けされた関連分析テクノロジープラットフォームも登場するでしょうこの文脈において、チームや個人がツールを選択するときは、ビジネスの実際のニーズに応じて評価し、比較する必要があります。

参考リンク:

[1]https://www.doc88.com/p-9788189626622.html?

[2]https://zwxb.chinacrops.org/article/2016/0496-3490-42-7-945.html

- 以上 -

66cccdd07a52e8268e3a697db36efa62.jpeg

QR コードをスキャンしてディスカッション グループに参加してください

より多くの高品質のデータセットを取得する

人工知能の応用を理解する

人気のカンファレンスや論文をフォローする

詳細については「読者」に返信してください

さらにエキサイティングなコンテンツ (画像をクリックして読んでください)

d52ecda5238e8e0a0d6065b027d38371.png

eb2bde61c79aba0e1134c9023bff7cd8.png

615dc0d21f810440f850a6e7b3d860db.png

fddd48a324d5885f4cc7057d3521114c.gif

おすすめ

転載: blog.csdn.net/HyperAI/article/details/131842591