人工知能の 10 の主要な数学的基本問題

        この記事は、ブロガーが人工知能やその他の分野を勉強する際に、個人的な学習、研究、または鑑賞のために記録した学習の抜粋およびメモであり、ブロガーの人工知能およびその他の分野に関する理解に基づいています。万が一不適切な内容や違反があった場合には、ご指摘いただきましたら直ちに修正させていただきますので、ご理解賜りますようお願い申し上げます。

記事は研究の抜粋とメモの列に分類されます

        研究の抜粋とメモ (1) --- 人工知能の10 の主要な数学的基本問題」

人工知能の 10 の主要な数学的基本問題

原文/論文の出典:

タイトル:「10大数学~人工知能の基礎問題~」

著者:徐宗本 

時間:受信日: 2021–07–04;受理日: 2021–09–30;オンライン公開日: 2021–12–09

出典:中国の科学: 情報科学

1. ビッグデータの統計的基礎;

        現在主流の人工知能技術(ディープラーニングなど)はビッグデータの処理をベースにしており、そのモデル、分析、計算基盤はすべて統計学に根ざしています。統計は常に、人々がデータを分析して利用することを支配し、導く学問であると考えられてきました。すべてのモデリングでは、表現の広範さと統計的推論の容易さまたは解釈可能性の間でバランスを取る必要があり、これがすべてのアプローチのボトルネックとなります。


2.ビッグデータコンピューティングの基本アルゴリズム;

        ビッグ データの分析と処理の中核は、コンピューティングを通じてビッグ データを処理し、そこから有用な情報を抽出することです。人工知能の応用に対する主な障害の 1 つは、実際のビッグデータの場合、既知のコア アルゴリズムと基本アルゴリズムのほとんどが失敗する (使用できない、または満足のいく結果を計算できない) ことです。テラバイトを超えるデータの直接クラスタリングのためのアルゴリズム。

        このようなビッグデータ アルゴリズムの不足の根本原因は、ビッグ データ環境における従来のコンピューティング理論と、従来のコンピューティング理論に基づくアルゴリズム設計および分析方法論の失敗にあります。米国科学アカデミー/米国研究評議会が発行した報告書では、ビッグデータ環境で次の 7 つの数学的問題を解く問題を「7 つの巨大な問題」と呼んでいます。

        • 基本的な統計。

        • 一般化された N 体問題。

        • グラフ理論計算。

        • 線形代数計算。

        • 最適化;

        • 統合;

        • アライメントの問題。


3. データ空間の構造と特性

        私たちが住む世界は、人間社会物理空間(両者を総称して現実世界と呼ぶことが多い)、情報空間(仮想世界と呼ぶ)から構成されています。人間社会の構成要素は、物理空間の構成要素は原子・分子、情報空間の構成要素はデータです。

人工知能の役割: データ空間において、データ空間の手法を使用して現実世界を認識し、操作する技術です。

        これらの共通のデータ空間に対して、数学的空間にするために何らかの数学的構造を与えることはできるでしょうか?

        もしそうなら、それらはどのような数学的空間になるでしょうか?

        それは内積空間でしょうか、ノルム空間でしょうか、それとも位相空間でしょうか(数学空間ごとに提供される解析ツールが異なることに注意してください)。

        最も自然で、合理的で、データ分析に最も役立つためには、どのような数学的構造を与える必要がありますか? より具体的にするために、さらに画像空間を例に挙げてみましょう: スケーリング、畳み込み、平行移動 + 回転を割り当てることができますか?または、ユークリッド距離、KL 発散、ワッサーシュタイン距離などの画像差の尺度を選択して、画像空間が数学的な意味での空間になるように操作しますか?

        もしそうなら、どのような選択と配置を行うと、確立された空間が画像分析にさらに適したものになるでしょうか?


4. 深層学習の数学的メカニズム; 

        現代の人工知能の主流技術はディープラーニングに代表されますディープラーニングの大成功は、普及した AI テクノロジーとしての支配的な地位を大きく高めましたが、その一方で、ディープラーニングの固有の限界と「ポストディープラーニングの時代」についての人々の考えも呼び起こしました。 

        ディープラーニングのユニークな利点は、あらゆる複雑なデータに対する強力なモデリング能力を備えていることであり、トレーニング データが十分である限り、それを学習して適用できるため、汎用的な AI ソリューションを提供できます。 

        しかし、ネットワーク構造の設計が難しく、結果が解釈できず、だまされやすいという致命的な欠陥があります。


5. 非公式な制約の下での最適な輸送 

        人工知能における多くの問題は、データ転送またはデータ接続に基づいています。たとえば、機械翻訳は音声とテキストという 2 つの言語を接続する必要があり、機械ビジョンは画像とテキストを接続する必要があります。「変数を保存する」という意味で最適な送信を
        どのように実現するか? これらはすべてデータの変換と接続の基礎であり、転移学習の最も基本的な問題でもあります。


6. 学習方法論の学び方; 

        学習方法論は、学習者が学習タスクを学習/完了する方法を導き、管理する一般原則と方法論です。 

        人工知能が自動化と自律化に向かう​​という一般的な傾向の下では、機械に人間の学習方法論、より厳密に言えば模擬学習方法論 (SLM) を学習させることがAI 開発の唯一の方法です。

        関数空間における学習理論は未開発の分野です。


7. 機械学習の事前の前提を打ち破る方法;

機械学習の適用と有効性は、常に次のようないくつかの基本的な先験的な仮定を前提としています。

        (i) 大容量の仮定:空間 F の容量は、fに依存せずにf。 

        (ii) 独立性の仮定:最適性の基準はデータ生成メカニズムとは独立して設定され、特に損失メトリックは私データなどとは独立して事前に設定されます。

        これらの仮定はすべて、機械学習研究の通常の設定です。これは、機械学習が急速に発展できる理由であるだけでなく、機械学習の発展の足枷でもあると考えられます。既存の人工知能テクノロジーのアプリケーションレベルとパフォーマンスを向上させるには、これらの機械学習のアプリオリな仮定を打ち破る必要があります。


8. 機械学習の自動化; 

        この新たな波は、「環境への適応」の波であるはずであり、これは、閉じられた静的環境、固定タスク、堅牢性の低さ、解釈可能性の低さにしか適用できない既存の深層学習の欠点を克服することに基づいています。 、説明可能な適応型 AI 技術。より現実的で達成しなければならない中間段階の目標は、機械学習の「6 つの自己」を 自動化するという目標を達成することです。

        • データ/サンプル レベル: 自己生成データ、自己選択データ。

        • モデル/アルゴリズム レベル: モデルは自己構築、アルゴリズムは自己設計。

        • タスク/環境レベル: タスクの自己切り替え、環境の自己適応。


9. 知識推論とデータ学習の統合

        ポストディープラーニングの時代では、知識推論とディープラーニングの組み合わせを追求し、強力なデータ学習機能を維持しながらディープラーニングがより明確な解釈可能性と強力な一般化を実現できるようにする必要があります。データと知識を結び付けるために、データ空間セマンティック空間の間に中間空間を確立することは良い選択であるはずです

        データと知識のハイブリッド システムを理論的に分析することも困難な問題です。


10. インテリジェントな最適化と人工知能チップの問題

        数学的最適化の理論と方法は、最適化の理論的基礎を提供しますが、数学的方法では通常、目的関数が分析形式を持ち、凸構造を持ち、既知のハイパーパラメーターを持つことを前提としています。最適化問題の解決はディープラーニングの専門分野ではありません。したがって、最適化のために人工知能プロセスを設計する方法はまだ解決されていません。

        人工知能チップは、AI アルゴリズムの実行を高速化する強力なツールです。その機能は、AI アルゴリズムにおける特定の再利用可能な計算/演算を (チップ上の集積回路の形で) ハードウェア化することであり、その本質は数学的演算を実現することです物理的な方法での操作。いくつかの高レベルの最適化アルゴリズム (ADMM など) チップに基づいて人工知能アルゴリズムを高速化することは、検討する価値のある方向性です。


11. その他:

 人工知能技術と開発は主に「計算例、アルゴリズム、計算能力」によって推進され、その基盤はデータであり、その中核はアルゴリズムです。

 数学は単なるツールではなく、技術的な意味合いそのものでもあり、本質や独自の革新性を最もよく体現する部分であることがよくあります。

AI アルゴリズムは基本的に次のとおりです。

        ビッグデータ分析および処理アルゴリズムは、主に、ビッグデータ分析および処理技術の最下層が依存する関連する数学的モデル、分析原理、および計算方法を解決します。

AIの役割:

        データ空間では、データ空間の手法を利用して現実世界を認識し、操作する技術です

構造の性質としては、

        データの数学的表現を求める

        オブジェクトのコレクションに特定の数学的構造 (操作 + トポロジー) が与えられると、それは数学的な意味での空間になることができます。

深層学習の独自の利点は次のとおりです。

        あらゆる複雑なデータに対する強力なモデリング能力を備えており、トレーニング データが十分であれば学習して適用できるため、汎用的な AI ソリューションを提供します。 

致命的な欠陥は、ネットワーク構造の設計が難しく、結果が解釈できず、だまされやすいことです。

ネットワークトポロジ(Network Topology)の構造

        さまざまなデバイスを伝送メディアと相互接続する物理的なレイアウトを指しますネットワークのメンバー間の特定の物理 (現実) または論理 (仮想) 配置を指します。2 つのネットワークが同じ接続構造を持っている場合、それぞれの内部物理配線やノード間の距離は異なっていても、ネットワーク トポロジは同じであると言います。

        実際にコンピュータとネットワーク機器を相互接続するには、一定の組織構造で接続する必要があり、この組織構造を「トポロジ構造」と呼びます。

        ネットワークトポロジとは、ネットワークの配置や構成、ノード間の関係をわかりやすく表現したもので、平たく言えば、コンピュータや通信機器がどのように接続されているかを指します。

ユークリッド空間

        これは特殊な種類のベクトル空間を指し、長さや角度などの幾何学的特性は通常の 3 次元空間 V3 のベクトルについて議論できます。

     記事が不適切で間違っている場合はご理解の上ご指摘ください。一部の文章や画像はインターネットから取得したものであるため、実際の出典を確認することができません。異議がある場合は、ブロガーに連絡して削除してください。間違い、質問、権利侵害がある場合は、コメントを残して著者に連絡するか、VX 公開アカウントRain21321 をフォローして著者に連絡してください。

おすすめ

転載: blog.csdn.net/qq_51399582/article/details/131388356