ナレッジグラフ: 知識表現の発展の歴史

データは多くの業界の中核資産です。人工知能テクノロジーとデータの緊密な統合も、主要な業界組織の焦点となっています。さまざまな人工知能テクノロジーの中でも、ナレッジ グラフはビジネス シナリオをより適切に表現できます。多様で包括的な全体像は、より適切に機能します。人工知能時代の分析と意思決定のシナリオであり、近年の技術革新のホットスポットの 1 つとなっています。

知識の概念

知識表現は、知識の記述、または知識の一連の規則であり、知識を記述するためにコンピュータに受け入れられるデータ構造です。これは機械が知能を達成するための基礎であり、機械が人間と同じように知識を使用できるようになります。

知識には、相対的な正確さ、不確実性、表現可能性、可用性という特性があります。さまざまな分類基準に従って、知識はさまざまなカテゴリに分類できます。例えば、範囲の範囲に応じて、常識知識と専門知識に分けることができます。機能や表現によって事実知識、手続き知識、制御知識に分類されます。確実性の分類によれば、決定的な知識と不確実な知識がある。構造や表現形式により、論理知識とイメージ知識に分けられます。

初期の知識の表現方法

1.一次述語論理

述語論理 (LP) は、原子命題をさらに分析し、個々の単語、述語、数量詞を分析し、それらの形式的構造、正しい推論形式、ルールの論理的関係を研究できます。

一階論理は数理論理学の基本部分であり、主に古典的な命題論理と一階述語論理が含まれますが、実は一階述語論理には命題論理も含まれます。1 次ロジックが「1 次」である理由は、それに含まれる述語ロジックが 1 次であるためです。述語とは、対象の性質を表す言葉です。オブジェクトのプロパティにはレベルがあり、述語の使用法ではこのレベルを「順序」と呼びます。いわゆる一次述語とは、個々の属性を記述する述語を指します。「赤」や「より大きい」などの述語は、個々の概念にのみ適用されます。「明るい」や「推移的」などの述語は、次のような述語を記述するために使用されます。述語は高次の述語であり、属性の属性を記述します。

一次述語論理は、自然である、自然言語に近い、受け入れやすい、厳密である、コンピュータの内部形式に変換しやすいなどのメリットがある一方で、不確実な知識を表現できない、表現するのが難しいというデメリットもあります。ヒューリスティック知識とメタ知識、組み合わせ爆発、効率の低さなどのデメリット。上記の欠点を克服するために、ホーン ロジックや記述ロジックなどの改善が提案されています。

2.生産体制

プロダクション システムは、述語ロジックに関連する、しかし述語ロジックとは異なる、より広範なルール システムです。初期のエキスパート システムのほとんどは実稼働システムに基づいていました。生産知識表現は、一般的に使用される知識表現方法の 1 つです。それは人間の脳の記憶モデルにおけるさまざまな知識間の多数の因果関係に基づいており、「IF-THEN」、つまり生成規則の形で表現されます。この形式のルールは、人間の問題解決の行動特性を捉え、認識と行動の循環プロセスを通じて問題を解決します。生成されたシステムは、ルール ベース、包括的なデータベース、および制御メカニズムの 3 つの基本部分で構成されます。

述語論理のルールは生成の基本形式に似ており、実際、含意は生成の特殊なケースにすぎません。生成ルール表現には、自然性の良さ、モジュール管理の容易さ、知識の効果的な表現、明確な知識表現など、非常に明白な利点があります。ただし、生産ルールには効率が低い、構造的な知識を表現できないなどの欠点もあります。したがって、他の知識表現方法 (フレーム表現やセマンティック ネットワーク表現など) と組み合わせて使用​​されることがよくあります。

3.フレーム表現

フレーム表現は1975年にミンスキーによって提案され、その最大の特徴は構造的な知識を表現することに長けており、知識の内部的な構造関係や知識間の特殊な関係を表現し、特定の物や実体と関連付けることができます。セットの関連機能がまとめられています。

フレーム表現法では、現実世界における人間のさまざまな理解がフレームに似た構造で記憶されていると考えられます。新しい物事に直面したとき、記憶の中から適切な枠組みを見つけ出し、その内容を現状に合わせて修正したり補足したりすることで、現在の物事の理解を形成します。

フレームは一定の状況を記述するデータ構造であり、一般にフレームはノードと関係から構成されるネットワークとみなすことができます。フレームワークの最上位レベルは固定されており、特定の状況に常に当てはまるものを記述しますが、フレームワークの下位レベルにはスロットと呼ばれる多くの端子があります。スロットに特定の値を入力することで、特定のトランザクションを記述するフレームワークを取得できます。各スロットには、スロットの値の範囲や評価方法などを示すために使用されるファセットと呼ばれる追加の命令を含めることができます。 。フレームには、あらゆる種類の情報を含めることができます。物事を説明する情報、フレームの使用方法に関する情報、次に何が起こるかについての期待、期待したイベントが起こらなかった場合にどうするかについての情報などです。この情報はフレームに含まれています。各スロットまたはサイドに .

特定の物はスロットに埋められた値によって記述することができ、異なるスロット値を持つフレームは、特定の種類の物におけるそれぞれの特定の物を反映することができます。関連するフレームは互いにリンクされてフレーム システムを形成し、フレーム システム内のあるフレームから別のフレームへの遷移は、状態、推論、またはその他のアクティビティの変化を表すことができます。異なるフレームワークが同じスロット値を共有できるため、この方法により、さまざまな角度から収集された情報をより適切に調整できます。

フレーム表現は知識を非常に完全かつ包括的に記述します。フレームに基づく知識ベースの品質は非常に高く、フレームでは数値計算が可能であり、他の知識表現言語よりも優れています。しかし、フレームワークの構築コストは非常に高く、知識ベースの品質要求も非常に高く、フレームワークの表現形式は柔軟性に欠け、他の形式のデータセットと関連付けて使用するのは困難です。

4.セマンティックネットワーク

セマンティックネットワークは知識表現において最も重要な手法の一つであり、高い表現力と柔軟性を備えた知識表現手法です。セマンティック ネットワークは、ノードの有向グラフとラベル付きエッジ構造を使用して、イベント、概念、状況、アクション、オブジェクト間の関係を記述します。ラベル付き有向グラフは、オブジェクト間の関係を非常に自然に記述することができます。

セマンティック ネットワークは、その自然な性質により広く使用されています。セマンティック ネットワークで表される知識ベースの特徴は、ラベル付き有向グラフを使用して起こり得るイベントを記述することです。ノードはオブジェクト、オブジェクトのプロパティ、概念、イベント、状況、アクションを表し、ラベル付きのエッジはオブジェクト間の関係を表します。知識ベースの変更は、オブジェクトおよびそれらの関連関係を挿入および削除することによって実現されます。ネットワーク表現が適している分野のほとんどは、推論が非常に複雑な分類に基づいている分野や、イベントの条件、プロパティ、アクションの間の関係を表現する必要がある分野です。

セマンティック ネットワークの基本形式は (ノード、アーク、ノード 2) です。ノードはさまざまなもの、概念、状況、属性、アクション、状態などを表します。各ノードは複数の属性を持つことができ、通常はフレームまたはタプルで表されます。 。さらに、ノードは、マルチレベルの入れ子構造を形成するセマンティック サブネットワークにすることもできます。セマンティック ネットワーク内のアークは、さまざまなセマンティック接続を表し、接続されているノード間の特定のセマンティック関係を示します。さまざまなオブジェクトの識別やオブジェクト間のさまざまな意味上の接続を容易にするために、ノードとアークの両方にラベルを付ける必要があります。

セマンティック ネットワークの利点:

1. さまざまなノード間の接続を明確かつ簡潔に表現する直感的な表現方法です。

2. 物事間の意味論的なつながりを強調し、人間の思考の連想プロセスを具体化し、物事間の関係の人間の表現と一致しているため、自然言語を意味論的ネットワークに変換するのが容易です。

3. 幅広い表現範囲と強力な表現能力を持ち、他の表現方法で表現できるほぼすべての知識は意味ネットワークで表現できます。

4. 物事の属性や物事間のさまざまな意味関係を表示する構造化された知識表現です。

セマンティック ネットワークの欠点:

1. 推論ルールはあまり明確ではなく、ネットワーク操作から得られる推論の厳密性と妥当性は完全には保証できません。

2. ノードの数が多すぎてネットワーク構造が複雑になると、推論が困難になります。

3. 判断的な知識や深い知識を表現するのは不便です。

おすすめ

転載: blog.csdn.net/WhiteCattle_DATA/article/details/133089676