知識推論の概要
1.知識推論タスクの分類
推論とは、さまざまな方法を通じて新しい知識や結論を得ることであり、これらの知識や結論は意味論を満たすものです。その具体的なタスクは、満足可能性、分類、具体化に分類できます。
充足可能性はオントロジーまたは概念に反映されます。オントロジーでは、オントロジー充足可能性は、オントロジーが満たされるかどうかを確認すること、つまり、オントロジーにモデルがあるかどうかを確認することです。オントロジーが満たされていない場合は、不整合があることを意味します。概念充足性とは、ある概念の充足可能性を調べること、つまり、その概念の説明が空集合にならないようなモデルがあるかどうかを調べることである。
2.知識推論の入門
OWLオントロジー言語は、ナレッジグラフの中で最も標準化されており(W3Cによって策定され)、最も厳密です(記述ロジックを使用)。最も表現力豊かな言語 (一次述語論理のサブセット) は、RDF 文法に基づいているため、表現された文書には意味論的な理解のための構造的基盤があります。統一された語彙の使用を促進し、豊富な意味論的な語彙を定義します。論理的な推論も可能になります。
OWL言語の論理基盤:記述ロジックについて。
記述ロジック
説明ロジックは、オブジェクトベースの知識表現を形式化したもので、概念表現言語または用語ロジックとも呼ばれ、一次述語ロジックの決定可能なサブセットです。
記述ロジック システムは、次の 4 つの基本部分で構成されます。
1. 最も基本的な要素は、概念、関係、個人です。
概念はドメインのサブセットとして解釈されます
この関係は、フィールド上の二項関係 (デカルト積) として解釈されます。
個人はドメイン内のインスタンスとして解釈されます
2. TBox 用語セット: 概念的用語の公理のコレクション
それは一般化された知識、概念や関係を説明する知識であり、公理と呼ばれます。TBox 知識は概念間の包含関係により格子状の構造を形成しますが、この構造は包含関係によって決まり、具体的な実装とは関係ありません。TBox 言語には定義と包含があり、定義は Mother、person、has_child などの概念と関係を導入する名前であり、包含は包含関係を宣言する公理を指します。
3. Abox アサーション セット: 個別のアサーション セット
特定の個人の情報を指します。ABox には、言説領域内の特定の個人を説明する拡張知識 (アサーションとも呼ばれます) が含まれています。説明ロジック知識ベース K:= <T, A> 、 TはTBOx 、 AはABOxです。ABox 言語には、概念アサーションと関係アサーションが含まれており、概念アサーションは、オブジェクトが特定の概念 (母親 (アリス)、人 (ボブ) など) に属するかどうかを示します。関係アサーションは、2 つのオブジェクトが特定の関係を満たすかどうかを示します。
4. TBoxとABoxの推論機構
記述論理意味論: 解釈 I は、I が K 内のすべてのアサーションのモデルである場合に限り、知識ベース K のモデルになります。知識ベース K にモデルがある場合、K は充足可能であると言われます。σ が K のすべてのモデルで満たされると主張される場合、K は論理的に σ を意味すると言われ、 で表されます。概念 C について、K が C が充足可能であると言われるようなモデル I を持っている場合。
記述ロジックは、提供された構築演算子に基づく単純な概念と関係に基づいて、複雑な概念と関係を構築します。記述ロジックには、少なくとも次の構築演算子が含まれます: 交差 ()、共用体 ()、非 (-)、存在量指定子 ()、および普遍量指定子 ()。セマンティクスを使用すると、推論を行うことができます。セマンティクスを通じて推論の正確さと完全性を保証します。
オントロジー推論の方法とツール
オントロジー推論に基づく一般的な方法には、Tableaux 操作に基づく方法、ロジック プログラミングの書き換えに基づく方法、一次クエリの書き換えに基づく方法、プロダクション ルールに基づく方法などが含まれます。
1. Tableaux の操作に基づく
Tableaux ベースの操作は、オントロジーの充足性のチェックやインスタンスの検出に適しています。基本的な考え方は、充足可能性を検出するため、または特定の概念に特定のインスタンスが存在するかどうかを検出するために、一連のルールを通じて Abox を構築することです。この考え方は、一階論理の還元的反論に似ています。
Tableaux の操作ルール (主な DL 演算子を例として) は次のとおりです。
ここで 1 つ目について説明します。1 つ目は、C と D(x) の論理積が存在し、同時に C(x) と D(x) が存在しない場合、それは可能性があることを意味します。 C の一部が含まれており、C(x) が含まれていない場合は、それらをそれに追加します。
Tableaux の操作は Herbrand モデルに基づいており、Herbrand モデルはモデルを満たす最小のモデルであると単純に理解できます。
2.論理プログラミングによる書き換え方法
オントロジー推論には特定の制限があります。たとえば、事前定義されたオントロジー公理に基づく推論のみをサポートし、カスタム語彙に対する柔軟な推論はサポートできません。ユーザーは独自の推論プロセスを定義できません。したがって、ルール推論が導入され、特定のシナリオに従ってルールをカスタマイズして、ユーザー定義の推論プロセスを実現できます。
上記の説明に基づいて、オントロジー推論とルール推論を組み合わせることができる Datalog 言語が紹介されます。ナレッジベースやデータベース設計のための論理言語で、OWLと同等の表現力があり、再帰をサポートしているため、ルールの記述や推論の実装が容易です。
Datalog の基本構文には次のものが含まれます。
Atom: p は述語、n は順序番号、has_child(X, Y) などの項目 (変数または定数) です。
ルール: アトムから構築されます。H はヘッドアトム、ボディアトムです。例: has_child X, Y : −has_son X, Y
事実:これは、本体も変数も持たないルールです(has_child アリス、ボブなど):-
Datalog プログラムはルールの集合です。
3.一次クエリ書き換えに基づく手法
クエリの書き換えに基づいて、異なるデータ形式のデータ ソースを効率的に組み合わせることができ、同時に書き換え方法により異なるクエリ言語が関連付けられます。
一次クエリは一次論理形式を持つ言語です。Datalog はデータベースのクエリ言語であり、一次論理形式も持つため、Datalog を中間言語として使用できます。まず、SPARQL 言語は次のようになります。 SQL クエリの場合、Datalog として書き換えると、Datalog を書き換えることができます。
4.制作ルールに基づく手法
生産システムは、特定のメカニズムに従ってルールを実行して特定の目標を達成することができる前向き推論システムであり、一次論理に似ていますが、相違点もあります。自動計画やエキスパート システムで使用されます。
運用システムは、ファクト収集 (ワーキング メモリ)、運用/ルール収集、および推論エンジンで構成されます。
ファクト セット/ワーキング メモリ (WM): ファクトのコレクションであり、現在のシステム内のすべてのファクトを保存するために使用されます。
ファクト (Working Memory Element、WME) には、記述オブジェクトと記述関係が含まれます。記述オブジェクトは、例えば、(学生名:アリス 年齢:24歳)のように、type、attr_i、val_iがすべてアトム(定数)である形式になっています。関係(Refication)を記述します。たとえば、(basicFact relationship:olderThan firstArg:John SecondArg:Alice)を(olderThan John Alice)と略します。
プロダクション メモリ (PM) はプロダクションのコレクションです。プロダクションもこれに似たステートメントです。ここで、条件は一連の条件であり、LHS とも呼ばれます。アクションは、RHS と呼ばれる一連のアクションです。
LHS は条件のセットであり、各条件間の関係は and です。LHS のすべての条件が満たされると、ルールがトリガーされます。条件は次の形式になります。
RHS はアクションシーケンス、つまり順番に実行される実行順序であり、アクションの種類には ADD パターン、REMOVE i、MODIFY i (属性仕様) があります。
推論エンジン: パターン マッチング (ルールの条件部分を使用してファクト セット内のファクトと照合し、LHS 全体が満たされるルールがトリガーされ、アジェンダに追加されます)、競合などのシステムの実行を制御できます。解決 (特定のポリシーに従って、トリガーされた複数のルールから 1 つを選択します) し、アクションを実行します (選択したルールの RHS を実行し、それによって WM 上で特定の操作を実行します)。
パターンマッチング RETE アルゴリズム
パターン マッチングでは、各ルールの条件部分を使用して現在の WM と一致します。効率的なパターン マッチング アルゴリズムは、1979 年に Charles Forgy (CMU) によって提案された RETE アルゴリズムです。これは、実稼働 LHS を判別ネットワーク形式に編成します。これは、空間と時間を交換する典型的なアルゴリズムです。プロセスを次の図に示します。
関連ツールのご紹介
よだれ
Drools は、ルール推論エンジンを提供する商用ルール管理システムであり、コア アルゴリズムは RETE アルゴリズムの改良に基づいています。ルール定義言語を提供し、Java コードの埋め込みをサポートします。
イエナ
Jena はセマンティック Web アプリケーション用の Java フレームワークを構築するために使用され、RDF、RDF、OWL データを処理するためのインターフェイスとルール エンジンを提供します。クエリ用にトリプルのメモリ内ストレージを提供します。
RDF4J
RDF4J は、RDF データを処理するためのオープン ソース フレームワークで、セマンティック データの解析、保存、推論、クエリをサポートします。ほぼすべての RDF ストレージ システムに関連付けることができ、リモート RDF ストレージへのアクセスに使用できます。