【代数言語学ツアー】帰納論理プログラミングⅢ

【代数言語学ツアー】帰納論理プログラミングⅢ


ここに画像の説明を挿入

帰納的論理とは、事例証拠によって裏付けられた論理です。演繹的論理では、有効な演繹的議論の前提には論理的に結論が含まれている必要があり、論理的含意とは、前提を真にする論理的に可能なすべての状態は結論も真にする必要があることを意味します。したがって、有効な演繹的議論の前提は、結論を完全に裏付けます。しかし、帰納的論理は、この見方をより弱い引数にまで拡張します。優れた帰納的議論では、前提の真実性が、何らかの数値スケールで測定できる、結論の真実性に対するある程度の裏付けを提供します。演繹的含意の概念との類推により、帰納的裏付けの概念は、前提が真である論理的に可能な状態では、結論には (少なくとも) r r が存在する必要があることを意味する可能性がありますrのサイズのスケールは正しいです。ここで、rrrは、証拠の裏付けの強さを示す数値尺度です。


帰納論理の正式な説明

コンピューターサイエンスの観点から見ると、AI 内の知識エンジニアリングは、「どのように知るか」 (手順的または規範的な知識) よりも「何を知る」 (宣言的または記述的知識) に重点を置く傾向があります。数理論理学は宣言型知識の好ましい表現であるため、データから論理式を生成する知識発見技術が必要です。誘導論理プログラミング (ILP) [1,2] は、そのような実現可能な方法を提供します。

概念 (相同タンパク質など) を使用した ILP アルゴリズムのEEの例Eと予備知識BBB (分子動力学の定義など) を例として、仮説を構築しますh 、 BBであると仮定します。EEについて説明するBE、例: タンパク質フォールディングドメインでは、EEE には、特定の折り畳み (タンパク質全体の形状) の正の例と負の例にグループ化された分子の説明が含まれる場合があります。「4本のHelix Up and Down Bundle」を下の図のように折ります。このようなタンパク質を説明するための考えられる仮説hは下図のようになります。この定義は head(フォールド(… \dots… \ドット )) と本体 (ステートメントが長い(… \dots) )、… \ドットらせん(… \ドット )) は決定的な条項です。この場合、「折り目」は例と仮説に含まれる述語であり、「長さ」、「位置」などは背景知識によって定義されます。論理プログラムとは、この定節の集合です。E、BE、BE Bhhhはロジックプログラムです。

ここに画像の説明を挿入
ILP の一般的な枠組みは、タンパク質のフォールディングを例にとると、学習システムには背景知識BBが提供されます。B、正の例のセットE + E^{+}E+と反例のセットE − E^{-}Eそして仮説を構築しますhB 、E + E − B、E^{+} E^{-}B E+ Eそしてふーんhはロジック プログラムです。ロジック プログラムは、次の形式の定義ステートメントの集合です。

h ← b 1 , … , bnh \leftarrow b_{1}, \ldots, b_{n}hb1b

ここで、ああhは原子命題と呼ばれ、b 1 , … , bn b_{1}, \ldots, b_{n}b1bは原子命題のセットです。通常はE + E^{+}E+ E − E^{-} E−基本的な引数で構成されます( E + E^{+}E+は空の本文を持つ定節です;E − E^{-}E先頭が「false」の句の場合、本文には基本的な原子命題が 1 つだけあります。

通常使用される論理表記は、logical AND ∧ \landです。、論理和∨ \lor、論理的含意⊨ \vDash、エラー□ \squareそして仮説を構築しますhの方法は以下の通りです。

  • 必要性: B ⊭ E + B\not\vDash E^{+}BE+
  • 十分性: B ∧ h ⊨ E + B\land h\vDash E^{+}BhE+
  • 弱い一貫性: B ∧ h ⊭ □ B\land h\not\vDash\squareBh
  • 強い一貫性: B ∧ h ∧ E − ⊭ □ B\land h\land E^{-}\not\vDash\squareBhE

ILP の具体的な導出アルゴリズムは空間に限定されており、拡張されませんが、その導出には明らかな統計的推論色があります。たとえば、ベイズの定理によれば、仮想空間hhhの最大事後確率を持つ仮説h MAP h_{\text{MAP}}h地図) は次のように推定できます。

h MAP = arg ⁡ max ⁡ h ∈ HP ( h ∣ E ) = arg ⁡ max ⁡ h ∈ HP ( E ∣ h ) P ( h ) p ( E ) = arg ⁡ max ⁡ h ∈ HP ( E ∣ h ) P ( h ) \begin{aligned} h_{MAP} &=\underset{h \in H}{\arg \max } P(h \mid E) \\ &=\underset{h \in H}{\arg \max } \frac{P(E \mid h) P(h)}{p(E)} \\ &=\underset{h \in H}{\arg \max } P(E \mid h) P (h) \end{整列}hマップ_ _=h Harg _マックスP ( hE )=h Harg _マックスp ( E )P ( Eh ) P ( h )=h Harg _マックスP ( Eh ) P ( h )


帰納的論理の例

帰納的論理の例をいくつか見てみましょう。次の 2 つの例を考えてみましょう。

  • example.1 3200 羽のカラスをランダムにサンプリングします。各カラスは黒色です。これは、すべてのカラスが黒いという結論を強く裏付けています。

  • 例 2登録有権者 400 名からなる無作為サンプル (2004 年 2 月 20 日に実施された世論調査) のうち、62% がジョージ W ブッシュよりもジョン ケリーを支持すると回答しました。これは少なくとも、登録有権者の 57% から 67% が (投票時またはその前後で) ブッシュよりもケリーを支持しているという結論を裏付けています。

この種の引数の定式化は列挙帰納法と呼ばれることが多く、統計的推定手法と密接に関連しています。これらの議論を準形式的に定式化できる論理形式は次のとおりです。

前提:ランダムサンプリングSSの場合S、グループBBBnn属性AAを持つn人のメンバーで構成されますAのメンバーの割合はrrr ;

したがって、学位をppとすると、pの支持度を取得できます:
結論: 属性はAAAさんのBBr − q rqにおけるBのすべてのメンバーの割合rqr + q r+qr+q間(つまりqqqの誤差の範囲内

この議論をより形式的に定式化してみましょう。この前提は、次の 3 つの別々のステートメントに分かれています。

プログラム 説明 形式化された
前提1 SSSメンバーは属性AAAのメンバーの頻度または割合はrrr F [ A , S ] = r F[A, S]=rF [ A ]=r
前提2 SSSはBBですBがAA属性を持つAのランダムなサンプル Rnd ⁡ [ S , B , A ] \operatorname{Rnd}[S, B, A]R nd [ S , _B ]
前提3 SSSの容量はnnですn ∥ S ∥ = n \|S\|=n_=n
したがって サポートppp --------------------- ppp
結論は 属性はAAですAさんのBBr − q rqにおけるBのすべてのメンバーの割合rqr + q r+qr+qの間 F [ A , B ] = r ± q F[A, B]=r \pm qF [ A B ]=r±q

実現と応用

参照できる実装は以下のとおりです。

  • 1BC および 1BC2: 1 次単純ベイズ分類器:https://intelligentsystems.bristol.ac.uk/
  • ACE (複合エンジン):https://dtai-static.cs.kuleuven.be/ACE/
  • アレフ:http://www.cs.ox.ac.uk/activities/programinduction/Aleph/
  • アトム:http://www.ahlgren.info/research/atom/
  • クローディアン:http://dtai.cs.kuleuven.be/claudien/
  • FOCLアルゴリズム(一次複合学習器):https://en.wikipedia.org/wiki/First-order_inductive_learner
いくつかのアプリケーションシナリオ
  • 河川水質の生物学的分類: 河川に存在するさまざまな生物種を観察することにより、河川の水質を監視および評価できます。
  • 生体分子シミュレーション: 生体分子シミュレーションにおける ILP の適用は、生物学的に重要な分子の化学式、三次元構造、および機能の間の相互関係の理解を向上させることを目的としています。
  • ILP 帰納的プログラムの不変性: 手続き型プログラムの正しさを正式に証明する場合、プログラム内の特定の点で常に真となる適切な条件を見つける必要があります。
  • プログラミングにおけるデータの最適化: 高レベル仕様からプログラムを構築する場合、(高レベル) 仕様言語の関数は (低レベル) ターゲット言語で実装されます。
  • 優先原則に従った革新的設計: 革新的設計を ILP に変換する方法は、事例から学ぶこととして革新的設計で形式化されています [5]。
  • 定性的システム同定: システム同定は力学システム理論の基本的な問題です。

引用文献

[1] マグルトン、スティーブン (1999)。「帰納的論理プログラミング:論理における言語学習の問題点、結果、課題」人工知能。114 (1-2): 283-296。
[2] WIKI:https://en.wikipedia.org/wiki/Inductive_reasoning
[3] https://plato.stanford.edu/entries/logic-inductive/
[4] Luc De Raedt。帰納的論理プログラミングに関する視点。論理プログラミングの現在および将来のトレンドに関するワークショップ、シェーカータウン、Springer LNCS、1999 年に掲載予定。CiteSeerX :10.1.1.56.1790
[5] Bratko,I.(1993b)例から学ぶ革新的な設計。Proc.Int.Conf.現代産業における製造設計、ブレッド、スロベニア、1993 年 6 月。

おすすめ

転載: blog.csdn.net/hanss2/article/details/111589628