文学読書ノート(XII)

インスタンス・ベースのオントロジーマッピング仕上げノート

 

 

まず、紙は、あなたの思考の流れを整理します

1.1関連研究論文

  1. CIM(共通情報モデル)は、コンピュータ業界では、システム管理者が同じように異なるベンダーからのプログラムやアプリケーション機器や情報源を制御し、管理するように、標準のアプリケーション機器および方法を定義するために使用されています。または:(デバイス名およびモデル番号、シリアル番号、容量、およびネットワークアドレス、およびその他のデバイスやアプリケーションとの関係を例えば)例えば、会社は、各デバイスのために同じ種類の情報を見ることができ、ストレージデバイスのさまざまな種類の異なる企業から購入しました情報を取得するためのアプリケーション。
  2. CATO:異なるエンティティ間のマッピングのためのオントロジーの統合エンジンは、緊密な統合を実現し、オントロジーのあいまいな解釈を避けるために、試合を表します。しかし、欠点は、ソースエンティティを構成するデータの量は、パフォーマンスの詳細が比較的小さい場合、不完全な定義されたエンティティの記述をもたらすことです。
  3. データベース・パターン・マッチング:指定された二つのモードA、Bマッチマッピングμが存在する場合、AとBの概念において、このような概念は、B A =μ(B)は、bは同じ意味を持つと見なされました。
  4. 不完全または不正確時間オリジナルリソース表現定義され、この用紙プレゼントCATOを追加する方法は、結果を改善することができます
  5. 自動的にCATOと知識管理の統合要素。
  6. 記事は、最初に実行すべきタスクCATO本体統合エンジンをまとめました。CIMに基づいて、異種リソースの統合は、発現パターンマッチングデータベースに例えることができます。我々は独立した機関による各リソースと仮定した場合CATOエンジンでは、相談身体関連サポートするためのメカニズムがなければならないと述べました。交渉のこの種類に関連付けられている目標は、表現に関連付けられている連絡先の真ん中を見つけることであることを確認することができます。
  7. CATOエンジンは、自然言語処理、類似性尺度、比較ツリーとして、アルゴリズムの様々な組み合わせ。最初のバージョンは、Java CATOに基づいており、API-イエナのJavaで使用されています。システムのCATO原理は比較的身体概念の間に散在レベル、である混合体、言語のレベルや構造に対処するための具体的な措置の内容分析の構文意味解析です。
  8. CATOプロセスを結ぶ:まず、テキストの類似性の二つの概念の間の比較は、同様の概念の意味論上のテキストが似ている必要がありますが、いくつかの概念がありますが、曖昧さを有していてもよく、それは構造的な比較を再導入し、木が特定され比較、親と子のクラスの概念概念の比較の概念。最終的には同じ関係の二つの概念を描きます。結果は同値関係のOWLの概念を含む文書で終わります
  9. CATOの成功は、量と質をコードの入力本体の情報に依存します。より豊かで完全な情報、より良いマッチング結果。入力が正しく体、不完全または欠落が定義されていない場合は逆に、データ統合エンジンが処理されるほとんど体であり、十分に信頼できる結果を提供することは不可能です。
  10. 問題CATOを解決するために、物品は、ケースベースのアプローチの使用を提案整合体の種類を取っていないが、体の例を考えます。ボディの店舗だけでなく、カテゴリ、更に、インスタンス。方法の例は、分類の一致に基づいているが、異なるエンティティ間で見出されます。物品の中心的な考えは、モデル設計を推定する信頼性の高い方法として、二つの異なる団体によって提起クエリを処理した結果であり、モデルは、概念の整列ペア間の一致率を示しています。したがって、物品は、各インスタンスは、GTINの識別を有する提案します。
  11. 記事は、その後、詳細な事例に基づく方法が提案始まりました

1.2論文の問題

論文の問題解決プロセス1.3

1)クエリ段階:本体はOを表すようにするには、まず、Cは、[C1 ... CN]分類などのカテゴリのセットを表します。各カテゴリの例は、CKのタイプの例[... RK1 RKN]と、O複数の番組に対応することができます。RAのRBと同じ現実の世界を表すオブジェクトのオビ、Oaのは、それは2つの例を考えられているインスタンスの例は、同等の関係であるが、CAとCBと同等とみなすことができます。このプロセスでは、各分類(CA、CB)、CAとCBはのRaおよびRbである場合、RAおよびN-(CA、CB)(すなわちRA≡rbの和のRB対数の各出現について計算される必要があります分類);周波数推定P(CA、CB)= N(CA、CB)/ N(CA)にマッピングされたクラスのCA、CBクラス

2)分析段階:計算N(CA、CB)、及び後P(CA、CB)、nにクエリからの結果セットを使用して(CA)、N(CA、CB)、及びP(CA、CB)再計算

 

αは補正係数であり、値のセットは{0.01、0.1、0、1、10、100}

Δ(CA、CB)は、現在のCAおよびCB発生の数です。

Δ(CA)が発生したCAの数です。

N(CA、CB)は、CAおよびCBの和が生じています。

N-(CA)が発生したCAの合計です。

これは、平滑化係数ですΨ

1.4実験方法古紙

  1. 6倍クロスバリデーション技術を使用して、検証データセットは、手動でラベル付けされています。
  2. 検証は、それぞれの係数の比較実験の異なる組み合わせを使用して設定しました。
  3. 得られたシステムの最終的な精度は89.7パーセント、81.3パーセントの再現率でした
  4. = 1、データは最高のパフォーマンスを設定するα係数設定、実際のマッチング率0.4

実験1.5の結果の最終評価

第二に、紙の革新

本論文でプレゼント補足CATOの方法、元のリソースが不完全または不正確に定義されて表すとき、あなたは自動的にCATOと知識管理の統合要素の結果を改善することができます。

 

おすすめ

転載: www.cnblogs.com/hwx1997/p/12444177.html