関係抽出 - 遠隔監視---「ノイズの多いデータから関係の分類のための強化学習」

  • 問題は、本明細書に対処

    1)センテンスレベルで予測することができない

    2)パケットベースのフィルタリング方法において、典型的にノイズの多いデータを、少なくとも一つのパケットを保持します。そのようなアプローチは、ケースのノイズデータの完全な袋を扱うことができないが、全体のパッケージは、リモート監視方法では非常に一般的なノイズデータであります
  • この記事では、達成するための方法の概要を示します。

  セレクタインスタンス(インスタンスセレクタ)と分類器(関係分類器)との間の関係:方法は、2つのモジュールで構成されています。高品質セレクタの例は、文と文レベルの関係クラシファイア分類関係からデータ・パケットを選択してもよい。第二の問題を解決するために、完全なパッケージは、ノイズデータフィルターインスタンスである場合、置換に選択することができますすべてのデータ。

  このアプローチの最大の課題は共同で、特に、二つのモジュールを訓練する方法である、データは、データが信頼できない信頼性の高いパッケージで、何であるか知らないの選択の一例です。選択用途は学習補強材)文を選択するセレクタの試行1)として、及びで分類子の関係の品質に関するフィードバック(報酬又は文章を得る:トレーニング方法(サットンとBartoの1998)、セレクタの例は、以下の2つのプロパティを満たします2)フィードバックは、セレクタは、操作の文を選択した場合にのみ端部で分類からのフィードバックを得るために言うことである、遅延されます。両方の特性は、2つのモジュール内の実際の研修で学習プロセスの強化された機能が互いに影響会います。

  • 本論文では、アイデアの概要を示します。

  二つのモジュールの分類器選択および関係によって方法の例。1)例えば、セレクタにおいて、文の各アクションが対応する(アクション文は、訓練データの関係分類器として選択されているかどうかを示します)。そして状態に各文対応する(状態)、文、文が選択されたエンティティとの組成物から出てきました。セレクタの例は現在の状態とポリシー機能(に基づいて、ポリシー機能文の分類および選択された選択された文2によれば)、動作が与えられる)畳み込みニューラルネットワーク(で関係クラシファイアCNN決定文)と選択フィードバック情報(与えながらエンティティの関係タイプ、報酬をさらにトレーニングポリシー機能を選択するために、)。

    

 

  •   セレクタの例

 

     

    

    

    

 

  • 関係分類器

    

 

 

  •  トレーニング方法:

   

  セレクタと事前訓練された分類器のそれぞれの開始前に合同訓練。第1の予備訓練された分類器および固定分類子パラメータ、セレクタ、最後のセレクタと共同訓練分類器の事前トレーニング。

 

 

 

     

 

 

 

 

 

 

 

 

 

 

 

 

 

 

おすすめ

転載: www.cnblogs.com/dhName/p/11850823.html