イベントを抽出する簡単な方法

再ビルドイベントグラフ、イベント抽出方法は、使用することではなく、ここで我々は他の誰かの概要を引用を基準としています助けることができません

https://www.cnblogs.com/cyandn/p/10915394.html

関係抽出

 

定義された:エンティティ間の特定の意味的な関係を持つ自動識別。参加エンティティの数は、2項関係抽出(2つのエンティティ)とポリオール関係抽出(三の以上のエンティティ)に分割することができます。

 

関心のある2つのエンティティ間の意味関係を得ることができる(ARG1、関係、arg2)は、前記ARG1とARG2 2つのエンティティ、トリプル、関係は、エンティティ間の意味的な関係を示しています。

 

データソースによっては、抽出は、次の3つの関係に分けることができます。

  • 関係指向の構造化テキスト抽出:テーブル、XML文書、データベースやその他のデータを含む文書
  • 非構造化テキスト抽出のための関係:プレーンテキスト
  • 関係指向の半構造化テキスト抽出:構造化および非構造化の間

テキスト抽出の範囲に応じて、関係抽出は、次の2つに分けることができます。

  • 文関係抽出:2人の意味関係の間にどのようなエンティティからの文章を決定
  • コーパス(章)関係抽出段階:コンテキストに現れる2つのターゲットエンティティに限定されるものではありません

抽出されたフィールドの分割に基づいて、関係抽出は、次の2つに分けることができます。

  • 関係抽出修飾ドメイン:関係を定義する1つ以上の定義されたカテゴリのエリア内のエンティティ間の意味関係を間引くこと、それは、テキスト分類タスクとみなすことができます
  • オープンフィールドの関係抽出:カテゴリー間の関係が限定されるものではなく、

 

修飾ドメイン関係抽出方法:

  • テンプレートベースの関係抽出方法:または手動で間引くと差別学んテンプレートテキストエンティティの関係を編集することによって、それがテンプレートの品質とカバレッジ、拡張可能ではない強いによって制限されています
  • 機械学習の関係に基づいて、抽出方法:関係が分類問題として描かれています

ここで機械学習に基づく関係抽出方法は、教師と弱い監督に分けることができます。

関係抽出方法があります監修しました:

  • 機能に基づくエンジニアリング:特徴ベクトルに分類器との間の関係の表示例を変換する必要が受け入れることができます
  • 基づいて、カーネル関数:使用されていない特徴ベクトル間の内積が、カーネルとの距離との関係を算出する際に、ツリー構造を直接、処理され
  • ニューラルネットワーク:入力テキストから直接、効果的な自動学習機能は、最後に言いました

関係抽出方法の弱い監督:データの手動タグ付けを大量に必要としません。

距離監督:オープンマッピング知識で標識した自動学習サンプルは、1による手動のタグ付け1を必要としない、弱い教師関係抽出です。

 

オープンドメイン関係抽出方法:

クラス、エンティティ間の関係を記述するために、エンティティのコンテキストを使用した単語の一部との間の関係を定義する必要はありません。

 

要約:

修飾ドメイン関係抽出は、研究の主な方向です。

機械学習に基づく伝統的なテンプレートベースの抽出法関係のスケーラビリティが悪い関係抽出方法は、現時点ではホットな話題です。

抽出には時間がかかり、教師データの多くを学ぶの関係に基づいて手動で注釈を必要とし、弱いより多くの注目を集め、関係抽出に基づく学習指導。

 

イベント抽出

 

定義:ユーザーがイベントに興味があり、構造化された形態で提示テキストから抽出されたイベント情報の記述。

手順:まず、入射(一般エンティティ)に関与する要素を特定する第二に、イベントの種類を識別し、最後の要素は、それぞれが入射において果たす役割を決定するために必要。

 

関連するイベントの概念を抽出します。

  • イベント申し立て:目標を行って発生する特定のイベント、文章の通常の文章やグループの自然言語記述
  • イベントトリガーの単語:単語は最高の疑惑事件を表してイベントを意味し、決定は重要な機能のイベントカテゴリ、通常は動詞や名詞であります
  • イベント要素:イベント参加、主にエンティティと属性の値によっては、時間を作ります
  • 要素の役割:イベント要素に対応するイベントでの役割とは何か
  • イベントカテゴリ:イベント要素とトリガ・ワードは、(カテゴリとサブカテゴリの数で定義された)イベントのカテゴリを決定

 

イベントフィールド抽出を定義:抽出を行う前に、イベントの種類と、予め定義された(特定のイベント要素を含む)は、各タイプの優れた標的特異的な構成は、一般に、一定量のデータが示されている与えます。

イベントフィールドの抽出方法を定義します:

  • ベースのパターンマッチング方法:イベント識別および抽出のいくつかのタイプには、モード(:取得モード、パターンマッチングのステップ)のいくつかの指示の下で行われます。
    • 教師付きイベントパターンマッチング:コーパスマニュアル注釈パターンに完全に基づい取得
    • 弱い監督イベントパターンマッチング:コーパスが完全に寸法を必要としない、特定の事前ソートモードや種子の少量の発展の唯一の人工コーパス
  • 機械学習に基づく方法
    • 監視対象イベント抽出法:マルチイベント分類としてモデル化抽出
      • プロジェクトベースのメソッドの機能:クラシファイアに許容可能な特徴ベクトルを変換するために、イベントのインスタンスを表示する必要性が、研究は際立った特徴を抽出する方法に焦点を当てて性的を持っています
      • ニューラルネットワークに基づく:自動的にテキスト特徴抽出から取得し、イベントを完了し、ツールによる誤差の蓄積の従来の自然言語処理の問題の使用を避けます
    • 弱い監督イベント抽出方法:なしマニュアルは、多数のサンプルをタグ付けませんが、ラベル付き訓練データ仕様セマンティックタグ(イベントカテゴリ、役割名など)で与えられる必要があります
      • ブートストラップイベント抽出に基づいて手動でラベルされたデータの小さな数を使用して大規模なタグ付けデータの自動生成(確信度が高い結果は、次に学習サンプル、およびトレーニング、連続的な反復として描かれます)
      • ベース遠隔Supervisonイベント抽出:カタログに記載されているイベントの完全自動生成、非構造化テキストに直接バック標準トレーニングサンプルにイベントの構造化された知識ベースを使用して

 

イベントのオープンフィールド抽出:イベント認識が実行される前に、イベントの可能性のあるイベントの種類と構造が不明であるため、タスクは通常、主に教師なしと分布仮説をベースデータを、マークされていません。

配布仮説:候補者または候補イベントトリガーワードイベント要素は、同様の文脈を持っている場合、これらの候補のイベントは言葉をトリガーするイベントの同じタイプをトリガする傾向があり、対応する要素を候補イベントは、同じイベント要素をプレイする傾向があります。

オープンフィールドイベント抽出方法:

  • イベントベースのコンテンツ特徴抽出法
  • イベント抽出法に基づく異常検知

 

BSUイベントにイベント関係抽出、イベント・ロジックであって、深い抽出および検出を実現しました。

  • イベント共参照関係抽出
  • イベント因果関係抽出
  • サブイベント関係抽出
  • イベントのタイミング関係抽出

 

要約:

整理し、ビルドが両方のエンティティ、エンティティ関係、イベントマッピング知識のイベントが含まれている、イベント関係はますます注目されています。

 

おすすめ

転載: www.cnblogs.com/chenyusheng0803/p/11574318.html