ホットペーパー|感情 - 抽出のための理由:新しいトピックテキストのセンチメント分析

1.概要

    感情的な理由のエキス(感情原因抽出、ECE)は、テキスト抽出タスク基礎となるが、最近広く注目を集めている、アプリケーションの広い範囲のために、目的と後ろにいくつかの感情を引き起こしています。;方法2)まず、感情的なタグ付けは、その後、それらは無視される理由を抽出1)ECEが大幅に実際のシーンでその適用を制限する、感情的なマークの抽出原因の前に行わなければならない。しかし、2つの不備がありますこの事実の別の指標。本論文では、プレゼント新しいタスク:感情 - (対抽出、ECPE -cause EMOD)抽出のための理由を、その目的は、文書と対応する基礎となる感情的な理由を抽出することです。

2.はじめに

    図1に示し伝統と新しいECPEのECEタスクタスク間の差。図1の例では、マーク感情を説明する:「警官の訪問失われたお金で老人」と「泥棒があったことを彼に言った:「幸せ」、ECEの目標は、対応するトラックに2つの句を引き起こすことがあります「キャッチ。ECPEタスクでは、ゴールは泥棒を捕まえた、彼を知らせる」、(「老人は非常に満足」、「警察の訪問高齢者の損失」)および(「老人は非常に満足」を含め、すべての感情的な理由(感情原因ペア)の直接抽出でありますライブ幸福「)、感情的なコメントを提供していません」。 "
ここに画像を挿入説明

図1:ECEタスクとECPEタスクとの間の差を示す例。

    この新しいECPEタスクに対処するために、紙は、2段階の枠組みを提案しています。2つのマルチタスク学習ネットワーク内のステップ1は、2つの別個のサブタスクが感情(情緒抽出)及び原因抽出(原因抽出)で抽出された抽出タスクの感情的な理由に変換されます。ステップ2ペアリングおよびスクリーニングのための感情的な理由。すべての論文は、ペアの二組、終電除外の因果関係は右の感情的な理由が含まれていないことをフィルタの要素を組み合わせることになります。

3.メソッド

ステップ1:個々の感情の抽出とその理由

    ステップ1は、感情のグループは、節の集合と、各文書句理由から抽出した標的とすることです。この目的のために、我々は2つのマルチタスク学習ネットワークを提案します。独立したマルチタスク学習やインタラクティブなマルチタスク学習。後者は、強化されたバージョンは、さらに、前者に基づいて感情と理性の間の相関関係を捕捉します。

1.独立したマルチタスク学習

    句の複数を含むドキュメント:D = [C 1、C 2、...]は、それぞれC Iは、ワードCの複数含むI [W = I1、W I2を ...]。そのようなA「ワード句文書」構造を捕捉するために、図に示すように、2つの層を含むバイLSTMネットワークを、層状。
ここに画像を挿入説明

図2:独立マルチタスク学習のためのモデル(INDEP)。

    層単語バイLSTMレベルモジュール、句に各モジュール対応し、コンテキスト句の各単語の蓄積情報のグループからなります。感情、抽出のための別の理由を抽出するための1つの上部層は二つの部分を含みます。各成分は、C句の入力レイヤを受信句レベルバイLSTM、あるI単語ベクトルを符号化すること秒後のI暗黙のうちの2つの部分の状態のBi-LSTM R&LT E I及びR&LT C Iは、句Cから分かるI感情的な理由と抽出し、最終的に戻って感情ソフトマックスレイヤ予測及び予測理由にフィードバック。

2.インタラクティブマルチタスク学習

    これまでのところ、2バイLSTM上位コンポーネントが独立しています。しかしながら、これら二つのサブタスク(抽出および感情的理由抽出物)は独立していません。一方では、その理由を特定し、より良い感情的な支援を提供し、一方で、より正確な感情を引き出す理由を理解するのを助けることができます。

    図3に示す構造。抽出法を改善するために感情的な理由抽出物の使用はインターECと呼ばれていることに留意すべきです。抽出法を使用して感情的な原因の抽出を高めるためのInter-CEと呼ばれています。インターECおよびインター-CEは、構造が類似しているので、従って唯一のInter-EC(図3(a)以下)を導入。
ここに画像を挿入説明

図3:インタラクティブマルチタスク学習のための二つのモデル:感情抽出を向上させる抽出を使用原因抽出(b)の間CEを改善するために、感情抽出()を使用してインターEC、。

    上位層は、感情的な課題を抽出し、対話的な理由抽出タスクを予測するために使用される2つの部分で構成しながら、独立したマルチタスク学習と比較すると、基礎となるインターECは、変更されません。各成分は、その後、句レベルバイLSTM、ソフトマックス層です。

ステップ2:感情にマッチング及びフィルタリング

    ステップ1において、最終的にセットと感情的な理由のセットのセットを得ます。第二のステップは、対のこれらの二つのセットを標的とすることです。

    まず、E(感情的な句のセット)とC(節集合の理由から)すべての可能なペアの集合を取得する直積適用:ポール= {···、(C E I、C C J)}···

    次に、3つの特徴からなる特徴ベクトルを用いて、ポールのそれぞれで表される:
ここに画像を挿入説明
前記S E I及びS C Iは C表すE I、C C Jの結果をコードワードベクトルを通じて、V Dを表しますC E IとC C Jの間の距離。

    ロジスティック回帰モデルは、各候補対が(C検出され、訓練されるE I、C C J、C)E IおよびC C J:との間の因果関係が存在するか否か
ここに画像を挿入説明
Y(C E IおよびC C J)= 1を示している(cは。E I、C C Jは)因果関係、Y(CあるE IおよびC C J)は(C示す0 = E I、C C J)ない因果関係、及びδ(・)をポールからシグモイド関数でありますY(C除去E IおよびC C Jを)=(C 0 E I、C C J)ペアは、感情的な原因は、最終的なペアを得ました。

4.おわりに

    論文参照データセット(感情原因データセット)に基づいて、感情的な理由(GUIら、2016a)は、試験データに感情的なコメントを使用することなく、方法を評価します。最終的な感情は、 - 理由の抽出のためのF1スコアの61.28パーセントを達成しました。実験結果は、この方法の実現可能性と有効性を示します。感情に加えて - 評価を抽出するため、紙はまた、2つの別々のタスク(抽出および感情的理由抽出物)の性能を評価しました。依存排除マークECEの感情の伝統的な方法と比較すると、この方法は大きな利点があります。
ここに画像を挿入説明

さらに興味深い情報スキャンコード懸念BBIT
リリース6元記事 ウォンの賞賛0 ビュー40

おすすめ

転載: blog.csdn.net/ShenggengLin/article/details/105302038