1. 요약
감정적 이유 추출물 (감정의 원인 추출, ECE)의 원인을 인해 애플리케이션의 넓은 범위, 목적, 최근 끌고있다 광범위한 관심을 뒤에 어떤 감정을 기본 텍스트 추출 작업입니다. 그러나이 두 가지 결함 : 1) ECE 크게 실제 현장에서의 적용을 제한하는 감정 마크의 추출 원인 전에 실시되어야한다 방법 2) 첫째, 정서적 태그, 그리고 그들은 무시하는 이유를 추출 이 사실의 또 다른 표시. 이 논문은 선물 새 작업 : 감정 - (쌍 추출, ECPE -cause EMOD) 추출을위한 이유를, 그 목적은 문서와 해당 기본 감정적 인 이유를 추출하는 것입니다.
2. 소개
1은 전통과 새로운 ECPE의 ECE 작업 작업의 차이를 그림. 도 1에서 예를 표시 감정을 설명한다 : "경찰관 방문 잃어버린 돈을 노인"와 "와 도둑 이었다는 것을 그에게 말했다 :"행복 ", ECE의 목표는 해당 트랙 두 절을 일으킬 것입니다 "붙 잡았다. ECPE 작업에서, 목표는 직접적인을 포함한 모든 감정의 이유 추출 (감정의 원인 쌍), ( "매우 행복 노인", "경찰 방문 노인 손실")와 ( "매우 행복 노인", "그에게은, 도둑이 붙 잡혔다입니다 라이브 행복 "), 감정적 인 의견을 제공하지 않습니다". "
이 새로운 ECPE 작업을 해결하기 위해, 종이는 두 단계의 프레임 워크를 제안한다. 이 다중 작업 학습 네트워크의 1 단계는 두 개의 하위 작업이 감정 (감정 추출) 및 원인을 추출 (원인 추출)을 추출하는 추출 작업에 대한 감정적 인 이유로 변환됩니다. 2 단계 페어링 및 심사에 대한 감정적 인 이유. 모든 서류는 쌍 두 세트, 막차 제외 인과 관계를 잘 감정적 인 이유를 포함하지 않는 것을 필터의 요소를 결합됩니다.
3. 방법
1 단계 : 개인의 감정과 이성의 추출
1 단계는 감정의 그룹 절 세트 및 각 문서 절 이유로부터 추출 된 대상이다. 이를 위해, 우리는 두 개의 다중 작업 학습 네트워크를 제안한다. 독립적 인 다중 작업 학습과 상호 작용하는 다중 작업 학습. 후자의 향상된 버전은 상기 이전에 기초하여 감정 이성 간의 상관 관계를 캡처한다.
1. 독립적 인 다중 작업 학습
절 복수를 포함하는 문서 : D는 = C . 1 , C 2 , ..., C 각각의 I는 또한 워드 C 복수 포함 I = [W I1 , W I2를 , ...]. 이러한 "워드 문서 절 -"구조를 캡처하기 위해,도 5에 도시 된 바와 같이, 두 개의 층을 포함 LSTM 양방향 네트워크를 계층화.
계층 단어 바이 LSTM 레벨 모듈 절 각 모듈에 대응하고, 문맥 구문의 각 단어에 대한 축적 정보의 그룹으로 구성. 감정 추출을위한 또 다른 이유를 추출 하나, 상위 계층은 두 부분을 포함. 각 성분 c를 절의 입력 층을 수용하는 절 레벨 양방향 LSTM이다 난 워드 벡터를 부호화하는 단계 (S) 후에 I를 . 암시 두 부분들의 상태 바이 LSTM R & LT E I 및 R LT C 나 절 C에서 알 수있는 I 감정 이유로 추출하고, 최종적으로 다시 감정이 softmax 계층 예측 및 예측 이유로 공급.
2. 대화 형 멀티 작업 학습
지금까지 두 바이 LSTM 상단 구성 요소는 독립적이다. 그러나이 두 하위 작업 (추출 및 정서적 이유 추출물) 독립적이지. 한편, 더 나은 이유를 식별 정서적 도움을 제공, 다른 한편으로는, 더 정확하게 감정을 추출하는 이유를 이해하는 데 도움이 될 수 있습니다.
도 3에 도시 된 구조. 감정적 인 이유의 사용이 간 EC이라고 추출 방법을 개선하기 위해 추출 주목해야한다. 간 CE라고 추출 방법을 사용하여 감정적 인 원인 추출을 강화합니다. 간 EC 간 CE는 동일 구조이기 때문에, 따라서 단지 간 EC (.도 3 (a)를 아래)를 소개한다.
상층 감정적 태스크를 추출하는데 사용 대화식 따라서 태스크를 추출하는 예측되는 두 부분으로 구성하면서 독립 멀티 태스크 학습에 비해 하부 간 EC는 변하지 않는다. 각 성분은 절 레벨 양방향 LSTM,이어서이 softmax 층이다.
2 단계 : 매칭 및 필터링 정동
1 단계에서 마지막 세트와 감정적 인 이유 세트의 세트를 얻을. 두 번째 단계는 두 쌍들의 세트를 목표로한다.
우선, E (감정적 절 세트) 및 C (절 세트 이유로) 모든 가능한 쌍들의 세트를 획득하기 위해 직교 제품 용도 : 폴 =를 {????? (C E I , C C J )} ?????
다음으로, 세 가지 기능으로 구성되는 특징 벡터를 사용하는 것은 폴 각각 표현 :
, S 상기 E I 및 S C 나 C 나타내는 E I , C C J를 한 결과를 부호화 어 벡터를 통해 V D가 나타내는 C E I 및 C C J 사이의 거리.
로지스틱 회귀 모형은 다음 각각의 후보 쌍 (C 검출되고, 훈련 E I , C C J , C) E I 및 C C J : 사이에 인과 관계가 있는지
Y (c E I 및 C C J ) = 1은 그 (다. E I , C C J는 ) 인과 관계, Y (C가 E I 및 C C J )이 (C 나타내는 0 = E I , C C J ) 인과 관계, 및 δ (·)를 폴로부터 시그 모이 드 함수이고 Y (C 제거 E I 및 C C J (C에서) = 0 E I , C C J) 쌍은 감정 원인은 최종 쌍을 제공합니다.
4. 결론
참조 데이터 집합을 기준으로 논문 감정적 인 이유 (감정 원인 데이터 집합) (GUI 등., 2016a) 테스트 데이터에 대한 감정적 인 코멘트를 사용하지 않고, 방법을 평가합니다. 감정적 최종 - 이유의 추출을위한 F1 점수의 달성 61.28 %. 실험 결과는이 방법의 타당성과 효과를 보여줍니다. 감정뿐만 아니라 - 평가의 추출에 대한 이유, 종이는 두 개의 분리 된 작업 (추출 및 정서적 이유 추출물)의 성능을 평가 하였다. 따라 제거 표시 ECE 감정의 전통적인 방법과 비교하여,이 방법은 큰 장점이있다.