인기있는 논문 | 감정 - 추출을위한 이유 : 새로운 주제 텍스트 감정 분석

1. 요약

    감정적 이유 추출물 (감정의 원인 추출, ECE)의 원인을 인해 애플리케이션의 넓은 범위, 목적, 최근 끌고있다 광범위한 관심을 뒤에 어떤 감정을 기본 텍스트 추출 작업입니다. 그러나이 두 가지 결함 : 1) ECE 크게 실제 현장에서의 적용을 제한하는 감정 마크의 추출 원인 전에 실시되어야한다 방법 2) 첫째, 정서적 태그, 그리고 그들은 무시하는 이유를 추출 이 사실의 또 다른 표시. 이 논문은 선물 새 작업 : 감정 - (쌍 추출, ECPE -cause EMOD) 추출을위한 이유를, 그 목적은 문서와 해당 기본 감정적 인 이유를 추출하는 것입니다.

2. 소개

    1은 전통과 새로운 ECPE의 ECE 작업 작업의 차이를 그림. 도 1에서 예를 표시 감정을 설명한다 : "경찰관 방문 잃어버린 돈을 노인"와 "와 도둑 이었다는 것을 그에게 말했다 :"행복 ", ECE의 목표는 해당 트랙 두 절을 일으킬 것입니다 "붙 잡았다. ECPE 작업에서, 목표는 직접적인을 포함한 모든 감정의 이유 추출 (감정의 원인 쌍), ( "매우 행복 노인", "경찰 방문 노인 손실")와 ( "매우 행복 노인", "그에게은, 도둑이 붙 잡혔다입니다 라이브 행복 "), 감정적 인 의견을 제공하지 않습니다". "
그림 삽입 설명 여기

도 1 : ECE 태스크와 태스크 ECPE의 차이를 보여주는 예.

    이 새로운 ECPE 작업을 해결하기 위해, 종이는 두 단계의 프레임 워크를 제안한다. 이 다중 작업 학습 네트워크의 1 단계는 두 개의 하위 작업이 감정 (감정 추출) 및 원인을 추출 (원인 추출)을 추출하는 추출 작업에 대한 감정적 인 이유로 변환됩니다. 2 단계 페어링 및 심사에 대한 감정적 인 이유. 모든 서류는 쌍 두 세트, 막차 제외 인과 관계를 잘 감정적 인 이유를 포함하지 않는 것을 필터의 요소를 결합됩니다.

3. 방법

1 단계 : 개인의 감정과 이성의 추출

    1 단계는 감정의 그룹 절 세트 및 각 문서 절 이유로부터 추출 된 대상이다. 이를 위해, 우리는 두 개의 다중 작업 학습 네트워크를 제안한다. 독립적 인 다중 작업 학습과 상호 작용하는 다중 작업 학습. 후자의 향상된 버전은 상기 이전에 기초하여 감정 이성 간의 상관 관계를 캡처한다.

1. 독립적 인 다중 작업 학습

    절 복수를 포함하는 문서 : D는 = C . 1 , C 2 , ..., C 각각의 I는 또한 워드 C 복수 포함 I = [W I1 , W I2를 , ...]. 이러한 "워드 문서 절 -"구조를 캡처하기 위해,도 5에 도시 된 바와 같이, 두 개의 층을 포함 LSTM 양방향 네트워크를 계층화.
그림 삽입 설명 여기

그림 2 : 독립적 인 멀티 태스킹 학습의 모델 (Indep).

    계층 단어 바이 LSTM 레벨 모듈 절 각 모듈에 대응하고, 문맥 구문의 각 단어에 대한 축적 정보의 그룹으로 구성. 감정 추출을위한 또 다른 이유를 추출 하나, 상위 계층은 두 부분을 포함. 각 성분 c를 절의 입력 층을 수용하는 절 레벨 양방향 LSTM이다 워드 벡터를 부호화하는 단계 (S) 후에 I를 . 암시 두 부분들의 상태 바이 LSTM R & LT E I 및 R LT C 절 C에서 알 수있는 I 감정 이유로 추출하고, 최종적으로 다시 감정이 softmax 계층 예측 및 예측 이유로 공급.

2. 대화 형 멀티 작업 학습

    지금까지 두 바이 LSTM 상단 구성 요소는 독립적이다. 그러나이 두 하위 작업 (추출 및 정서적 이유 추출물) 독립적이지. 한편, 더 나은 이유를 식별 정서적 도움을 제공, 다른 한편으로는, 더 정확하게 감정을 추출하는 이유를 이해하는 데 도움이 될 수 있습니다.

    도 3에 도시 된 구조. 감정적 인 이유의 사용이 간 EC이라고 추출 방법을 개선하기 위해 추출 주목해야한다. 간 CE라고 추출 방법을 사용하여 감정적 인 원인 추출을 강화합니다. 간 EC 간 CE는 동일 구조이기 때문에, 따라서 단지 간 EC (.도 3 (a)를 아래)를 소개한다.
그림 삽입 설명 여기

그림 3 : 대화 형 멀티 태스킹 학습에 대한 두 모델 (A) 간 EC, 추출 원인 용도 감정 추출을 향상시키는 원인 추출 (B) 간 CE를 개선하기 위해 감정 추출을 사용합니다.

    상층 감정적 태스크를 추출하는데 사용 대화식 따라서 태스크를 추출하는 예측되는 두 부분으로 구성하면서 독립 멀티 태스크 학습에 비해 하부 간 EC는 변하지 않는다. 각 성분은 절 레벨 양방향 LSTM,이어서이 softmax 층이다.

2 단계 : 매칭 및 필터링 정동

    1 단계에서 마지막 세트와 감정적 인 이유 세트의 세트를 얻을. 두 번째 단계는 두 쌍들의 세트를 목표로한다.

    우선, E (감정적 절 세트) 및 C (절 세트 이유로) 모든 가능한 쌍들의 세트를 획득하기 위해 직교 제품 용도 : 폴 =를 {????? (C E I , C C J )} ?????

    다음으로, 세 가지 기능으로 구성되는 특징 벡터를 사용하는 것은 폴 각각 표현 :
그림 삽입 설명 여기
, S 상기 E I 및 S C C 나타내는 E I , C C J를 한 결과를 부호화 어 벡터를 통해 V D가 나타내는 C E I 및 C C J 사이의 거리.

    로지스틱 회귀 모형은 다음 각각의 후보 쌍 (C 검출되고, 훈련 E I , C C J , C) E I 및 C C J : 사이에 인과 관계가 있는지
그림 삽입 설명 여기
Y (c E I 및 C C J ) = 1은 그 (다. E I , C C J는 ) 인과 관계, Y (C가 E I 및 C C J )이 (C 나타내는 0 = E I , C C J ) 인과 관계, 및 δ (·)를 폴로부터 시그 모이 드 함수이고 Y (C 제거 E I 및 C C J (C에서) = 0 E I , C C J) 쌍은 감정 원인은 최종 쌍을 제공합니다.

4. 결론

    참조 데이터 집합을 기준으로 논문 감정적 인 이유 (감정 원인 데이터 집합) (GUI 등., 2016a) 테스트 데이터에 대한 감정적 인 코멘트를 사용하지 않고, 방법을 평가합니다. 감정적 최종 - 이유의 추출을위한 F1 점수의 달성 61.28 %. 실험 결과는이 방법의 타당성과 효과를 보여줍니다. 감정뿐만 아니라 - 평가의 추출에 대한 이유, 종이는 두 개의 분리 된 작업 (추출 및 정서적 이유 추출물)의 성능을 평가 하였다. 따라 제거 표시 ECE 감정의 전통적인 방법과 비교하여,이 방법은 큰 장점이있다.
그림 삽입 설명 여기

더 흥미로운 정보 스캔 코드의 우려 BBIT
출시 여섯 개 원래 기사 · 원의 칭찬 0 · 조회수 40

추천

출처blog.csdn.net/ShenggengLin/article/details/105302038