Discriminative Information Retrieval for Question Answering Sentence Selection论文笔记

其他 2018-12-21 14:24:46 阅读次数: 0

原文下载地址

摘要

该算法提出场景：text-based QA，即给定一段文字说明，提出问题，从文字说明中找出相应答案作答。

text-based QA算法的主要步骤包含三个：1）获取可能包含答案的段落；2)候选段落的重排；3）提取信息选择答案

本文的算法主要是解决第一个步骤

算法

算法主要框架：

预处理：将文字说明切成一句一句，每句都作为第一步的候选集，设，假设query为q,得分函数为F(q,p)，IR系统（即上述三个步骤的第一步）的目标是检索出前k个p，目标函数为：

（1）

设为query q的特征，为候选集p的特征，是由和合成的(query, candidate)对的特征：

（2）

训练权重向量，使得优化目标为：，转为：（3），这样相当于将query q提取特征后，先进行query expansion再采用点积与获选集计算相似度得分。下边将如何提取特征

特征

特征向量f中的一个项表示为“（KEY = value，weight）”，并且特征向量可以被视为一组这样的元组，写f（KEY = value）= weight表示特征作为关联数组的关键，θX是训练模型中特征X的权重θ。

1.问题特征

:问题词，如问题是how many，则（QWORD=how many, 1）添加到特征向量中；

：词汇答案类型（LAT），如果query有问题词：“what”或“which”这个问题的LAT被定义为问题词之后的第一个名词短语（NP）。例如，“What is the city of brotherly love?”，该元组为（LAT = city，1）

：所有的命名实体，如：(NE-PERSON=Margaret Thatcher,1)

：tf-idf ，如

2.段落特征（即候选句特征）

：词袋，段落中任何不同的x都会产生一个特征

：命名实体类型。如果段落包含人名，则将生成（NETYPE = PERSON，1特征

特征向量算法

1.合成

首先要实现公式2，对任何的query特征向量fQ（q）= {（ki = vi，wi）}，（wi≤1）和，定义两个操作：

ki=kj表示ki和kj的值相同。

C定义：

2.映射

定义：，，

则上式公式（3）中的t(theta)(q)得到表达

至此，通过(query, candidate)对进行训练获取theta值即可

猜你喜欢

转载自blog.csdn.net/Suan2014/article/details/83007111

Discriminative Information Retrieval for Question Answering Sentence Selection论文笔记

Information Extraction over Structured Data: Question Answering with Freebase【论文笔记】

《Information Extraction over Structured Data：Question Answering with Freebase》论文笔记

Adaptive Document Retrieval for Deep Question Answering

Retrieval Augmented Visual Question Answering with Outside Knowledge

Question Answering with Subgraph Embeddings【论文笔记】

【论文笔记】Question Answering with Subgraph Embeddings

论文阅读 Question Answering

论文阅读 | Multi-Cast Attention Networks for Retrieval-based Question Answering and Response Prediction

Multi-Hop Paragraph Retrieval for Open-Domain Question Answering

论文笔记：IRGAN：A Minimax Game for Unifying Generative and Discriminative Information

论文阅读：Unsupervised Question Answering by Cloze Translation

More Accurate Question Answering on Freebase阅读笔记

Information Retrieval

Question Condensing Networks for Answer Selection in Community Question Answering读书笔记

Question Answering over Freebase with Multi-Column Convolutional Neural Networks【论文笔记】

Semantic Parsing via Staged Query Graph Generation: Question Answering with Knowledge Base【论文笔记】

论文笔记 Multiomdal Learning and Reasoning for Visual Question Answering (NIPS 2017)

论文笔记 Visual Question Answering with Memory-Augmented Networks（CVPR2018)

论文笔记 Learning Visual Knowledge Memory Networks for Visual Question Answering （CVPR2018)

Gated Self-Matching Networks for Reading Comprehension and Question Answering论文笔记

论文笔记：Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

论文笔记：Heterogeneous Memory Enhanced Multimodal Attention Model for Video Question Answering

论文笔记 Entity-Relation Extraction as Multi-turn Question Answering | ACL2019

MCAN：Deep Modular Co-Attention Networks for Visual Question Answering——2019 CVPR 论文笔记

DYNAMIC COATTENTION NETWORKS FOR QUESTION ANSWERING阅读理解论文阅读笔记

【论文笔记】Unsupervised Information Extraction: Regularizing Discriminative Approaches with RelDist loss

【论文笔记】Weakly Supervised Discriminative Feature Learning with State Information for Person ...

Question Retrieval with Distributed Representations and Participant Reputation in Community QA论文笔记

Visual Question Answering with Memory

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)