基于Bidirectional AttentionFlow的机器阅读理解实践【demo】【code】 - 代码天地

基于Bidirectional AttentionFlow的机器阅读理解实践【demo】【code】

其他 2018-06-13 05:07:46 阅读次数: 2

机器阅读是实现机器认知智能的重要技术之一。机器阅读任务主要有两大类：完形填空和阅读理解。

（1）完型填空类型的问答，简单来说就是一个匹配问题。问题的求解思路基本是：
　　1）　获取文档中词的表示
　　2）　获取问题的表示

　　3）　计算文档中词和问题的匹配得分，选出最优

（2）文本段类型的问答，与完型填空类型的问答，在思想上非常类似，主要区别在于：完形填空的目标是文档中的一个词，文本阅读理解的目标是文档中的两个位置，分别用来标志答案的起点和终点。目标的差别带来了网络模型上一些差别。

继上次复现了r-net的方案之后，现将之前复现过的Bidirectional AttentionFlow （经典的阅读理解模型）也进行记录一下。

1、基本原理

BiDAF模型最大的特点是在interaction层引入了双向注意力机制，计算Query2Context和Context2Query两种注意力，并基于注意力计算query-aware的原文表示。

模型由这样几个层次组成：

(1)Character Embedding Layer使用char-CNN将word映射到固定维度的向量空间;

(2)Word Embedding Layer使用(pre-trained)word embedding将word映射到固定维度的向量空间;

从上图可以看出，该模型同时使用了字符的词向量和词向量两种层次的嵌入表示。

(3)Contextual Embedding Layer将上面的到的两个word vector拼接，然后输入LSTM中进行context embedding;

(4)Attention Flow Layer将passage embedding和question embedding结合，使用Context-to-query Attention 和Query-to-contextAttention得到word-by-word attention;

(5)Modeling Layer将上一层的输出作为bi-directional RNN的输入，得到Modeling结果M;

(6)Output Layer使用M分类得到passage的起始位置，然后使用M输入bi-directional LSTM得到M2，再使用M2分类得到passage的中止位置作为answer。

2、实验测试

（1）启动训练，加载词向量模型

（2）训练过程截图

（3）训练后的测试结果，如下所示，可以看到F1的值可以达到74.9%

转载： https://blog.csdn.net/sparkexpert/article/details/79233125

猜你喜欢

转载自blog.csdn.net/jdbc/article/details/80658180

基于Bidirectional AttentionFlow的机器阅读理解实践【demo】【code】

Tensorflow实现基于Bidirectional LSTM Classifier

BERT(Bidirectional Encoder Representations from Transformers)理解

Tensorflow实现基于Bidirectional LSTM Classifier （双向LSTM）

Bidirectional LSTM-CRF Models for Sequence Tagging阅读笔记

文献阅读 - Bidirectional LSTM-CRF Models for Sequence Tagging

Deep Bidirectional Language-Knowledge Graph Pretraining论文阅读

r-net机器阅读理解实践[code][github]

基于机器阅读理解（MRC）的信息抽取方法

【自然语言处理（NLP）】基于SQuAD的机器阅读理解

《Sentiment Analysis of Chinese Microblog Based on Stacked Bidirectional LSTM》论文阅读笔记

论文阅读：BERT：Pre-training of Deep Bidirectional Transformers for Language Understanding

论文阅读 BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transformer

【论文阅读】BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

经典文献阅读之--Bidirectional Camera-LiDAR Fusion（Camera-LiDAR双向融合新范式）

深入理解深度学习——BERT（Bidirectional Encoder Representations from Transformers）：微调训练-[单句标注]

深入理解深度学习——BERT（Bidirectional Encoder Representations from Transformers）：微调训练-[文本问答]

深入理解深度学习——BERT（Bidirectional Encoder Representations from Transformers）：模型总结与注意事项

深入理解深度学习——BERT（Bidirectional Encoder Representations from Transformers）：NSP任务

深入理解深度学习——BERT（Bidirectional Encoder Representations from Transformers）：MLM（Masked Language Model）

深入理解深度学习——BERT派生模型：BART（Bidirectional and Auto-Regressive Transformers）

深入理解深度学习——BERT（Bidirectional Encoder Representations from Transformers）：微调训练-[单句分类]

深入理解深度学习——BERT（Bidirectional Encoder Representations from Transformers）：输入表示

深入理解深度学习——BERT（Bidirectional Encoder Representations from Transformers）：BERT的结构

深入理解深度学习——BERT（Bidirectional Encoder Representations from Transformers）：基础知识

bidirectional_rnn

Bidirectional RRT / RRT Connect

Bidirectional RNN (BRNN)

【自然语言处理（NLP）】基于预训练模型的机器阅读理解

【自然语言处理（NLP）】基于Bi-DAF的机器阅读理解

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)