【论文笔记】ULMFiT——Universal Language Model Fine-tuning for Text Classification

0 一些术语tranductive transfer 直推迁移学习inductive transfe大数据
分类: 其他 发布时间: 03-18 23:05 阅读次数: 0

【论文笔记】QANET:Combining Local Convolution With Global Self-attention for Reading Comprehension

1. 简要介绍模型创新点:(一)移除了RNN,核心就是卷积 + self-attention。这样使
分类: 其他 发布时间: 03-18 23:05 阅读次数: 0

【论文笔记】Knowledgeable Reader_ Enhancing Cloze-Style Reading Comprehension with External Commonsense Kg

Abstract和介绍论文特点:引入了external commonsense knowledge,
分类: 其他 发布时间: 03-18 23:05 阅读次数: 0

【论文笔记】AS Reader vs Stanford Attentive Reader

Attention Sum Reader Network数据集CNN&DailyMail每篇网络
分类: 其他 发布时间: 03-18 23:05 阅读次数: 0

【论文笔记】Enhancing Pre-Trained Language Representations with Rich Knowledge for MRC

KT-NET——Knowledge and Text fusion NETKBs :WrodNet
分类: 其他 发布时间: 03-18 23:04 阅读次数: 0

【博文笔记】Attentive Reader\Impatient Reader:机器阅读理解之开山之作Teaching Machines to Read and Comprehend

来源参考博客:机器阅读理解(看经典MRC模型与花式Attention)CNN&Dailyma网络
分类: 其他 发布时间: 03-18 23:04 阅读次数: 0

【博文笔记】AoA Reader_Attention-over-Attention Neural Networks for Reading Comprehension

介绍论文地址:Attention-over-Attention Neural Networks fo网络
分类: 其他 发布时间: 03-18 23:04 阅读次数: 0

【兼容调试】pytorch出现RuntimeError: CUDA out of memory时的一些解决方法

代码方面要适当删除没用的中间变量(虽然效果不大)比如:del outputtrain的时候,累加loPython
分类: 其他 发布时间: 03-18 23:04 阅读次数: 0

【源码阅读】BERT pytorch源码结构关系图

如图,模型基本结构是BERT,是model,而BERTLM集成了Bert,NSP,MLM,是模型结构人工智能
分类: 其他 发布时间: 03-18 23:03 阅读次数: 0

【论博文笔记】XLNet总结

结合XLNet结合了Bert、GPT 2.0和Transformer XL它通过PLM预训练目标,吸
分类: 其他 发布时间: 03-18 23:03 阅读次数: 0

【论文翻译+笔记】Neural Machine Reading Comprehension: Methods and Trends

1 Introduction过去的MRC技术的特点:hand-crafted rules or fe人工智能
分类: 其他 发布时间: 03-18 23:03 阅读次数: 0

预训练模型小结:XLNet\Transformer-xl\Bert\GPT\ELMo

大纲1 语言模型2 XLNetXLNET好处XLNet 创新点应用3 Transformer-xl3
分类: 其他 发布时间: 03-18 23:03 阅读次数: 0

CMake 最简单工程

CMake 最简单工程编写C++文件编写CMakeLists.txt生产Makefile运行编写C+
分类: 其他 发布时间: 03-18 23:02 阅读次数: 0

CMake GoogleTest工程

CMake GoogleTest工程CMake GoogleTest工程编写被测试函数编写测试用例编
分类: 其他 发布时间: 03-18 23:02 阅读次数: 0

vscode python 扩展 setting.josn 文件事例

{ python.analysis.cacheFolderPath: test, Python
分类: 其他 发布时间: 03-18 23:02 阅读次数: 0

Java自带web启动框架--com.sun.net.httpserver,使用实例

代码项目简单结构,是一个输入参数并返回解密内容的微服务体系,代码简单看源码基本上直接就懂了顺子在帝都Java
分类: 其他 发布时间: 03-18 23:02 阅读次数: 0

记一次Ubuntu 14 升级 16的过程和理解(1)upgrade

在线升级,upgrade 之前最好update 一下update是更新镜像源upgrade则是对已有
分类: 其他 发布时间: 03-18 23:01 阅读次数: 0

记Ubuntu apt-get命令理解

首先我们命令:find / -name apt-get 会出现两个结果:/usr/bin/apt-g
分类: 其他 发布时间: 03-18 23:01 阅读次数: 0

SOCKET复习

客户端
分类: 其他 发布时间: 03-18 23:01 阅读次数: 0

神经网络中的常用表示方式

标量(OD 张量) 数字组成的数组叫作向量(vector)或一维张量(1 D 张量)。一维张量只有一个轴。下面是一个 Numpy 向量。 (tensorflowcv) turing@localhost ~ % python Python 3.7.5 (v3.7.5:5c02a39a0b, Oct 14 2019, 18:49:57) [Clang 6.0 (clang-600.0.57)] on darwin Type "help", "copyright", "credits" or "l
分类: 其他 发布时间: 03-18 23:01 阅读次数: 0