Quick thoughts:一种新型、有效的sentence vector模型

其他 2019-01-14 16:01:02 阅读次数: 0

目录

一、概要

英文原文链接：https://pan.baidu.com/s/1FwqOzn7kdDAiYpOHACQzEQ 密码：sjsa

英文论文名称：《An efficient framework for learning sentence representations》

本文主要提出了一种新的方法来实现sentence2vec，实际上则是对skip thoughts的一种改进。从效果上来看，它训练得到的句向量在测试方面表现得也比较优异。而且他的另一个特点则是训练快，这是它非常具有吸引力的一个地方。

如果不了解skip thoughts，请去了解……

二、原理

Quick thoughts的原理实际上非常简单，就是将skip thoughts的预测行为修改成了分类问题。

（1）skip thoughts的原理简介（真的只是简介）

Skip thoughts采用的是encoder-decoder模型。所谓的coder，其实就是一个循环神经网络，无论采用lstm还是gru的方式。输入的是一个句子，经过encoder编码后，得到一个输出，这个输出作为decoder的输入，decoder的输出就是我们最终得到的东西。所以skip thoughts是用一个句子去预测另一个句子的模型。

（2）Quick thoughts模型

区别于skip thoughts的预测句子模型，quick thoughts在skip thoughts的模型基础上，略加修改，使得预测行为变成了分类行为。图解如下：

如上图所示，输入的是一系列句子的编码（或者叫句子的向量形式）。

1、f,g是带参数（需要训练）的函数，它们的作用是将句子变为定长的向量。（常用的包括RNN、LSTM等）

2、s表示一个句子

3、 $S_{ctxt}$ 表示出现s周围的句子的集合（即s的上下文，context）

4、 $S_{cand}$ 应该（据我的理解）是 $S_{ctxt}$ 的子集，其中包含一个有效的上下文句子和许多无效的非上下文句子。模型的用处就是对这个集合进行分类。这部分的英文原文我贴出来：

模型的目标函数：

对于一个给定的句子s，一个 $s_{cand}\in S_{cand}$ 是s的上下文的概率（上述4中有效的上下文句子）为：

我们的训练目标则是最大化如下概率（D为训练集，就是让有效上下文的概率最大化）：

其中函数c表示两个向量的内积（或许还有其他定义函数c的方法）。f和g通常用RNN。最后句子s的向量用f(s)和g(s)的拼接来表示。

猜你喜欢

转载自blog.csdn.net/cpluss/article/details/81456755

Quick thoughts:一种新型、有效的sentence vector模型

Quick BI 取数模型

QT quick学习一

SpringBoot(一)：Quick start

【论文笔记】一种有效攻击BERT等模型的方法

【论文笔记】一种有效攻击BERT等模型的方法

【论文笔记】一种有效攻击BERT等模型的方法

【论文笔记】一种有效攻击BERT等模型的方法

基于梯度下降算法自建一种短期有效的自回归模型

没有Qt Quick UI，没有 Qt Quick Project

quick实践——第一个quick empty工程

Qt Quick——QML基础（一）

Quick BI取数模型深度剖析

hbase in action学习笔记一(quick start)

Quick start Solr 之安装指南(一)

Qt Quick——新建一个QML

quick-x笔记（一）配置环境

[Drools Demos] 其 (一) : Quick Start

pybullet学习笔记(一)——Quick start with an example

Learning Qt 5! (21)：Qt Quick 中的模型和视图

Quick BI 的模型设计与生成SQL原理剖析

如何高效提炼有效信息？阿里武大创造了一种零样本文档过滤模型 | ACL 论文

论文《一种金融市场预测的深度学习模型：FEPA》(2)----有效市场假说，预测原则概念及自己的思考

关于句子embedding的一些工作简介（四）---- Quick Thoughts

Stable Diffusion：一种新型的深度学习AIGC模型

七种排序--------快速排序（Quick Sort）

Qt Quick App的两种启动模式

Quick Sort的两种实现方法---Python

QT Quick App的两种启动方式

Qt Quick 图形渲染 - QtGraphicalEffects 的25种特效

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)