DSSM笔记 - 代码天地

DSSM笔记

其他 2021-02-28 10:16:40 阅读次数: 0

在这里插入图片描述

模型：

在这里插入图片描述

INPUT

将一个单词序列的文档 $d$ 转换为网络输入层的向量表示 $x$ 需要两个步骤：

将单词中的每个单词转换为单词向量
通过连接这些单词向量来构建

第一步：one-hot表示每一个word（N=150K）为了获得质量更高的词向量，同时映射 $W$ 得3-letter向量（30K）。最后链接

Convolutional Layer

window大小：3
在这里插入图片描述
c是窗口大小为3的单词的上下文向量

Max-pooling Layer

在这里插入图片描述

Fully-Connected Layers

在这里插入图片描述

训练

DSSM参数：在这里插入图片描述
$L$ $O$ $S$ $S$ ：pair-wise rank loss(文档对（s，t1）（s，t2）)

s表示源文档，t1和t2表示候选文档，构建相对于s，t1比t2相关
分数计算：
在这里插入图片描述
优化目标：最大化sim（s，t1）-sim（s，t2）
使用逻辑LOSS

∆为sim（s，t1）-sim（s，t2）

实验采用mini-batch ：（256（source-target）对）。从batch随机选4个作为源文档的负样本

实体查询

通过从流量加权的Web文档集中随机抽样一组文档来构造第二个任务的评估数据集。在第二步中，使用内部命名实体识别器来标识每个文档中的实体名称。向商业搜索引擎发出每个实体名称作为查询，并保留最多100个检索到的文档作为候选目标文档。为每个实体形成一个源文档，它由一个200字的窗口定义的实体文本及其周围的文本组成。
最终评估数据集包含10000个源文档。平均而言，每个源文档与87个目标文档相关联。最后，源文档-目标文档对由付费注释器根据兴趣进行标记。标签的级别为5级，从0到4。

扫描二维码关注公众号，回复： 12559798 查看本文章

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_43390809/article/details/108754942

DSSM笔记

DSSM 学习笔记

DSSM简介

DSSM(以及CNN-DSSM，LSTM-DSSM)

DSSM(以及CNN-DSSM，LSTM-DSSM)

DSSM & Multi-view DSSM TensorFlow实现

DSSM模型—“双塔”模型

DSSM算法-计算文本相似度

DSSM线上预测速度优化案例

用于web检索的DSSM 论文阅读

语义相似度匹配（一）—— DSSM模型

【推荐系统】DSSM双塔模型浅析

【推荐系统 02】DeepFM、YoutubeDNN、DSSM、MMOE

【深度学习】DSSM双塔模型结构解析

DSSM：深度语义匹配模型（及其变体CLSM、LSTM-DSSM）

DSSM|基于Transformer的语义相似度计算模型DSSM及代码开源

DSSM、CNN-DSSM、孪生网络、ARC-II、MV-LSTM、BERT

DSSM、CNN-DSSM、孪生网络、ARC-II、MV-LSTM、BERT

推荐模型复现（三）：召回模型YoutubeDNN、DSSM

【PyTorch基础教程30】DSSM双塔模型代码解析

【深度学习】Transformer/VitNet/Conformer/DSSM模型结构解析

4. 文本相似度计算-CNN-DSSM算法

基于深度学习的语义匹配若干模型DSSM，ESIM, BIMPM, ABCNN

推荐系统中不得不说的DSSM双塔模型

【Torch-RecHub学习】DSSM双塔模型与其两个方向的改进

推荐系统实战5——EasyRec 在DSSM召回模型中添加负采样构建CTR点击平台

推荐系统实战4——EasyRec 搭建DSSM召回模型实现CTR点击平台

深度学习实战案例：构建基于 DSSM 双塔模型的电影推荐系统

【DSSM】Learning Deep Structured Semantic Models for Web Search using Clickthrough Data

MATLAB算法实战应用案例精讲-【深度学习】推荐系统模型DSSM&DeepFM

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)