DSSM 学习笔记 - 代码天地

DSSM 学习笔记

其他 2020-06-23 09:58:08 阅读次数: 0

概述

深度结构化语义模型（Deep Structed Semantic Models），可用于匹配搜索问题和搜索答案，即匹配 query-doc 对。

DSSM 可分为输入层、表示层、匹配层。

输入层

输入层负责将输入句子转化为数据向量。传统方法一般是做独热编码，然而这里为了减小数据量并对没有在训练集中见过的单词做出较好地反映，可以采用下面的做法。

英文

对每一个单词编码用 multi-hot，即在字母层面上用 N-grams 分解单词，如 preview，编码后 pr-pre-rev-evi-vie-iew-ew。

这种编码方式虽然会在一定情况下有冲突，但是实际中冲突的概率非常小，而且这种编码方式可以有效处理没有见过的新单词。

中文

中文的词数相比英文来说要多得多。一般处理中文的方法都是分词之后去编码，除了embedding外，还可以对中文的字进行编码，作者对每一个单独的字 one-hot 编码，我认为，这里需要考虑实际的任务需求，来选择合适的编码方式。

表示层

表示层中，首先需要把变长的句子转化为定长。

在不考虑单词/字顺序时，可以用 Bag of Words，否则，RNN、CNN、LSTM、Gru 和 transformer 等模型都是不错的选择。

定长向量可以表达少量的句子信息，为了更加合理地表示句子，用深度神经网络去学习句意表达。通过多层的累加，表示层的输出为 query 或 doc 的语义。

匹配层

作者的匹配方法简单粗暴，直接选择用余弦距离决定两个语义的相似程度。

在训练时，从其他的doc中选择若干个不相关的搜索答案，然后将余弦距离层的输出通过 softmax，得到正样本。

预测时，直接在已有的 doc 中计算最大余弦距离，标记答案。

猜你喜欢

转载自www.cnblogs.com/TABball/p/13180410.html

DSSM笔记

DSSM 学习笔记

【深度学习】DSSM双塔模型结构解析

【深度学习】Transformer/VitNet/Conformer/DSSM模型结构解析

DSSM简介

DSSM(以及CNN-DSSM，LSTM-DSSM)

DSSM(以及CNN-DSSM，LSTM-DSSM)

DSSM & Multi-view DSSM TensorFlow实现

基于深度学习的语义匹配若干模型DSSM，ESIM, BIMPM, ABCNN

【Torch-RecHub学习】DSSM双塔模型与其两个方向的改进

深度学习实战案例：构建基于 DSSM 双塔模型的电影推荐系统

MATLAB算法实战应用案例精讲-【深度学习】推荐系统模型DSSM&DeepFM

DSSM模型—“双塔”模型

深度学习应用篇-推荐系统[12]：经典模型-DeepFM模型、DSSM模型召回排序策略以及和其他模型对比

DSSM算法-计算文本相似度

DSSM线上预测速度优化案例

用于web检索的DSSM 论文阅读

语义相似度匹配（一）—— DSSM模型

【推荐系统】DSSM双塔模型浅析

【推荐系统 02】DeepFM、YoutubeDNN、DSSM、MMOE

DSSM：深度语义匹配模型（及其变体CLSM、LSTM-DSSM）

DSSM|基于Transformer的语义相似度计算模型DSSM及代码开源

DSSM、CNN-DSSM、孪生网络、ARC-II、MV-LSTM、BERT

DSSM、CNN-DSSM、孪生网络、ARC-II、MV-LSTM、BERT

推荐模型复现（三）：召回模型YoutubeDNN、DSSM

【PyTorch基础教程30】DSSM双塔模型代码解析

4. 文本相似度计算-CNN-DSSM算法

推荐系统中不得不说的DSSM双塔模型

推荐系统实战5——EasyRec 在DSSM召回模型中添加负采样构建CTR点击平台

推荐系统实战4——EasyRec 搭建DSSM召回模型实现CTR点击平台

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)