DSSM模型—“双塔”模型

其他 2020-09-14 16:03:05 阅读次数: 0

文章目录

一、潜在语义分析（LSA）
二、DSSM模型
- 2.1 DSSM模型的原理
- 2.2 DSSM模型的结构
参考文献

一、潜在语义分析（LSA）

可以了解下《统计学习方法》中的潜在语义分析，有助于理解DSSM模型。

二、DSSM模型

DSSM(Deep Structured Semantic Models)也叫深度语义匹配模型。在2013年，是微软发表的一篇用于NLP邻域中的计算语义相似度任务的文章中。

2.1 DSSM模型的原理

原理：与LSA模型的原理差不多，获取搜索引擎中的用户搜索query和doc的海量曝光和点击日志数据，训练阶段分别用复杂的深度学习网络构建query侧特征的query embedding和doc侧特征的doc embedding，线上infer时通过计算两个语义向量的cos距离来表示语义相似度，最终获得语义相似模型。这个相似度就我的理解是：若运用在推荐系统中（视频推荐），相似度表示用户（user=query）对这个视频（item=doc）的喜欢程度。

2.2 DSSM模型的结构

DSSM结构图
上图DSSM模型结构图主要分为三部分：1-输入层，2-表示层，3-匹配层。

1、输入层：
输入层主要的作用就是把文本映射到低维向量空间转化成向量提供给深度学习网络。例如：
在这里插入图片描述
将输入的文本进行切分，如：good —>（go,goo,ood,od）等例子，中文类似是将字进行切分。

2、表示层：

看上图2部分，并结合传统的DNN模型。

3、匹配层：

通过cos函数计算这两个向量的余弦相似度就可以了，公式如下：
匹配相似度公式

扫描二维码关注公众号，回复： 11687479 查看本文章

参考文献

[1] Huang P, He X, Gao J, et al. Learning deep structured semantic models for web search using clickthrough data[C]. Conference on Information and Knowledge Management, 2013: 2333-2338.

猜你喜欢

转载自blog.csdn.net/weixin_41044112/article/details/108196550

DSSM模型—“双塔”模型

【推荐系统】DSSM双塔模型浅析

【深度学习】DSSM双塔模型结构解析

【PyTorch基础教程30】DSSM双塔模型代码解析

推荐系统中不得不说的DSSM双塔模型

【Torch-RecHub学习】DSSM双塔模型与其两个方向的改进

深度学习实战案例：构建基于 DSSM 双塔模型的电影推荐系统

推荐系统（六）双塔模型

语义相似度匹配（一）—— DSSM模型

推荐系统之采样修正的双塔模型

匹配网络(Learning to Rank、单双塔模型)

推荐模型复现（三）：召回模型YoutubeDNN、DSSM

DSSM：深度语义匹配模型（及其变体CLSM、LSTM-DSSM）

DSSM|基于Transformer的语义相似度计算模型DSSM及代码开源

【深度学习】Transformer/VitNet/Conformer/DSSM模型结构解析

双塔模型的最强出装，谷歌又开始玩起“老古董”了？

基于深度学习的语义匹配若干模型DSSM，ESIM, BIMPM, ABCNN

推荐系统实战4——EasyRec 搭建DSSM召回模型实现CTR点击平台

推荐系统实战5——EasyRec 在DSSM召回模型中添加负采样构建CTR点击平台

MATLAB算法实战应用案例精讲-【深度学习】推荐系统模型DSSM&DeepFM

NLP文本匹配任务Text Matching [有监督训练]：PointWise（单塔）、DSSM（双塔）、Sentence BERT（双塔）项目实践

深度学习应用篇-推荐系统[12]：经典模型-DeepFM模型、DSSM模型召回排序策略以及和其他模型对比

训练双塔检索模型，可以不用query-doc样本了？明星机构联合发文

推荐系统（九）SENet 双塔模型在推荐领域召回粗排的应用

模型

DSSM简介

DSSM笔记

hanoi双塔

模型-视图模型

贫血模型or领域模型

今日推荐

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

SVN同步出现问题

解决 nginx 出现 413 Request Entity Too Large 的问题

第一节区块链服务BaaS的总体架构以及基本模块设计的一种方案

ITeye 2013年度盘点——社区赠书书单

IDEA / git 和github 的新手使用教程史上最简单的 IntelliJ IDEA 教程史上最简单的 GitHub 教程

测试工程方法：测试用例设计综合策略

Spark优化(三)：对多次使用的RDD进行持久化

使用STM32 ST-LINK Utility 设置读保护后不能运行

exgcd 解同余方程ax=b(%n)

Android使用脚本进行多渠道打包

每日归档

更多

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)