tf计算余弦相似度 - 代码天地

tf计算余弦相似度

其他 2018-07-04 11:30:49 阅读次数: 0

词向量被广泛应用在NLP的任务中，在端到端的实验中，我们需要先定义一个embedding矩阵，
首先我们先定义embedding矩阵

embedding = tf.Variable(
    tf.random_uniform([vocab_size,embedding_size],-1.0,1.0),name='embedding')

接下来就是一些计算词向量的方法，假设已经有了词向量矩阵，那么我们如故计算向量之间的余弦相似度呢？
我们需要现对词向量矩阵进行归一化，假设有一个向量\(a=(x_1,x_2,x_3)\)，求模的公式就为\(\sqrt{x_1^2+x_2^2+x_3^2} \quad\)，对应的代码如下

norm = tf.sqrt(tf.reduce_sum(tf.square(embeddings), 1, keepdims=True))

需要注意的是reduce_sum方法里面的参数，keepdims的含义为retains reduced dimensions with length 1，即保持减少的那一个维度(axis)的值为1

x = tf.constant([[1, 1, 1], [1, 1, 1]])
tf.reduce_sum(x) # 6
tf.reduce_sum(x, 0) # [2, 2, 2]
tf.reduce_sum(x, 1) # [3, 3]
tf.reduce_sum(x, 1, keepdims=True) # [[3], [3]]
tf.reduce_sum(x, [0, 1]) # 6

再接下来就是求\(cos\theta\)

normalized_embeddings = embedding / norm 
#对验证集中的数据进行归一化
valid_embeddings = tf.nn.embedding_lookup(
    normalized_embeddings, valid_x)
#计算相似性
similarity = tf.matmul(valid_embeddings, tf.transpose(normalized_embeddings))

猜你喜欢

转载自www.cnblogs.com/wxshi/p/9262383.html

tf计算余弦相似度

余弦相似度计算

相似度计算之余弦相似度

余弦相似度计算[转载]

sklearn计算余弦相似度

Python计算余弦相似度

TF-IDF算法和余弦相似度算法计算文本相似度（纯手撕）

KNN cosine 余弦相似度计算

算法基础之余弦计算相似度

Python科学计算初探——余弦相似度

使用sklearn 计算文本余弦相似度

[转]余弦cos计算相似度

余弦相似度的计算方法

gensim计算余弦相似度采坑

python/pytorch计算tensor的余弦相似度

使用余弦相似度算法计算文本相似度

【python 走进NLP】句子相似度计算--余弦相似度

使用余弦相似度计算文本相似度

计算pearson相似度和余弦(cosine)相似度

445 余弦相似度

余弦相似度

python余弦相似度

scala 余弦相似度

【文本相似度】利用余弦相似性计算句子的相似度

基于Lucene、TF-IDF、余弦相似性实现长文本相似度检测

Python简单实现基于VSM的余弦相似度计算

使用余弦定理计算文本相似度

计算两向量的欧式距离，余弦相似度

Python 余弦相似度与皮尔逊相关系数计算

文本相似度计算之余弦定理

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)