精析神经语言模型实验 set_shape()和reshape()的区别 - 代码天地

精析神经语言模型实验 set_shape()和reshape()的区别

其他 2019-05-01 14:11:08 阅读次数: 0

区别：

这两个主要是适用场合的区别，前者用于更新图中某个tensor的shape；而后者则往往用于动态地创建一个新的tensor

set_shape的典型用法如下：

import tensorflow as tf
x1 = tf.placeholder(tf.int32)
x1.set_shape([2，2])
print(x1.get_shape())
sess = tf.Session()
#print(sess.run(tf.shape(x1), feed_dict={x1:[0,1,2,3]}))
print(sess.run(tf.shape(x1), feed_dict={x1:[[0,1],[2,3]]}))

输出：

(2, 2)
[2 2]

这代表了图中最开始没有shape的x1在使用了set_shape后，它的图中的信息已经改变了，如果取消掉注释就会报错，因为我们传入了和图不符合的参数。

reshape的典型用法则是这样：

import tensorflow as tf
x1 = tf.placeholder(tf.int32)
x2 = tf.reshape(x1, [2,2])
print(x1.get_shape())
sess = tf.Session()
print(sess.run(tf.shape(x2), feed_dict={x1:[0,1,2,3]}))
print(sess.run(tf.shape(x2), feed_dict={x1:[[0,1],[2,3]]}))

输出：

(2,2)
[2,2]
[2,2]

即它并不是想改变图，而只是想创造一个新的tensor以供我们使用。

但是reshape能否和set_shape有着相同的用法，即用来改变图？我们试着修改上面的代码：

import tensorflow as tf
x1 = tf.placeholder(tf.int32)
x1 = tf.reshape(x1, [2,2]) # use tf.reshape()
print(tf.shape(x1))
sess = tf.Session()
#print(sess.run(tf.shape(x1), feed_dict={x1:[0,1,2,3]}))
print(sess.run(tf.shape(x1), feed_dict={x1:[[0,1],[2,3]]}))

经测试，reshape后x1的shape也发生了变化，注释不取消仍然会有报错现象。

那么set_shape和reshape的用法是否完全一样呢？还是有一定差别的。

reshape可以改变原有tensor的shape，而set_shape只能更新信息没办法直接改变值，可以参考下面的程序：

import tensorflow as tf
x1 = tf.Variable([[0, 1], [2, 3]])
print(x1.get_shape())
x1 = tf.reshape(x1, [4, 1]) # if we use x1.set_shape([4, 1]),the program cannot run
print(x1.get_shape())

猜你喜欢

转载自blog.csdn.net/iajin/article/details/89649576

精析神经语言模型实验 set_shape()和reshape()的区别

Tensorflow set_shape()和reshape()的区别

精析神经语言模型实验：tf.identity()的作用

精析神经语言模型实验：TensorFlow queue多线程读取数据转载

Tensorflow中的dynamic shape、static shape及reshape、set_shape

OSI7层网络模型协议精析

Javascript中escape(), encodeURI()和encodeURIComponent()之精析与比较

tensorflow中shape,get_shape,reshape,set_shape的对比

Python TensorFlow，张量的形状，静态形状与动态形状，set_shape()，reshape()

eclipse maven build、maven clean、maven install和maven test的区别精析

application/x-www-form-urlencoded与multipart/form-data与application/json的区别精析

【C# 基础精讲】构造函数和析构函数

golang的defer精析

精析树状数组

精析WebSocket

【论文】期刊和会议如何查询、期刊级别分类和顶会概念一文精析

用户画像全面精析

Spring中的事务精析

消息队列RabbitMq精析

numpy shape()和reshape()

shape和reshape

shape和reshape的应用

MySQL视图索引与存储过程精析

绝命毒师口语精析（4）

子网划分详解+实例精析

笔记(总结)-神经语言模型和词向量

语言模型和循环神经网络（LM、RNNs）

espnet中的transformer和LSTM语言模型对比实验

Lamini：大语言模型精调框架

python：shape和reshape()函数

今日推荐

与 Apollo 共创生态：观看7周年大会的心路历程

与 Apollo 共创生态：Apollo7周年大会的心得体会，干货满满

国内各种免费AI聊天机器人(ChatGPT)推荐(上)

智能时代 | 合合信息Embedding模型荣获C-MTEB榜单第一

Ubuntu 24.04 LTS 正式“开放升级”

【送书福利-第四十四期】《深入Rust标准库》

开源日报 | Altman七宗罪；微软必应全球宕机；美国限制AI出口；淘汰VBScript；PostgreSQL 17

wlnmp 一键安装包更新 240522

ChatGPT 严重宕机，结果被造谣“遭遇俄罗斯黑客入侵”

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

周排行

通知、自定义控件颜色

山东财经大学新生赛暨天梯赛选拔赛 C Retina

C#中String类的几个方法(IndexOf、LastIndexOf、Substring)

怎么把WPS文字自动替换直引号为弯引号？

《Spring实战》-第六章:渲染视图（表达式，标签库，模板）

ubuntu11.04安装apache,php,mysql

梦里Babel知多少（一）

python 中whl文件安装

UI设计师月薪大概是多少一般能工作到多少岁

Thinkpad Fn键与Ctrl键互换【不通过BIOS】

每日归档

更多

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)