tf.train.shuffle_batch打乱顺序输出数据

其他 2020-02-25 22:30:45 阅读次数: 0

tf.train.shuffle_batch

该函数怎么输出数据的？

tf.train.shuffle_batch主要有三个参数：batch_size,capacity,min_after_dequeue。这三个数据决定了怎么输出数据，数据有多乱。
首先我们知道tfrecord输出是按照队列输出的，那么我们一次从tfrecord加多少容量的队列呢？这个参数就是capacity。注意，此时首先加载一定量（capacity）的数据是按照tfrecord顺序的。在加载一定量capacity的数据后，才进行打乱，出队列需要的数据（也就是出队出batch size量的数据供我们的模型训练加载）。而min_after_dequeue代表了该capacity容量下的队列中元素的最小数量，用于确保元素的混合程度，也就是说，该队列在不断的输出数据后，其容量不能低于min_after_dequeue的数值，若低于就应该又从tfrecord中加载数据入队，那很显然的，若min_after_dequeue的值较大接近capacity的话，那么其实就是输出数据后，队列值不满足最小量，又从tfrecord加了新的数据，就增加了其混合程度。
如下代码所示，这也是为什么上述三者参数常常选择这一标准，当队列输出三个以上batch size量的数据后，即不满足了队列最小容量，才又加新数据。

capacity = min_after_dequeue+3*batch_size

但是，我在自己做图像数据集时候在这里也发现了个问题，我的图像是分组加载进去tfrecord的，而我的batch size较小，capacity，min_after_dequeue很大，所以尽管输出数据后就重新从tfrecord加载了新的数据，但是原始留在队列中的数据已经很多了，还是在继续打乱原始的数据，而没有获取新的数据。终于找到了个人数据集量小的原因。
PS:我在自己加载图片数据集时候，经实验结果推测入队是按照顺序的，若有错误请斧正。

强大源

发布了27 篇原创文章 · 获赞 15 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_42192910/article/details/89930004

tf.train.shuffle_batch打乱顺序输出数据

tf.train.batch and tf.train.shuffle_batch

tensorflow---之tf.train.shuffle_batch函数

TFrecord的制作以及tf.train.shuffle_batch详解

tensorflow学习——tfreader格式，队列读取数据tf.train.shuffle_batch()

tf.train.batch和tf.train.shuffle_batch的理解

关于tf.train.batch和tf.train.shuffle_batch

tf.train.batch和tf.train.shuffle_batch的用法

tf.train.batch和tf.train.shuffle_batch理解以及遇到的问题

[tensorflow教程] [cifar10] tf.train.batch和tf.train.shuffle_batch的用法

tf.train.batch 和tf.train.shuffle_batch的用法

TensorFlow ——tf.train.batch( )和tf.train.shuffle_batch( )

tensorflow---线程如何使用以及在tf.train.shuffle_batch()等函数当中如何使用

损失函数震荡不收敛可能原因：tf.train.shuffle_batch

tensorflow-tf.train.shuffle_batch

tf.train.batch

数据及标签打乱顺序（shuffle）的两种方法--python

tensorflow数据读取机制tf.train.slice_input_producer 和 tf.train.batch 函数

tensorflow tf.train.batch之数据批量读取

Tensorflow tf.train.batch

javascript 数组 shuffle 洗牌打乱顺序

numpy.random.shuffle打乱顺序函数

tf.train.batch的偶尔乱序问题

Tensorflow -- tf.train.batch函数

tensorflow中的tf.train.batch详解

快速数据打乱顺序

Pytorch使用shuffle打乱数据

random.shuffle()随机打乱数组顺序

用 sklearn.utils.shuffle 来打乱样本顺序

python：numpy.random.shuffle打乱顺序函数

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)