tf.data.Dataset的一些小坑 - 代码天地

tf.data.Dataset的一些小坑

编程语言 2018-11-08 10:53:16 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/Murdock_C/article/details/83856669

我们使用数据的时候都是用batch来做输入,使用tf.data.Dataset的时候,一般会这样写:

dataset = dataset.batch(batch_size).repeat(epochs)

用来说明我们需要对整个数据集进行多少个epochs,每次的输入大小是多少个batch.
注意:
如果我们的数据集的数量为N,而N%batch_size刚好能整除的话,上述代码是没有任何bug的,但如果整除不了,那么在每个epoch的最后一个batch,其数据不再是batch_size个,而是N%batch_size个数据. 程序中如果有设定好tf.placeholder来修饰input,那么程序在运行到最后一个batch的时候就会报错,因为batch数量对不上. 所以,无论怎样,一个比较好的代码习惯是这么写:

dataset = dataset.batch(batch_size, drop_remainder=True).repeat(epochs)

这样程序会自动把最后一个不足batch_size的batch给忽略掉.

猜你喜欢

转载自blog.csdn.net/Murdock_C/article/details/83856669

tf.data.Dataset的一些小坑

tensorflow 学习笔记-- tf.data.Dataset

tf.keras 模型多个输入 tf.data.Dataset

一文讲解TensorFlow数据接口 tf.data.Dataset

180512 tensorflow数据集tf.data.Dataset的基本操作

tf.data.Dataset图像预处理详解

Tensorflow tf.data.Dataset下的各种属性

tensorflow使用tf.keras.Mode写模型并使用tf.data.Dataset作为数据输入

数据挖掘算法和实践（十三）：使用tf.data.DataSet模块处理数据

tensorflow 数据集对象（tf.data）的使用( tf.data.Dataset 、tf.data.TextLineDataset 、 tf.data.TFRecordDataset ) 示例

TensorFlow数据读取机制：文件队列 tf.train.slice_input_producer和 tf.data.Dataset机制

一些小坑

Tensorflow2.x：利用tf.data.Dataset API读取CSV文件/DataFrame对象作为Keras输入流

Firebase的一些小坑

tf的一些坑

tf.data.Dataset.map与tf.data.Dataset.interleave

tf.data.Dataset.map()

ElasticSearch里面一些小坑笔记

JavaScript 中遇到的一些小坑

关于parseInt()里的一些小坑

Jquery中on绑定的一些小坑

Vue遇到的一些小坑

写小程序的一些小坑

webpack 4.0的一些小坑

前端开发一些小坑

卷积网络一些小知识点整理(tf)

tf.random_uniform, tf.data.Dataset.from_tensor_slices,tf.data.Dataset.range

tf.data.Dataset.from_tensor_slices

tf.data.dataset.list_files

近一年一些小坑

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)