tensorflow中Dataset读数性能测试

编程语言 2019-02-25 12:37:04 阅读次数: 0

首先我们随机生成一批数据文件;

可以看到我们总共生成了500万条数，均匀分到20个文件中，全部数据大约220M。

现在，我们用python中标准的文件读取方式读入数据，测试结果如下：

读入仅仅只需3秒。

我们接着重复读10次：

耗时31.6秒，大约是单遍读取时间的10倍。

接着我们用tensorflow的dataset试试看，测试结果如下：

可以看到耗时8秒。

下面让epoch为10再看看dataset的耗时：

耗时80秒，刚好是单个epoch的10倍。

下面加入shuffle且让epoch为10再看看dataset的耗时：

耗时122秒，可以发现shuffle会增加大约一半的耗时。至此，我们可以断定，在我们测试这种场景下dataset性能实在不怎么样。

猜你喜欢

转载自blog.csdn.net/wjj547670933/article/details/87912639

tensorflow中Dataset读数性能测试

【Tensorflow】Dataset 中的 Iterator

tensorflow中的dataset API

Tensorflow中的数据对象Dataset

ubuntu 中tensorflow-gpu性能测试

TensorFlow入门：使用TensorFlow中的Dataset

接口测试-从csv文件中读数据

tensorflow 中dataset常规使用方法

tensorflow2.0中dataset API 总结

Tensorflow dataset

tensorflow-读数据(1)

Tensorflow中API------tf.data.Dataset使用

关于tensorflow中Dataset图片的批量读取以及维度的操作

如何使用TensorFlow中的高级API：Estimator、Experiment和Dataset

Tensorflow中的数据对象Dataset - shuffle()、repeat()、batch() 等用法

django vs flask 负载性能测试对比，谁更快（二）读数据库

tensorflow Dataset API

Tensorflow dataset API 的使用

tensorflow Dataset的使用

2. Tensorflow Dataset

软件测试中的《性能测试》

tensorflow dataset.shuffle dataset.batch dataset.repeat

Java 从Excel中读数据

TensorFlow数据集Dataset的使用

tensorflow的keras实现搭配dataset

TensorFlow之数据集（dataset）

TensorFlow2.0（六）：Dataset

Tensorflow使用Dataset读取数据

tf tensorflow dataset interleave的用法

Tensorflow2.0学习（13）：在Tf1.0中使用Dataset

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)