tf.data.Dataset.interleave() 最通俗易懂的使用详解（有图有真相） - 代码天地

tf.data.Dataset.interleave() 最通俗易懂的使用详解（有图有真相）

其他 2020-02-11 10:49:05 阅读次数: 0

最近学习tensorflow，对于这个函数tf.data.Dataset.interleave()始终有点晕乎，即使搞明白了，用不了多久又忘了，在网上查了查，发现很少有人能把这个函数讲清楚。趁着现在还明白，记录下来——备忘+助友。

interleave()是Dataset的类方法，所以interleave是作用在一个Dataset上的。
语法：

interleave(
    map_func,
    cycle_length=AUTOTUNE,
    block_length=1,
    num_parallel_calls=None
)

解释：

假定我们现在有一个Dataset——A
从该A中取出cycle_length个element，然后对这些element apply map_func,得到cycle_length个新的Dataset对象。
然后从这些新生成的Dataset对象中取数据，取数逻辑为轮流从每个对象里面取数据，每次取block_length个数据
当这些新生成的某个Dataset的对象取尽时，从原Dataset中再取cycle_length个element，，然后apply
map_func，以此类推。

举例：

a = tf.data.Dataset.range(1, 6)  # ==> [ 1, 2, 3, 4, 5 ]
# NOTE: New lines indicate "block" boundaries.
b=a.interleave(lambda x: tf.data.Dataset.from_tensors(x).repeat(6),
            cycle_length=2, block_length=4) 
for item in b:
    print(item.numpy(),end=', ')

输出结果：

1, 1, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 3, 3, 4, 4, 5, 5, 5, 5, 5, 5,

上面程序的图示，看示意图可能更清晰：

在这里插入图片描述
其中map_func在这里是重复6次-repeat(6)。

常见case:
dataset里面存储文件名，将所有文件读取出来，产生一个大数据集

更详细内容可以参考官方文档

发布了34 篇原创文章 · 获赞 33 · 访问量 7万+

私信关注

猜你喜欢

转载自blog.csdn.net/menghuanshen/article/details/104240189

tf.data.Dataset.interleave() 最通俗易懂的使用详解（有图有真相）

tf.data.Dataset.map与tf.data.Dataset.interleave

tf.data基础API使用（tf.data.Dataset.from_tensor_slices()，repeat，batch,interleave）

tf tensorflow dataset interleave的用法

tf.data.Dataset图像预处理详解

tf.data.Dataset.from_tensor_slices() 详解

Tensorflow中API------tf.data.Dataset使用

tensorflow 数据集对象（tf.data）的使用( tf.data.Dataset 、tf.data.TextLineDataset 、 tf.data.TFRecordDataset ) 示例

tensorflow使用tf.keras.Mode写模型并使用tf.data.Dataset作为数据输入

数据挖掘算法和实践（十三）：使用tf.data.DataSet模块处理数据

最通俗易懂的UML类图详解及实例

学习Tensorflow数据读取类-data.Dataset通俗易懂资料

tf.data.Dataset.map()

（九）通俗易懂理解——TF-IDF与TextRank

tf.data详解

Git Tutorial --- 最通俗易懂的教程，没有之一

tf.random_uniform, tf.data.Dataset.from_tensor_slices,tf.data.Dataset.range

算法-最通俗易懂的KMP算法详解

最通俗易懂的HashMap底层原理图文详解

最通俗易懂的i++和++i详解

最通俗易懂的Mysql进阶索引详解

用最通俗易懂的语言详解Vue的组件通信

tensorflow 学习笔记-- tf.data.Dataset

tf.data.Dataset.from_tensor_slices

tf.data.dataset.list_files

Deep learning和tensorflow学习记录（二十五）：tf.contrib.data.parallel_interleave

tf.keras 模型多个输入 tf.data.Dataset

通俗易懂的ThreadLocal详解

SpringSecurity 详解(通俗易懂)

SQL注入详解有图有真相

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)