【tf.keras.utils.Sequence】构建自己的数据集生成器

其他 2020-10-29 11:55:20 阅读次数: 0

every blog every motto: You can do more than you think.

0. 前言

在训练模型时，我们往往不一次将数据全部加载进内存中，而是将数据分批次加载到内存中。

一种方法是用 while True 遍历数据，用yeid产生，具体可参考语义分割代码讲解部分
另一种方法是本文即将讲解的tf.keras.utils.Sequence方法

1. 正文

__ len __ 中返回的即1个epoch迭代的次数，即：
总样本数/ batch_size

__ getitem __ 根据len中的迭代次数，生成数据

注意： __ len __ ，__ getitem __ 必须要实现

"""
测试
__getitem__
"""
import os

os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
import tensorflow as tf


class Date(tf.keras.utils.Sequence):

    def __init__(self):
        print('初始化相关参数')

    def __len__(self):
        """
        此方法要实现，否则会报错
        正常程序中返回1个epoch迭代的次数
        :return:
        """
        return 5

    def __getitem__(self, index):
        """生成一个batch的数据"""
        print('index:', index)
        x_batch = ['x1', 'x2', 'x3', 'x4']
        y_batch = ['y1', 'y2', 'y3', 'y4']
        print('-'*20)
        return x_batch, y_batch


# 实例化数据
date = Date()

for batch_number, (x, y) in enumerate(date):
    print('正在进行第{} batch'.format(batch_number))
    print('x_batch:', x)
    print('y_batcxh:', y)

结果：
在这里插入图片描述

参考文献

[1] https://blog.csdn.net/weixin_39190382/article/details/105808830
[2] https://blog.csdn.net/weixin_43198141/article/details/89926262
[3] https://blog.csdn.net/u011311291/article/details/80991330

猜你喜欢

转载自blog.csdn.net/weixin_39190382/article/details/109195031

【tf.keras.utils.Sequence】构建自己的数据集生成器

keras数据自动生成器，继承keras.utils.Sequence，结合fit_generator实现节约内存训练

TF - 数据生成器

TF - 数据生成器

tf.keras 用生成器读取图片数据+预处理

keras数据生成器--数据增强

使用Keras 构建基于 LSTM 模型的故事生成器

Keras时序生成器

python装饰器应用之keras数据生成器

keras.utils.Sequence验证数据

[Tensorflow] 使用 tf.keras.utils.get_file() 下载 MS-COCO 2014 数据集

tf.kerasr入门示例:Lenet手写字符分类(2扩展) eager模式下Sequence生成器方式加载数据并训练

数据生成器

基于LSTM + keras 的诗歌生成器

【图像-关键点json标签】的数据集生成器

【Keras】使用数据生成器（data generators）解决训练数据内存问题

数组数据生成器

数据生成器模板

yuv数据生成器

自己写代码生成器

自己用的MybatisPlus代码生成器

Keras用动态数据生成器(DataGenerator)和fitgenerator动态训练模型

当数据集的数据过大时，采用生成器generator生成数据循环调用

keras图片增强批量生成器ImageDataGenerator

Python生成器深度解析：构建强大的数据处理管道

Mybatis-Plus代码生成器，设置自己的代码生成器

从文本到图像——文本识别数据集生成器

module ‘keras.utils‘ has no attribute ‘Sequence‘

[开发技巧]·深度学习使用生成器加速数据读取与训练简明教程（TensorFlow，pytorch，keras）

代码生成器系列（数据筛选）

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)