TFRecord 可以理解为一系列序列化的 tf.train.Example
元素所组成的列表文件,而每一个 tf.train.Example
又由若干个 tf.train.Feature
的字典组成。
写入record
读取该数据元素到内存;
将该元素转换为
tf.train.Example
对象(每一个tf.train.Example
由若干个tf.train.Feature
的字典组成,因此需要先建立 Feature 的字典);将该
tf.train.Example
对象序列化为字符串,并通过一个预先定义的tf.io.TFRecordWriter
写入 TFRecord 文件。
import tensorflow as tf
import os
data_dir = './catsdogs'
train_cats_dir = data_dir + '/train/Cat/'
train_dogs_dir = data_dir + '/train/Dog/'
train_cat_filenames = [train_cats_dir + filename for filename in os.listdir(train_cats_dir)]
train_dog_filenames = [train_dogs_dir + filename for filename in os.listdir(train_dogs_dir)]
train_filenam