tensorflow-tf.decode_csv

tf.decode_csv

tf.decode_csv(
    records,
    record_defaults,
    field_delim=',',
    use_quote_delim=True,
    name=None,
    na_value='',
    select_cols=None
)

将CSV记录转换为张量。每一列映射到一个张量。

rfc4180格式预计用于CSV记录。(https://tools.ietf.org/html/rfc4180)注意,我们允许使用int或float字段来引导和跟踪空格

参数:

records:字符串类型的张量。每个字符串都是csv中的记录/行,所有记录都应该具有相同的格式。

record_defaults:具有特定类型的张量对象的列表。可接受的类型有float32、float64、int32、int64、string。输入记录的每列有一个张量,该列的默认值为标量,如果需要该列,则为空。
field_delim: 可选字符串。默认为“,”。用于分隔记录中的字段的char分隔符。

use_quote_delim:可选bool。默认值为True。如果为false,则将双引号作为字符串字段内的正则字符

name:操作的名称(可选)。
na_value:要识别为NA/NaN的附加字符串。

select_cols:要选择的列索引的可选排序列表。如果指定,则只解析和返回这个列子集。
返回:

张量对象的列表。具有与record_defaults相同的类型。每个张量的形状都和记录中的一样。
抛出:

ValueError:如果任何参数格式错误。

猜你喜欢

转载自blog.51cto.com/13959448/2335453