pad_sequences序列预处理

用法:

pad_sequences = tf.contrib.keras.preprocessing.sequence.pad_sequences

keras.preprocessing.sequence.pad_sequences(sequences,maxlen=None,dtype='int32',padding='pre',truncating='pre', value=0.)

解释:

sequences:浮点数或整数构成的两层嵌套列表

maxlen:None或整数,为序列的最大长度。大于此长度的序列将被截短,小于此长度的序列将在后部填0.在命名实体识别任务中,主要是指句子的最大长度

dtype:返回的numpy array的数据类型

padding:‘pre’或‘post’,确定当需要补0时,在序列的起始还是结尾补

truncating:‘pre’或‘post’,确定当需要截断序列时,从起始还是结尾截断

value:浮点数,此值将在填充时代替默认的填充值0

 

返回形如(nb_samples,nb_timesteps)的2D张量

 

例子:

train_x = pad_sequences(train_x, maxlen=max_len, padding='post')

train_y = pad_sequences(train_y, maxlen=max_len, padding='post')

猜你喜欢

转载自blog.csdn.net/yangfengling1023/article/details/81202767
今日推荐