用法:
pad_sequences = tf.contrib.keras.preprocessing.sequence.pad_sequences
keras.preprocessing.sequence.pad_sequences(sequences,maxlen=None,dtype='int32',padding='pre',truncating='pre', value=0.)
解释:
sequences:浮点数或整数构成的两层嵌套列表
maxlen:None或整数,为序列的最大长度。大于此长度的序列将被截短,小于此长度的序列将在后部填0.在命名实体识别任务中,主要是指句子的最大长度
dtype:返回的numpy array的数据类型
padding:‘pre’或‘post’,确定当需要补0时,在序列的起始还是结尾补
truncating:‘pre’或‘post’,确定当需要截断序列时,从起始还是结尾截断
value:浮点数,此值将在填充时代替默认的填充值0
返回形如(nb_samples,nb_timesteps)的2D张量
例子:
train_x = pad_sequences(train_x, maxlen=max_len, padding='post')
train_y = pad_sequences(train_y, maxlen=max_len, padding='post')