我有一个包含单词索引的pandas数据框架。
id seq int_sequence
0 111 cat over dog [2, 7, 3]
1 222 hello silly dog cat from [6, 9, 3, 2, 5]
2 333 biscuit sandwich food [1, 8, 4]我现在正在尝试用零填充序列,使其达到最大长度。
padded_sequences = pad_sequences(df.int_sequence, maxlen=MAX_SEQ_LENGTH, padding='post', value=0)它返回一个形状为(3,5)的numpy数组-之后,我使用下面的转换将numpy数组转换为df并连接回原始的df:
df_padded_sequences = pd.DataFrame({ 'padded_seq': padded_sequences.tolist()})虽然它的工作,它感觉很麻烦-所以我想在现场pad_sequences的熊猫的df主要是,所以我不担心任何订单打破,因此改变。
谢谢!
发布于 2019-06-21 02:02:05
好了,我已经让它工作了!很高兴听到更好的解决方案...
df['padded_sequences'] = pad_sequences(df.int_sequence, maxlen=MAX_SEQ_LENGTH, padding='post', value=0).tolist()将numpy数组转换为列表。
https://stackoverflow.com/questions/56691251
复制相似问题