首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在pandas数据帧中使用keras pad_sequences

在pandas数据帧中使用keras pad_sequences
EN

Stack Overflow用户
提问于 2019-06-21 01:37:08
回答 1查看 1.3K关注 0票数 2

我有一个包含单词索引的pandas数据框架。

代码语言:javascript
复制
    id  seq                          int_sequence
0   111 cat over dog                 [2, 7, 3]
1   222 hello silly dog cat from     [6, 9, 3, 2, 5]
2   333 biscuit sandwich food        [1, 8, 4]

我现在正在尝试用零填充序列,使其达到最大长度。

代码语言:javascript
复制
padded_sequences = pad_sequences(df.int_sequence, maxlen=MAX_SEQ_LENGTH, padding='post', value=0)

它返回一个形状为(3,5)的numpy数组-之后,我使用下面的转换将numpy数组转换为df并连接回原始的df:

代码语言:javascript
复制
df_padded_sequences = pd.DataFrame({ 'padded_seq': padded_sequences.tolist()})

虽然它的工作,它感觉很麻烦-所以我想在现场pad_sequences的熊猫的df主要是,所以我不担心任何订单打破,因此改变。

谢谢!

EN

回答 1

Stack Overflow用户

发布于 2019-06-21 02:02:05

好了,我已经让它工作了!很高兴听到更好的解决方案...

代码语言:javascript
复制
df['padded_sequences'] = pad_sequences(df.int_sequence, maxlen=MAX_SEQ_LENGTH, padding='post', value=0).tolist()

将numpy数组转换为列表。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56691251

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档