首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在pad序列中要为max_len设置什么值?

在pad序列中要为max_len设置什么值?
EN

Stack Overflow用户
提问于 2022-08-21 06:10:19
回答 1查看 83关注 0票数 -1

max_len在深层次学习中的价值是否取决于用例?假设它是与Twitter相关的分类,是否应该将值设置为280 (280是tweet中字符的最大长度)?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-08-21 07:02:31

绝对不是,在你通过标记器将文本转换成序列之后,你可以迭代这些序列,得到seqeunces的长度。

max_len函数中的pad_sqeuences参数引用序列的最大长度,因此它并不意味着基于其字符的tweet的长度,而是指序列的长度。

在那之后,你不需要给它设定推特序列的最大长度,甚至你也可以把它设置得更低。但是请注意,通过这种方法,在将标记器放入tweet列表之前,最好删除停止词和筛选字符。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/73432054

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档