首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >可测性-向量器加权误差

可测性-向量器加权误差
EN

Stack Overflow用户
提问于 2018-03-12 14:42:34
回答 1查看 419关注 0票数 0

我最近发现了Textacy,当我阅读API参考指南时,我遇到了Vectorizer的一个错误。如果我从API引用中添加任何选项,就会得到一个TypeError:意外关键字参数。除了加权之外,我还得到了其他选项的错误。

我使用pip安装了textacy,在Ubuntu上使用了Python3。任何帮助都是非常感谢的。谢谢!

代码语言:javascript
复制
vectorizer = textacy.vsm.Vectorizer(weighting='tfidf')

TypeError: __init__() got an unexpected keyword argument 'weighting'
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-03-29 19:09:16

遇到了同样的问题。API文档不反映当前的Vectorizer关键字参数。现在,向量器提供了不同的关键字参数,以允许更多地控制TF*国防军的应用。

vectorizer = textacy.Vectorizer(tf_type='linear', apply_idf=True, idf_type='smooth')

tf_type应用标准术语频率(TF),apply_idf=True应用逆文档频率(IDF)。在回购注释中,idf_type='smooth'在每个文档频率中增加一个,以避免零分割。

要查看有关选项的更多信息,请查看存储库中第182行的注释:https://github.com/chartbeat-labs/textacy/blob/master/textacy/vsm/vectorizers.py

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/49237995

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档