首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在python中设置斯坦福解析器的-maxLength选项

如何在python中设置斯坦福解析器的-maxLength选项
EN

Stack Overflow用户
提问于 2015-01-20 00:05:36
回答 1查看 819关注 0票数 2

我使用的是斯坦福解析器的python接口。在做解析工作时,我想跳过长句子。所以我使用:

代码语言:javascript
复制
path1 = '/usr/local/Cellar/stanford-parser/3.4/libexec/stanford-parser.jar'
path2 = '/usr/local/Cellar/stanford-parser/3.4/libexec/stanford-parser-3.4-models.jar'
parser = StanfordParser(path_to_jar = path1, path_to_models_jar = path2, java_options = '-maxLength50')

但上面写着:

代码语言:javascript
复制
Unrecognized option: -maxLength50
Error: Could not create the Java Virtual Machine.

然后我试着:

代码语言:javascript
复制
parser = StanfordParser(path_to_jar = path1, path_to_models_jar = path2, java_options = '-maxLength=50')

上面还写着

代码语言:javascript
复制
Unrecognized option: -maxLength=50

不过,以下选项可以很好地工作:

代码语言:javascript
复制
parser = StanfordParser(path_to_jar = path1, path_to_models_jar = path2, java_options = '-mx20000m')

但是如果我没有设置句子的最大长度,即使设置了'-mx20000m‘,我也会不断地耗尽内存。所以我想我真的需要跳过一些长句子。

谁能告诉我如何在python中设置'-maxLength‘选项?谢谢!!

EN

回答 1

Stack Overflow用户

发布于 2015-01-21 17:32:38

java选项实际上是JVM的选项,而不是Stanford解析器的选项。您不能设置java选项。

我没有看到在http://www.nltk.org/_modules/nltk/parse/stanford.html中设置maxLen的选项。

在python中如何: if (len(sentence.split())>50: continue

这不是简单多了吗?

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28028811

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档