文章/答案/技术大牛

发布

社区首页 >问答首页 >CoreNLP请求超时。您的文档可能太长了。

问CoreNLP请求超时。您的文档可能太长了。
EN

Stack Overflow用户

提问于 2016-04-05 19:19:55

回答 1查看 4.8K关注 0票数 8

我试图在长文本上运行吡咯烷酮，并获得CoreNLP request timed out. Your document may be too long错误消息。怎么修呢？有什么办法增加斯坦福大学CoreNLP的超时吗？

我不想把文本分割成更小的文本。

下面是我使用的代码：

'''
From https://github.com/smilli/py-corenlp/blob/master/example.py
'''
from pycorenlp import StanfordCoreNLP
import pprint

if __name__ == '__main__':
    nlp = StanfordCoreNLP('http://localhost:9000')
    fp = open("long_text.txt")
    text = fp.read()
    output = nlp.annotate(text, properties={
        'annotators': 'tokenize,ssplit,pos,depparse,parse',
        'outputFormat': 'json'
    })
    pp = pprint.PrettyPrinter(indent=4)
    pp.pprint(output)

斯坦福核心NLP服务器的启动使用如下：

java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer 9000

timeout

nlp

stanford-nlp

python

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-04-05 21:13:07

您可以在'timeout': '50000'字典中添加properties (单元为ms)：

output = nlp.annotate(text, properties={
    'timeout': '50000',
    'annotators': 'tokenize,ssplit,pos,depparse,parse',
    'outputFormat': 'json'
})

否则，您可以启动指定超时的斯坦福核心NLP服务器：

java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -port 9000 -timeout 50000

( 文档没有提到timeout参数，也许他们忘了添加它，它至少出现在斯坦福大学-corenlp-2015全年-12-09，a.3.6.0.中，这是最新的公开发行版)

票数 12

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/36435207

复制

相似问题

问CoreNLP请求超时。您的文档可能太长了。
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问CoreNLP请求超时。您的文档可能太长了。EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问CoreNLP请求超时。您的文档可能太长了。
EN