首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >CoreNLP请求超时。您的文档可能太长了。

CoreNLP请求超时。您的文档可能太长了。
EN

Stack Overflow用户
提问于 2016-04-05 19:19:55
回答 1查看 4.8K关注 0票数 8

我试图在长文本上运行吡咯烷酮,并获得CoreNLP request timed out. Your document may be too long错误消息。怎么修呢?有什么办法增加斯坦福大学CoreNLP的超时吗?

我不想把文本分割成更小的文本。

下面是我使用的代码:

代码语言:javascript
复制
'''
From https://github.com/smilli/py-corenlp/blob/master/example.py
'''
from pycorenlp import StanfordCoreNLP
import pprint

if __name__ == '__main__':
    nlp = StanfordCoreNLP('http://localhost:9000')
    fp = open("long_text.txt")
    text = fp.read()
    output = nlp.annotate(text, properties={
        'annotators': 'tokenize,ssplit,pos,depparse,parse',
        'outputFormat': 'json'
    })
    pp = pprint.PrettyPrinter(indent=4)
    pp.pprint(output)

斯坦福核心NLP服务器的启动使用如下:

代码语言:javascript
复制
java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer 9000
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-04-05 21:13:07

您可以在'timeout': '50000'字典中添加properties (单元为ms):

代码语言:javascript
复制
output = nlp.annotate(text, properties={
    'timeout': '50000',
    'annotators': 'tokenize,ssplit,pos,depparse,parse',
    'outputFormat': 'json'
})

否则,您可以启动指定超时的斯坦福核心NLP服务器:

代码语言:javascript
复制
java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -port 9000 -timeout 50000

( 文档没有提到timeout参数,也许他们忘了添加它,它至少出现在斯坦福大学-corenlp-2015全年-12-09,a.3.6.0.中,这是最新的公开发行版)

票数 12
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36435207

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档