我使用maven来管理依赖项。我需要使用斯坦福NLP解析器来获取英语句子的通用依存关系。我使用的是edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz模型。我的pom.xml包含以下内容
<dependency>
<groupId>edu.stanford.nlp</groupId>
<artifactId>stanford-parser</artifactId>
<version>3.6.0</version>
</dependency>
<dependency>
<groupId>edu.stanford.nlp</groupId>
<artifactId>stanford-parser</artifactId>
<version>3.6.0</version>
<classifier>models</classifier>
</dependency>通过添加模型依赖项,jar的大小增加了大约300MB。我需要确保罐子尽可能小。有没有办法在maven中处理这个问题?
发布于 2016-10-14 09:52:04
您可以通过不包含模型并从其他地方引用它们来使jar更小(即,为属性parse.model指定一个自定义路径),但一般来说,如果您想要生成解析树,则需要让解析器模型在某个地方可访问。默认情况下,CoreNLP将其包含在模型jar中,以便更容易独立于特定的目录结构运行代码。
另一种选择是运行CoreNLP服务器,然后您只需要客户端库(服务器包括模型jar)。
https://stackoverflow.com/questions/40031501
复制相似问题