他说:我正在使用GATE NLP处理我的文档,我想使用实体名作为门上的候选标记--这里有OpenNLP和LingPipe,我正在阅读here @Shashikant答卷。
如果你有一句话“我的朋友乔·史密斯去了沃尔玛商店”,OpenNLP就能识别出两个有名字的实体--“乔·史密斯”和“沃尔玛”。我不能把“乔·史密斯”写成“人”,“沃尔玛”写成“组织”。
并建议使用LingPipe,所以我使用了Gate中提供的LingPipe,如下所示
SerialAnalyserController pipeline = (SerialAnalyserController) Factory.createResource("gate.creole.SerialAnalyserController");
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.TokenizerPR"));
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.NamedEntityRecognizerPR"));
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.POSTaggerPR"));
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.SentenceSplitterPR"));
Corpus corpus = Factory.newCorpus("SegmenterCorpus");
Document document = Factory.newDocument(handler.toString());
corpus.add(document);
pipeline.setCorpus(corpus);
pipeline.execute();然而,当我运行我的程序时,我有这个异常。
线程"main“gate.creole.ResourceInstantiationException中的异常:没有提供模型文件!在gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55) at gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55)
没有提供模型文件意味着什么??对不起,因为我问这个问题,但我对这个领域完全陌生,我只是了解安妮,它不需要任何文件,当我使用它来提取POS标记任何帮助?
发布于 2016-03-07 14:34:44
终于对我起作用了。
我在GATE中尝试了File -> Ready Made Applications -> LingPipe -> LingPipe IE System。已经装好了。
工作模式是:$gatehome$plugins/LingPipe/resources/models/ne-en-news-muc6.AbstractCharLmRescoringChunker
gate.lingpipe.NamedEntityRecognizerPR的完整相关配置是:
...
<string>modelFileUrl</string>
<gate.util.persistence.PersistenceManager-URLHolder>
<urlString>$gatehome$plugins/LingPipe/resources/models/ne-en-news-muc6.AbstractCharLmRescoringChunker</urlString>
</gate.util.persistence.PersistenceManager-URLHolder>
...

https://stackoverflow.com/questions/35684497
复制相似问题